Paralelización y Escalabilidad en el Tratamiento de Datos
Objetivo
El estudiante debe comprender los diferentes modelos de almacenamiento en bases de datos y sus características de escalabilidad, sabiendo utilizar diferentes lenguajes y tipos de consultas como medio de extraer datos para las tareas de data science.
El estudiante debe conocer las diferentes plataformas para procesamiento paralelo, tales como Hadoop y Spark, así como las plataformas de este tipo para los datos en streaming o que se producen a altas velocidades. Finalmente, el estudiante debe saber seleccionar y utilizar servicios en la nube que utilizan estas tecnologías para la creación de modelos analíticos o la extracción de patrones en aplicaciones que utilizan Big Data.
Temario
Bases de Datos no Convencionales.
Motores de Computación Paralela.
Tratamiento de Datos en Streaming.
Analítica Escalable.