Objetivos
Conoce las bases y conceptos generales necesarios para empezar en BigData y analítica de datos.
- Conocer los motivos de la aplicación de BigData. BigData no son símplemente muchos datos.
- Conocer el paradigma de aplicación di BigData, sus retos, principios y propiedades.
- Conocer las características de la naturaleza de los Datos en BigData.
- Entender las estrategias de procesamiento de datos.
- Saber qué es la analítica de datos y cuál es el papel del científico de datos.
- Situar las herramientas que forman parte del ecosistema BigData.
¿A quién va dirigido?
Técnicos que quieran comenzar a introducirse en el ámbito de BigData.
Contenidos
1. El concepto de BigData.
- ¿qué es BigData?
- Evolución de Big Data
- Dónde aplica el uso de BigData.
2. El paradigma de BigData
- Retos y problemas de la gestión de BigData con sistemas tradicionales
- Gestión del Almacenamiento
- Complejidad
- Estructura cambiante
- Principios y propiedades de un sistema BigData
- Robustez
- Tolerancia a fallos
- Latencia
- Escalabilidad
- Mantenimiento
- Escalabilidad horizontal vs Escalabilidad vertical.
3. Los datos en BigData
- Características de los datos
- Modelos de representación.
- Persistencia de Datos. La necesidad de NoSQL.
4. Procesado de BigData
- Motivación en el procesado
- Modelo de computación distribuida: MapReduce
- Analítica de datos y Data Science.
- Eventos, colas, y Streams
5. La arquitectura Lambda
6. Estrategias y ecosistemas BigData
- Procesado en Batch: Hadoop, Cassandra, Hive, Pig, HBase, Spark
- Procesado en Tiempo Real: Spark, Flume, Google Data Model.