En este Curso en Entorno Distribuido de Big Data se trabajarán los conceptos básicos sobre el framework de Hadoop, como opensource, para almacenar datos del entorno Big Data y ejecutar aplicaciones en clusters de servidores básicos.
Veremos también cómo este sistema proporciona con HDFS un almacenamiento masivo para cualquier tipo de datos.
Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.
Este curso forma parte del Máster en Data Science y Big Data.
Si quieres ampliar tu formación, consulta el programa completo.
Maestrías
Big data & IA
Máster en Data Science y Big Data
a quién va dirigido
El Curso en Entorno Distribuido de Big Data proporciona formación específicamente orientada a los siguientes perfiles:
- Ingenieros que tengan por objetivo una actualización de sus conocimientos y el desarrollo de nuevas competencias dentro de la Inteligencia Artificial
- Programadores que tengan por objetivo ampliar sus conocimientos y capacidades en el mundo de la ciencia de datos para su desarrollo profesional
- Analistas de datos con experiencia que quieran dar el salto a los aspectos más profundos de la tecnología
QUÉ APRENDERÁS
Al finalizar el Curso en Entorno Distribuido de Big Data serás perfectamente capaz de:
- Entender y saber aplicar el modelo MapReduce para el procesamiento distribuido de Big Data.
- Saber manejar sistemas de ficheros distribuidos en Hadoop con HDFS.

PLAN DE ESTUDIOS
Resumen
Esta clase tiene como objetivo adquirir conciencia de las implicaciones y los conocimientos necesarios para diseñar una arquitectura distribuída para un proyecto empresarial en un contexto Batch con datos estáticos. Para ello, se abordarán los aspectos de este tipo de arquitecturas para el procesamiento y análisis de datos en Batch en HDFS con Hive.
Objetivos
- Ser capaz de diseñar arquitecturas distribuídas para datos estáticos.
- Aprender los comandos de HDFS y sentecias HiveQL para el análisis de datos Batch.
Temario
- Introducción a sistemas distribuídos
- Historia
- Conceptos clave
- Introducción a Hadoop
- Origen y características
- Casos de uso
- Componentes Hadoop
- HDFS. Parte I
- HDFS. Parte II
- MapReduce
- YARN
- Ecosistema Hadoop
- Hive, Pig, Hbase y plataformas
- Alcance de Hadoop
- Consideraciones
Resumen
Esta clase tiene como objetivo adquirir conciencia de las implicaciones y los conocimientos necesarios para diseñar una arquitectura distribuida para un proyecto empresarial en un contexto Streaming con un flujo continuo de datos. Para ello, se abordarán los aspectos de este tipo de arquitecturas para el movimiento de datos en Streaming con Kafka.
Objetivos
- Ser capaz de diseñar arquitecturas distribuídas para datos Streaming.
- Aprender conceptos relacionados con la configuración de Kafka y sus herramientas para el análisis de datos Streaming.
Temario
- Entornos distribuídos para arquitecturas Streaming
- Contexto
- Arquitecturas Streaming
- Arquitectura de Apache Kafka
- Introducción
- Definición y conceptos clave
- Mensajería distribuida
- Herramientas y uso de Apache Kafka
- Ecosistema: Schema Registry y Rest Proxy
- Ecosistema: Connect, Streams y KSql
Resumen
Esta clase tiene como objetivo adquirir conciencia de las implicaciones y los conocimientos necesarios para diseñar una arquitectura distribuida para un proyecto empresarial en un contexto ETLs para la transformación de datos tanto en Batch como en Streaming. Para ello, se abordarán los aspectos de este tipo de arquitecturas para el diseño e implementación de estas ETLs con NiFi.
Objetivos
- Ser capaz de diseñar arquitecturas distribuídas para la extracción, transformación y carga de datos.
- Aprender como funciona la configuración de NiFi para el diseño e implementación de flujos ETLs.
Temario
- Introducción a ETLs
- Contexto
- Obtención de datos
- Técnicas de obtención de datos. Parte I
- Técnicas de obtención de datos. Parte II
- Características de Apache NiFi
- Componentes
- Casos de uso
- Programación Basada en Flujos
- FlowFiles
- Arquitectura
- ETLs con Apache NiFi
- Conceptos básicos
- Principales herramientas
profesorado
aprende con los mejores expertos
OPINIONES del Curso en Entorno Distribuido de Big Data

Orlando Hernández Jiménez
Consultant, Data Scientist and Trainer in BI, ECM, BigData, ML & Blockchain
Todos los objetivos claros en combinación con dedicación y esfuerzo, darán un extraordinario y satisfactorio resultado. Así que a seguir con los siguientes objetivos #iebs.

Arantxa Martínez Capitán
Técnico BPO en Integra HCM
En el Postgrado en Business Intelligence & BD he trabajado con herramientas como Alteryx, RapidMiner, MySQL y Microsoft Power BI. Con ellas he ido encajando piezas hasta crear el puzle completo mediante el desarrollo de casos prácticos reales.

Juan Manuel Hernández Espinosa
Senior Petroleum Economist & Data Scientist
¡He disfrutado mucho este viaje! Un logro más, ahora es el momento de aplicar todos los aprendizajes y aprovecharlos en todos los aspectos profesionales!, Gracias IEBS Business School.

Roberto Esteves
Gerente General en Masapp
Solamente pasaba para compartirles un pequeño éxito, haber terminado el postgrado en el IEBS Business School en "Data Science y Machine Learning", esto me sirve para poder seguir dando mejores capacitaciones.
resumen
del Curso en Entorno Distribuido de Big Data
DURACIÓN
1 mes (40 horas)
INICIO
27 Noviembre
Modalidad
Online - Accesible 24/7
precio
510 U$S
incluye
Diploma IEBS y bolsa de empleo
valoración
4.9/5 de valoración por los alumnos
No enseñamos el futuro. Te ayudamos a crearlo.
FORMACIÓN RELACIONADA
Cursos
Big data & IA
Curso en Transformación digital: Inteligencia Artificial Generativa (genAI) y cloud computing

Cursos
Big data & IA
Curso en Estrategia Digital: Cómo lograr ventajas diferenciales con tecnología digital

Cursos
Big data & IA
Curso en IA Aplicada a Social Media

Cursos
Big data & IA
Curso en Aprende a desarrollar narrativas con ChatGPT

Cursos
Big data & IA
Curso en IA aplicada al Customer experience

Cursos
Big data & IA
Curso en Revolución Visual: crea productos Audiovisuales con IA Generativa y Runway
