Curso ONLINE

Curso en Entorno Distribuido de Big Data

Impartido por Miguel Ángel Fernández Díaz, Ingeniero Big Data en Stratio BD

Inicio: 27 Noviembre 2025

1 mes

4.7

Presentación del curso

En este Curso en Entorno Distribuido de Big Data se trabajarán los conceptos básicos sobre el framework de Hadoop, como opensource, para almacenar datos del entorno Big Data y ejecutar aplicaciones en clusters de servidores básicos.

Veremos también cómo este sistema proporciona con HDFS un almacenamiento masivo para cualquier tipo de datos.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

Veremos también cómo este sistema proporciona con HDFS un almacenamiento masivo para cualquier tipo de datos.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

¿Qué aprenderás en este curso?

Al finalizar el Curso en Entorno Distribuido de Big Data serás perfectamente capaz de:

Entender y saber aplicar el modelo MapReduce para el procesamiento distribuido de Big Data.
Saber manejar sistemas de ficheros distribuidos en Hadoop con HDFS.

¿Para quién es este curso?

El Curso en Entorno Distribuido de Big Data proporciona formación específicamente orientada a los siguientes perfiles:

Ingenieros que tengan por objetivo una actualización de sus conocimientos y el desarrollo de nuevas competencias dentro de la Inteligencia Artificial
Programadores que tengan por objetivo ampliar sus conocimientos y capacidades en el mundo de la ciencia de datos para su desarrollo profesional
Analistas de datos con experiencia que quieran dar el salto a los aspectos más profundos de la tecnología

El curso incluye:

3 clases (1 mes)
3 sprint semanales
Masterclass y/o tutorias
1 proyecto
Diploma IEBS
Bolsa de empleo

Plan de estudios

Contenidos del curso:

Bienvenida y presentación

Tema 1: Fundamentos y herramientas del ecosistema Hadoop

Resumen

Esta clase tiene como objetivo adquirir conciencia de las implicaciones y los conocimientos necesarios para diseñar una arquitectura distribuída para un proyecto empresarial en un contexto Batch con datos estáticos. Para ello, se abordarán los aspectos de este tipo de arquitecturas para el procesamiento y análisis de datos en Batch en HDFS con Hive.

Objetivos

Ser capaz de diseñar arquitecturas distribuídas para datos estáticos.
Aprender los comandos de HDFS y sentecias HiveQL para el análisis de datos Batch.

Temario

Introducción a sistemas distribuídos

Historia
Conceptos clave

Introducción a Hadoop

Origen y características
Casos de uso

Componentes Hadoop

HDFS. Parte I
HDFS. Parte II
MapReduce
YARN

Ecosistema Hadoop

Hive, Pig, Hbase y plataformas

Alcance de Hadoop

Consideraciones

Tema 2: Gestión de datos Streaming

Resumen

Esta clase tiene como objetivo adquirir conciencia de las implicaciones y los conocimientos necesarios para diseñar una arquitectura distribuida para un proyecto empresarial en un contexto Streaming con un flujo continuo de datos. Para ello, se abordarán los aspectos de este tipo de arquitecturas para el movimiento de datos en Streaming con Kafka.

Objetivos

Ser capaz de diseñar arquitecturas distribuídas para datos Streaming.
Aprender conceptos relacionados con la configuración de Kafka y sus herramientas para el análisis de datos Streaming.

Temario

Entornos distribuídos para arquitecturas Streaming

Contexto
Arquitecturas Streaming

Arquitectura de Apache Kafka

Introducción
Definición y conceptos clave
Mensajería distribuida

Herramientas y uso de Apache Kafka

Ecosistema: Schema Registry y Rest Proxy
Ecosistema: Connect, Streams y KSql

Tema 3: Extracción, transformación y carga de datos

Resumen

Esta clase tiene como objetivo adquirir conciencia de las implicaciones y los conocimientos necesarios para diseñar una arquitectura distribuida para un proyecto empresarial en un contexto ETLs para la transformación de datos tanto en Batch como en Streaming. Para ello, se abordarán los aspectos de este tipo de arquitecturas para el diseño e implementación de estas ETLs con NiFi.

Objetivos

Ser capaz de diseñar arquitecturas distribuídas para la extracción, transformación y carga de datos.
Aprender como funciona la configuración de NiFi para el diseño e implementación de flujos ETLs.

Temario

Introducción a ETLs

Contexto
Obtención de datos
Técnicas de obtención de datos. Parte I
Técnicas de obtención de datos. Parte II

Características de Apache NiFi

Componentes
Casos de uso
Programación Basada en Flujos
FlowFiles
Arquitectura

ETLs con Apache NiFi

Conceptos básicos
Principales herramientas

Experto

Miguel Ángel Fernández Díaz

Ingeniero Big Data en Stratio BD

Nuestros alumnos opinan

Roberto Esteves, Gerente General en Masapp

Solamente pasaba para compartirles un pequeño éxito, haber terminado el postgrado en el IEBS Business School en "Data Science y Machine Learning", esto me sirve para poder seguir dando mejores capacitaciones.

Juan Manuel Hernández Espinosa, Senior Petroleum Economist & Data Scientist

¡He disfrutado mucho este viaje! Un logro más, ahora es el momento de aplicar todos los aprendizajes y aprovecharlos en todos los aspectos profesionales!, Gracias IEBS Business School.

Arantxa Martínez Capitán, Técnico BPO en Integra HCM

En el Postgrado en Business Intelligence & BD he trabajado con herramientas como Alteryx, RapidMiner, MySQL y Microsoft Power BI. Con ellas he ido encajando piezas hasta crear el puzle completo mediante el desarrollo de casos prácticos reales.

Orlando Hernández Jiménez, Consultant, Data Scientist and Trainer in BI, ECM, BigData, ML & Blockchain

Todos los objetivos claros en combinación con dedicación y esfuerzo, darán un extraordinario y satisfactorio resultado. Así que a seguir con los siguientes objetivos #iebs.

¿Por qué elegirnos?

Descubre lo que nos diferencia

95%Empleo

El 95% de nuestros alumnos está trabajando o emprende cuando finaliza sus estudios

175kAlumnos

Somos la mayor comunidad de profesionales digitales del mundo

15Años

Expertos en formación online: más de 15 años liderando la innovación del elearning

95%Satisfacción

El 95% de nuestros alumnos consiguen mejorar su situación al finalizar sus estudios

Curso en Entorno Distribuido de Big Data

U$S 510

Big data & IA

Inicio: 27 Noviembre 2025

1 mes

Online

Ininterrumpido 24/7

Diploma de IEBS

Matricúlate en este curso Solicita información

Curso en Entorno Distribuido de Big Data

U$S 510

Matricúlate en este curso Solicita información

Los alumnos de este curso también compraron

10h -

Curso en
Transformación digital: Inteligencia Artificial Generativa (genAI) y cloud computing

10h -

Curso en
Estrategia Digital: Cómo lograr ventajas diferenciales con tecnología digital

10h -

Curso en
IA Aplicada a Social Media

10h -

Curso en
Aprende a desarrollar narrativas con ChatGPT

10h -

Curso en
IA aplicada al Customer experience

10h -

Curso en
Revolución Visual: crea productos Audiovisuales con IA Generativa y Runway

10h -

Curso en
Transformación digital: Inteligencia Artificial Generativa (genAI) y cloud computing

10h -

Curso en
Estrategia Digital: Cómo lograr ventajas diferenciales con tecnología digital

10h -

Curso ONLINE

Curso en Entorno Distribuido de Big Data

Presentación del curso

¿Qué aprenderás en este curso?

Al finalizar el Curso en Entorno Distribuido de Big Data serás perfectamente capaz de:

¿Para quién es este curso?