Cursos ONLINE

Curso en Arquitecturas distribuidas de Big Data

Impartido por Alejandro Pérez Pérez, Datos - Business Intelligence - Inteligencia Artificial
Inicio: 2 Mayo 2024
1 mes
4.8

Presentación del curso

Como ya hemos estado viendo a lo largo de todo el curso, el principal objetivo del Big Data es el análisis y procesamiento de grandes cantidades de datos que no se puede realizar de manera convencional. Por ello, es tan importante que realicemos un estudio extra del ecosistema donde queremos realizar todos estos procesos, moviéndonos de entornos convencionales a entornos específicos para el tratamiento de estos datos.

Durante este Curso en Arquitecturas distribuidas de Big Data seremos capaces de evaluar las diferentes herramientas disponibles para la obtención de los datos y el tratamiento de estos, y las diferentes combinaciones que podemos hacer entre estas herramientas para conseguir un mayor beneficio de nuestros objetivos.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

Como ya hemos estado viendo a lo largo de todo el curso, el principal objetivo del Big Data es el análisis y procesamiento de grandes cantidades de datos que no se puede realizar de manera convencional. Por ello, es tan importante que realicemos un estudio extra del ecosistema donde queremos realizar todos estos procesos, moviéndonos de entornos convencionales a entornos específicos para el tratamiento de estos datos.

Durante este Curso en Arquitecturas distribuidas de Big Data seremos capaces de evaluar las diferentes herramientas disponibles para la obtención de los datos y el tratamiento de estos, y las diferentes combinaciones que podemos hacer entre estas herramientas para conseguir un mayor beneficio de nuestros objetivos.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

¿Qué aprenderás en este curso?

Al finalizar el Curso en Arquitecturas distribuidas de Big Data serás perfectamente capaz de:

  • Saber analizar y seleccionar las arquitecturas apropiadas y los recursos necesarios para realizar proyectos de Big Data eficientes y ágiles.
  • Saber evaluar herramientas en el mercado y cómo se podrían combinar para la mejora de proceso de los datos en nuestro ecosistema

¿Para quién es este curso?

El Curso en Arquitecturas distribuidas de Big Data proporciona formación específicamente orientada a los siguientes perfiles:

  • Ingenieros que tengan por objetivo una actualización de sus conocimientos y el desarrollo de nuevas competencias dentro de la Inteligencia Artificial
  • Programadores que tengan por objetivo ampliar sus conocimientos y capacidades en el mundo de la ciencia de datos para su desarrollo profesional
  • Analistas de datos con experiencia que quieran dar el salto a los aspectos más profundos de la tecnología

El curso incluye:

  • 3 clases (1 mes)

  • 3 sprint semanales

  • Masterclass y/o tutorias

  • 1 proyecto

  • Diploma IEBS

  • Bolsa de empleo

Plan de estudios

Contenidos del curso:

  • Bienvenida y presentación
Tema 1: Arquitectura Batch y Streaming. Arquitectura Lambda

Resumen

En esta sesión, se expondrá una introducción a lo que son las arquitecturas distribuidas, cuáles son las más utilizadas y cómo podemos diferenciarlas. 

Se ahondará en más detalle, en dos de las arquitecturas más utilizadas en nuestros días.

 

Objetivos

  • Conocer lo que son arquitecturas distribuidas.
  • Diferenciar las diferentes capas dentro de una arquitecturas distribuida.
  • Generar herramientas y perspectivas para poder empezar a indagar en cuál es la mejor arquitectura a utilizar.
  • Ser capaces de dibujar o esquematizar un arquitectura distribuida con sus diferentes módulos y herramientas.
 

Temario

  • Arquitecturas distribuidas
    • Introducción a las arquitecturas distribuidas
  • Tipos de computación distribuida
    • Computación en Cluster
    • Computación en Malla/Grid y computación en Cloud
  • Tipos de computación distribuida por procesamiento de datos
    • Tipos de computación
    • Arquitectura Lambda
    • Arquitectura Kappa
    • Ambas arquitecturas
    • Conclusiones
Tema 2: Herramientas del ecosistema Hadoop: Hive

Resumen

En esta siguiente lección, se verán las diferentes herramientas que coexisten en una arquitectura distribuidas, cómo podemos tipificarlas, y cuáles son importantes para que nos ayuden en nuestra manera de gestionar las arquitecturas distribuidas.

 

Objetivos

  • Conocer herramientas que podemos utilizar y para qué se utilizan.
  • Ser capaces de entender el ecosistema que rodea el big data y cómo no se trata de únicamente almacenamiento de datos.
  • Conocer Hive y cómo funciona.
  • Conocer el HiveQL.
 

Temario

  • Herramientas de ecosistemas
    • Para recolectar datos
    • Para almacenar datos y gestionar recursos
    • Herramientas específicas
  • Hadoop Hive
    • Hadoop Hive con Facebook
    • Instalación Hadoop Hive Parte I
    • Instalación Hadoop Hive Parte II
    • Uso Hadoop Hive Parte I
    • Uso Hadoop Hive Parte II
  • Cierre
    • Sprint 2: Diseñar y crear tu propio Apache Hive
Tema 3: Gestión de recursos: YARN

Resumen

Después de conocer diversas herramientas de ayuda en nuestro ecosistema, nos centramos en una de las herramientas que más nos pueden ayudar en nuestras arquitecturas distribuidas. Herramientas de gestión de recursos.

En esta clase, hablaremos sobre YARN y cómo se utiliza

 
 

Objetivos

  • Ser capaces de instalar y gestionar al menos un nodo.
  • Comprender para qué sirven las herramientas de gestión de recursos.
  • Entender las diferencias de las distintas herramientas.
 

Temario

  • Gestión de recursos
    • Herramientas
    • Herramientas en detalle
  • Sistema Hadoop
    • YARN
    • Componentes principales: Resource Manager
    • Resource Manager: Configuración CapacityScheduler
    • Resource Manager: Configuración FairScheduler
    • Componentes principales: Node Manager y Application Master
  • Extras YARN
    • Nuevas aplicaciones, comandas y seguridad
  • Sprint 2
    • Desplegar Yarn y comprobar que funciona

Experto

Alejandro Pérez Pérez

Datos - Business Intelligence - Inteligencia Artificial

Nuestros alumnos opinan

¿Por qué elegirnos?

Descubre lo que nos diferencia

95%Empleo

El 95% de nuestros alumnos está trabajando o emprende cuando finaliza sus estudios

Empleo
175kAlumnos

Somos la mayor comunidad de profesionales digitales del mundo

Comunidad
13Años

Expertos en formación online: más de 10 años liderando la innovación del elearning

Experiencia
95%Satisfacción

El 95% de nuestros alumnos consiguen mejorar su situación al finalizar sus estudios

Seguridad

Curso en Arquitecturas distribuidas de Big Data

U$S 510

  • Big data & IA
Inicio: 2 Mayo 2024
1 mes
Online
Ininterrumpido 24/7
Diploma de IEBS

Curso en Arquitecturas distribuidas de Big Data

U$S 510