Cursos ONLINE

Curso en Técnicas de aprendizaje supervisado: Modelos binarios

Impartido por Juan José Silva Torres, Data Director en Ymedia
Inicio: 27 Junio 2024
1 mes
4.9

Presentación del curso

El Curso en Técnicas de aprendizaje supervisado: Modelos binarios se centra en enfoques y técnicas de aprendizaje supervisado donde vamos a explorar los árboles de decisión: una familia de algoritmos de Machine Learning capaces de realizar tanto tareas predictivas de regresión como de clasificación, así como de manejar eficazmente datos complejos.  Seguidamente, veremos qué son los Ensembles o combinaciones de múltiples modelos de clasificación, y los bosques aleatorios o Random Forest: un particular ejemplo de métodos Ensemble que entrena simultáneamente un conjunto de árboles de decisión y que, pese a su simplicidad, sigue siendo a día de hoy una de las técnicas de Machine Learning más poderosas.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

El Curso en Técnicas de aprendizaje supervisado: Modelos binarios se centra en enfoques y técnicas de aprendizaje supervisado donde vamos a explorar los árboles de decisión: una familia de algoritmos de Machine Learning capaces de realizar tanto tareas predictivas de regresión como de clasificación, así como de manejar eficazmente datos complejos.  Seguidamente, veremos qué son los Ensembles o combinaciones de múltiples modelos de clasificación, y los bosques aleatorios o Random Forest: un particular ejemplo de métodos Ensemble que entrena simultáneamente un conjunto de árboles de decisión y que, pese a su simplicidad, sigue siendo a día de hoy una de las técnicas de Machine Learning más poderosas.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

¿Qué aprenderás en este curso?

Al finalizar el Curso en Técnicas de aprendizaje supervisado: Modelos binarios serás perfectamente capaz de:

  • Saber ajustar un modelo binario utilizando modelos Naive Bayes y Support Vector Machine (SVM).
  • Saber validar un modelo binario mediante la curva ROC y el Área Bajo la Curva (AUC).

¿Para quién es este curso?

El Curso en Técnicas de aprendizaje supervisado: Modelos binarios proporciona formación específicamente orientada a los siguientes perfiles:

  • Ingenieros que tengan por objetivo una actualización de sus conocimientos y el desarrollo de nuevas competencias dentro de la Inteligencia Artificial
  • Programadores que tengan por objetivo ampliar sus conocimientos y capacidades en el mundo de la ciencia de datos para su desarrollo profesional
  • Analistas de datos con experiencia que quieran dar el salto a los aspectos más profundos de la tecnología

El curso incluye:

  • 3 clases (1 mes)

  • 3 sprint semanales

  • Masterclass y/o tutorias

  • 1 proyecto

  • Diploma IEBS

  • Bolsa de empleo

Plan de estudios

Contenidos del curso:

  • Bienvenida y presentación
Tema 1: Clasificación binaria, multiclase y métricas. Curva ROC

Resumen

En esta clase se ofrece una visión histórica del Machine Learning, además de definir dicho concepto. También se detallan las fases a seguir en cualquier proyecto de modelización, desde la carga de datos hasta la validación del algoritmo, pasando por el análisis descriptivo inicial, la creación de un conjunto de entrenamiento y otro de test y la elección del algoritmo de aprendizaje supervisado. Se introducen conceptos como valores missing y outliers en la fase descriptiva; se presentan los diferentes tipos de muestreo, aleatorio y aleatorio estratificado junto con sus principales casos de uso y se profundiza en la construcción de la curva ROC y en el área bajo la curva como métricas de precisión y bondad del algoritmo ajustado en la fase de modelización. 

Objetivos

  • Aprender las principales fases a desarrollar a lo largo de un proyecto de aprendizaje supervisado. 
  • Realizar un análisis descriptivo exhaustivo de un conjunto de datos real.
  • Obtener una perspectiva amplia de los diferentes algoritmos de aprendizaje supervisado.
  • Conocer las principales métricas de validación. Curva ROC, área bajo la curva, matriz de confusión y precisión.
  • Utilizar Google Colab para realizar el análisis descriptivo de un conjunto de datos real utilizando python como lenguaje de programación.

Temario

  • Machine Learning: Una perspectiva histórica
    • Parte I. Historia de la Inteligencia Artificial. Desde el 1940 hasta la década de los 90
    • Parte II. Explosión de la Inteligencia Artificial. Desde la década de los 90 hasta nuestros días.
  • Entrando en materia. Etapas de un proyecto de aprendizaje supervisado.
    • ¿Qué es la modelización supervisada?
    • Visión global de las etapas en el proceso de modelización
    • ¿Cómo realizar un análisis descriptivo?
    • ¿Qué es un valor missing? Imputación de missings, creación de nuevas variables y muestreo
    • ¿Qué hacer cuando el evento es raro?
    • Selección de algoritmos y métricas de validación
    • Curva ROC y área bajo la curva
  • ¡Empecemos con la práctica en Google Colab!
    • Parte I
    • Parte II
Tema 2: Clasificación con Naive Bayes

Resumen

En esta clase nos familiarizaremos con el algoritmo de aprendizaje supervisado de Naive Bayes. Para conocer los conceptos matemático - estadísticos que dan origen al algoritmo, se presentan conceptos tan importantes como Sensibilidad y Especificidad de una prueba diagnóstica. A partir del Teorema de Bayes, se formula una hipótesis que da origen al algoritmo de Naive Bayes. En función de la naturaleza de las variables explicativas, aprenderéis a escoger la familia correcta. Utilizando Scikit Learn de Python, deberéis ajustar vuestro propio algoritmo sobre un conjunto de datos real. Una vez ajustado, seréis capaces de medir la bondad del modelo a partir de la curva ROC y el área bajo la curva. Se evalúa la posibilidad de que el algoritmo esté sobreajustando.

Objetivos

  • Conocer e interpretar el significado de Sensibilidad y Especificidad de un test diagnóstico.
  • Conocer e interpretar el significado de Valor Predictivo Positivo y Valor Predictivo Negativo.
  • Comprender y saber utilizar el Teorema de Bayes.
  • Conocer los fundamentos del algoritmo de Naive Bayes.
  • Saber ajustar un algoritmo de Naive Bayes sobre un conjunto de datos real utilizando Scikit Learn de Python.
  • Saber medir la precisión del modelo a partir de la curva ROC, el área bajo la curva y la matriz de confusión utilizando Scikit Learn de Python.

Temario

  • Introducción al Teorema de Bayes
    • Conceptos fundamentales
    • Seguimos con el ejemplo
    • Profundizando en el teorema de Bayes
  • Naive Bayes
    • El algoritmo
    • Fortalezas, debilidades y casos de uso
  • ¡A practicar! Profundizamos en el análisis descriptivo. Ajustando el algoritmo de Naive Bayes
    • Introducción
    • Parte I
    • Parte II
Tema 3: Clasificación con Support Vector Machine (SVM)

Resumen

En esta clase veremos el algoritmo de aprendizaje supervisado de Support Vector Machine (SVM). Para conocer los conceptos matemático - estadísticos que dan origen al algoritmo, se presentan conceptos tan importantes como hiperplano de separación, margen y vectores soporte. Además, se explican los principales hiperparámetros del algoritmo y cuáles son las implicaciones de utilizar unos valores u otros. Utilizando Scikit Learn de Python, ajustaremos nuestro propio algoritmo sobre un conjunto de datos real. Una vez ajustado, es capaz de medir la bondad del modelo a partir de la curva ROC y el área bajo la curva. Se evalúa la posibilidad de que el algoritmo esté sobreajustando. Como fin de fiesta, se presenta la función Grid Search, la cual permite probar un gran número de modelos distintos escribiendo muy pocas líneas de código.

Objetivos

  • Conocer los fundamentos del algoritmo de SVM.
  • Saber ajustar un algoritmo de SVM sobre un conjunto de datos real utilizando Scikit Learn de Python.
  • Saber medir la precisión del modelo a partir de la curva ROC, el área bajo la curva y la matriz de confusión utilizando Scikit Learn de Python.
  • Aprender a utilizar la función Grid Search para probar distintas combinaciones de hiperparámetros de forma sencilla.

Temario

  • Fundamentos del SVM
    • Orígenes del algoritmo
    • Soft margin
    • Kernel
  • Scikit Learn y SVM
    • SVM en Scikit Learn
  • ¡Llegó la parte práctica con SVM!
    • Parte I - Entendiendo SVM en Scikit con un ejemplo
    • Parte II - Ajustando el algoritmo, validando con la curva ROC y el AUC
    • Parte III - Función Grid Search

Experto

Juan José Silva Torres

Data Director en Ymedia

Nuestros alumnos opinan

¿Por qué elegirnos?

Descubre lo que nos diferencia

95%Empleo

El 95% de nuestros alumnos está trabajando o emprende cuando finaliza sus estudios

Empleo
175kAlumnos

Somos la mayor comunidad de profesionales digitales del mundo

Comunidad
13Años

Expertos en formación online: más de 10 años liderando la innovación del elearning

Experiencia
95%Satisfacción

El 95% de nuestros alumnos consiguen mejorar su situación al finalizar sus estudios

Seguridad

Curso en Técnicas de aprendizaje supervisado: Modelos binarios

U$S 510

  • Big data & IA
Inicio: 27 Junio 2024
1 mes
Online
Ininterrumpido 24/7
Diploma de IEBS

Curso en Técnicas de aprendizaje supervisado: Modelos binarios

U$S 510