Curso ONLINE

Curso en Acciones de procesamiento de datos

Impartido por Rafael Zambrano López, Data Scientist en LaLiga
Inicio: 8 Febrero 2024
1 mes
4.8

Presentación del curso

En este Curso en Acciones de procesamiento de datos haremos una aproximación a diferentes alternativas de procesamiento de datos como la extracción de información de sitios web (web scraping), generación de conocimiento a partir de textos (text mining) y la visualización de datos como facilitador del descubrimiento de conclusiones y mejora en la toma de decisiones.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

En este Curso en Acciones de procesamiento de datos haremos una aproximación a diferentes alternativas de procesamiento de datos como la extracción de información de sitios web (web scraping), generación de conocimiento a partir de textos (text mining) y la visualización de datos como facilitador del descubrimiento de conclusiones y mejora en la toma de decisiones.

Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.

¿Qué aprenderás en este curso?

Al finalizar el Curso en Acciones de procesamiento de datos serás perfectamente capaz de:

  • Saber obtener y procesar datos semi-estructurados y no estructurados obtenidos mediante web scraping y minería de texto.
  • Ser capaz de visualizar e interpretar la información que subyace a datos de variada complejidad.

¿Para quién es este curso?

El Curso en Acciones de procesamiento de datos proporciona formación específicamente orientada a los siguientes perfiles:

  • Ingenieros que tengan por objetivo una actualización de sus conocimientos y el desarrollo de nuevas competencias dentro de la Inteligencia Artificial
  • Programadores que tengan por objetivo ampliar sus conocimientos y capacidades en el mundo de la ciencia de datos para su desarrollo profesional
  • Analistas de datos con experiencia que quieran dar el salto a los aspectos más profundos de la tecnología

Plan de estudios

El curso incluye:

  • 3 clases (1 mes)

  • 3 sprint semanales

  • Masterclass y/o tutorias

  • 1 proyecto

  • Diploma IEBS

  • Bolsa de empleo

Contenidos del curso:

  • Bienvenida y presentación
Tema 1: Web Scrapping

Resumen

El web scraping consiste en el proceso automatizado de extracción de datos de sitios web, simulando el proceso de navegación de un usuario.

Permite resolver la necesidad de recoger información cuando no disponemos de una API, esta no es gratuita o está limitada, o bien no permite extraer todos los datos requeridos.

Diferenciamos en web scraping (extracción de datos de una o varias webs) y web spider (recorre enlaces en la web).

Podemos implementar estos procesos de extracción de datos con aplicaciones como Octoparse, UiPath RPA, Data Miner y Librerías / frameworks como BeutifulSoup, Scrapy o Jauntium.

 

Objetivos

  • ¿Qué es el web scraping?
  • Conceptos básicos de su funcionamiento: HTML y Parsing
  • ¿Es legal utilizar estas técnicas?
  • Herramientas de implementación: Aplicaciones y Librerías / Frameworks
 

Temario

  • Web Scrapping
    • Introducción y conceptos básicos
    • Aspectos legales, necesidades y desafíos del Web Scrapping
  • Implementación del Web Scraping
    • Clasificación e Implementación: Octoparse & Data Miner
    • Práctica con Data Miner
    • Implementación: Ui Path RPA & Microsoft Excel
    • Implementación: Python (I)
    • Implementación: Python (II)
Tema 2: Text mining: limpieza texto, TF-Idf, wordcloud

Resumen

La minería de textos tiene como finalidad obtener información y conocimiento a partir de textos. La gran cantidad de datos disponibles se encuentran en formato texto (no estructurado). Existen dos categorías dentro del PLN: generación del lenguaje natural y comprensión del lenguaje natural. Podemos identificar modelos logicos basados en reglas o gramaticas, o bien modelos probabilisticos basados en el aprendizaje de los datos. Existen herramientas específicas como BRAT, NLTK o GATE que permiten analizar textos de manera especifica o bien emplear herramientas de propósito mas general como Power BI para identificar patrones en los textos.

 

Objetivos

  • Conocer en qué consiste la Minería de texto.
  • Entender su origen y su clasificación.
  • Conocer diferentes herramientas para obtener conocimiento a partir de textos.
 

Temario

  • Minería de textos
    • PLN y Minería de textos
    • Historia y Motivación
    • Procesamiento del Lenguaje Natural y Herramientas
  • Caso práctico con Power BI
    • Parte I
    • Parte II
    • Parte III
    • Parte IV
  • Métodos
    • WordCloud e Indicadores
Tema 3: Visualización de datos

Resumen

La visualización de datos permite comunicar ideas a una audiencia concreta en un contexto específico, para ello establecemos métricas y dimensiones en la información que nos permiten generar visualizaciones efectivas.

Es necesario tener en cuenta los tipos de variables disponibles para seleccionar la visualización óptima, así como maximizar el uso de las propiedades de visualización.

Existen diferentes herramientas que permiten visualizar datos: Microsoft Power BI, Looker, Tableau, Data Studio, etc.

 

Objetivos

  • ¿Por qué crear visualizaciones de datos?
  • Cuáles son los pasos a seguir para crear una visualización de datos efectiva.
  • ¿Qué tipos de visualizaciones existen?
  • ¿Cuáles son los factores clave de la visualización?
  • ¿Qué tipos de visualizaciones podemos emplear?
  • ¿Qué herramientas puedo utilizar?
 

Temario

  • Visualización de Datos
    • Introducción y pasos a seguir
    • Tipos de visualizaciones y Factores clave
    • Visualizaciones
    • Uso de Visualizaciones - recursos web
    • Formatos Cuantitativos y de Comparación, Relacionales y Geográficos
    • Propiedades visuales y herramientas de visualización
  • Creamos visualizaciones en Power BI
    • Parte I
    • Parte II
    • Parte III
  • Cierre
    • Conclusiones

Experto

Rafael Zambrano López

Data Scientist en LaLiga

Nuestros alumnos opinan

¿Por qué elegirnos?

Descubre lo que nos diferencia

95%Empleo

El 95% de nuestros alumnos está trabajando o emprende cuando finaliza sus estudios

Empleo
175kAlumnos

Somos la mayor comunidad de profesionales digitales del mundo

Comunidad
13Años

Expertos en formación online: más de 10 años liderando la innovación del elearning

Experiencia
95%Satisfacción

El 95% de nuestros alumnos consiguen mejorar su situación al finalizar sus estudios

Seguridad

Curso en Acciones de procesamiento de datos

U$S 510

  • Big data & IA
Inicio: 8 Febrero 2024
1 mes
Online
Ininterrumpido 24/7
Diploma de IEBS

Curso en Acciones de procesamiento de datos

U$S 510