En este Curso en Acciones de procesamiento de datos haremos una aproximación a diferentes alternativas de procesamiento de datos como la extracción de información de sitios web (web scraping), generación de conocimiento a partir de textos (text mining) y la visualización de datos como facilitador del descubrimiento de conclusiones y mejora en la toma de decisiones.
Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.
En este Curso en Acciones de procesamiento de datos haremos una aproximación a diferentes alternativas de procesamiento de datos como la extracción de información de sitios web (web scraping), generación de conocimiento a partir de textos (text mining) y la visualización de datos como facilitador del descubrimiento de conclusiones y mejora en la toma de decisiones.
Este curso forma parte del Master en Data Science y Big Data. Si quieres ampliar tu formación, consulta el programa completo.
El curso incluye:
Contenidos del curso:
El web scraping consiste en el proceso automatizado de extracción de datos de sitios web, simulando el proceso de navegación de un usuario.
Permite resolver la necesidad de recoger información cuando no disponemos de una API, esta no es gratuita o está limitada, o bien no permite extraer todos los datos requeridos.
Diferenciamos en web scraping (extracción de datos de una o varias webs) y web spider (recorre enlaces en la web).
Podemos implementar estos procesos de extracción de datos con aplicaciones como Octoparse, UiPath RPA, Data Miner y Librerías / frameworks como BeutifulSoup, Scrapy o Jauntium.
La minería de textos tiene como finalidad obtener información y conocimiento a partir de textos. La gran cantidad de datos disponibles se encuentran en formato texto (no estructurado). Existen dos categorías dentro del PLN: generación del lenguaje natural y comprensión del lenguaje natural. Podemos identificar modelos logicos basados en reglas o gramaticas, o bien modelos probabilisticos basados en el aprendizaje de los datos. Existen herramientas específicas como BRAT, NLTK o GATE que permiten analizar textos de manera especifica o bien emplear herramientas de propósito mas general como Power BI para identificar patrones en los textos.
La visualización de datos permite comunicar ideas a una audiencia concreta en un contexto específico, para ello establecemos métricas y dimensiones en la información que nos permiten generar visualizaciones efectivas.
Es necesario tener en cuenta los tipos de variables disponibles para seleccionar la visualización óptima, así como maximizar el uso de las propiedades de visualización.
Existen diferentes herramientas que permiten visualizar datos: Microsoft Power BI, Looker, Tableau, Data Studio, etc.
El 95% de nuestros alumnos está trabajando o emprende cuando finaliza sus estudios
Somos la mayor comunidad de profesionales digitales del mundo
Expertos en formación online: más de 10 años liderando la innovación del elearning
El 95% de nuestros alumnos consiguen mejorar su situación al finalizar sus estudios
Curso en Acciones de procesamiento de datos
Curso en Acciones de procesamiento de datos