Contenidos

En 5 sesiones se cubrirán temas avanzados de ciencia de datos aplicada como los siguientes:

  1. Scraping: ¿Cómo obtener datos desde internet? Introducción básica a la estructura de las páginas web. Programación de scrapers, cómo almacenar los datos y cómo consultarlos.
  2. Análisis de texto: introducción al procesamiento y análisis de textos. Ejemplo con noticias de distintos medios de comunicación. Aplicación a la medición del conflicto social en base a noticias de medios masivos.
  3. Aprendizaje Automático: Introducción a las técnicas de aprendizaje automático.  Aprendizaje supervisado: regresión y clasificación. Aprendizaje no supervisado: agrupamiento y reducción de la dimensionalidad. Sobreajuste y métricas de evaluación de modelos. Casos de implementación.
  4. ShinyCómo diseñar aplicaciones interactivas de manera rápida utilizando R. Consideraciones del alojamiento de datos y rendimiento para aplicaciones web. Publicación de aplicaciones.


Bibliografía de consulta

General:  R for data science: Import, tidy, transform, visualize, and model data.  -  Wickham, H., & Grolemund, G. (En español en https://es.r4ds.hadley.nz/ )
1) Web Scraping  - Steve Pittard (https://steviep42.github.io/webscraping/book/)
2) Text Mining with R – Silge y Robinson (https://www.tidytextmining.com/)
3)  An introduction to statistical learning -  James, G., Witten, D., Hastie, T., & Tibshirani, R.  (https://hastie.su.domains/ISLR2/ISLRv2_website.pdf)
4) Mastering Shiny – Hadley Wickham (https://mastering-shiny.org/)


Este curso forma parte de la oferta académica de la Diplomatura en Ciudades y Políticas Urbanas y de la Diplomatura en Uso de Datos y Evidencia para Políticas Públicas.