Contenidos


Introducción a la Ciencia de Datos - modalidad online

El curso tiene por objetivo incorporar técnicas de análisis y visualización de datos. Para ello se dictará con una doble dinámica de instrucción formal por parte del profesor y de práctica asistida. Los alumnos tendrán la posibilidad de trabajar con datos concretos y con preguntas guiadas para aplicar los conocimientos impartidos durante las clases teóricas. Se brindarán funciones simplificadas en R para que la adaptación sea más simple y se proporcionará material auxiliar de consulta.

Clase 1 | Ciencia de datos

¿Qué entendemos por Ciencia de Datos? Componentes de un proyecto típico de Ciencia de Datos. Casos de estudio. Introducción al lenguaje de programación R y el entorno de desarrollo en RStudio.

Clase 2 | Análisis exploratorio y transformación de datos

Introducción a los paquetes que componen tidyverse. Técnicas de Data Wrangling para poner en forma los datos. Análisis exploratorio de datos.

Clase 3 | Estableciendo relaciones entre variables

Estimación e interpretación de regresiones en R. Relaciones enmascaradas, multicolinealidad y otros peligros. ¿Cuándo podemos establecer una interpretación causal y cuando no?

Clase 4 | Machine learning

¿A qué llamamos Machine learning? Navegando las aguas del overfitting y el underfitting. Entrenamiento de modelos de árboles en R: árboles de decisión, random forests y eXtreme Gradient Boosting (XGB)

Clase 5 | Visualizaciones

Práctica de comunicación de resultados a través de visualizaciones basadas en ggplot. Tipos de gráficos y su objetivo.

 

Ciencia de Datos para Ciudades - modalidad online

El curso tiene por objetivo incorporar técnicas de análisis y visualización de datos con aplicaciones a temáticas urbanas. Para ello se dictará con una doble dinámica de instrucción formal por parte del profesor y de práctica asistida. Los alumnos tendrán la posibilidad de trabajar con datos concretos y con preguntas guiadas para aplicar los conocimientos impartidos durante las clases teóricas. Se brindarán funciones simplificadas en R para que la adaptación sea más simple y se proporcionará material auxiliar de consulta.

Clase 1 | Ciencia de datos y las ciudades

¿Qué ofrece la Ciencia de Datos al análisis de las ciudades? Casos de estudio. Smart Cities y Big Data. Introducción a R. Entorno de desarrollo en RStudio. Breve repaso del contenido del curso Introducción a la Ciencia de Datos

Clase 2 | ¿Qué son los datos espaciales?

Dimensión espacial de los datos ¿Cuál es su especificidad? Sistemas de coordenadas. Vectores y rasters. Operaciones espaciales. Uso de Simple Features en R.

Clase 3 | Análisis exploratorio y transformación de datos espaciales

Matriz de pesos espaciales, autocorrelación espacial y análisis de clustering.

Clase 4 | Visualización de datos espaciales

Creación de mapas temáticos y visualizaciones en diversos paquetes de R: ggplot y tmap. Visualización dinámica de datos espaciales.

Clase 5 | Análisis espacial de datos

Introducción a la estimación de modelos de machine learning para predecir el precio de las inmuebles: árboles de decisión, random forests y XGB. Overfitting y underfitting.

 

Ciencia de Datos Aplicada - modalidad online

En 5 sesiones se cubrirán temas avanzados de ciencia de datos aplicada como los siguientes:

  • Scraping. ¿Cómo obtener datos desde internet? Introducción básica a la estructura de las páginas web. Programación de scrapers, cómo almacenar los datos y cómo consultarlos.
  • Análisis de texto: introducción al procesamiento y análisis de textos. Ejemplo con noticias de distintos medios de comunicación nacionales. Aplicación a la medición del conflicto laboral en base a noticias de medios masivos.
  • Análisis de redes. Concepto de una red y análisis de su estructura. Diversas aplicaciones vinculadas con las ciencias sociales. Aplicación al análisis de las transiciones laborales de Argentina.
  • Shiny. Cómo diseñar aplicaciones interactivas de manera rápida utilizando R. Publicación de aplicaciones.