Programa

MÓDULO 1 | Introducción al Análisis Computacional del Derecho (ACD). 
Temas en la investigación contemporánea, recursos utilizados, promesas y limitaciones del campo de estudio. Aportes para la justicia y el ejercicio profesional. El ACD como lectura a distancia. La herramienta: programación para abogadas/os. Operaciones programáticas básicas, especialmente orientadas al procesamiento de textos y la extracción de información: tipos y estructuras de datos, variables, librerías, funciones nominadas y anónimas (lambdas); control del flujo de la información: condicionales y bucles. 
Práctica I: Ejercitación básica en Python.

MÓDULO 2 | Adquisición, exploración y visualización de datos jurídicos.
Datos estructurados vs. no estructurados. Carga, exploración y manipulación de datos con Pandas: series y dataframes. Estadísticas descriptivas. Visualización de datos con matplotlib y seaborn: gráficos de barras, gráficos de cajas, histogramas, gráficos de líneas, series temporales y gráficos de dispersión. 
Práctica II: Visualización exploratoria de los datos jurisprudenciales.

MÓDULO 3 | El procesamiento del lenguaje natural (NLP) aplicado a textos jurídicos. 
Tokenización y normalización de textos con spaCy y NLTK (Natural Language Toolkit). Reconocimiento de entidades nominadas (NER) y extracción automática de información legal. Expresiones regulares para segmentación e identificación de patrones de texto en fallos y leyes.
Práctica III: Estudio sobre la perspectiva de género en una muestra de 22.000+ fallos judiciales.

MÓDULO 4 | Análisis automatizado de contenidos mediante inteligencia artificial (IA). 
Tareas de aprendizaje automatizado supervisado vs. no supervisado. Topic modelling: identificación automática de los temas presentes en un corpus de textos. Agrupamiento automático de instrumentos normativos según su materia. 
Práctica IV: Agrupamiento automatizado de los tratados internacionales de las Naciones Unidas de acuerdo con sus temas principales.

MÓDULO 5 | Predicción del sentido de las decisiones judiciales mediante IA. 
Algoritmos predictivos y jurisprudencia: Support-Vector Machines, Random Forests, XGBoost con scikit-learn. Construcción de la muestra: remuestreo, separación en conjuntos de entrenamiento y prueba: diferentes abordajes (train-test split vs. cross-validation). Entrenamiento del modelo y selección de hiperparámetros: GridSearch y RandomSearch. Evaluación cuantitativa de resultados: matriz de confusión, puntajes de exactitud, precisión y sensibilidad. Evaluación cualitativa: interpretación de variables informativas.
Práctica V: Predicción de decisiones de la Cámara Federal de Casación Penal.

MÓDULO 6 | Análisis de similitud textual en sentencias y leyes.
Similitud semántica y léxica. Representación vectorial de textos: los modelos one-hot encoding, bag-of-words, term frequency-inverse document frequency (TF-IDF) y word embeddings. Limitaciones para tareas de similitud y W-shingling. Visualización mediante mapas de calor. 
Práctica VI: Mapa de semejanza entre los códigos procesales provinciales y nacionales.