En los medios
30/11/22
La Nobel de la estadística
Andrea Rotnitzky, profesora de la Licenciatura en Economía y las Maestrías en Economía y Econometría, fue entrevistada por la revista Information Technology sobre la investigación que la llevó a ganar el Rousseeuw Prize for Statistics, que otorga la Fundación del Rey Balduino de Bélgica.
Hasta hace un puñado de semanas, Andrea Rotnitzky —doctora en estadística y egresada de la UBA— era “apenas” profesora plenaria del Departamento de Economía de la Universidad Di Tella, profesora adjunta de la Universidad de Harvard en los Estados Unidos, e investigadora principal del Conicet. Su bio incluía decenas de papers e investigaciones originales, publicadas en revistas científicas de alto prestigio e impacto internacional. Pero ahora, como si aquellos pergaminos no fueran más que suficientes, acaba de recibir el prestigiosísimo “Rousseeuw Prize for Statistics”, que otorga la Fundación del Rey Balduino de Bélgica. Este premio, si bien no está relacionado con la academia sueca, en el mundillo académico recibe el apodo del “Nobel de la Estadística” debido al mérito que acarrea. Y, como su inspirador, además del prestigio también divide casi US$ 1 millón entre los ganadores.
Infotechnology entrevistó a Rotnitzky en su estudio unos días antes de que partiera a Bruselas para recibir esta distinción que comparte con otros cuatro colegas. Los cinco son considerados, en las últimas décadas, figuras centrales de una nueva rama de esta especialidad, la inferencia causal.
¿Qué hace un estadístico en su vida laboral?
El espectro es enorme. Es como en medicina donde hay diferentes subespecialidades. Yo soy estadística-matemática y me dedico a tratar de diseñar las mejores estrategias para recoger datos, para que sean informativos y los métodos más apropiados para analizarlos, de manera que nos permitan hacer interpretaciones confiables. Así, a nosotros pueden consultarnos por un problema en particular o también podemos tratar de entender las estructuras de problemas generales y avanzar en desarrollos teóricos que luego pueden utilizarse para encontrar soluciones puntuales. Pero, en general, la estadística usa la matemática como herramienta para algún fin concreto.
¿La estadística es una disciplina ya madura?
Si y no. Es cierto que tiene muchos siglos, pero está en continua evolución y revolución. En las últimas tres décadas surgieron en paralelo dos subdisciplinas que provocaron verdaderas revoluciones en estadística: la ciencia de datos y la inferencia causal. La ciencia de datos estudia algoritmos para hacer clasificaciones y predicciones en base a grandes bases de datos, mientras que la inferencia causal nos ayuda a razonar con datos para tomar las mejores decisiones sobre intervenciones, tratamientos médicos, políticas públicas, exposiciones a agentes potencialmente tóxicos. Por ejemplo, en medicina la inferencia causal nos ayuda a razonar correctamente cuando queremos analizar datos “observacionales” que obtenemos de los registros médicos, para decidir cuales son las mejores estrategias personalizadas para tratar a un paciente con alguna enfermedad crónica, a lo largo del tiempo. Idealmente una quisiera estudiar las distintas estrategias en un ensayo clínico, pero esto es imposible en la práctica. Por eso es fundamental aprender a analizar correctamente datos observacionales. Esto es clave, por ejemplo, para saber si dar cierta medicación ayuda, o no, a los pacientes que sufren una enfermedad compleja, que puede evolucionar a lo largo del tiempo y del propio tratamiento.
¿En qué consiste la innovación estadística que reconoció el premio que recibió?
Hay tres científicos: Robins, Rubin y Pearl que — desde fines de los años 70 y principio de los 80— impulsaron una verdadera revolución en la estadística, cada uno desde un campo distinto de la ciencia. De hecho, uno de estos investigadores, Robins, es médico y ni siquiera se formó como estadístico en la universidad. Yo me sumé a desarrollar esas ideas al poco tiempo de recibirme, cuando eran todavía bastante incipientes.. Podría decirse que estos “padres fundadores” desarrollaron una nueva metodología que le dio rigor y formalismo a nociones sobre causa-efecto que eran, hasta ese momento, muy superficiales. Así fue naciendo este campo que hoy se conoce como “inferencia causal” y que tiene aplicaciones en muchos campos, y en particular, es central en la investigación médica y de salud pública.
¿Cuál era la falla teórica que había antes?
Si bien todo el mundo sabe que una correlación entre dos variables no implica que una cause a la otra , lo cierto es que había que definir bien lo contrario, ¿cuándo sí podemos decir con alguna certeza y formalidad que una situación provoca una consecuencia concreta? Robins desarrolló grandes ideas en este campo y los demás premiados fuimos siguiendo sus pasos y completando conceptos, casi como “actores de reparto”. Su gran aporte fue descifrar un problema importantísimo, hasta entonces irresuelto, para poder estimar los efectos de tratamientos cambiantes en el tiempo: como incorporar en el análisis estadístico variables que son simultáneamente intermedias en el camino causal entre los tratamientos que las preceden y la respuesta, y a la vez son confusoras, o sea causas comunes, de los tratamientos posteriores y la respuesta. Por ejemplo, los pacientes que no responden bien a un cierto tratamiento inicial son los que tienen más tendencia a ser cambiados de tratamiento por sus médicos, entonces la respuesta al tratamiento inicial es a la vez, una variable en el camino causal entre este tratamiento y la respuesta final al cabo de un cierto tiempo, y a la vez es una variable confusora entre el siguiente tratamiento al que es asignado y la respuesta final. Para sacar conclusiones médicas válidas, es fundamental incorporar estas variables en el análisis correctamente.
¿Y eso qué consecuencias trajo?
Muchas, porque estas ideas ya se adoptaron en la investigación médica y hoy se usan estos análisis para determinar si una estrategia de tratamiento para una enfermedad compleja (un cáncer, por ejemplo) sirve o no. Incluso también pueden usarse para comparar mejor si una estrategia de vacunas o de medicamentos antivirales en el Covid, resultan más efectivos que otros ya que ahora podemos analizar los estudios epidemiológicos de forma más razonada y adecuada que años atrás.
¿El análisis estadístico puede caer en las famosas “grietas”?
(Risas). No sé si en grietas pero sí sé que partiendo un mismo “set” de datos se puede llegar a conclusiones completamente diferentes, según el modelo de análisis que proponga cada investigador. De alguna manera podría decirse que la estadística no es necesariamente matemática y muchas veces los resultados dependen del contexto del que se parte. En la “buena” estadística es clave que el científico explique su modelo, o sea las suposiciones de donde parte para hacer su análisis. Y determinar si dichas suposiciones tienen un correlato con la realidad. En definitiva, la estadística hace interpretaciones y eso implica una cierta subjetividad, sentido común, honestidad intelectual, etcétera. Si algo de eso falta, los resultados seguramente cambien.
¿Se aplica la estadística en otros campos?
¡Se aplica en todas partes, no hay desempleo en nuestra profesión! De hecho, todas las grandes empresas en el mundo desarrollado, especialmente las tecnológicas, tienen equipos de estadísticos trabajando para tomar las mejores decisiones en forma cotidiana. Pero no es algo que sólo sirve en multinacionales: cualquier compañía mediana que quiera hacer opciones de negocios fundadas debería recurrir al aporte estadístico para minimizar sesgos y elegir bien. Y también el Estado debe sumarlo: la verdad es que cualquier organización necesita apoyarse en la evidencia para evitar errores y maximizar las estrategias que mejoren sus beneficios.
Infotechnology entrevistó a Rotnitzky en su estudio unos días antes de que partiera a Bruselas para recibir esta distinción que comparte con otros cuatro colegas. Los cinco son considerados, en las últimas décadas, figuras centrales de una nueva rama de esta especialidad, la inferencia causal.
¿Qué hace un estadístico en su vida laboral?
El espectro es enorme. Es como en medicina donde hay diferentes subespecialidades. Yo soy estadística-matemática y me dedico a tratar de diseñar las mejores estrategias para recoger datos, para que sean informativos y los métodos más apropiados para analizarlos, de manera que nos permitan hacer interpretaciones confiables. Así, a nosotros pueden consultarnos por un problema en particular o también podemos tratar de entender las estructuras de problemas generales y avanzar en desarrollos teóricos que luego pueden utilizarse para encontrar soluciones puntuales. Pero, en general, la estadística usa la matemática como herramienta para algún fin concreto.
¿La estadística es una disciplina ya madura?
Si y no. Es cierto que tiene muchos siglos, pero está en continua evolución y revolución. En las últimas tres décadas surgieron en paralelo dos subdisciplinas que provocaron verdaderas revoluciones en estadística: la ciencia de datos y la inferencia causal. La ciencia de datos estudia algoritmos para hacer clasificaciones y predicciones en base a grandes bases de datos, mientras que la inferencia causal nos ayuda a razonar con datos para tomar las mejores decisiones sobre intervenciones, tratamientos médicos, políticas públicas, exposiciones a agentes potencialmente tóxicos. Por ejemplo, en medicina la inferencia causal nos ayuda a razonar correctamente cuando queremos analizar datos “observacionales” que obtenemos de los registros médicos, para decidir cuales son las mejores estrategias personalizadas para tratar a un paciente con alguna enfermedad crónica, a lo largo del tiempo. Idealmente una quisiera estudiar las distintas estrategias en un ensayo clínico, pero esto es imposible en la práctica. Por eso es fundamental aprender a analizar correctamente datos observacionales. Esto es clave, por ejemplo, para saber si dar cierta medicación ayuda, o no, a los pacientes que sufren una enfermedad compleja, que puede evolucionar a lo largo del tiempo y del propio tratamiento.
¿En qué consiste la innovación estadística que reconoció el premio que recibió?
Hay tres científicos: Robins, Rubin y Pearl que — desde fines de los años 70 y principio de los 80— impulsaron una verdadera revolución en la estadística, cada uno desde un campo distinto de la ciencia. De hecho, uno de estos investigadores, Robins, es médico y ni siquiera se formó como estadístico en la universidad. Yo me sumé a desarrollar esas ideas al poco tiempo de recibirme, cuando eran todavía bastante incipientes.. Podría decirse que estos “padres fundadores” desarrollaron una nueva metodología que le dio rigor y formalismo a nociones sobre causa-efecto que eran, hasta ese momento, muy superficiales. Así fue naciendo este campo que hoy se conoce como “inferencia causal” y que tiene aplicaciones en muchos campos, y en particular, es central en la investigación médica y de salud pública.
¿Cuál era la falla teórica que había antes?
Si bien todo el mundo sabe que una correlación entre dos variables no implica que una cause a la otra , lo cierto es que había que definir bien lo contrario, ¿cuándo sí podemos decir con alguna certeza y formalidad que una situación provoca una consecuencia concreta? Robins desarrolló grandes ideas en este campo y los demás premiados fuimos siguiendo sus pasos y completando conceptos, casi como “actores de reparto”. Su gran aporte fue descifrar un problema importantísimo, hasta entonces irresuelto, para poder estimar los efectos de tratamientos cambiantes en el tiempo: como incorporar en el análisis estadístico variables que son simultáneamente intermedias en el camino causal entre los tratamientos que las preceden y la respuesta, y a la vez son confusoras, o sea causas comunes, de los tratamientos posteriores y la respuesta. Por ejemplo, los pacientes que no responden bien a un cierto tratamiento inicial son los que tienen más tendencia a ser cambiados de tratamiento por sus médicos, entonces la respuesta al tratamiento inicial es a la vez, una variable en el camino causal entre este tratamiento y la respuesta final al cabo de un cierto tiempo, y a la vez es una variable confusora entre el siguiente tratamiento al que es asignado y la respuesta final. Para sacar conclusiones médicas válidas, es fundamental incorporar estas variables en el análisis correctamente.
¿Y eso qué consecuencias trajo?
Muchas, porque estas ideas ya se adoptaron en la investigación médica y hoy se usan estos análisis para determinar si una estrategia de tratamiento para una enfermedad compleja (un cáncer, por ejemplo) sirve o no. Incluso también pueden usarse para comparar mejor si una estrategia de vacunas o de medicamentos antivirales en el Covid, resultan más efectivos que otros ya que ahora podemos analizar los estudios epidemiológicos de forma más razonada y adecuada que años atrás.
¿El análisis estadístico puede caer en las famosas “grietas”?
(Risas). No sé si en grietas pero sí sé que partiendo un mismo “set” de datos se puede llegar a conclusiones completamente diferentes, según el modelo de análisis que proponga cada investigador. De alguna manera podría decirse que la estadística no es necesariamente matemática y muchas veces los resultados dependen del contexto del que se parte. En la “buena” estadística es clave que el científico explique su modelo, o sea las suposiciones de donde parte para hacer su análisis. Y determinar si dichas suposiciones tienen un correlato con la realidad. En definitiva, la estadística hace interpretaciones y eso implica una cierta subjetividad, sentido común, honestidad intelectual, etcétera. Si algo de eso falta, los resultados seguramente cambien.
¿Se aplica la estadística en otros campos?
¡Se aplica en todas partes, no hay desempleo en nuestra profesión! De hecho, todas las grandes empresas en el mundo desarrollado, especialmente las tecnológicas, tienen equipos de estadísticos trabajando para tomar las mejores decisiones en forma cotidiana. Pero no es algo que sólo sirve en multinacionales: cualquier compañía mediana que quiera hacer opciones de negocios fundadas debería recurrir al aporte estadístico para minimizar sesgos y elegir bien. Y también el Estado debe sumarlo: la verdad es que cualquier organización necesita apoyarse en la evidencia para evitar errores y maximizar las estrategias que mejoren sus beneficios.