En esta interesante entrevista, Rodrigo Laje -flamante profesor del DC- nos cuenta de qué tratará la materia Estadística Computacional, que dictará por primera vez en el segundo cuatrimestre de este año, y cómo sus investigaciones sobre neurociencia y modelado del comportamiento humano se conectan con herramientas de la estadística.
Rodrigo Laje es profesor del DC, recientemente designado para dictar la materia “Estadística Computacional” del nuevo plan de estudios de la carrera de Computación. En cuanto a su formación es doctor en física, egresado de Exactas-UBA. Actualmente es Investigador del CONICET en el área de neurociencias y docente en la Universidad Nacional de Quilmes. Es autor de destacados libros de divulgación científica. Fue docente en la Diplomatura en Enseñanza de las Ciencias de FLACSO e integra la ONG Expedición Ciencia, dedicada a organizar campamentos y otras actividades científicas para estudiantes y docentes.
Para conocer los pormenores de la materia Estadística Computacional y sus investigaciones sobre neurociencia y modelado del comportamiento, conversamos en detalle con Rodrigo.
¿Cómo surgió la posibilidad de dictar Estadística Computacional y cuáles son tus primeras sensaciones sobre este nuevo rol que te toca asumir?
La materia es nueva en el Plan 2023, del tercer año de la Licenciatura en Ciencias de la Computación y se va a dictar en el segundo cuatrimestre de este año. En el equipo docente de esta materia están Bruno Bianchi, Pablo Turjanski, Pablo Riera y Tobias Carreira Munich. Me parece un equipazo el que me tocó para armar e implementar el dictado de esa materia, que es la primera vez que se va a dar, porque los cursantes todavía no llegaron a esa instancia.
Cuando concursé el cargo que tengo ahora, un cargo interino por tres años, ya venía con la tarea de liderar el armado de los contenidos fundamentales para esta materia. Será una asignatura un poco más que introductoria, porque esperamos construir modelos estadísticos interesantes. La idea directriz que estoy proponiendo para armar los contenidos de esta materia, es que aquellos estudiantes que la cursen terminen sabiendo aplicar y discutir “inferencia estadística”. Es decir, en base a una muestra o un conjunto de datos medidos, poder inferir parámetros de la población subyacente. Y las actividades van a estar formuladas con esa premisa.
Ahora estamos relevando en los grupos de investigación dentro del DC/ICC qué tipos de modelos y qué tipos de datos se usan, para poder contar con ejemplos concretos.
Esta tarea me parece muy placentera para mí y me parece una oportunidad genial porque la estadística es una de las herramientas que uso cotidianamente.
¿Cómo es ese fuerte vínculo que tenés con la estadística y qué valor creés que adquiere actualmente para la computación?
En mi caso soy físico de formación pero realmente lo que hago ahora no es física sino ciencias cognitivas y neurociencias, hago modelado matemático y experimentos. Y en los experimentos, por ejemplo, tuve que usar un montón de estadística para poderle creer a mis resultados, es decir, confiar en mis propios resultados.
Porque cuando uno mide un sistema ruidoso no alcanza con medirlo una sola vez y cualquier repetición del experimento te va a dar otro valor. El hecho de determinar cuántas veces tenés que medir, cómo mostrás la confianza en el resultado que acabas de medir, cuán similar es ese valor al anterior, son todos temas de estadística donde no estoy mencionando la terminología técnica (la terminología es intervalo de confianza, determinación del tamaño de la muestra basado en potencia estadística, etc.).
En cuanto a lo que es computación, el testeo de hipótesis se hace poco e inclusive en algunas áreas que desarrollan trabajos para muchas revistas, como Machine Learning, hay trabajos que muestran una cierta mejora para un modelo grande de lenguaje o lo que fuera y que evidencian un incremento en la performance. Por ejemplo, cuantificado por la F1 del 88% al 89%. Pero si usás otros datos, o usás otras simulaciones, o elegís otra semilla para tu generador de números pseudoaleatorios, ¿te da 89% o 88,1% u 87,9%?
Entonces ese análisis estadístico en muchos papers estaba completamente ausente. Y es una discusión que viene dándose hace años en otras áreas, por ejemplo en ciencias cognitivas, que es el área donde estoy actualmente. Y a esta altura es imposible no pensar en obtener un resultado sin un intervalo de incerteza o sin un análisis de potencia estadística para saber cuántas repeticiones es necesario hacer para expresar con confianza nuestro resultado, el valor final del experimento. Ahora esto es mucho más trabajo para los investigadores y se necesitan muchos más datos que antes.
En definitiva, queremos saber cuán variables son los resultados y qué pasa si repetís el experimento, si te da exactamente lo mismo o cuánto difiere el valor del resultado.
Si bien en otras áreas ya estaba dando vueltas esta discusión, en algunas áreas apenas está empezando: se empieza a ver análisis estadísticos en papers de Machine Learning. Y muchos grupos de investigación del DC/ICC usan estas herramientas propias de la estadística, muy bien aplicadas, pero creo que esto recién se aprende en el doctorado, no en la carrera de grado.
Por eso considero que será muy bueno tener una estadística computacional en la carrera, donde se puedan profundizar un poco estos temas, va a ser más que una introducción y se va a dar a nivel de grado, no de doctorado.
Gran parte de tu interés se centra en investigar cómo el cerebro humano procesa el tiempo, ¿podrías contar sobre esos proyectos de investigación en particular?
Desde mi doctorado el modelado de problemas me resulta muy natural, en este paso a preguntas más orientadas a la neurociencia o ciencias cognitivas. En mi caso me independicé en la investigación de un tema particular: cómo hacemos para sincronizarnos con un estímulo periódico, como por ejemplo la música. Empezó siendo un juego en una práctica especial de Laboratorio 1, donde yo era JTP, en la carrera de Física. Entonces escribí un mini código y me empezó a interesar el hecho de que había todo un espacio para estudiar el comportamiento y más en el área de neurociencia.
Empecé a ver por qué me gusta mucho hacer modelados matemáticos que predigan comportamientos no medidos, que había muchos modelos pero eran todos lineales. Se usaban para representar justamente cómo hacemos para sincronizarnos a un estímulo periódico donde uno pone el dedo y va siguiendo una secuencia rítmica (golpeando con el dedo mantenemos una sincronía y en ese caso no es una tarea de tiempo de reacción, no estás reaccionado al “bip” sino que estás anticipando un gesto motor para caer junto con el bip, movemos el dedo antes de que ocurra el sonido).
El tema es que se entiende poco sobre cómo hacemos esa sincronización. Y trabajando con los datos encontré una necesidad clara de que el modelo sea no lineal y de modelar el comportamiento matemáticamente.
De ese modo empecé a consolidar un tema grande de investigación: cómo el cerebro procesa el tiempo. En particular, en esta escala de centenas de milisegundos hago trabajo tanto experimental como teórico. Mido el gesto humano y escribo modelos matemáticos, tanto a nivel de comportamiento como a nivel de actividad nerviosa central. Mido las respuestas del dedo y modelo eso matemáticamente y miro la actividad del sistema nervioso central, por ejemplo con electroencefalografías y hago modelos matemáticos con esas combinaciones: teórico y experimental, comportamiento y nervioso central. Depende un poco del paper, algunos son puramente teóricos, otros son experimentales y otros son mixtos. Por ejemplo, uno de mis últimos papers tiene un modelo estadístico bastante complicado que era necesario para representar correctamente el diseño experimental que teniamos.
Los experimentos son no invasivos, una persona se siente frente a una computadora con auriculares puestos y en el experimento más simple, por ejemplo, tiene que sincronizarse al estímulo periódico que está escuchando y le hago perturbaciones el período, para ver cómo reacciona la persona.
¿Qué resultados principales se pueden comentar?
Cuando un sujeto está sincronizado y se le hace una perturbación, por ejemplo un cambio de tempo (es decir un ritmo más rápido o más lento), la persona tiene que tratar de mantenerse o re-sincronizarse en ese golpeteo. Parece bastante diferente si te aumentan el tempo o si te disminuyen el tempo, es asimétrica la respuesta por más que esa perturbación sea simétrica.
Tradicionalmente en la literatura del área lo que hacían era ajustar un modelo a la perturbación positiva y otro a la perturbación negativa. Ya que con el mismo modelo era imposible de ajustar, porque era asimétrico. Pero cuando lo ves un poco más de lejos, te planteás si la perturbación que se le está proponiendo a la persona es inesperada, ya que justamente no querés que se anticipe. Se resincroniza sin saber cuándo va a ocurrir una perturbación, si le vas a subir el tempo o bajárselo.
Lo primero que uno piensa parsimoniosamente es que hay un mecanismo a cargo de esa sincronización o resincronización, un mecanismo presente en alguna parte de la cabeza o compartido entre áreas que se encarga de resincronizar, sea lo que sea. Y la persona no tiene forma de cambiar anticipadamente de acuerdo a si los signos son de una perturbación negativa o positiva.
Lo que hicimos nosotros fue proponer un modelo que forzosamente tiene que ser no líneal, porque vendría a ser asimétrica la respuesta. Al mismo tiempo, mostramos que es necesaria la no linealidad en estos problemas, que es intrínseca del mecanismo de corrección y también proponemos un modelo único, unificador, para todos los signos positivos y negativos de perturbación.
Acá se puede entender esa variedad divergente de comportamientos, como el resultado de funcionamiento de un único mecanismo dentro del cerebro, que está probado que es asimétrico, y que el cerebro procesa el tiempo en varios rangos diferentes, lo cual depende de un montón de factores, que incluso pueden ser emocionales y anímicos.
Del lado de la física uno siempre tiende a proponer el mecanismo único subyacente a la aparente diversidad de resultados. Y en la biología normalmente se enfatiza en la diversidad de resultados. Y es cierto que existe esa diversidad pero a veces podés explicarla como la diversidad de un único mecanismo. Teniendo esa idea de cómo podría funcionar el mecanismo, vas y hacés un experimento específico para probarla.
En definitiva, si en el experimento vas encontrando esa diferencia de comportamiento entonces está funcionando bien el sistema sino realmente hay que hacer la corrección a la idea previa que tenías.
Por último, tu producción en divulgación científica y en enseñanza de la ciencia es muy reconocida. ¿Cómo fue ese acercamiento que no siempre es habitual para quienes hacen ciencia?
La divulgación es una parte de mi desarrollo profesional que me encanta, tanto en comunicación pública de la ciencia como en investigación en enseñanza de la ciencia, incluso con instancia no formales como estos campamentos científicos organizados en todo el país por “Expedición Ciencia”, una ONG sin fines de lucro a la que pertenezco hace muchos años. Allí fui presidente hasta hace un año, ocupé ese cargo durante diez años y sigo perteneciendo a esa organización, que ya tiene casi 22 años de vida. Es una institución increíble que fue creciendo mucho y se fue profesionalizando.
Nos dedicamos a propagar el gusto por el pensamiento científico y la vida en la naturaleza, al aire libre, con herramientas de enseñanza y de comunicación pública de la ciencia que son muy placenteras, porque te enfocás en los conceptos y no en la terminología, te enfocás en el cómo de la ciencia, más que en el qué, porque los resultados tienen mucho más sentido si entendés cómo se logran.
Un ejemplo, en una típica clase de electricidad electroestática, la primera clase con pizarrón, hay dos cargas eléctricas, positiva y negativa, las cargas iguales se repelen entre sí, las diferentes se atraen entre sí. Y una clase que empieza así, dependiendo del nivel, te impide la existencia de que haya una tercera carga. Cuando el universo no lo impide. ¿Cómo nos damos cuenta de que hay sólo dos cargas? Nos dimos cuenta armando el rompecabezas de todas las atracciones y repulsiones, generamos ese resultado para llegar a la conclusión de que hay solamente dos. Nos dimos cuenta de que hay dos, por eso las llamamos positiva y negativa, pero podríamos haberle puesto A y B o azul y roja, porque llamar a esas cargas de otra forma no te impide eventualmente la existencia de una tercera carga, no te limita en el entendimiento. En cambio, positiva y negativa, esa terminología de entrada ya te limita en el entendimiento. Con lo cual es mucho más productivo saber cómo hicimos para darnos cuenta de ese resultado que la terminología específica, porque armamos el rompecabezas de las atracciones y las repulsiones.
Esto que resumí es el tipo de actividades que proponemos en Expedición Ciencia. Trabajar con los fenómenos o con las ideas, sin terminología, y una de las actividades usuales que tenemos son los campamentos científicos para adolescentes, que son intensivos e inmersivos, con la presencia de coordinadores entre los cuales hay científicos y científicas, docentes, estudiantes de ciencia y profesores de educación física. Y también estamos sumando actividades más acotadas, como el encuentro “Caminando con cientifiques”, en la reserva ecológica de Costanera Sur. Y versiones del campamento más chicas y más locales.
La verdad que Expedición Ciencia me dio lugar para crecer en el entendimiento de la ciencia, de cómo resuelve problemas la ciencia. Creo que me hago mejores preguntas después de haber pasado por Expedición Ciencia, porque es muy lúdico y llega a un público clave al que nos interesa acercar a la ciencia, el de adolescentes de escuelas.