Esteban Feuerstein es Profesor Regular del Departamento de Computación (DC) e Investigador del Instituto de Ciencias de la Computación (ICC UBA-CONICET). Desde 2021 es Consultor en Ciencias de Datos de la AFIP. Durante nueve años se desempeñó en la Fundación Sadosky, ocupando los cargos de Director del Programa de Ciencia de Datos y Director Ejecutivo , entre otras responsabilidades. En cuanto a su formación es Licenciado en Informática de la Escuela Superior Latinoamericana de Informática (ESLAI) y Doctor en Informática de la Universidad de Roma «La Sapienza». Posee más de veinticinco años de experiencia como investigador y consultor en organizaciones públicas y privadas, en Argentina, Latinoamérica y Europa. Su área de especialización es en el campo de los algoritmos y estructuras de datos, búsqueda y organización de la información y ciencias de datos.
En esta entrevista con el DC, tratamos una diversidad de temas: Esteban nos comenta sobre su tarea actual en AFIP; sus temas de investigación relacionados con algoritmos y comunidades en redes sociales y, por último, detalla esta inusual experiencia docente de haber tenido que convertir la cursada presencial a virtual.
¿Cómo es tu rol actual en AFIP y cuáles son los desafíos de la tarea?
Actualmente estoy trabajando en la Dirección de Ciencia de Datos, que está cargo de Cecilia Ruz (profesora del DC a quien ustedes ya entrevistaron). Soy consultor técnico en una dirección nueva. Algunas de las misiones de esta dirección tienen que ver con el acceso a la información para que los estamentos decisorios del organismo puedan tomar decisiones basadas en datos, que accedan a buenos tableros de información, visualizando correctamente y a tiempo todas las métricas. Otra misión importante, que va en paralelo a lo anterior, consiste en la aplicación de modelos predictivos para esos datos: la ciencia de datos más pura aplicada a las necesidades del organismo con un uso más sofisticado e innovador de los datos para impuestos, aduana y seguridad social. En este caso, mi rol consiste en asesorar en el uso eficiente de la ciencia de datos para cumplir estos objetivos y también en la utilización de técnicas de grafos para modelar y visualizar la información de manera clara, correcta y útil.
En general, ¿qué cosas se pueden predecir en un organismo público tributario?
La toma de decisiones en políticas públicas debería basarse en datos (no en simples percepciones o intuiciones). Como cualquier organismo público requiere tener datos de la actividad económica (datos precisos y de calidad), ya sea para informar la recaudación periódica, una tarea que desde ya no es tan fácil porque un mismo índice se puede calcular de varias maneras distintas, por lo que es necesario uniformizar esos cálculos y si hay divergencias en la misma información tratar de ajustarla para que sea muy precisa, correcta y para entender cómo se calcularon esos índices. Al mismo tiempo, en un organismo de administración de ingresos públicos la idea de poder proyectar en el tiempo es clave así como también de planificar para mejorar la performance económica de la actividad. Se trata de utilizar modelos para proyectar escenarios posibles y además poder encontrar relaciones o patrones entre sujetos contribuyentes a los fines de entender datos significativos, por ejemplo de cumplimiento, fiscalización o fraude.
Más allá de tu labor en el sector público, sé que continuás con una línea de investigación en el ICC sobre Algoritmos y procesamiento de grafos masivos para el análisis de opiniones en redes sociales. ¿Podrías contar un poco sobre las problemáticas en las que están trabajando con tu grupo?
Ahora estamos investigando sobre redes sociales, grafos y el lenguaje que utilizan los usuarios para comunicarse. También sobre detección de comunidades, grupos y burbujas dentro de las redes sociales. Las principales técnicas que usamos son procesamiento del lenguaje natural, machine learning y análisis de grafos, sobre todo para redes sociales.
¿Qué redes sociales están analizando y bajo qué enfoque?
Tenemos varias publicaciones específicas del tema y estamos trabajando interdisciplinariamente con un sociólogo e investigador de la UNSAM que se llama Gabriel Kessler. Incluso recientemente publicamos un artículo en Revista Anfibia sobre la polarización de opiniones políticas en Twitter en Argentina y Estados Unidos. Desde el punto de vista sociológico, nuestra premisa es utilizar las técnicas que desarrollamos para redes sociales enfocadas en el análisis político. En este momento estamos analizando el lenguaje de la política, cómo se habla en cada una de las redes principales: Facebook, Twitter e Instagram. Teniendo en cuenta que aunque los tópicos sean similares, se habla muy distinto en cada red. En estos trabajos también participan mis alumnos Juan Manuel Ortiz de Zárate y Federico Albanese.
Además desarrollamos una herramienta para detectar comunidades en redes sociales y también aplicamos nuestro trabajo a algunos focus group reducidos a una cierta cantidad de personas, siempre analizando el lenguaje que utilizan para sacar conclusiones sobre sus posicionamientos absolutos y relativos con respecto a distintas temáticas. Por otro lado, estamos trabajando en una red social pública, basada en foros temáticos, que se llama Reddit. Es poco conocida en nuestro país pero está muy presente en Estados Unidos. Lo interesante es que en esa red se habla muchísimo, hay muchas discusiones que son extensas y los usuarios están auto segmentados por grupos de discusión construidos sobre una temática en particular y los perfiles sociodemográficos son muy variados. Estamos investigando el tema de la toxicidad, que es la generación de posts que pueden provocar que otros miembros de la comunidad se bajen de una discusión.
En el plano de la docencia, ¿cómo fue tu experiencia de dar clases virtuales como profesor de la materia Algoritmos y Estructuras de Datos II durante el aislamiento social por el COVID-19?
Durante el primer cuatrimestre de 2020 hicimos el enorme esfuerzo de grabar videos de todas las clases teóricas y prácticas, que realmente fueron muy valiosos para organizar la cursada y después fuimos reutilizando esos videos durante los cuatrimestres siguientes. Aplicamos un poco esto del “Aula invertida”: en lugar de dar la teórica o la clase magistral, nos encontrábamos en las salas a discutir, generar un ida y vuelta o contestar consultas sobre los contenidos de esas clases. Ese es el concepto, aunque nadie nos enseñó que eso se llama “aula invertida”; lo fuimos aprendiendo sobre la marcha.
Claro que varias cosas podrían haber sido distintas, si hubiéramos tenido más tiempo de planificar o anticipado que las clases iban a ser con esa modalidad. En mi caso fui aprendiendo a armar clases grabadas y editar videos con efectos, y creo que los últimos videos fueron saliendo mejores con la experiencia en el uso de las herramientas, más allá de que no son videos profesionales. Observo que de a poco estamos yendo hacia una modalidad híbrida donde estos recursos pueden complementar a las clases presenciales.
En cuanto a lo que son las consultas online, a mí me frustró un poco el tema de que haya tantas cámaras apagadas y que participen muy pocos de las consultas (algo que a veces también pasa en la presencialidad). Clase por clase lo hablamos. Entiendo que el motivo de no prender la cámara puede ser tan variado y tan entendible, pero de a poco nos fuimos acostumbrando a que la gente esté cursando en su casa (con familiares de fondo) o en un espacio público o que estén al mismo tiempo distraídos mirando otras pantallas. La clase teórica de Algo II suele durar entre 3 y 4 horas. Y esa clase se convirtió ahora en unos 8 videos de 12 minutos cada uno. Realmente es muy difícil que esta generación de alumnos (millennials) vuelva a la modalidad de teóricas con esta carga horaria presencial.
Por último, ¿qué materia estás dictando este primer cuatrimestre de 2022 y en qué modalidad?
Estoy dando la optativa “Redes, Sociedad y Economía” en forma presencial, donde vemos muchos de los temas de investigación que comenté antes, basados en redes, teoría de juegos y otras herramientas de modelado.
Si bien puedo decir que hay algunas ventajas de la virtualidad, claramente yo banco la presencialidad: me gusta verles la cara a los alumnos, que me repregunten y poder percibir si entienden o no, hacer las prácticas y resolver ejercicios. Pero especialmente para las teóricas, considero que el video es una herramienta muy valiosa, es barata y queda disponible (es evidente que los contenidos se explican tan bien como en la clase presencial). Tenemos por delante un permanente aprendizaje sobre cómo hacer más efectivas las clases y que los estudiantes en general participen cada vez más.