Defensa Tesis Licenciatura Victoria Klimkowski
diciembre 15 @ 1:00 pm - 2:00 pm
Título: Ejes temporales locales en embeddings de LLMs: efectos del modelo, la granularidad y los límites de la extrapolación
Director: Esteban Feuerstein
Jurado: Andrés Farall, Federico Albanese
Resumen:
El análisis de la evolución de la información en grandes corpus de texto, como los artículos de noticias, presenta un desafío significativo en el procesamiento del lenguaje natural (PLN). Los \textit{embeddings}, son la herramienta estándar para capturar el significado textual, pero su naturaleza de «caja negra» y su alta dimensionalidad dificultan la interpretación de trayectorias temáticas o temporales. Esta tesis aborda un método para la proyección de embeddings en un espacio latente interpretable de baja dimensionalidad.
El método desarrollado se concibe como una extensión del método de Waller et al, adaptado para operar sobre espacios de embeddings en un dataset de noticias periodísticas. El objetivo es definir un eje temporal utilizando un conjunto de días «tempranos» y «tardíos» como semillas y proyectar nuevos días sobre este eje para analizar su posición relativa.
Los resultados demuestran de manera concluyente la viabilidad del método con sus limitaciones.
