
Defensa Tesis Licenciatura Juan Carlos Giudici
19 mayo, 2023 @ 4:00 pm - 5:00 pm
Título: Técnicas de adaptación de dominio en tareas de extracción de opiniones
Director: Juan Manuel Pérez
Jurado: Bruno Bianchi y María Vanina Martínez
Resumen:
En el campo del procesamiento de lenguaje natural (NLP, por sus siglas en inglés), existen distintas tareas dentro del área de extracción de opiniones: detección de emociones, detección de discurso de odio, ironía y clasificación de polaridad. Estas tareas se abordan típicamente mediante técnicas de aprendizaje supervisado utilizando conjuntos de datos específicos a cada tarea. En este trabajo exploramos la adaptación de dominio de modelos de lenguaje desde un dominio de origen enciclopédico, como la Wikipedia en español, hacia un dominio de textos sociales, como Twitter.
Proponemos una modificación de la técnica Universal Language Model Fine-tuning for Text Classification (ULMFit), agregando una nueva etapa de adaptación de dominio intermedio entre el dominio de Wikipedia y el dominio de las tareas de clasificación sobre textos no supervisados. Este dominio intermedio se enfoca en textos genéricos de redes sociales, con la esperanza de que esta etapa intermedia mejore los resultados de las tareas de clasificación.
Nuestros resultados muestran que algunas combinaciones que incluyen al dominio de las tareas de clasificación obtienen mejor desempeño que la aplicación del método según lo recomendado en la literatura. Además, en algunos casos, logramos recortar buena parte del rendimiento obtenido mediante el pre-entrenamiento de modelos de lenguaje sobre textos de redes sociales.
Palabras clave: Procesamiento de Lenguaje Natural, Adaptación de Dominio, Tareas de Clasificación, Extracción de Opiniones, ULMFiT.