Defensa Tesis Licenciatura Maximiliano Neustadt
Título: "Modelos de sentimiento no dependientes de dominio en español". Director: José M. Castaño
| Qué |
|
|---|---|
| Cuándo |
01/06/2011 de 12:00 pm a 01:00 pm |
| Dónde | Aula 13 |
| Agregar evento al calendario |
|
- Título: "Modelos de sentimiento no dependientes de dominio en español"
- Director: José M. Castaño
- Jurados:
- Ernesto Mislej
- Viviana Cotik
- Resumen:
El minado de opinión es un área de investigación relativamente joven (las publicaciones "fundacionales" son del año 2002), y su objetivo es extraer la orientación semántica de un conjunto de textos para clasificarlos de acuerdo a ella como positivas o negativas.
Los enfoques para atacar este problema son esencialmente dos: "Orientación semántica" (en este enfoque se busca utilizar técnicas existentes de Procesamiento de Lenguaje Natural para encontrar la información semántica contenida en cada palabra y oración del documento y a partir de ello obtener un score global que permita clasificar al documento) y Machine Learning (en este caso se trata al problema como uno tradicional de clasificación de textos).
Las técnicas del segundo enfoque obtienen muy buenos resultados si los textos a clasificar se encuentran dentro de un mismo dominio, pero al salirse del mismo la performance decae, mientras que la ventaja del primer enfoque es que generalmente las técnicas existentes (y una nueva propuesta en la tesis) utilizan recursos de orientación semántica ya disponibles que además son completamente independientes del dominio, por lo tanto los resultados de estos clasificadores no dependen de una etapa de entrenamiento, que es la que genera la dependencia al dominio al que pertenezcan las opiniones utilizadas en el proceso.
Gran parte de las investigaciones que se están realizando en la actualidad se encuentra enfocada hacia el idioma inglés, por lo que el objetivo de este trabajo será analizar el comportamiento de las técnicas existentes en corpus que se encuentren en español, analizando el comportamiento de los métodos existentes de machine learning y proponiendo dos técnicas dentro del enfoque de orientación semántica. Esto será luego evaluado en distintos dominios, para luego realizar un análisis detallado y sugerir mejoras para el problema de dependencia de dominio.


