
Defensa Tesis Licenciatura Javier Minces Müller
18 diciembre, 2020 @ 4:00 pm - 5:00 pm
La detección automática de relaciones entre entidades nombradas es una tarea importante del procesamiento del lenguaje natural. En informes médicos, en particular, la extracción de relaciones es de suma utilidad. Permite, entre otras cosas, asociar de manera automática los hallazgos clínicos descriptos en el informe con el área del cuerpo en donde ocurrieron. Esto hace posible descubrir información, que puede asistir en la toma de decisiones, de manera mucho más rápida de lo que se haría mediante un análisis manual.
Casi todos los métodos desarrollados para esta tarea están implementados para textos en idioma inglés. Estos incluyen métodos basados en reglas y en técnicas de aprendizaje automático.
En este trabajo se realizó extracción de relaciones entre entidades nombradas sobre informes de ecografías escritos en español. Estos tienen la dificultad adicional de ser de naturaleza informal. Para esto se propusieron tres métodos: uno basado en co-ocurrencia de entidades, otro basado en reglas y finalmente uno basado en redes neuronales convolucionales. Para este último se entrenaron word embeddings en español para textos médicos.
Se obtuvieron resultados alentadores para los últimos dos métodos, siendo mejores aquellos basados en reglas (F1 0.88 y 0.87 respectivamente). Se observó que la distancia entre las entidades relacionadas influye en los resultados.