Cargando Eventos

Titulo: MÉTODOS DE RECOLECCIÓN DE UN CORPUS DE CINE DOCUMENTAL ARGENTINO Y EVALUACIÓN DE RESULTADOS
Directores: Ricardo rodriguez y José Castaño

Resumen:
En este trabajo se generaron corpus de documentales argentinos de archivos html, pdf y doc que sirven para alimentar a una componente de clasificación de un prototipo de buscador vertical sobre cine documental asistido por aprendizaje. El propósito es generar una herramienta que sustituya la búsqueda manual de documentales, para el armado de dichos corpus. También se automatizó la generación de estos corpus, a través del desarrollo de un script, para evitar la intervención humana.

Además se exploraron distintos criterios para determinar qué documentales son relevantes en esos corpus (buscados de la web) y cuáles no. Estos criterios se basaron en los resultados de aplicar diferentes filtros a los corpus. Dichos filtros fueron implementados en el mismo script. La ejecución del mismo y otros scripts (auxiliares) permitirían automatizar también el filtrado de falsos positivos realizados por intervención manual humana. La aplicación de estos criterios servirían para la etapa de aprendizaje del clasificador (el cual es usado como componente del prototipo de un buscador mencionado con anterioridad).