Herramientas Personales
Usted está aquí: Inicio / Materias / Procesamiento del Habla / 2017 / Primer Cuatrimestre

Procesamiento del Habla

Primer cuatrimestre de 2017

Profesor: Agustín Gravano

Horario y lugar: Lunes de 9:30 a 13:30. Laboratorio Turing.

Correlativas: Métodos Numéricos y Teoría de Lenguajes.

Puntajes: 3 puntos para la Licenciatura y el Doctorado en Ciencias de la Computación.

Resumen: El procesamiento del habla tiene como objetivo manejar computacionalmente el lenguaje oral: extraer información de la señal acústica (p.ej.: palabras, emociones, características del hablante) y también producir y modificar señales de habla. Gracias a los avances de las últimas décadas, las tecnologías del habla han ido incorporándose gradualmente a nuestra vida cotidiana. Ejemplos de ello son los sistemas de dictado automático, los sistemas de diálogo y las interfaces multimodales. Estas tecnologías presentan un pobre desarrollo en nuestro país y en Latinoamérica; en ese sentido, esta materia intentará fomentar el desarrollo y la investigación de tecnologías locales. Asimismo, dado que esta rama de la Inteligencia Artificial posee fuerte interacción con disciplinas como la Lingüística, la Fonética, la Física y las Neurociencias, esta materia presentará a los alumnos nuevos enfoques en la resolución de problemas, fomentando la interdisciplinariedad y la apertura hacia otras concepciones de la Ciencia.

Temario:

  • Motivaciones para el procesamiento del habla.
  • Elementos de acústica y procesamiento digital de señales.
  • Elementos de fonética, fonología y prosodia.
  • Elementos de estadística y aprendizaje automático.
  • Elementos de procesamiento del lenguaje natural: n-gramas, part-of-speech tagging, parsing sintáctico, entre otros.
  • Síntesis del habla: concatenativa, formantes, articulatoria y HMM.
  • Sistemas de texto-a-habla (TTS): front-end y back-end.
  • Modelización acústica, lingüística y prosódica del habla.
  • Reconocimiento del habla. Modelos ocultos de Markov (HMM).
  • Sistemas de diálogo. Comprensión y generación del lenguaje hablado.
  • Evaluación de sistemas de procesamiento del habla.
  • Temas avanzados: extracción de información del hablante (identidad, edad, género); detección de emociones; detección del idioma o dialecto; detección de mentiras; generación automática de resúmenes; traducción automática; y otros.

____

Modo de evaluación

  • Dos exámenes parciales
  • Dos trabajos prácticos grupales
  • Promoción: La materia se promociona obteniendo nota 75/100 o superior en todas las instancias. Quienes obtengan al menos una nota inferior a 75/100 deben dar el final. Para quienes recuperen un parcial o TP, la nota que cuenta es la del recuperatorio. La promoción es opcional: pueden optar por dar final para levantar la nota.

____

Bibliografía

____

Cronograma

Junto a cada tema se muestran las lecturas sugeridas.

20/3: Introducción; archivos adjuntos. // Acústica del Habla (J&M:7.4; Johnson:1); archivos.

27/3: Procesamiento Digital de Señales (Johnson:cap.2); archivos.

03/4: Fonética y Fonología (J&M:7.1-7.3, 7.5); archivos; ejercicios.

10/4: Taller (a cargo de Pablo Brusco)

17/4: Prosodia (J&M:8.3; Handbook:23); archivos.

24/4: Estadística Aplicada y Lingüística Empírica; archivos.

1/5: Feriado.

8/5: Primer parcial: acústica, procesamiento de señales, fonética y prosodia. // Síntesis del Habla (J&M:8; Handbook:20,21); archivos. // Presentación del TP1

15/5: Sistemas TTS (J&M:8 (front-end), J&M:5 (POS tagging) y J&M:13 (sintaxis); Handbook:19,22).

22/5: Sistemas de Diálogo Hablado (J&M:24; Handbook:35).

28/5 23:59h: Fecha límite de entrega del TP1.

29/5: Aprendizaje automático (Intro to Statistical Learning); archivos.

5/6: Reconocimiento Automático del Habla (ASR) (J&M:4, 9; Handbook:27). Ejemplo del algoritmo de Viterbi. Lectura obligatoria: Rabiner 1989, secciones I, II y III.

12/6: Tópicos y Herramientas de ASR (J&M:9; Handbook:27); archivos. // Evaluación de TTS // Presentación del TP2

19/6: Temas avanzados: presentaciones de los alumnos

26/6: Temas avanzados: presentaciones de los alumnos

3/7: Segundo parcial: síntesis del habla, sistemas TTS, sistemas de diálogo hablado, reconocimiento automático del habla y tópicos de ASR. 10:00h, Aula 7, pabellón 1.

10/7: Entrega del TP2, de 9:30 a 11:30h y de 14 a 16h. Labo 3 (graduados).

14/7: Recuperatorio de parciales. 11:00h, Labo 3 (graduados).