
Defensa Tesis Licenciatura Cyntia Bonomi
12 agosto, 2022 @ 10:00 am - 11:00 am
Título: Desarrollo y evaluación de sistemas de calificación de la pronunciación basados en redes neuronales profundas
Directora: Luciana Ferrer
Co-directora: Jazmín Vidal
Jurados: Claudio Estienne y Diego Fernandez Slezak
Resumen:
Los sistemas de calificación de la pronunciación son una herramienta importante para el aprendizaje de idiomas. Evalúan la manera en que se producen los sonidos del lenguaje y permiten interactuar de manera incansable con los estudiantes, indicando errores en tiempo real y permitiendo a cada alumno avanzar a su propio ritmo. Una manera de implementar sistemas de calificación de la pronunciación es usando como base un sistema de Reconocimiento Automático del Habla (RAH). Los sistemas RAH resuelven la tarea de estimar la transcripción ortográfica de una señal de habla. Pueden ser usados para calificar pronunciación con un método llamado Goodness of pronunciation (GOP). Este método consiste en utilizar un sistema RAH entrenado con habla nativa de la población de interés para estimar las probabilidades a posteriori de los sonidos que el estudiante debiera haber pronunciado. Se asume que estas probabilidades serán bajas cuando la pronunciación sea
incorrecta ya que las características de la señal no coincidirán con lo que el modelo entrenado con hablantes nativos espera encontrar. En esta tesis estudiamos un sistema de calificación de la pronunciación a nivel fono basado en DNN, entrenando diferentes modelos con el fin de encontrar la red con mejor rendimiento. Estos modelos usan distintas características para representar la señal y diversas arquitecturas e hiperparámetros de entrenamiento.