
Defensa Tesis Licenciatura Sebastián Prillo
4 abril, 2019 @ 11:00 am - 12:00 pm
Director: Leandro Lombardi.
Jurados: Agustín Gravano y Ernesto Mislej.
Resumen
En este trabajo estudiamos las Máquinas de Factorización (FMs), un modelo de aprendizaje automático de alta performance en sistemas de recomendación. Nuestro objetivo es estudiar dos aspectos de las FMs: la asimetrı́a de la ecuación del modelo FM, y la viabilidad de parametrizar de forma continua el orden de interacción de las FMs como propuesto en las FMs de orden intermedio. Más en general, en este trabajo tratamos de desarollar una comprensión más profunda sobre el sesgo inductivo de las FMs.
Con respecto a la asimetrı́a de las FMs, mostramos que esto tiene un impact no trivial sobre las predicciones de las FMs. Por este motivo, mostramos que ensamblar dos FMs, una entrenada sobre los datos originales y otra entrenada luego de negar el valor de la variable respuesta, puede llevar a mejoras inusualmente grandes de performance (cuando se lo compara con la mejora de performance tı́picamente observada al ensamblar dos modelos de la misma clase). También consideramos una formulación simétrica de FMs para la cual la estrategia de ensamblado puede ser vista como una estrategia efectiva de regularización.
Con respecto a parametrizar de forma continua el orden de interacción de FMs, mostramos que esto puede ser efectivo cuando las FMs se usan como predictor general, en algunos casos obteniendo performance comparable a la de predictores generales estado del arte como los gradient boosted decision trees (GBDTs). Por otra parte, cuando lo utilizamos en el contexto de problemas de recomendación, obtenemos poca o ninguna mejora.