
Defensa Tesis Licenciatura Martín Baigorria
12 junio, 2020 @ 2:00 pm - 3:00 pm
donde el agente elige la alternativa que le provee del máximo nivel de satisfacción entre las disponibles. Para utilizar un modelo de elección, primero debemos ajustar una distribución, sea paramétrica o no paramétrica, a datos históricos de elecciones.
La literatura actualmente está migrando de modelos paramétricos (que imponen una estructura a la función de utilidad) hacia modelos no paramétricos, con mínimas asunciones y puramente orientados a datos. En contextos donde el modelo subyacente de generación de datos (ground truth) es paramétrico o la cantidad de datos disponible no es grande, una distribución paramétrica puede ofrecer una performance predictiva competitiva. Sin embargo, a medida que el número de datos crece, la literatura ha mostrado (ver por ejemplo Farias et al. [1]) que muchas familias de modelos no paramétricos son capaces de capturar modelos subyacentes paramétricos de generación de datos de manera muy precisa, lo que ofrece un alto grado de flexibilidad.
Esta tesis se dividirá en dos partes principales. En la primera parte, exploraremos métodos de aprendizaje no supervisado para clustering de órdenes parciales. Esto está motivado por el hecho de que la estructura de preferencias de un agente puede ser modelada con un DAG (directed acyclic graph, o grafo dirigido acíclico). Poder agrupar este tipo de grafos es útil para encontrar grupos similares de agentes en este contexto, utilizando algún tipo de métrica o noción de similitud. La segunda parte de esta tesis intentará mejorar nuestro entendimiento y la performance de modelos basados en el orden parcial de los agentes. Estos modelos han sido introducidos por Jagabathula y Vulcano [2], transicionando de modelos basados en órdenes totales a modelos basados en órdenes parciales, donde las preferencias latentes de un agente son parcialmente observables. Intentaremos mejorar la performance de estos modelos utilizando diferentes estrategias de clustering para inicializar las funciones de verosimilitud. A partir de esta inicialización, finalmente computaremos los estimadores de máxima verosimilitud con el algoritmo esperanza-maximización (EM). También haremos experimentos numéricos utilizando el dataset IRI, que incluye millones de registros reales sobre la disponibilidad de productos en diferentes supermercados y las transacciones a nivel desagregado de los diferentes clientes identificados por sus tarjetas de membresía.
Concluimos empíricamente que el clustering utilizado para la inicialización de las funciones de verosimilitud parece no tener efecto sobre la performance predictiva de los diferentes modelos. Validamos los resultados encontrados por Jagabathula y Vulcano [2] sobre la performance de los modelos basados en órdenes parciales. Por otro lado, introducimos un nuevo modelo uniforme sobre órdenes parciales y con el mismo mostramos algunas de las consecuencias de utilizar una estructura de preferencias por cliente dada por un DAG.
[1] Vivek F Farias, Srikanth Jagabathula, and Devavrat Shah. A nonparametric approach to modeling choice with limited data. Management Science, 59(2):305–322, 2013.
[2] Srikanth Jagabathula and Gustavo Vulcano. A partial-order-based model to estimate individual preferences using panel data. Management Science, 2017.