Cargando Eventos

Título: «Un modelo de estimación de habilidad para la Asociación Argentina de Go con perspectiva internacional»
Director: Esteban Mocskos
Director adjunto: Gustavo Landfried
Jurados: Agustín Gutierrez y Matías López-Rosenfeld

Transmision en vivo: https://youtu.be/IAFimyMvBpg

Resumen
=======
El Go es un juego de mesa milenario creado en Asia que, a pesar de tener reglas relativamente sencillas, presenta una enorme complejidad combinatoria en cuanto a las posibles jugadas. Esto deriva en grandes
diferencias de habilidad entre distintos jugadores. Es una práctica común que, cuando la diferencia de habilidad entre dos jugadores es muy grande, se ofrezca una ventaja para producir un juego más entretenido. En la tradición del Go existe un sistema de ranking con el que se intenta clasificar a las personas en niveles con la idea de que la diferencia de niveles represente la ventaja que una persona debería otorgarle a la otra.
Sin embargo, determinar la ventaja necesaria para alcanzar un buen equilibrio en el juego es un problema de difícil solución ya que depende de la estimación de la habilidad de cada uno de los jugadores. El problema de estimar la probabilidad de ganar comenzó a resolverse a mediados del siglo pasado con el objetivo de evaluar la habilidad de los jugadores profesionales de ajedrez. Desde entonces la mayoría de los modelos utilizan la probabilidad del resultado observado, r, para actualizar las estimaciones de habilidad s, P(r|si, sj). En el caso del Go, además es importante estimar el efecto que produce la ventaja en la probabilidad de ganar.
Actualmente, la Asociación Argentina de Go (AAGo) reúne a las personas aficionadas del juego de Go en nuestro país y utiliza el sistema de ranking de la Asociación Estadounidense de Go. En la práctica, este
algoritmo ha mostrado tener serias dificultades según manifiestan los propios miembros de la AAGo. La dificultad particular que tiene la AAGo es el tamaño de su comunidad que además está compuesta por una gran diversidad de habilidades.
En esta tesis nos propusimos desarrollar un sistema para la AAGo que mejore sustancialmente las estimaciones de habilidad con las que cuentan en la actualidad haciendo un uso eficiente de los datos.
Para ello, decidimos adaptar el modelo estado del arte en la industria del video juego, TrueSkill Through Time (TTT), de modo tal que incorpore los efectos de las ventajas, modelo que llamamos TTT-hreg. En vez de propagar la información en un único sentido, del pasado al futuro, TTT propaga la información a través de todo el sistema ofreciendo así mejores estimaciones de habilidad con menor cantidad de datos.
Luego de su publicación original, se implementó un algoritmo similar denominado Whole History Rating (WHR), de referencia en la actualidad en la estimación de habilidad de los jugadores profesionales de Go.
Ambos algoritmos que utilizan toda la historia (TTT y WHR) mostraron tener un desempeño altamente superior al algoritmo utilizado actualmente por la AAGo. En particular, el modelo WHR mostró tener predicciones a priori mejores que TTT. Por otro lado, este último tiene la ventaja de permitir agregar nuevos factores respetando las reglas de la probabilidad dentro del marco bayesiano, simplificando su uso y adaptación a nuevos contextos.
En la actualidad, no es posible comparar las estimaciones de habilidad obtenidas por las diferentes Asociaciones de Go del mundo, no sólo porque utilizan sistemas diferentes, sino porque en general son bases
de datos disconexas. Sin embargo, unos pocos vı́nculos entre bases de datos le permitirían a nuestra solución propagar la información eficientemente, garantizando la comparabilidad entre las diversas asociaciones internacionales. En este trabajo dejamos sentadas las bases para extender el uso de nuestra solución como medida de referencia internacional utilizando la base de datos completa de KGS con 100
millones de partidas de todas las asociaciones de Go del mundo.

Palabras clave: Habilidad, Go, Handicap, Aprendizaje, Comparabilidad