
Defensa Tesis Licenciatura Martin Forte y Eitan Rosenzvaig
11 diciembre, 2019 @ 5:00 pm - 6:00 pm
Título: Aprendizaje por Refuerzo. Aprendiendo en Comunidad.
Director: Enrique Carlos Segura
Jurados: Marta Mejail, Julio Jacobo Berlles.
Resumen: El aprendizaje por refuerzo es una de las areas de mayor auge en la inteligencia articial gracias al desarrollo de las redes neuronales profundas y por la versatilidad del algoritmo de aprendizaje para abordar problemas de la vida cotidiana. Como jugar al Truco.
En este trabajo abordamos el aprendizaje por refuerzo acotado a los problemas donde se crea un enfrentamiento entre 2 sujetos, como el Ajedrez, Go, Truco, Poker y otros. Para poder entrenar a los agentes artificiales la estrategia dominante en la comunidad científica es una en la cual un agente se enfrenta a una copia de sí mismo e intenta sobreponerse. Inclusive se puede simular esta copia y llevar al agente a enfrentarse a si mismo.
La alternativa que proponemos es introducir más agentes al entrenamiento para que haya una mayor riqueza de estrategias, una suerte de comunidad. Es decir, en vez de que un jugador se enfrente durante todo el ciclo de entrenamiento a una única copia y por ende a una única estrategia (que evoluciona al pasar el tiempo) se enfrente a n agentes distintos que evolucionan a la par donde se enfrentarán todos contra todos, por turnos.
Mostramos con el juego del Truco que este aumento en contrincantes brinda un beneficio al momento de entrenar y por ende los agentes que son enfrentados a más contrincantes son superiores a los agentes que solo fueron entrenados contra un único rival.
Palabras clave: Q-Learning, Truco, Comunidad, Red Neuronal, Aprendizaje por Refuerzo