
BEGIN:VCALENDAR
VERSION:2.0
PRODID:-//Departamento de Computación - ECPv6.15.18//NONSGML v1.0//EN
CALSCALE:GREGORIAN
METHOD:PUBLISH
X-WR-CALNAME:Departamento de Computación
X-ORIGINAL-URL:https://www.dc.uba.ar
X-WR-CALDESC:Eventos para Departamento de Computación
REFRESH-INTERVAL;VALUE=DURATION:PT1H
X-Robots-Tag:noindex
X-PUBLISHED-TTL:PT1H
BEGIN:VTIMEZONE
TZID:America/Sao_Paulo
BEGIN:STANDARD
TZOFFSETFROM:-0200
TZOFFSETTO:-0300
TZNAME:-03
DTSTART:20180218T020000
END:STANDARD
BEGIN:DAYLIGHT
TZOFFSETFROM:-0300
TZOFFSETTO:-0200
TZNAME:-02
DTSTART:20181104T030000
END:DAYLIGHT
BEGIN:STANDARD
TZOFFSETFROM:-0200
TZOFFSETTO:-0300
TZNAME:-03
DTSTART:20190217T020000
END:STANDARD
END:VTIMEZONE
BEGIN:VEVENT
DTSTART;TZID=America/Sao_Paulo:20191211T170000
DTEND;TZID=America/Sao_Paulo:20191211T180000
DTSTAMP:20260612T041707
CREATED:20191203T115755Z
LAST-MODIFIED:20191203T182615Z
UID:5601-1576083600-1576087200@www.dc.uba.ar
SUMMARY:Defensa Tesis Licenciatura Martin Forte y Eitan Rosenzvaig
DESCRIPTION:Título: Aprendizaje por Refuerzo. Aprendiendo en Comunidad.\nDirector: Enrique Carlos Segura\nJurados: Marta Mejail\, Julio Jacobo Berlles. \nResumen: El aprendizaje por refuerzo es una de las areas de mayor auge en la inteligencia articial gracias al desarrollo de las redes neuronales profundas y por la versatilidad del algoritmo de aprendizaje para abordar problemas de la vida cotidiana. Como jugar al Truco.\nEn este trabajo abordamos el aprendizaje por refuerzo acotado a los problemas donde se crea un enfrentamiento entre 2 sujetos\, como el Ajedrez\, Go\, Truco\, Poker y otros. Para poder entrenar a los agentes artificiales la estrategia dominante en la comunidad científica es una en la cual un agente se enfrenta a una copia de sí mismo e intenta sobreponerse. Inclusive se puede simular esta copia y llevar al agente a enfrentarse a si mismo.\nLa alternativa que proponemos es introducir más agentes al entrenamiento para que haya una mayor riqueza de estrategias\, una suerte de comunidad. Es decir\, en vez de que un jugador se enfrente durante todo el ciclo de entrenamiento a una única copia y por ende a una única estrategia (que evoluciona al pasar el tiempo) se enfrente a n agentes distintos que evolucionan a la par donde se enfrentarán todos contra todos\, por turnos.\nMostramos con el juego del Truco que este aumento en contrincantes brinda un beneficio al momento de entrenar y por ende los agentes que son enfrentados a más contrincantes son superiores a los agentes que solo fueron entrenados contra un único rival.\nPalabras clave: Q-Learning\, Truco\, Comunidad\, Red Neuronal\, Aprendizaje por Refuerzo
URL:https://www.dc.uba.ar/event/defensa-tesis-licenciatura-martin-forte-y-eitan-rosenzvaig/
LOCATION:Aula E24
CATEGORIES:Agenda
END:VEVENT
BEGIN:VEVENT
DTSTART;TZID=America/Sao_Paulo:20191211T183000
DTEND;TZID=America/Sao_Paulo:20191211T203000
DTSTAMP:20260612T041707
CREATED:20190326T124059Z
LAST-MODIFIED:20190326T124059Z
UID:5036-1576089000-1576096200@www.dc.uba.ar
SUMMARY:Charla de la Carrera
DESCRIPTION:El miercoles 11 de diciembre a las 18:30 hs nos encontraremos para nuestra clásica charla de la carrera de Computación\, junto con graduados y graduadas\, docentes y estudiantes de la carrera. Nos vemos unos minutos antes de la hora de comienzo en el Hall del Pabellón I de Ciudad Universitaria. \n¿Te interesa saber qué hacemos? ¿Qué cosas vas a aprender? ¿Cuál es la salida laboral? Vamos a responder todas tus dudas. \nEsta será la última charla de carrera del 2019. La próxima recién será a mitad de febrero de 2020\, ¡así que vení\, que te esperamos! \nTenés varias formas de llegar a Ciudad Universitaria.\nColectivos: líneas 28\, 33\, 34\, 37\, 42\, 45\, 107 y 160\nTren Línea Belgrano: estación Ciudad Universitaria\nSubte Línea C: hasta estación Retiro\, y luego combinación con tren Línea Belgrano
URL:https://www.dc.uba.ar/event/charla-de-la-carrera-dicembre19/
LOCATION:Hall de Pabellón 1
CATEGORIES:Agenda
END:VEVENT
END:VCALENDAR