
Defensa Tesis Licenciatura Matías Sandacz
4 octubre, 2024 @ 6:00 pm - 7:00 pm
Título: Generación de locomoción para un robot hexápodo usando Aprendizaje Por Refuerzo Profundo.
Director: Dr. Pablo De Cristóforis.
Co-director: Lic. Nicolás Romero.
Jurados: Dr. Gustavo Landfried, Dr. Gastón Castro.
Resumen:
Los robots con patas articuladas se destacan por su capacidad para realizar tareas en entornos no estructurados, hostiles o incluso inaccesibles para otros robots terrestres con sistemas de locomoción basado en ruedas u orugas. Al mismo tiempo pueden transportar más carga y operar durante más tiempo que los vehículos aéreos no tripulados. Sus habilidades para realizar movimientos omnidireccionales y atravesar terrenos irregulares los convierten en una excelente opción para diversas aplicaciones, tales como: misiones de Búsqueda y Rescate Urbano (USAR por sus siglas en inglés) en situaciones de catástrofe, operar en ambientes subterráneos como minas e inclusive para la exploración extra planetaria. Sin embargo, es sabido que el control de movimiento de este tipo de robots es sumamente desafiante debido a la cantidad de grados de libertad involucrados. Por otro lado, el control clásico requiere conocer en detalle la física del robot lo cual agrega una dificultad extra y limita su portabilidad a otros sistemas.
En este trabajo adoptamos un enfoque alternativo a las estrategias de control tradicional, empleando Aprendizaje por Refuerzo Profundo (DRL del inglés Deep Reinforcement Learning). Presentamos un controlador para la locomoción para un robot hexápodo que se adapta a distintos tipos de terrenos. Durante el entrenamiento hacemos uso de un curriculum de terrenos, es decir, que a medida que el robot va experimentando, incrementamos progresivamente la dificultad, con terrenos cada vez más desafiantes. La hipótesis central de este trabajo es que, posteriormente a la etapa de aprendizaje, el robot
pueda adaptarse a terrenos no explorados durante su entrenamiento. Los experimentos realizados en simulación utilizando Gazebo muetras la factibilidad del enfoque propuesto. El sistema fue desarrollado bajo ROS (Robot Operating System) y se encuentra disponible para la comunidad en: https://github.com/lrse/hexapo