O CyberRunner pode autonomamente vencer humanos em um clássico jogo de labirinto com bola. Para aqueles não familiarizados com o jogo, os jogadores basicamente conduzem uma bola de mármore de um ponto de partida até um ponto de chegada, evitando que ela caia em qualquer um dos buracos presentes no tabuleiro.
Este robô de IA utiliza aprendizado por reforço baseado em modelo e sua capacidade de tomar decisões informadas sobre comportamentos potencialmente bem-sucedidos, planejando para o futuro.
Essencialmente, ele aprende coletando experiência enquanto joga o jogo. Observações são capturadas e, em seguida, recompensadas com base em seu desempenho, tudo por meio da câmera que olha para baixo no labirinto.
A “memória” coletada é então usada para um algoritmo de aprendizado por reforço baseado em modelo, permitindo que ele reconheça quais estratégias e comportamentos são mais promissores.
“Consequentemente, a maneira como o robô usa os dois motores – suas ‘mãos’ – para jogar o jogo é continuamente aprimorada. Importante destacar que o robô não para de jogar para aprender; o algoritmo é executado simultaneamente com o robô jogando o jogo. Como resultado, o robô continua melhorando a cada execução”, afirmaram os pesquisadores da ETH Zurich.
Veja no vídeo abaixo.
O CyberRunner funcionando
Veja mais sobre tecnologia!