Machine learning acelera aprendizado de robôs com feedback humano

O recente avanço em machine learning tem permitido que robôs executem tarefas complexas de maneira surpreendentemente eficiente. Pesquisadores da Universidade da Califórnia, Berkeley, desenvolveram um protocolo de treinamento que combina feedback humano com aprendizado de máquina, alcançando uma taxa de sucesso de 100% em tarefas desafiadoras.
Contexto da pesquisa
A pesquisa foi conduzida no laboratório de Robótica e Aprendizagem da UC Berkeley, liderado pelo professor Sergey Levine. O objetivo era superar os desafios enfrentados no ensino de máquinas para realizar atividades não apenas simples, como pegar objetos, mas também ações mais complexas e imprevisíveis, como a manipulação de peças em um jogo de Jenga.
Método proposto
O modelo, denominado Human-in-the-Loop Sample Efficient Robotic Reinforcement Learning (HiL-SERL), foi fundamentado em métodos de aprendizado por reforço. Nele, um robô aprende tanto com tentativas e erros em tempo real quanto por meio de intervenções humanas, que corrigem sua trajetória durante o aprendizado. Este método visa acelerar o processo e melhorar a eficácia na execução das tarefas.
Resultados e impacto
Os robôs foram capazes de aprender a realizar uma série de tarefas, incluindo a montagem de uma placa-mãe e a manipulação de objetos em um ambiente variado, sempre alcançando uma precisão de 100%. Como resultado, a nova abordagem superou métodos tradicionais, como a clonagem comportamental, que geralmente apresentam taxas de sucesso inferior. Jianlan Luo, pesquisador pós-doutorado da UC Berkeley, comentou sobre a eficácia do sistema:
“A primeira vez que o robô conquistou o desafio do Jenga, isso realmente me surpreendeu”
(“the first time the robot conquered the Jenga whipping challenge, that really shocked me”)— Jianlan Luo, Pesquisador Pós-Doutorado, UC Berkeley
.
Esses resultados ressaltam a importância de desenvolver robôs que possam aprender de forma confiável e adaptativa, especialmente em setores como manufatura e eletrônicos, onde a consistência é crucial. Próximos passos incluem a prévia formação dos robôs em manipulação de objetos, visando uma progressão mais rápida para habilidades complexas.
Fonte: (TechXplore – Machine Learning & AI)