Robô aprende comportamento normativo com MORL e parafusos restritivos

São Paulo — InkDesign News — Nos últimos anos, robôs e sistemas de automação têm se tornado essenciais em diversos setores, desde a logística até a saúde, demonstrando a eficácia de algoritmos avançados e a adaptação diante de ambientes incertos.
Tecnologia aplicada
Os sistemas de aprendizado por reforço (RL) permitem que agentes autônomos aprendam comportamentos otimizados por meio da interação com o ambiente. O método desenvolvido, chamado de Restraining Bolt, introduz regras que alinham o aprendizado do agente às normas sociais e legais, usando lógicas temporais como LTL (lógica temporal linear) e suas variações. Esses algoritmos são projetados para que os agentes recebam recompensas por suas ações, incentivando comportamentos que respeitem especificações normativas.
Desenvolvimento e testes
Em um ambiente de teste semelhante a jogos de estratégia, os agentes foram programados para coletar recursos e entregá-los a locais designados. Este cenário permitiu a observação de como o sistema lida com conflitos normativos, como evitar áreas perigosas enquanto cumpre prazos específicos. O tempo de resposta dos agentes foi medido em ciclos, e os testes demonstraram a eficácia do sistema em priorizar normas sem comprometer a eficiência.
“O agente aprende a minimizar violações normativas com base em um sistema de classificação que determina quais regras devem ser priorizadas.”
(“The agent learns to minimize normative violations based on a ranking system that determines which rules should be prioritized.”)— Emery Neufeld, Pesquisador Pós-Doutoral, TU Wien
Impacto e aplicações
A pesquisa, que recebeu o prêmio de artigo distinto na IJCAI 2025, destaca a importância de integrar a lógica normativa com o aprendizado por reforço. As aplicações práticas incluem o uso em veículos autônomos, onde é crucial que as máquinas não apenas sigam regras de segurança, mas também normas sociais que regulam a interação com humanos. A proposta de Ordered Normative Restraining Bolts oferece um novo caminho para a conformidade social em sistemas autônomos, permitindo ajustes em tempo real às normas em resposta a mudanças ambientais.
Com o contínuo avanço em robótica, a próxima etapa pode envolver a implementação desses sistemas em cenários do mundo real, conferindo autonomia a drones e robôs em entregas, monitoramento e assistências em ambientes urbanos complexos.
Fonte: (Robohub – Robótica & Automação)