IA embarcada ganha destaque com prêmio Turing 2024 a Barto e Sutton

Massachusetts — InkDesign News — Dois dos principais pesquisadores em aprendizado por reforço, Andrew Barto e Richard Sutton, foram laureados com o Prêmio Turing 2024 por suas contribuições fundamentais no desenvolvimento de algoritmos que influenciam a robótica e automação, expandindo a autonomia e eficiência em sistemas robóticos.
Tecnologia aplicada
O trabalho de Barto e Sutton, iniciado na década de 1980, estabeleceu a base conceitual e algorítmica para o aprendizado por reforço, método que permite que robôs e agentes autônomos aprendam a tomar decisões através de interações com o ambiente. Esses algoritmos utilizam sensores para capturar dados do ambiente e atuadores para executar ações, enquanto processam recompensas para otimizar seu comportamento ao longo do tempo.
Desenvolvimento e testes
Os primeiros sistemas baseados em aprendizado por reforço foram testados em ambientes simulados e reais, envolvendo ciclos repetidos de tentativa e erro para ajuste fino de políticas de controle. Sensores típicos nesse contexto variam de câmeras e LIDARs até sensores táteis e IMUs, fornecendo feedback crítico ao algoritmo. Os tempos de resposta dos sistemas melhoraram significativamente, o que permite adaptação quase em tempo real em aplicações como veículos autônomos e drones industriais.
Impacto e aplicações
O impacto do aprendizado por reforço na robótica se traduz em melhorias na autonomia de robôs móveis, manipulação em ambientes dinâmicos e otimização de processos industriais automatizados. Empresas e laboratórios utilizam esses algoritmos para aumentar a eficiência de robôs em inspeção de infraestrutura, logística automatizada e sistemas de produção inteligente, resultando em menor intervenção humana e maiores taxas de sucesso operacional.
“Desenvolvemos os fundamentos matemáticos e algoritmos que permitem que máquinas aprendam de forma autônoma a partir da experiência acumulada.”
(“We developed the mathematical foundations and algorithms that enable machines to autonomously learn from accumulated experience.”)— Andrew Barto, Professor Emérito, Universidade de Massachusetts, Amherst
“As técnicas de aprendizado por reforço agora estão sendo aplicadas para criar sistemas robóticos que se adaptam a ambientes complexos e mudanças imprevistas.”
(“Reinforcement learning techniques are now applied to build robotic systems that adapt to complex environments and unforeseen changes.”)— Richard Sutton, Professor, Universidade de Alberta
Próximos passos na pesquisa em robótica envolvem a integração do aprendizado por reforço com outras formas de inteligência artificial, visando aumentar a autonomia em ambientes não estruturados e a colaboração entre robôs e humanos, além do desenvolvimento de sensores cada vez mais precisos para melhorar o feedback dos sistemas.
Para mais artigos sobre robótica e automação, consulte robótica e automação.
Fonte: (Robohub – Robótica & Automação)