- Publicidade -
- Publicidade -
Robótica & Automação

Robô orienta ações usando goal representations para AI

- Publicidade -
- Publicidade -

Berkeley — InkDesign News — Pesquisadores do Berkeley Artificial Intelligence Research Lab (BAIR) desenvolveram um sistema avançado para controle de robôs com instruções em linguagem natural, aumentando a eficiência e autonomia de manipuladores robóticos em ambientes domésticos e industriais.

Tecnologia aplicada

A técnica denominada GRIF (Goal Representations for Instruction Following) utiliza dois encoders — um para linguagem natural e outro para imagens de objetivos — que mapeiam comandos e metas em um espaço compartilhado de tarefas. Esse método combina aprendizado comportamental condicionado por linguagem (LCBC) e por metas visuais (GCBC), aproveitando grandes conjuntos de dados não anotados para o treinamento. Sensores visuais capturam o estado dos objetos e o cenário, permitindo que o robô compreenda e execute instruções detalhadas como “coloque o pimentão amarelo no pano”. O alinhamento entre linguagem e imagens é aprimorado por aprendizado contrastivo e uso modificado da arquitetura CLIP, que incorpora pares de imagens de estado e objetivo.

Desenvolvimento e testes

O GRIF foi treinado com o conjunto Bridge-v2, contendo 7 mil demonstrações anotadas e 47 mil não anotadas em manipulação de cozinha. A política unificada compartilha a rede neural para execução dos comandos, usando dados anotados para condições de linguagem e meta, enquanto os dados não anotados alimentam o aprendizado condicional por meta. Em testes reais, o sistema executou 15 tarefas em três ambientes distintos, incluindo um cenário com objetos inéditos. Foram identificados dois principais modos de falha: falhas no entendimento da linguagem e execuções manipulativas imprecisas. Mesmo assim, o GRIF superou abordagens anteriores como LCBC, LangLfP e BC-Z em generalização e robustez.

Impacto e aplicações

Este avanço permite a criação de robôs manipuladores mais flexíveis e intuitivos, capazes de executar tarefas complexas a partir de simples comandos verbais, sem necessidade de gerar imagens de metas. A adaptação do CLIP e o alinhamento de representações entre linguagens e metas visuais aumentam a capacidade de generalização a ambientes variados. Pesquisadores projetam a utilização futura de dados humanos em vídeo para ampliar a semântica aprendida, possibilitando robôs que possam atuar em ambientes diversos e se adaptar a instruções qualitativas, como “despeje a água lentamente”.

“GRIF permite que um robô utilize grandes quantidades de dados de trajetórias não anotadas para aprender políticas condicionadas por metas, enquanto oferece uma ‘interface de linguagem’ para estas políticas via representações alinhadas de tarefa em linguagem e objetivo. Em contraste com métodos anteriores, nossas representações alinham mudanças de estado à linguagem, melhorando significativamente o desempenho.”
(“GRIF enables a robot to utilize large amounts of unlabeled trajectory data to learn goal-conditioned policies, while providing a ‘language interface’ to these policies via aligned language-goal task representations. In contrast to prior methods, our representations align changes in state to language, which significantly improves performance.”)

— Andre He & Vivek Myers, Berkeley Artificial Intelligence Research Lab

O GRIF oferece avanços na autonomia de robôs manipuladores em tarefas cotidianas, com potencial para integração em automação doméstica e industrial, especialmente onde a flexibilidade do comando por linguagem natural e a robustez operacional são essenciais.

Fonte: (Robohub – Robótica & Automação)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!