
São Paulo — InkDesign News — Pesquisadores da NVIDIA estão desenvolvendo um sistema avançado para a geração sintética escalável de dados para o treinamento de modelos robóticos, abordando desafios significativos na robótica moderna.
Tecnologia aplicada
O novo framework, descrito na pesquisa da NVIDIA, utiliza modelos fundacionais de IA generativa, como o Cosmos, em conjunto com o pipeline de geração de dados DreamGen. O DreamGen serve como base para o NVIDIA Isaac GR00T-Dreams, que visa criar dados sintéticos robustos para o treinamento de robôs. O sistema permite a criação de vídeos sintéticos e a extração de sequências de ações de robôs, utilizando um modelo de ação latente que elimina a necessidade de rotulagem manual. O resultado é uma eficiência de treinamento que possibilita a redução significativa no tempo de desenvolvimento, permitindo que mesmo tarefas complexas sejam ensinadas em apenas horas.
Desenvolvimento e testes
O pipeline do DreamGen consiste em quatro etapas principais: a adaptação do modelo Cosmos-Predict2 às necessidades específicas do robô; a geração de vídeos sintéticos; a extração de pseudo-ações para sequências rotuladas; e, por fim, o treinamento de políticas robóticas. O benchmarking no DreamGen Bench avalia a eficácia dos modelos gerados, testando a fidelidade à instrução e o realismo físico dos vídeos, com métricas precisas que garantem a qualidade dos dados sintéticos gerados.
“Modelos que obtêm notas mais altas no DreamGen Bench apresentam um desempenho superior em tarefas de manipulação reais.” — explicou um representante da NVIDIA sobre a correlação entre a qualidade dos dados e o desempenho robótico.
Impacto e aplicações
Os benefícios operacionais incluem a redução do custo e do tempo necessários para coletar dados do mundo real, possibilitando que empresas adotem tecnologias robóticas mais adaptáveis e eficientes. Entre os primeiros adotantes está a AeiRobot, que integra esses modelos em robôs industriais para permitir a compreensão de comandos em linguagem natural. Outro exemplo é a Lightwheel, que utiliza dados sintéticos para acelerar a implementação de robôs humanoides em fábricas, melhorando a agilidade e a flexibilidade operacional.
“Essa abordagem não apenas melhora a qualidade dos dados, mas também leva a robôs mais capacitados e adaptáveis na prática.” — comentou um especialista na área.
O futuro das operações robóticas parece promissor, com a expectativa de que as inovações da NVIDIA sejam amplamente adotadas, acelerando a transformação de diversas indústrias. Com um foco contínuo em métodos de treinamento que combinam dados reais e sintéticos, o setor se prepara para uma nova era de robótica avançada e eficiente.
Fonte: (The Robot Report – Robótica & Automação)