
São Paulo — InkDesign News — O Allen Institute for AI, conhecido como Ai2, anunciou nesta terça-feira o lançamento do modelo MolmoAct 7B, uma inovação em robótica que integra inteligência artificial ao mundo físico, usando técnicas de raciocínio visual para planejamento e execução de ações.
Tecnologia aplicada
O MolmoAct é classificado como um “modelo de raciocínio de ação” (ARM), que se diferencia por sua capacidade de interpretar instruções em linguagem natural e traduzir essas diretrizes em sequências de ações físicas. Este modelo é projetado para construir um entendimento tridimensional do ambiente, utilizando dados visuais para delinear planos de movimento. Ao invés de tratar cada tarefa como um processo único e opaco, o MolmoAct fragmenta as operações em uma série de decisões espaciais inter-relacionadas, permitindo intervenções mais precisas e seguras em contextos como lares e hospitais.
Desenvolvimento e testes
Treinado com um banco de dados curado de aproximadamente 12.000 episódios robóticos, o MolmoAct demonstrou sua eficácia em cenários do mundo real, variando de cozinhas a quartos. O instituto sublinha que a eficiência foi mantida com apenas 18 milhões de amostras, utilizando 256 GPUs da NVIDIA durante 24 horas para pré-treinamento. O modelo não só superou benchmarks de desempenho, alcançando uma taxa de sucesso de 71,9% no SimPLER, como também apresenta uma arquitetura aberta e reutilizável, promovendo transparência e reprodutibilidade.
A experiência do usuário foi uma prioridade, permitindo que os operadores visualizem os planos de movimento do robô antes da execução.
(“User experience was a priority, allowing operators to preview the robot’s movement plans before execution.”)— Ali Farhadi, CEO, Ai2
Impacto e aplicações
Com seu foco em raciocínio e transparência, MolmoAct tem potencial para transformar operações em diversas indústrias. Seus benefícios operacionais incluem uma resposta mais adaptativa a instruções complexas e a habilidade de ajustar comportamentos em tempo real, o que pode resultar em economias substanciais e aumento da eficiência operativa. A plataforma é integrada ao repositório Hugging Face, permitindo acesso facilitado a seus artefatos e dados.
Estamos estabelecendo as bases para uma nova era de IA, permitindo que a inteligência dos modelos avance em sincronia com as necessidades humanas.
(“We are laying the groundwork for a new era of AI, allowing the intelligence of models to advance in sync with human needs.”)— Ali Farhadi, CEO, Ai2
Com a aplicação do MolmoAct, o futuro da automação e robótica parece promissor, permitindo que máquinas se tornem mais colaborativas e eficientes em ambientes dinâmicos, estabelecendo novos padrões para a interação homem-máquina.
Fonte: (The Robot Report – Robótica & Automação)