- Publicidade -
- Publicidade -
- Publicidade -
Machine learning & AI

Modelos de linguagem visual aprimoram raciocínio espacial

- Publicidade -
- Publicidade -

São Paulo — InkDesign News —

Pesquisadores estão utilizando técnicas de machine learning para avançar na criação de modelos de linguagem-visual, com o objetivo de melhorar a capacidade de sistemas de inteligência artificial (AI) na interpretação de ambientes e interação com usuários.

Contexto da pesquisa

Uma equipe de pesquisadores do Instituto Italiano de Tecnologia (IIT) e da Universidade de Aberdeen apresentou um novo framework conceitual e um dataset que pode ser utilizado para treinar modelos de linguagem-visual (VLMs) em tarefas de raciocínio espacial. O trabalho, publicado em um paper no arXiv, busca contribuir para o desenvolvimento de sistemas de AI que consigam navegar de maneira mais eficaz em ambientes reais.

Método proposto

A pesquisa é parte do projeto FAIR e resulta de uma colaboração entre a linha de pesquisa Social Cognition in Human-Robot Interaction (S4HRI) do IIT e o Action Prediction Lab da Universidade de Aberdeen. Os pesquisadores desenvolveram um dataset contendo dados gerados computacionalmente, com o auxílio da plataforma Omniverse Replicator da NVIDIA, que captura imagens em 3D de um cubo a partir de diferentes ângulos e distâncias.

“Nosso principal objetivo era permitir que os robôs raciocinassem de maneira efetiva sobre o que outros agentes podem ou não perceber a partir de seus pontos de vista em ambientes compartilhados”
(“Our primary objective was to enable robots to reason effectively about what other agents (human or artificial) can or cannot perceive from their vantage points within shared environments.”)

— Davide De Tommaso, Tecnólogo, IIT

O dataset consiste em pares de imagens e matrizes de transformação, que representam a posição e a orientação do cubo. Essa abordagem oferece uma nova maneira de os modelos aprenderem sobre a percepção visual alheia, permitindo que robôs compreendam não apenas o que veem, mas também como isso é percebido por outros.

Resultados e impacto

Os resultados preliminares indicam que o uso de representações sintéticas de cena, combinadas com modelos de linguagem de grande escala, apresenta um potencial significativo para o desenvolvimento de capacidades de percepção visual em robôs. Joel Currie, primeiro autor do estudo, enfatiza a importância do dataset: “É uma forma de ensinar os robôs a não apenas ver, mas a entender o espaço como um ser físico faria”
(“It’s a way of teaching robots to not just see, but to understand space like a physical being would.”).

Embora o framework ainda seja teórico, ele poderá ser utilizado em treinos futuros de modelos reais. O próximo passo é tornar o ambiente virtual o mais realista possível, para que o conhecimento adquirido em simulação possa ser transferido para o mundo real.

As aplicações potenciais incluem melhorias na interação entre humanos e robôs, especialmente em cenários onde ambos compartilham uma compreensão espacial do ambiente. Isso pode revolucionar o campo da robótica e da inteligência artificial.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!