- Publicidade -
- Publicidade -
- Publicidade -
Machine learning & AI

Deep learning entende categorias visuais em novos contextos

- Publicidade -
- Publicidade -

Uma nova pesquisa em inteligência artificial, focada em machine learning, apresenta um modelo inovador que redefine a categorização de imagens, permitindo que sistemas de AI adaptem suas interpretações com base no contexto. Este desenvolvimento foi liderado pela Universidade de Michigan e apresentado na conferência CVPR 2025.

Contexto da pesquisa

O estudo, que foi apresentado em junho de 2025, traz uma abordagem chamada “categorization ad-hoc aberta” (OAK), que permite que sistemas de AI reinterpretam a mesma imagem de maneira dinâmica, dependendo do contexto e do propósito da categorização. A pesquisa destaca a flexibilidade necessária para que a AI possa compreender imagens de maneira similar à percepção humana.

Método proposto

A equipe de pesquisa ampliou o modelo CLIP da OpenAI, que é um modelo de AI baseado em visão e linguagem. A principal inovação foi a introdução de tokens de contexto, que funcionam como conjuntos de instruções especializadas. Esses tokens são alimentados no sistema junto com dados de imagem, permitindo que a tecnologia se concentre em características visuais relevantes sem instruções explícitas sobre onde “olhar”.

“Ficamos surpresos com a eficácia com que o sistema aprendeu a focar a atenção adequadamente e organizar os dados de maneira limpa com um mecanismo tão simples.”
(“We were surprised by how effectively the system learned to focus attention appropriately and organize data cleanly with such a simple mechanism.”)

— Zilin Wang, Estudante de doutorado, Universidade de Michigan

Resultados e impacto

Os resultados mostram que OAK pode identificar categorias que nunca foram vistas durante o treinamento. Por exemplo, quando solicitado a reconhecer itens que podem ser vendidos em uma venda de garagem, o sistema pode identificar itens como malas e chapéus, mesmo que só tenha visto exemplos de sapatos. OAK combina abordagens de aprendizado semântico e agrupamento visual, alcançando uma precisão de 87,4% na identificação de categorias novas no conjunto de dados Stanford, superando outros modelos por mais de 50%.

A nova abordagem pode ser crucial para aplicações em robótica e outras áreas, onde os sistemas precisam perceber ambientes diferentes dependendo de suas tarefas.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!