
São Paulo — InkDesign News —
A pesquisa recente sobre machine learning e inteligência artificial (AI) revela que a forma como os computadores “veem” o mundo é significativamente diferente da percepção humana. O estudo analisa como algoritmos de AI, especialmente os modelos de linguagem grande (LLMs), processam imagens e as implicações disso nos contextos visuais.
Contexto da pesquisa
O trabalho, conduzido em colaboração com a Universidade de Tecnologia de Nova Iorque, busca entender as nuances entre a visão humana e a visão computacional. Ao comparar imagens produzidas por humanos e geradas por AI, foi possível identificar como as máquinas interpretam dados visuais.
Método proposto
Para investigar as capacidades dos modelos de AI, foi utilizado um modelo de linguagem grande, que classifica e gera descrições visuais de imagens. A pesquisa incluiu dois conjuntos de dados: ilustrações desenhadas à mão e fotografias obtidas por câmeras. O desempenho do modelo foi avaliado em relação à sua capacidade de capturar características como realismo, cor e contexto cultural, métricas que influenciam diretamente a interpretação da imagem.
“O AI tratou o realismo fotográfico como o estilo visual padrão, a menos que solicitado de outra forma”
(“AI seems to see photorealism as the default visual style, unless specifically prompted otherwise.”)— Pesquisador, Universidade de Tecnologia de Nova Iorque
Resultados e impacto
Os resultados revelaram que as descrições geradas pelo AI focavam em aspectos como bordas e padrões, negligenciando profundidade e cultura. Além disso, as imagens geradas eram mais saturadas e sensacionalistas em comparação com as imagens originais, indicando uma preferência por fotos de estilo estereotipado encontradas nos dados de treinamento.
“Enquanto humanos podem identificar nuances e contextos, os algoritmos falham em captar a essência cultural das imagens”
(“While humans detect nuances and contexts, algorithms fail to capture the cultural essence of images.”)— Pesquisador, Universidade de Tecnologia de Nova Iorque
Essas descobertas têm implicações diretas na forma como a AI pode ser utilizada em aplicações visuais, ressaltando a necessidade de uma compreensão mais profunda sobre os dados de entrada e os contextos culturais em que as imagens são inseridas.
A integração de métodos de machine learning na visualização de dados pode trazer benefícios significativos, mas é importante considerar as limitações na interpretação humana e na autenticidade visual em criações de AI.
Fonte: (TechXplore – Machine Learning & AI)