- Publicidade -
- Publicidade -
- Publicidade -
Machine learning & AI

Modelos de IA aprendem a desenhar como humanos

- Publicidade -
- Publicidade -

O novo sistema de inteligência artificial, chamado SketchAgent, desenvolvido pelo MIT e pela Universidade de Stanford, utiliza um modelo de linguagem multimodal para transformar comandos textuais em esboços em poucos segundos, trazendo avanços significativos no campo de machine learning.

Contexto da pesquisa

Tradicionalmente, os modelos de IA têm se mostrado proficientes na geração de imagens realistas, mas falham em capturar o processo iterativo de esboçamento, essencial para o brainstorming humano.

Método proposto

O SketchAgent utiliza um approach denominado “sketching language”, que traduz esboços em sequências numeradas de traços em uma grade, permitindo que o modelo aprenda a desenhar de forma mais natural. Este processo não depende de dados treinados especificamente, mas utiliza modelos de linguagem pré-treinados, como o Claude 3.5 Sonnet, para generalizar novos conceitos.

“Nosso objetivo é emular o processo de esboçamento humano, tornando os modelos de linguagem multimodal mais úteis para a expressão visual de ideias.”
(“Our tool aims to emulate that process, making multimodal language models more useful in helping us visually express ideas.”)

— Yael Vinker, Pesquisadora, MIT

Resultados e impacto

Os pesquisadores demonstraram que o SketchAgent pode criar representações abstratas de conceitos diversificados, como robôs e diagramas de fluxo, coletando dados de colaborações humanas e permitindo que a IA se integre aos processos criativos. Durante os testes, a inclusão de contribuições do modelo se provou vital para a coesão dos esboços finais. O modelo demonstrou uma performance superior em relação a outros, como o GPT-4o, com Claude 3.5 Sonnet produzindo esboços mais reconhecíveis.

“A superioridade do Claude 3.5 Sonnet sugere que este modelo processa e gera informações visuais de maneira diferente.”
(“The fact that Claude 3.5 Sonnet outperformed other models like GPT-4o suggests that this model processes and generates visual-related information differently.”)

— Tamar Rott Shaham, Co-autora, MIT

Embora o SketchAgent ainda não possa criar esboços profissionais, suas capacidades já sugerem aplicações promissoras no ensino e na visualização de conceitos complexos. Os próximos passos incluem refinar a interação entre humanos e a IA, além de melhorar a precisão nos esboços produzidos.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!