Modelos de IA aprendem a desenhar como humanos

- Publicidade -

Tiago F Santiago 03/06/2025Última Atualização 03/06/2025

0 164 1 minuto de leitura

Modelos de IA aprendem a desenhar como humanos — SketchAgent uses a multimodal language model to turn natural language prompts into sketches in a few seconds. It can doodle on its own or through collaboration, drawing with a human or incorporating text-based input to sketch each part separately. Credit: Alex Shipps/MIT CSAIL, with AI-generated sketches from the researchers

- Publicidade -

O novo sistema de inteligência artificial, chamado SketchAgent, desenvolvido pelo MIT e pela Universidade de Stanford, utiliza um modelo de linguagem multimodal para transformar comandos textuais em esboços em poucos segundos, trazendo avanços significativos no campo de machine learning.

Contexto da pesquisa

Tradicionalmente, os modelos de IA têm se mostrado proficientes na geração de imagens realistas, mas falham em capturar o processo iterativo de esboçamento, essencial para o brainstorming humano.

Método proposto

O SketchAgent utiliza um approach denominado “sketching language”, que traduz esboços em sequências numeradas de traços em uma grade, permitindo que o modelo aprenda a desenhar de forma mais natural. Este processo não depende de dados treinados especificamente, mas utiliza modelos de linguagem pré-treinados, como o Claude 3.5 Sonnet, para generalizar novos conceitos.

“Nosso objetivo é emular o processo de esboçamento humano, tornando os modelos de linguagem multimodal mais úteis para a expressão visual de ideias.”
(“Our tool aims to emulate that process, making multimodal language models more useful in helping us visually express ideas.”)

— Yael Vinker, Pesquisadora, MIT

Resultados e impacto

Os pesquisadores demonstraram que o SketchAgent pode criar representações abstratas de conceitos diversificados, como robôs e diagramas de fluxo, coletando dados de colaborações humanas e permitindo que a IA se integre aos processos criativos. Durante os testes, a inclusão de contribuições do modelo se provou vital para a coesão dos esboços finais. O modelo demonstrou uma performance superior em relação a outros, como o GPT-4o, com Claude 3.5 Sonnet produzindo esboços mais reconhecíveis.

“A superioridade do Claude 3.5 Sonnet sugere que este modelo processa e gera informações visuais de maneira diferente.”
(“The fact that Claude 3.5 Sonnet outperformed other models like GPT-4o suggests that this model processes and generates visual-related information differently.”)

— Tamar Rott Shaham, Co-autora, MIT

Embora o SketchAgent ainda não possa criar esboços profissionais, suas capacidades já sugerem aplicações promissoras no ensino e na visualização de conceitos complexos. Os próximos passos incluem refinar a interação entre humanos e a IA, além de melhorar a precisão nos esboços produzidos.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 03/06/2025Última Atualização 03/06/2025

0 164 1 minuto de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Modelos de IA aprendem a desenhar como humanos

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Aldebaran entra em recuperação judicial após crise com robôs

Vídeo viral de parapente pode ser gerado por AI

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado