- Publicidade -
- Publicidade -
- Publicidade -
Machine learning & AI

Tokenizers e decodificadores permitem edição sem geradores

- Publicidade -
- Publicidade -

O uso de técnicas de machine learning tem revolucionado o campo da geração de imagens, especialmente com o surgimento de novas abordagens que eliminam a necessidade de geradores tradicionais. Pesquisadores do MIT apresentaram métodos inovadores que podem alterar a forma como as imagens são manipuladas e geradas.

Contexto da pesquisa

A geração de imagens por meio de IA geralmente envolve redes neurais que precisam ser treinadas em vastos conjuntos de dados de milhões de imagens. Este processo consome um tempo significativo e recursos computacionais. O grupo de pesquisa do MIT, sob a orientação de Lukas Lao Beyer, desenvolveu uma nova técnica que utiliza um tokenizer unidimensional, capaz de representar imagens de forma altamente comprimida.

Método proposto

O modelo proposto baseia-se em um tokenizer unidimensional que traduz uma imagem de 256×256 pixels em uma sequência de apenas 32 números, chamados tokens. Com isso, as informações visuais são incorporadas de maneira eficiente. Ao modificar esses tokens, os pesquisadores conseguiram afetar diretamente atributos da imagem, como qualidade e luminosidade. Em um experimento, uma modificação em um token alterou a resolução da imagem, enquanto outro influenciou a aparência de desfoque.

“Esta foi uma descoberta sem precedentes, pois ninguém havia observado alterações visualmente identificáveis a partir da manipulação de tokens.”
(“This was a never-before-seen result, as no one had observed visually identifiable changes from manipulating tokens.”)

— Lukas Lao Beyer, Pesquisador, MIT

Resultados e impacto

Os resultados indicaram que, através da utilização do tokenizer e de um decodificador, as imagens podem ser criadas sem a necessidade de um gerador. Isso não apenas simplifica o processo de geração, mas também potencialmente reduz custos computacionais, uma vez que evita o treinamento extensivo dos modelos geradores. Os pesquisadores demonstraram que, a partir de tokens aleatórios, imagens poderiam ser iterativamente ajustadas para corresponder a descrições textuais.

“Descobrimos que novas capacidades podem surgir quando se juntam essas diferentes peças.”
(“But we did discover that new capabilities can arise when you put all these pieces together.”)

— Sertac Karaman, Professor, MIT

As implicações dessa pesquisa são vastas e podem se estender além do campo da visão computacional. Os pesquisadores sugerem que a metodologia pode ser aplicada em áreas como a robótica, onde as ações dos veículos autônomos podem ser tokenizadas de maneira semelhante.

Fontes: (TechXplore – Machine Learning & AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!