- Publicidade -
- Publicidade -
- Publicidade -
Machine learning & AI

Chain-of-Zoom permite super-resolução extrema com machine learning

- Publicidade -
- Publicidade -

São Paulo — InkDesign News — Um novo avanço em inteligência artificial (IA) propõe um método inovador para a geração de imagens em super-resolução por meio de um framework chamado Chain-of-Zoom, desenvolvido por pesquisadores da KAIST AI, na Coreia do Sul. O estudo revela como a aplicação de técnicas de machine learning pode melhorar significativamente a qualidade de imagens ampliadas sem a necessidade de retraining.

Contexto da pesquisa

A prática convencional de aumentar a resolução de imagens frequentemente resulta em artefatos e borrões, limitando seu uso em diversas aplicações, desde segurança pública até reconstruções históricas. Os pesquisadores identificaram que frameworks existentes utilizam principalmente métodos de interpolação ou regressão, que não são eficazes em grandes ampliações.

Método proposto

O Chain-of-Zoom (CoZ) introduz um processo de zoom em etapas, no qual um modelo de super-resolução (SR) existente é aplicado repetidamente para refinar a imagem em cada fase. A cada passo, um modelo de linguagem-visual (VLM) gera prompts descritivos que ajudam o modelo SR a produzir melhorias incrementais na resolução. Essa abordagem evita a necessidade de um modelo treinado para cada novo fator de escala, permitindo aumentos extremos de 16x a 256x.

“O novo framework não requer retraining para melhorar a qualidade da imagem, tornando-o mais portátil.”
(“The new framework does not require retraining to improve image quality, making it more portable.”)

— Bryan Sangwoo Kim, Pesquisador, KAIST AI

Resultados e impacto

Os testes realizados demonstraram que o Chain-of-Zoom supera imagens geradas por benchmarks padrão, apresentando melhores resultados em clareza e detalhe. O uso de técnicas de reforço na geração de prompts assegurou sua utilidade e efetividade. No entanto, os pesquisadores alertam para a aplicabilidade destas imagens, enfatizando que as representações não são realistas e podem não corresponder a objetos reais, como placas de carros, por exemplo.

Os próximos passos incluem a exploração de aplicações práticas da tecnologia em áreas como vigilância e análise de dados visuais, potencializando o uso de soluções de AI para casos que exigem clareza em imagens ampliadas.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!