Chain-of-Zoom permite super-resolução extrema com machine learning

São Paulo — InkDesign News — Um novo avanço em inteligência artificial (IA) propõe um método inovador para a geração de imagens em super-resolução por meio de um framework chamado Chain-of-Zoom, desenvolvido por pesquisadores da KAIST AI, na Coreia do Sul. O estudo revela como a aplicação de técnicas de machine learning pode melhorar significativamente a qualidade de imagens ampliadas sem a necessidade de retraining.
Contexto da pesquisa
A prática convencional de aumentar a resolução de imagens frequentemente resulta em artefatos e borrões, limitando seu uso em diversas aplicações, desde segurança pública até reconstruções históricas. Os pesquisadores identificaram que frameworks existentes utilizam principalmente métodos de interpolação ou regressão, que não são eficazes em grandes ampliações.
Método proposto
O Chain-of-Zoom (CoZ) introduz um processo de zoom em etapas, no qual um modelo de super-resolução (SR) existente é aplicado repetidamente para refinar a imagem em cada fase. A cada passo, um modelo de linguagem-visual (VLM) gera prompts descritivos que ajudam o modelo SR a produzir melhorias incrementais na resolução. Essa abordagem evita a necessidade de um modelo treinado para cada novo fator de escala, permitindo aumentos extremos de 16x a 256x.
“O novo framework não requer retraining para melhorar a qualidade da imagem, tornando-o mais portátil.”
(“The new framework does not require retraining to improve image quality, making it more portable.”)— Bryan Sangwoo Kim, Pesquisador, KAIST AI
Resultados e impacto
Os testes realizados demonstraram que o Chain-of-Zoom supera imagens geradas por benchmarks padrão, apresentando melhores resultados em clareza e detalhe. O uso de técnicas de reforço na geração de prompts assegurou sua utilidade e efetividade. No entanto, os pesquisadores alertam para a aplicabilidade destas imagens, enfatizando que as representações não são realistas e podem não corresponder a objetos reais, como placas de carros, por exemplo.
Os próximos passos incluem a exploração de aplicações práticas da tecnologia em áreas como vigilância e análise de dados visuais, potencializando o uso de soluções de AI para casos que exigem clareza em imagens ampliadas.
Fonte: (TechXplore – Machine Learning & AI)