
São Paulo — InkDesign News —
A pesquisa recente em machine learning e inteligência artificial trouxe avanços significativos, especialmente na geração e edição de imagens. Um novo modelo desenvolvido pela NVIDIA, chamado DiffusionRenderer, visa trazer maior controle e precisão nos processos de criação visual.
Contexto da pesquisa
No evento Conference on Computer Vision and Pattern Recognition (CVPR 2025), realizado em Nashville entre 11 e 15 de junho, cientistas da NVIDIA apresentaram sua abordagem de aprendizado de máquina. O DiffusionRenderer propõe uma nova forma de gerar e editar imagens de maneira mais acessível e controlável, unindo a precisão das técnicas gráficas tradicionais à flexibilidade da IA.
Método proposto
O DiffusionRenderer combina técnicas de inverse rendering e forward rendering, permitindo a extração e geração de conteúdos visuais. O modelo utiliza “G-buffers”, representações intermediárias das imagens que definem atributos específicos. Com isso, a abordagem gera imagens fotorrealistas a partir de representações de cena. A técnica se fundamenta em modelos de difusão, uma classe de algoritmos de aprendizado profundo que aprimora ruídos aleatórios até criar gráficos coerentes.
“Com o DiffusionRenderer, queremos preencher essa lacuna combinando a precisão das pipelines gráficas tradicionais com a flexibilidade da IA.”
(“With DiffusionRenderer, we wanted to bridge that gap by combining the precision of traditional graphics pipelines with the flexibility of AI.”)— Sanja Fidler, VP de Pesquisa em IA, NVIDIA
Resultados e impacto
O DiffusionRenderer resolveu desafios de longa data na área de gráficos computacionais, melhorando a eficiência de tarefas tradicionalmente morosas, como a criação de ativos e a edição de iluminação. A pesquisa demonstrou que o desempenho do modelo melhora com o aumento do tamanho do dataset subjacente, como evidenciado pela integração com o NVIDIA Cosmos. Essa nova abordagem pode gerar dados fotorrealistas cruciais para a formação de algoritmos em diversas áreas, incluindo robótica e classificação de imagens.
“Um dos maiores impactos do DiffusionRenderer pode ser na simulação e IA física, onde a diversidade dos conjuntos de dados é essencial.”
(“Its other big impact could be in simulation and physical AI — robotics and AV training need the most diverse possible datasets, and DiffusionRenderer can generate new lighting conditions from new scenes.”)— Sanja Fidler, VP de Pesquisa em IA, NVIDIA
No futuro, o DiffusionRenderer pode transformar fluxos de trabalho para criadores de conteúdos, permitindo edições precisas em videogames, anúncios e filmes. As próximas etapas da pesquisa incluem a geração de resultados com ainda mais qualidade e a incorporação de controles semânticos e ferramentas de edição avançadas.
Fonte: (TechXplore – Machine Learning & AI)