
São Paulo — InkDesign News — O recente lançamento do Gemini 2.5 Flash Image promete uma revolução no campo da geração de imagens por inteligência artificial, destacando-se como uma resposta competitiva às inovações do setor, especialmente em um cenário dominado pela OpenAI.
Contexto e lançamento
O Gemini 2.5 Flash Image foi apresentado como uma atualização significativa por parte do Google, que busca fechar a distância em relação ao seu principal concorrente, OpenAI, que tem liderado com o ChatGPT e sua funcionalidade de geração de imagens. Este novo modelo surge em um contexto em que a geração de imagens tem desempenhado um papel vital no crescimento e na popularização das soluções de inteligência artificial. Em março, após o lançamento do ChatGPT-4, a utilização do aplicativo disparou, enquanto a Gemini tinha reportado 450 milhões de usuários mensais até julho, ainda atrás dos mais de 700 milhões do concorrente.
Design e especificações
O novo modelo permite que os usuários emitam comandos em linguagem natural, não apenas para gerar novas imagens, mas também para unir fotos existentes e realizar edições precisas, tudo isso sem as distorções problemáticas que afetaram modelos anteriores. “Você pode agora colocar o mesmo personagem em diferentes ambientes, apresentar um único produto de múltiplos ângulos em cenários novos ou gerar ativos de marca consistentes, tudo ao mesmo tempo que preserva o sujeito”, destacou o Google em um comunicado.
“Com modificações específicas usando apenas um prompt, como desfocar o fundo, remover manchas ou mudar a pose de um sujeito, o modelo se mostra extremamente versátil.”
(“You can now make very specific tweaks with just a prompt, such as blurring the background, removing a stain from a T-shirt, or changing a subject’s pose.”)
Repercussão e aplicações
O impacto do Gemini 2.5 já é palpável, com desenvolvedores explorando suas capacidades para criar cartões de lista de imóveis, crachás de uniformes e maquetes de produtos. As reações da comunidade são positivas, com uma demonstração do modelo, anteriormente conhecido sob o nome “nano-banana”, chamando a atenção na plataforma de avaliação LMArena, onde suas capacidades foram elogiadas pela qualidade e praticidade nas edições.
“A nova atualização resolve um dos maiores desafios da inteligência artificial: a consistência entre as edições de diversos itens.”
(“With its latest update, Google says it’s solved one of AI’s biggest headaches.”)
Com essas inovações, o Google parece estar bem posicionado para reforçar sua presença no mercado de inteligência artificial generativa, sugerindo que novos avanços ainda estão por vir. O futuro da geração de imagens por inteligência artificial promete ser cada vez mais dinâmico e acessível.
Fonte: (Gizmodo – Cultura Tech & Geek)