
São Paulo — InkDesign News — A crescente integração da inteligência artificial em ferramentas de criação de vídeos tem gerado tanto entusiasmo quanto frustração. O modelo Veo 3, da Google, utilizado por criadores para gerar clipes, enfrenta críticas pelo surgimento de legendas errôneas, dificultando a produção criativa.
Contexto da pesquisa
O Veo 3, lançado como parte da oferta de serviços de assinatura da Google, reflete avanços significativos na inteligência artificial aplicada à produção de mídia. Josh Woodward, vice-presidente do Google Labs e Gemini, anunciou em junho de 2023 que a empresa estava desenvolvendo correções para reduzir os textos sem sentido que aparecem nas produções. Contudo, mais de um mês após esse anúncio, usuários ainda relatam problemas através do canal do Discord da Google Labs, como evidenciado por Mona Weiss, diretora criativa da área publicitária.
Método e resultados
O Veo 3 utiliza algoritmos avançados de machine learning para gerar vídeos a partir de descrições textuais, empregando as plataformas Gemini e Flow. No entanto, o acesso a este modelo é restrito aos assinantes dos pacotes pagos da Google, que começam em R$ 1.300 por mês. Cada geração de um clip de oito segundos consome um mínimo de 20 créditos de IA, representando um custo adicional significativo. “Se você está criando uma cena com diálogo, até 40% do seu resultado pode ter legendas sem sentido, tornando-o inviável”, explica Weiss.
Implicações e próximos passos
A dificuldade em eliminar legendas indesejadas suscita discussões sobre a confiabilidade de modelos de IA em aplicações criativas. A equipe de suporte da Google Labs tem informado aos usuários que as legendas podem ser ativadas pela fala e que estão cientes do problema. Weiss enfrentou desafios ao tentar solicitar um reembolso por créditos utilizados em tentativas frustradas, recebendo um retorno apenas sobre o custo do Veo 3. “Ao aceitar, eu perderia acesso ao modelo totalmente,” afirmou.
“Você está queimando dinheiro tentando conseguir uma cena que gosta, mas depois não consegue usá-la.”
(“You’re burning through money trying to get a scene you like, but then you can’t even use it.”)— Mona Weiss, Diretriz Criativa
Os desafios éticos e técnicos encontrados na implementação desse tipo de tecnologia revelam a necessidade de um desenvolvimento mais cuidadoso e orientado pela experiência do usuário. A Google continua a trabalhar em ajustes, mas a solução completa para as questões levantadas pelos usuários ainda parece distante.
A adoção mais ampla de tecnologias de IA na produção de vídeo requer não apenas inovação técnica, mas também um compromisso com a melhoria contínua e a satisfação do usuário.
Fonte: (MIT Technology Review – Artificial Intelligence)