
São Paulo — InkDesign News — Pesquisadores da Universidade da Califórnia, Berkeley, da Universidade de Stanford e da Databricks introduziram um novo método de otimização em inteligência artificial chamado GEPA, que tem se mostrado superior a técnicas tradicionais de aprendizado por reforço (RL) na adaptação de grandes modelos de linguagem (LLMs) para tarefas especializadas.
Tecnologia e abordagem
O GEPA (Genetic-Pareto) usa uma metodologia inovadora ao se afastar do paradigma de aprendizado orientado por milhares de tentativas e erros, baseadas em notas numéricas simples. Ao invés disso, o método aproveita a capacidade do LLM para entender sua própria linguagem, refletindo sobre seu desempenho, diagnosticando erros e evoluindo suas instruções de maneira iterativa. Essa abordagem não somente aumenta a precisão, mas também a eficiência, conseguindo resultados até 35 vezes mais eficazes com menos tentativas.
Exemplo de implementação inclui a substituição de recompensas esparsas por feedback rico em linguagem natural, onde a execução do sistema AI e seus passos são transformados em um texto que o LLM consegue entender. Esta metodologia é fundamentada em três pilares: evolução genética de prompts, reflexão com feedback em linguagem natural e seleção baseada em Pareto.
Aplicação e desempenho
O GEPA foi avaliado em quatro tarefas diversas, incluindo perguntas de múltiplas etapas e consultas que preservam a privacidade. Nos testes, ele apresentou um desempenho notavelmente melhor em comparação ao GRPO (Group Relative Policy Optimization), uma técnica popular de RL. Em uma das análises, o tempo de otimização para um sistema de questões e respostas foi reduzido para aproximadamente 3 horas, em comparação com as 24 horas necessárias pelo GRPO, além de resultar em uma performance 20% superior.
“Usamos o GEPA para otimizar um sistema de perguntas e respostas em ~3 horas em comparação com as 24 horas do GRPO — uma redução de 8x no tempo de desenvolvimento, além de 20% de performance a mais.”
(“We used GEPA to optimize a QA system in ~3 hours versus GRPO’s 24 hours—an 8x reduction in development time, while also achieving 20% higher performance.”)— Lakshya A Agrawal, Co-autor, Universidade da Califórnia, Berkeley
Impacto e mercado
O impacto do GEPA vai além da mera otimização de sistemas. Os pesquisadores destacaram que sistemas otimizados pelo GEPA demonstraram maior confiabilidade ao lidar com dados novos e não vistos, o que está relacionado à "lacuna de generalização". Isso significa que o GEPA é capaz de produzir sistemas de AI mais flexíveis e adaptáveis, importantes para aplicações em ambientes de negócios.
Além da performance, as instruções baseadas em prompts do GEPA são até 9,2 vezes mais curtas, resultando em menores latências e custos para modelos baseados em API. Com a potencial integração do GEPA em pipelines de CI/CD, ele pode se transformar em um processo contínuo e automatizado de geração de soluções, superando o ajuste humano de especialistas.
Conforme os autores, a intenção do GEPA é democratizar a otimização de sistemas AI, permitindo que os usuários finais, que possuem conhecimento específico da área, possam construir e otimizar sistemas de forma mais acessível.
Fonte: (VentureBeat – AI)