- Publicidade -
- Publicidade -
- Publicidade -
Inteligência Artificial

GEPA otimiza LLMs sem aprendizado de reforço custoso

- Publicidade -
- Publicidade -

São Paulo — InkDesign News — Pesquisadores da Universidade da Califórnia, Berkeley, da Universidade de Stanford e da Databricks introduziram um novo método de otimização em inteligência artificial chamado GEPA, que tem se mostrado superior a técnicas tradicionais de aprendizado por reforço (RL) na adaptação de grandes modelos de linguagem (LLMs) para tarefas especializadas.

Tecnologia e abordagem

O GEPA (Genetic-Pareto) usa uma metodologia inovadora ao se afastar do paradigma de aprendizado orientado por milhares de tentativas e erros, baseadas em notas numéricas simples. Ao invés disso, o método aproveita a capacidade do LLM para entender sua própria linguagem, refletindo sobre seu desempenho, diagnosticando erros e evoluindo suas instruções de maneira iterativa. Essa abordagem não somente aumenta a precisão, mas também a eficiência, conseguindo resultados até 35 vezes mais eficazes com menos tentativas.

Exemplo de implementação inclui a substituição de recompensas esparsas por feedback rico em linguagem natural, onde a execução do sistema AI e seus passos são transformados em um texto que o LLM consegue entender. Esta metodologia é fundamentada em três pilares: evolução genética de prompts, reflexão com feedback em linguagem natural e seleção baseada em Pareto.

Aplicação e desempenho

O GEPA foi avaliado em quatro tarefas diversas, incluindo perguntas de múltiplas etapas e consultas que preservam a privacidade. Nos testes, ele apresentou um desempenho notavelmente melhor em comparação ao GRPO (Group Relative Policy Optimization), uma técnica popular de RL. Em uma das análises, o tempo de otimização para um sistema de questões e respostas foi reduzido para aproximadamente 3 horas, em comparação com as 24 horas necessárias pelo GRPO, além de resultar em uma performance 20% superior.

“Usamos o GEPA para otimizar um sistema de perguntas e respostas em ~3 horas em comparação com as 24 horas do GRPO — uma redução de 8x no tempo de desenvolvimento, além de 20% de performance a mais.”
(“We used GEPA to optimize a QA system in ~3 hours versus GRPO’s 24 hours—an 8x reduction in development time, while also achieving 20% higher performance.”)

— Lakshya A Agrawal, Co-autor, Universidade da Califórnia, Berkeley

Impacto e mercado

O impacto do GEPA vai além da mera otimização de sistemas. Os pesquisadores destacaram que sistemas otimizados pelo GEPA demonstraram maior confiabilidade ao lidar com dados novos e não vistos, o que está relacionado à "lacuna de generalização". Isso significa que o GEPA é capaz de produzir sistemas de AI mais flexíveis e adaptáveis, importantes para aplicações em ambientes de negócios.

Além da performance, as instruções baseadas em prompts do GEPA são até 9,2 vezes mais curtas, resultando em menores latências e custos para modelos baseados em API. Com a potencial integração do GEPA em pipelines de CI/CD, ele pode se transformar em um processo contínuo e automatizado de geração de soluções, superando o ajuste humano de especialistas.

Conforme os autores, a intenção do GEPA é democratizar a otimização de sistemas AI, permitindo que os usuários finais, que possuem conhecimento específico da área, possam construir e otimizar sistemas de forma mais acessível.

Fonte: (VentureBeat – AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!