EAGLET aprimora desempenho de agentes de AI em tarefas complexas

São Paulo — InkDesign News — A inteligência artificial (IA) e os modelos de linguagem de grande escala (LLM) continuam a evoluir, prometendo melhorias significativas em estratégias de planejamento e execução de tarefas longas. Um novo framework chamado EAGLET visa superar os desafios que esses modelos enfrentam na realização de tarefas complexas.
Tecnologia e abordagem
EAGLET é um módulo de planejamento global que pode ser integrado a fluxos de trabalho existentes de agentes, funcionando ao lado dos modelos de execução, como GPT-4.1 e GPT-5. A metodologia proposta pela equipe de pesquisadores da Universidade de Tsinghua, da Universidade de Pequim, da DeepLang AI e da Universidade de Illinois Urbana-Champaign, separa a geração de planos da execução, proporcionando maior coesão nas estratégias voltadas para tarefas.
O treinamento do planejador EAGLET é realizado em duas etapas: a primeira envolve a geração de planos sintéticos utilizando LLMs avançados. Em seguida, esses planos passam por um processo de filtragem chamado "homologous consensus filtering". A segunda etapa refina o planejador por meio de um aprendizado por reforço baseado em regras, utilizando uma função de recompensa customizada.
Aplicação e desempenho
Um dos destaques do EAGLET é o Executor Capability Gain Reward (ECGR), que avalia a eficácia dos planos gerados em ajudar agentes com diferentes capacidades. EAGLET foi testado em três benchmarks reconhecidos: ScienceWorld, ALFWorld e WebShop. Os resultados mostram que os agentes com EAGLET superaram seus concorrentes não planejadores. Por exemplo, em cenários não vistos no ScienceWorld, o desempenho aumentou de 42,2 para 61,6.
Além disso, as métricas confirmam que a integração do EAGLET resulta em uma diminuição do número médio de passos para a conclusão das tarefas, otimizando o tempo de execução e reduzindo os custos computacionais.
Impacto e mercado
Embora o EAGLET seja descrito como "plug-and-play", a integração em estruturas populares de empresas como LangChain ainda não está clara. A ausência de um código aberto até o momento pode limitar a implementação prática em ambientes empresariais. Questões como escalabilidade e adaptabilidade do sistema em modelos menores também permanecem em aberto.
As implicações estratégicas do EAGLET são significativas, especialmente em setores que demandam planejamento passo a passo, como automação de TI e suporte ao cliente. A capacidade de guiar modelos de código aberto e fechado pode oferecer um ponto de partida acessível para equipes que buscam otimizar o desempenho de agentes de IA sem a sobrecarga de re-treinamento.
Próximos passos incluem esclarecer a viabilidade de implementação e identificar os modelos mínimos necessários para o uso prático do EAGLET.
Fonte: (VentureBeat – AI)