Novo framework de memória melhora AI em cenários imprevisíveis

São Paulo — InkDesign News — Pesquisadores da Universidade de Illinois Urbana-Champaign e do Google Cloud AI Research desenvolveram um novo framework chamado ReasoningBank, que permite a agentes de modelos de linguagem grande (LLMs) organizarem suas experiências em um banco de memória. Essa inovação tem como objetivo aprimorar o desempenho em tarefas complexas ao longo do tempo, utilizando estratégias de raciocínio generalizáveis.
Tecnologia e abordagem
ReasoningBank distila estratégias úteis a partir de experiências passadas, sejam elas bem-sucedidas ou falhas, transformando essas informações em itens de memória estruturados. De acordo com Jun Yan, pesquisa científica do Google e coautor do estudo, “Agentes tradicionais operam de forma estática — cada tarefa é processada isoladamente" (“Traditional agents operate statically—each task is processed in isolation”). Com o ReasoningBank, as experiências são transformadas em estratégias reutilizáveis, permitindo que os agentes não comecem do zero a cada nova tarefa.
A abordagem processa tanto sucessos quanto falhas, utilizando esquemas como LLM-as-a-judge para eliminar a necessidade de rotulagem humana. Isso cria um ciclo fechado onde, a cada nova tarefa, o agente busca memórias relevantes para guiar suas ações.
Aplicação e desempenho
A pesquisa demonstrou que a combinação do ReasoningBank com técnicas de escalonamento em tempo de teste (test-time scaling) melhora significativamente o desempenho dos LLMs. Essa técnica, chamada de Memory-aware Test-Time Scaling (MaTTS), integra o uso de memória ao escalonamento, permitindo que o sistema gere múltiplas tentativas para encontrar soluções e aprenda com essas experiências.
Nos testes realizados em benchmarks como o WebArena e SWE-Bench-Verified, o ReasoningBank superou agentes sem memória e frameworks de memória baseados em trajetórias. Por exemplo, no WebArena, observou-se uma melhoria de até 8,3 pontos percentuais na taxa de sucesso em comparação com um agente sem memória.
Impacto e mercado
Os resultados sugerem que o ReasoningBank pode transformar o desenvolvimento de agentes adaptativos no mercado empresarial, que aprendem com a experiência e se adaptam a workflows complexos em áreas como suporte ao cliente e engenharia de software. Yan observa que a adoção dessa tecnologia pode resultar na redução de custos operacionais: “Esses custos de tentativa e erro poderiam ser evitados aproveitando insights relevantes do ReasoningBank” ( “Those trial and error costs could be avoided by leveraging relevant insights from ReasoningBank”).
O ReasoningBank destaca-se como um passo em direção à construção de agentes com inteligência composicional, que são capazes de aprender habilidades discretas e combiná-las para resolver tarefas complexas de forma autônoma. Essa evolução pode indicar um futuro em que os agentes gerenciem fluxos de trabalho com mínima intervenção humana.
Fonte: (VentureBeat – AI)