Novo método de treinamento AI cria agentes poderosos com 78 exemplos

São Paulo — InkDesign News — Um novo estudo do Laboratório de Pesquisa em IA Generativa da Universidade Jiao Tong de Xangai (GAIR) revela que treinar modelos de linguagem de grande porte (LLMs) para tarefas complexas e autônomas não requer conjuntos de dados massivos.
Tecnologia e abordagem
O framework LIMI (Less Is More for Intelligent Agency) propõe que “a autonomia da máquina surge não da abundância de dados, mas da curadoria estratégica de demonstrações agentivas de alta qualidade” (”machine autonomy emerges not from data abundance but from strategic curation of high-quality agentic demonstrations”). A pesquisa destaca que inteligência agentiva pode ser obtida a partir de um conjunto reduzido de exemplos, desafiando a crença de que grandes volumes de dados são essenciais para o sucesso. No experimento, um conjunto de apenas 78 exemplos bem selecionados mostrou uma performance superior a modelos treinados com milhares de dados.
Aplicação e desempenho
Os cientistas definem "agência" como “a capacidade emergente de sistemas de IA funcionarem como agentes autônomos” (”the emergent capacity of AI systems to function as autonomous agents”), realizando descobertas, formulando hipóteses e executando soluções por meio de envolvimento auto-dirigido. O modelo LIMI foi testado utilizando o benchmark AgencyBench, focado em medir habilidades agentivas. O modelo treinado com 78 exemplos alcançou uma média de 73,5%, superando todos os modelos de referência, como GLM-4.5, que obteve 45,1%. Além disso, demonstrou um desempenho notável com apenas 128 vezes menos dados em comparação com modelos tradicionais.
Impacto e mercado
O impacto desse estudo abrange tanto o desenvolvimento de agentes autônomos quanto a aplicação prática em empresas, onde dados podem ser escassos ou dispendiosos de coletar. “Esta descoberta remodela fundamentalmente como desenvolvemos sistemas de IA autônomos, sugerindo que dominar a agência requer compreensão de sua essência, e não escalamento de dados de treinamento” (”this discovery fundamentally reshapes how we develop autonomous AI systems, suggesting that mastering agency requires understanding its essence, not scaling training data”).
Embora o LIMI tenha demonstrado resultados promissores, o futuro vê a possibilidade de uma adoção mais ampla, onde empresas poderão aproveitar suas equipes de especialistas para criar conjuntos de dados pequenos e de alta qualidade. Isso reduz barreiras e possibilita o desenvolvimento de agentes de IA customizados, conferindo vantagens competitivas em fluxos de trabalho relevantes.
Fonte: (VentureBeat – AI)