
São Paulo — InkDesign News — Pesquisadores da Universidade de Illinois em Urbana-Champaign desenvolveram o s3, um framework de código aberto que otimiza a criação de sistemas de geração com recuperação aumentada (RAG) de forma mais eficiente do que os métodos atuais. Essa inovação pode transformar o desenvolvimento de aplicações baseadas em modelos de linguagem de aprendizado profundo (LLM).
Tecnologia e abordagem
O s3 propõe uma separação clara entre os componentes de busca e geração, permitindo que um modelo de busca interaja de forma estruturada com fontes externas de conhecimento. A inovação central do s3 é o sinal de recompensa chamado Gain Beyond RAG (GBR), que quantifica a melhoria na precisão do gerador ao ser condicionado por documentos recuperados pelo s3. Essa abordagem modular permite que empresas utilizem qualquer LLM, seja ele proprietário ou de mercado, sem necessidade de ajuste fino.
“s3 desacopla o recuperador (pesquisador) do gerador. Isso permite que empresas utilizem qualquer LLM disponível no mercado, sem precisar ajustá-lo.”
(“s3 decouples the retriever (searcher) from the generator. This lets companies plug in any off-the-shelf or proprietary LLM—whether GPT-4, Claude, or an internal model—without having to fine-tune it.”)— Patrick (Pengcheng) Jiang, Estudante de doutorado, UIUC
Aplicação e desempenho
O s3 foi testado em benchmarks de perguntas e respostas, superando metodologias prévias de RAG, como fine-tuning de ponta a ponta e técnicas de recuperação estática. Com apenas 2.400 exemplos de treinamento, o s3 obteve resultados superiores em qualidade de contexto e desempenho de respostas, diferenciando-se de métodos que exigem dezenas de milhares de exemplos.
“Muitas empresas não possuem conjuntos de dados anotados ou a infraestrutura necessária. O s3 reduz as barreiras ao proporcionar desempenho de recuperação forte com supervisão mínima.”
(“Many enterprises lack large-scale annotated QA datasets or the GPU infrastructure to fine-tune end-to-end LLM systems. s3 lowers the barrier by enabling strong retrieval performance with minimal supervision and compute.”)— Patrick (Pengcheng) Jiang, Estudante de doutorado, UIUC
Impacto e mercado
A adaptabilidade do s3 em domínios não treinados e sua capacidade de generalizar para aplicações específicas, como gestão de conhecimento corporativa e suporte à pesquisa científica, o posicionam como uma solução viável para empresas que lidam com conjuntos de dados proprietários. A modularidade do sistema torna-o atraente para setores com restrições regulatórias ou contratuais.
Os próximos passos envolvem a exploração de aplicações em setores onde a qualidade da recuperação é essencial e os dados rotulados são escassos. O potencial do s3 é palpável em áreas como saúde e serviços empresariais.
Fonte: (VentureBeat – AI)