
São Paulo — InkDesign News — A nova abordagem conhecida como DeepConf visa otimizar o desempenho de modelos de machine learning, reduzindo custos computacionais enquanto melhora a acurácia em tarefas complexas, como problemas de Olimpíada de Matemática.
Arquitetura de modelo
Os pesquisadores da Meta AI desenvolveram o “DeepConf”, ou “Deep Think with Confidence” (“Pensar Profundamente com Confiança”), que lida com um problema central em modelos de linguagem: a consistência interna. Em essência, DeepConf filtra soluções de raciocínio com base na confiança do modelo antes da votação final, tornando o processo mais eficiente.
“Em vez de tomar centenas de soluções e simplesmente votar nelas, buscamos sinais internos de confiança do modelo durante e após a geração.”
(“Instead of taking hundreds of solutions and simply voting on them, we look at the model’s internal confidence signals during and after generation.”)— A. Dayananda, Pesquisador, Meta AI
Treinamento e otimização
A técnica aborda a geração de até 512 traçados de raciocínio por questão. Um único traçado gera 68% de acurácia, enquanto a maioria dos votos resultou em 82% de acertos. No entanto, esses traçados geram um volume excessivo de tokens, 100 milhões adicionais em um único exemplo, o que destaca a necessidade de otimizar a geração.
“Se os alunos estão adivinhando aleatoriamente, então o voto da classe não reflete o melhor pensador da sala.”
(“if the students are guessing randomly, then the class vote doesn’t reflect the best thinker in the room.”)— A. Dayananda, Pesquisador, Meta AI
Resultados e métricas
Em experimentos com o benchmark AIME 2025, o DeepConf com GPT-OSS-120B alcançou uma acurácia notável de 99.9%, superando os 97% com votação simples. A geração de tokens foi reduzida em até 84.7%, um grande avanço ao evitar cálculo excessivo durante o processo de raciocínio.
“O algoritmo é a arte do ‘early stopping’ e economiza uma quantidade enorme de computação e recursos.”
(“The algorithm is the art of early stopping and saving an enormous amount of computation and resources.”)— A. Dayananda, Pesquisador, Meta AI
Essa melhoria pode ser aplicada em uma variedade de setores, como educação e programação, onde a eficiência e precisão são cruciais. O foco em modelos de deep learning que não apenas respondem, mas otimizam a maneira como processam informações representa um passo importante na evolução da inteligência artificial.
Fonte: (Towards Data Science – AI, ML & Deep Learning)