Framework D1 reduz em 30 segundos respostas de AI e LLM

- Publicidade -

Tiago F Santiago 04/05/2025Última Atualização 04/05/2025

0 66 2 minutos de leitura

Framework D1 reduz em 30 segundos respostas de AI e LLM — 30 seconds vs. 3: The d1 reasoning framework that's slashing AI response times

- Publicidade -

São Paulo — InkDesign News —
Pesquisadores da UCLA e Meta AI desenvolveram o d1, um framework que utiliza reinforcement learning para aprimorar significativamente as capacidades de raciocínio de modelos de linguagem baseados em difusão (dLLMs). Essa inovação pode gerar ganhos importantes em eficiência e aplicações práticas no mercado de inteligência artificial, especialmente para empresas que demandam agilidade e qualidade no processamento de linguagem natural.

Tecnologia e abordagem

Diferentemente dos modelos autoregressivos tradicionais, como GPT, que geram texto sequencialmente prevendo o próximo token a partir dos anteriores, os modelos de linguagem por difusão (dLLMs) funcionam por meio de um processo iterativo de “desmascaramento” de tokens. Inicialmente, o texto é fragmentado e mascarado; depois, o modelo gradualmente reconstrói a sequência completa, considerando o contexto global simultaneamente em cada etapa. Esse método, originado em modelos de geração de imagem como DALL-E 2 e Stable Diffusion, apresenta vantagens como processamento paralelo e potencial melhora na velocidade inferencial.

O desafio com dLLMs é que sua estrutura torna complexa e custosa a aplicação direta de técnicas de reinforcement learning, amplamente usadas para reforçar o raciocínio em modelos autoregressivos. O framework d1 propõe uma solução em duas etapas: fine-tuning supervisionado com exemplos detalhados de raciocínio e um treinamento por RL usando o algoritmo diffu-GRPO, que introduz uma forma eficiente de estimar probabilidades logarítmicas evitando cálculos caros, além de uma técnica inovadora chamada “random prompt masking” que promove regularização e aumento de dados.

“Enquanto modelos autoregressivos utilizam raciocínio para melhorar a qualidade, isso gera um custo computacional severo, com latências superiores a 30 segundos para uma única resposta… dLLMs de ponta podem superar os melhores modelos autoregressivos otimizados para velocidade em 10 vezes no throughput de usuários.”
(“While autoregressive LLMs can use reasoning to enhance quality, this improvement comes at a severe compute cost with frontier reasoning LLMs incurring 30+ seconds in latency to generate a single response… frontier dLLMs like Mercury can outperform the best speed-optimized autoregressive LLMs from frontier labs by 10x in user throughputs.”)

— Aditya Grover, Professor, UCLA

Aplicação e desempenho

O d1 foi aplicado no modelo open-source LLaDA-8B-Instruct e avaliado contra benchmarks de raciocínio matemático (GSM8K, MATH500) e lógico (4×4 Sudoku, Countdown number game). O modelo integrado com d1 apresentou desempenho superior consistentemente, superando versões com apenas fine-tuning ou apenas diffu-GRPO, evidenciando robustez e capacidade de autocorreção, além de aprendizagem de estratégias de resolução mais complexas.

“Modelos dLLMs aprimorados para raciocínio como o d1 podem alimentar diversos agentes para cargas de trabalho empresariais, incluindo agentes de codificação para engenharia de software instantânea e pesquisas profundas ultrarrápidas para estratégias e consultorias em tempo real…”
(“Reasoning-enhanced dLLMs like d1 can fuel many different kinds of agents for enterprise workloads, including coding agents for instantaneous software engineering, as well as ultra-fast deep research for real-time strategy and consulting…”)

— Aditya Grover, Professor, UCLA

Impacto e mercado

O avanço do d1 pode alterar a dinâmica entre modelos autoregressivos e de difusão no mercado, especialmente para empresas que enfrentam limitações de latência e custo. Segundo Grover, o modelo d1 pode superar os autoregressivos em qualidade, velocidade e custo, oferecendo uma alternativa plug-and-play para integração imediata em aplicações corporativas. Isso pode impulsionar automação e aceleração de fluxos de trabalho digitais, especialmente em setores que demandam respostas rápidas e raciocínio avançado.

Como próximos passos, o aprimoramento de frameworks como o d1 e sua escalabilidade podem fomentar o desenvolvimento de agentes cada vez mais eficientes, combinando raciocínio profundo com alta performance computacional, ampliando o alcance e a aplicabilidade dos LLMs no mercado empresarial.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 04/05/2025Última Atualização 04/05/2025

0 66 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Framework D1 reduz em 30 segundos respostas de AI e LLM

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Investidores redefinem estratégias em inteligência artificial

Reguladores avaliam impacto da inteligência artificial em relacionamentos

Modelos de IA geram vídeos com redes neurais avançadas

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Investidores redefinem estratégias em inteligência artificial

Reguladores avaliam impacto da inteligência artificial em relacionamentos

Modelos de IA geram vídeos com redes neurais avançadas

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

LIGO revela 10 descobertas sobre ondas gravitacionais

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Microsoft apresenta Xbox Ally X a R$999: design premium em handheld

Aura lança digital frame Aspen com recursos inteligentes por US$229

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Investidores redefinem estratégias em inteligência artificial

Reguladores avaliam impacto da inteligência artificial em relacionamentos

Modelos de IA geram vídeos com redes neurais avançadas

Startups lançam ferramentas para detectar uso do app Cluely com IA

AI habilita novo padrão para dispositivos IoT sem bateria

Artigos relacionados

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Microsoft apresenta Xbox Ally X a R$999: design premium em handheld

Aura lança digital frame Aspen com recursos inteligentes por US$229

Adblock detectado