Microsoft lança Phi-4-Reasoning-Plus, modelo LLM de inteligência artificial

São Paulo — InkDesign News —
A Microsoft Research lançou o Phi-4-reasoning-plus, um modelo de linguagem (LLM) aberto com foco em tarefas que exigem raciocínio profundo e estruturado. Com 14 bilhões de parâmetros, o modelo usa uma arquitetura Transformer decoder-only e emprega técnicas avançadas de fine-tuning supervisionado e aprendizado por reforço, elevando a precisão em benchmarks de matemática, ciência, programação e lógica.
Tecnologia e abordagem
O Phi-4-reasoning-plus é treinado com 16 bilhões de tokens, incluindo aproximadamente 8,3 bilhões únicos, extraídos de conjuntos sintéticos e da web curada. Uma fase específica de aprendizado por reforço, utilizando cerca de 6.400 problemas matemáticos, aprimora sua capacidade de raciocínio. A inovação principal é a utilização de uma estrutura de saída que separa os passos intermediários do raciocínio da resposta final, marcados por tokens especiais, promovendo maior transparência e coerência nas soluções complexas.
“Estas saídas estruturadas orientam o modelo a separar os passos intermediários do raciocínio da resposta final, promovendo tanto transparência quanto coerência na resolução de problemas longos.”
(“These structured outputs guide the model to separate its intermediate reasoning steps from the final answer, promoting both transparency and coherence in long-form problem solving.”)— Microsoft Research
Aplicação e desempenho
Apesar do tamanho moderado em comparação a outros modelos abertos, Phi-4-reasoning-plus supera modelos maiores como o DeepSeek-R1-Distill-70B em vários benchmarks exigentes. No exame matemático AIME 2025, o modelo apresenta mais acertos “pass@1” do que a versão com 70 bilhões de parâmetros, aproximando-se do desempenho do DeepSeek-R1 original, que possui 671 bilhões de parâmetros.
Além disso, o modelo suporta comprimento de contexto padrão de 32.000 tokens, estendido para até 64.000 tokens em testes, adequando-se a aplicações que demandam análise de documentos extensos ou raciocínio complexo em chatbots configurados para instruções de resolução passo a passo.
Impacto e mercado
O Phi-4-reasoning-plus oferece alternativas para engenheiros de IA e equipes de operação lidarem com modelos robustos de alta performance, mas com menor custo computacional e facilidade de integração em múltiplos frameworks como Hugging Face Transformers, vLLM, llama.cpp e Ollama. Sua compatibilidade com contextos extensos beneficia setores como jurídico, financeiro e técnico para análises e tomada de decisão complexa.
“Para tomadores de decisão técnicos, o Phi-4-reasoning-plus proporciona uma opção modular, interpretável e eficiente para gerenciamento de desempenho, escalabilidade, custo e risco.”
(“For technical decision-makers, Phi-4-reasoning-plus offers a modular, interpretable alternative that can be evaluated and integrated on a flexible basis.”)— Microsoft Research
A Microsoft recomenda avaliação criteriosa quanto à segurança e ética antes do uso em ambientes sensíveis, ressaltando o trabalho extenso em alinhamento e testes adversariais para minimizar vieses e riscos.
Os próximos passos indicam expansão no uso de modelos menores e abertos que democratizam o acesso a modelos de linguagem avançados, impulsionando a adoção em múltiplas escalas e setores.
Fonte: (VentureBeat – AI)