TNG Technology Consulting lança variante DeepSeek R1-0528 200% mais rápida

São Paulo — InkDesign News — A nova era da inteligência artificial (IA) se destaca com o lançamento do modelo DeepSeek-TNG R1T2 Chimera, desenvolvido pela TNG Technology Consulting, uma empresa alemã de consultoria em tecnologia. Este modelo, que se insere na categoria de Large Language Models (LLMs), promete melhorias significativas em termos de desempenho e eficiência, potencializando aplicações em diversas indústrias.
Tecnologia e abordagem
O R1T2 Chimera se baseia na técnica Assembly-of-Experts (AoE), que combina os pesos de múltiplos modelos pré-treinados, ao invés de ativar dinamicamente especialistas como em arquiteturas Mixture-of-Experts (MoE). Essa abordagem permite que o R1T2 mantenha altos níveis de raciocínio enquanto reduz os custos de inferência. O modelo utiliza uma nova configuração chamada “Tri-Mind”, que integra três modelos parentais: DeepSeek-R1-0528, DeepSeek-R1 e DeepSeek-V3-0324.
Aplicação e desempenho
Segundo benchmarks apresentados pela TNG, o R1T2 alcança entre 90% e 92% do desempenho em raciocínio do R1-0528, utilizando cerca de 40% menos tokens para gerar suas respostas. Isso se traduz em uma redução de 60% no comprimento das saídas, refletindo em um aumento de velocidade nas respostas. A modelagem do R1T2 não requer ajuste fino adicional e já se mostra eficiente para tarefas de raciocínio, porém não é recomendada para funções de chamada ou uso de ferramentas atualmente.
“R1T2 gera respostas usando aproximadamente 40% dos tokens necessários pelo R1-0528.”
(“R1T2 generates responses using approximately 40% of the tokens required by R1-0528.”)— TNG Technology Consulting
Impacto e mercado
A TNG Technology Consulting se posiciona como um fornecedor de soluções tecnológicas em setores como telecomunicações, seguros e automotivo. O lançamento do R1T2 não só reduz os custos de inferência, mas também promove uma implementação mais modular e personalizada, permitindo que empresas criem variantes especializadas a partir de forças preexistentes. Em um cenário onde a eficiência é crucial, a liberdade proporcionada pela licença MIT favorece a adoção do modelo em ambientes regulados e comerciais.
“R1T2 preserva a maior parte da potência de raciocínio de modelos de ponta, mas sem sua verbosidade.”
(“R1T2 preserves much of the reasoning power of top-tier models, but without their long-windedness.”)— TNG Technology Consulting
O modelo já está disponível na plataforma Hugging Face, permitindo acesso imediato para desenvolvedores interessados. Futuros aprimoramentos podem abordar as limitações atuais, principalmente sobre o uso de funções e ferramentas, conforme a TNG se dedica ao avanço contínuo das tecnologias de IA.
Fonte: (VentureBeat – AI)