Nvidia abre Nemotron-Nano-9B-v2 com raciocínio ativado/desativado

São Paulo — InkDesign News — A inteligência artificial (IA) continua a avançar com lançamentos significativos no desenvolvimento de modelos menores e mais eficientes. O recente lançamento do modelo Nemotron-Nano-9B-V2, da Nvidia, destaca-se no campo das LLMs (grandes modelos de linguagem), combinando a arquitetura híbrida de Mamba com Transformers para oferecer novos recursos.
Tecnologia e abordagem
O modelo Nemotron-Nano-9B-V2 utiliza uma combinação de arquiteturas Mamba-Transformer, permitindo que ele mantenha a eficácia enquanto desenvolve capacidades de raciocínio. A Nvidia afirma que o modelo foi reduzido de 12 bilhões para 9 bilhões de parâmetros, o que representa uma otimização significativa para operação em um único GPU Nvidia A10, um hardware popular entre desenvolvedores. Essas melhorias são alcançadas ao integrar modelos de espaço de estado seletivo (SSMs), que proporcionam um processamento de sequências mais longas de maneira eficiente.
“O modelo foi podado de 12 bilhões para 9 bilhões para se adequar especificamente ao A10, que é uma escolha popular para implantação.”
(“The 12B was pruned to 9B to specifically fit A10 which is a popular GPU choice for deployment.”)— Oleksii Kuchiaev, Diretor de AI Model Post-Training, Nvidia
Aplicação e desempenho
O Nemotron-Nano-9B-V2 é treinado para lidar com instruções em múltiplos idiomas, incluindo inglês, espanhol e japonês, e oferece suporte tanto para a geração de código quanto para o seguimento de instruções. Avaliações de desempenho revelam que o modelo atinge 72,1% no benchmark AIME25 e 90,3% no IFEval, mostrando uma precisão competitiva em comparação com outros modelos de pequeno porte.
A incursão da Nvidia no ajuste de parâmetros e na gestão de recursos de raciocínio permite que os desenvolvedores ajustem o desempenho e a latência, crucial para aplicações empresariais e de suporte ao cliente.
Impacto e mercado
O lançamento do Nemotron-Nano-9B-V2 se posiciona como uma ferramenta valiosa para desenvolvedores que buscam eficiência em produção sem a necessidade de comprometer a capacidade de raciocínio. A Nvidia disponibiliza o modelo sob a Nvidia Open Model License, que permite uso comercial imediato sem taxas adicionais, enfatizando um compromisso com a acessibilidade.
“Os modelos são comercialmente utilizáveis de imediato, permitindo que desenvolvedores criem e distribuam modelos derivados.”
(“Nvidia explicitly states that the models are commercially usable out of the box, and that developers are free to create and distribute derivative models.”)— Nvidia
Diante do aumento do custo de tokens e da demanda por sistemas de IA mais sustentáveis, a proposta da Nvidia de otimizar a utilização computacional sem sacrificar a qualidade posiciona a empresa como uma líder neste espaço. Nos próximos meses, o foco em aplicações práticas e escalabilidade do modelo poderá moldar a forma como soluções de IA são desenvolvidas e implementadas no mercado.
Fonte: (VentureBeat – AI)