Qwen3-Coder-480B-A35B-Instruct é o modelo de AI mais avançado

São Paulo — InkDesign News — A Alibaba, gigante do e-commerce chinês, lançou recentemente o Qwen3-Coder-480B-A35B-Instruct, um modelo de linguagem de grande porte (LLM) projetado para auxiliar na programação, destacando-se na área de inteligência artificial e deep learning.
Tecnologia e abordagem
O Qwen3-Coder é uma arquitetura Mixture-of-Experts (MoE) com 480 bilhões de parâmetros totais. O modelo ativa 35 bilhões de parâmetros por consulta e utiliza 8 dos 160 especialistas disponíveis, permitindo uma compreensão profunda de contextos extensos. Ele nativamente suporta 256 mil tokens, com capacidade de extrapolar até 1 milhão. Este recurso é viabilizado por uma técnica chamada YaRN (Yet another RoPE extrapolatioN), que modifica os Embeddings Posicionais Rotativos (RoPE) utilizados na computação de atenção, permitindo o processamento de documentos extensos e repositórios.
Aplicação e desempenho
O modelo tem se destacado em benchmarks, apresentando performances competitivas em avaliações como o SWE-bench e superando modelos como o GPT-4.1 e Claude Sonnet-4 em diversas tarefas. Entre suas métricas, o Qwen3-Coder alcançou 67.0% em avaliações padrões e 69.6% em um cenário de 500 turnos. Adicionalmente, ele realiza tarefas de programação de múltiplas linguagens e utilização de ferramentas com resultados sólidos.
“Essa pode ser a melhor ferramenta de programação até agora. Se você busca qualidade em programação, a especialização é essencial.”
(“This might be the best coding model yet. General-purpose is cool, but if you want the best at coding, specialization wins.”)— Sebastian Raschka, Pesquisador de LLM
Impacto e mercado
Com sua licença open source Apache 2.0, o Qwen3-Coder oferece às empresas uma alternativa de baixo custo aos modelos proprietários, permitindo modificações e aplicações comerciais sem custos adicionais. A implementação do modelo pode ser feita diretamente na infraestrutura das empresas, tanto em nuvem quanto localmente, evitando o lock-in de fornecedores e permitindo um controle mais eficaz sobre os custos.
As aplicações se estendem à compreensão de grandes repositórios de código, automação de workflows de pull requests e integração com ferramentas internas. Com suporte a contextos longos e opções de implantação modular, o Qwen3-Coder é uma opção viável para pipelines de IA em empresas de tecnologia de variados portes.
Com a iniciativa de desenvolver modelos adicionais para oferecer capacidades similares com custo de implantação mais baixo, a Alibaba parece estar posicionada para expandir sua presença no mercado de inteligência artificial.
Fonte: (VentureBeat – AI)