Alibaba lança modelo Qwen3 open source em IA superando OpenAI o1

São Paulo — InkDesign News — A Alibaba, gigante chinesa do comércio eletrônico e tecnologia, lançou a série open source de modelos de inteligência artificial multimodais Qwen3, que se destacam como um dos LLMs (Large Language Models) mais avançados disponíveis publicamente, competindo com modelos proprietários como os da OpenAI e Google. O lançamento inclui oito versões, entre modelos densos e “mixture-of-experts” (MoE), com até 235 bilhões de parâmetros.
Tecnologia e abordagem
A arquitetura Qwen3 inclui dois modelos MoE e seis modelos densos, que combinam diferentes especialidades ativadas conforme a tarefa, método popularizado pela startup francesa Mistral. A versão principal, Qwen3-235B-A22B, supera benchmarks de código aberto como o DeepSeek R1 e o OpenAI o1, chegando perto do desempenho do Google Gemini 2.5-Pro.
Os modelos são treinados para oferecer “raciocínio híbrido” ou “raciocínio dinâmico”, permitindo alternar entre respostas rápidas e mais simples e raciocínios complexos que demandam maior poder computacional, similar às estratégias da OpenAI. A ativação desse modo pode ser feita via comandos específicos ou interface web.
Aplicação e desempenho
Os Qwen3 podem ser acessados por meio de plataformas como Hugging Face, ModelScope, Kaggle e GitHub, além do Qwen Chat online, que suporta geração rápida de imagens com adesão decente a prompts. Contudo, há restrições comuns ao conteúdo na China, como censura sobre tópicos sensíveis.
Os modelos têm suporte multilíngue para 119 idiomas e dialetos, expandindo sua utilidade global. Para integração, são compatíveis com frameworks OpenAI-like, e para uso local, ferramentas como Ollama, LMStudio e llama.cpp são recomendadas. A licensa Apache 2.0 permite uso comercial sem limitações legais associadas ao uso.
Impacto e mercado
As soluções MoE Qwen3 proporcionam raciocínio com nível de GPT-4 usando menos memória GPU, viabilizando adoção rápida em empresas com infraestrutura moderada. A possibilidade de microajustes privados (LoRA, QLoRA) ajuda a proteger dados sensíveis. Além disso, o modelo abre possibilidades frente a rivais chineses e internacionais, num mercado altamente competitivo.
Junyang Lin, integrante da equipe Qwen, comentou sobre as dificuldades técnicas superadas:
“Construir o Qwen3 envolveu desafios críticos, como a escalabilidade estável do aprendizado por reforço, balanceamento de dados multi-domínio e ampliação do desempenho multilíngue sem sacrificar qualidade.”
(“Building Qwen3 involved critical challenges such as scaling reinforcement learning stably, balancing multi-domain data, and expanding multilingual performance without quality sacrifice.”)— Junyang Lin, Membro da equipe Qwen
O foco futuro inclui ampliar tamanho e dados dos modelos, contextos maiores, modalidades múltiplas e aprendizado por reforço aprimorado, mirando avanços rumo à Inteligência Artificial Geral (AGI).
Fonte: (VentureBeat – AI)