
São Paulo — InkDesign News — A ByteDance, empresa mãe do TikTok, anunciou a liberação do Seed-OSS-36B, um novo modelo de inteligência artificial (IA) com foco em linguagens, desenvolvendo soluções para raciocínio avançado e usabilidade voltada para desenvolvedores. Este modelo de grande porte (LLM) apresenta uma capacidade de contexto de até 512.000 tokens, superando competidores estabelecidos como OpenAI.
Tecnologia e abordagem
O Seed-OSS-36B é lançado em três variantes: Seed-OSS-36B-Base com dados sintéticos, Seed-OSS-36B-Base sem dados sintéticos e Seed-OSS-36B-Instruct. A variante com dados sintéticos é projetada para oferecer alto desempenho em tarefas gerais, enquanto a versão sem dados sintéticos serve como uma base mais limpa para evitar distorções. Assim, a equipe visa equilibrar a flexibilidade de pesquisa com a performance prática.
“Ao fornecer ambas as variantes, buscamos dar aos usuários aplicados acesso a resultados aprimorados enquanto garantimos uma base neutra para estudos.”
(“By providing both, the team gives applied users access to improved results while ensuring researchers retain a neutral baseline for studying post-training methods.”)— Equipe Seed, ByteDance
Aplicação e desempenho
Com 36 bilhões de parâmetros, cada modelo é estruturado em 64 camadas e suporta um vocabulário de 155.000 tokens. A capacidade nativa de longa duração é uma inovação que permite o processamento de documentos extensos sem perda de desempenho, característica que representa uma vantagem para aplicações que exigem raciocínio complexo e documentação volumosa.
O Seed-OSS-36B-Instruct apresenta resultados excepcionais em benchmarks de matemática e programação, registrando 91,7% no AIME24, 67,4 no LiveCodeBench v6 e 94,6 no RULER, tornando-se um dos modelos abertos mais robustos para tarefas que exigem raciocínio lógico.
Impacto e mercado
Esse lançamento se alinha à crescente tendência de empresas chinesas que oferecem modelos de IA de código aberto poderosos, competindo diretamente com iniciativas como a do ChatGPT com sua gama de modelos abertos. A estrutura de licenciamento Apache-2.0 permite que empresas usem, modifiquem e redistribuam modelos sem custos adicionais, aumentando as opções para desenvolvedores e pesquisadores.
“O Seed-OSS oferece potencial robusto em tarefas intensivas de matemática e programação, além de flexibilidade para usos de pesquisa.”
(“These results suggest Seed-OSS offers strong potential across math-heavy, coding, and long-context workloads while still providing flexibility for research use cases.”)— Equipe Seed, ByteDance
À medida que a competição no espaço da IA se intensifica, a ByteDance estabelece um novo padrão em acessibilidade e inovação, sugerindo que o futuro da inteligência artificial pode estar amplamente disponível e colaborativo.
Próximos passos incluem a exploração de suas capacidades em aplicações comerciais, consolidando um espaço no mercado de IA acessível e eficiente.
Fonte: (VentureBeat – AI)