Qwen lança modelo LLM 2.5-Omni-3B para PCs e laptops

- Publicidade -

Tiago F Santiago 04/05/2025Última Atualização 04/05/2025

0 41 2 minutos de leitura

OpenAI lança GPT-4o apesar de críticas de especialistas em IA — OpenAI overrode concerns of expert testers to release sycophantic GPT-4o

- Publicidade -

São Paulo — InkDesign News — A chinesa Alibaba anunciou o lançamento do modelo multimodal Qwen2.5-Omni-3B, uma versão compacta com 3 bilhões de parâmetros de sua arquitetura avançada de inteligência artificial (IA) capaz de processar texto, áudio, imagem e vídeo. Projetado para rodar em hardware consumidor, o modelo propõe expandir o acesso à tecnologia multimodal com menor consumo de memória, mantendo alta performance em deep learning.

Tecnologia e abordagem

Qwen2.5-Omni-3B é um modelo multimodal que utiliza uma arquitetura de 3 bilhões de parâmetros, reduzida em relação à versão original de 7 bilhões, mas que mantém mais de 90% da performance em múltiplas tarefas. Entre os destaques técnicos, está o uso da arquitetura Thinker-Talker e do método customizado de embedding posicional TMRoPE, que sincroniza dados de vídeo e áudio para uma compreensão integrada. Essa otimização permite reduzir em mais de 50% o uso da memória de GPU quando lidando com contextos longos, beneficiando uso em GPUs de 24GB presentes em desktops e laptops avançados.

Aplicação e desempenho

O modelo suporta entrada simultânea de múltiplas modalidades e consegue gerar texto e voz em tempo real, incluindo opções de personalização de voz entre masculina e feminina. Benchmarks mostram que o Qwen2.5-Omni-3B alcança resultados competitivos em comparação ao modelo maior, apresentando notas próximas em testes como OmniBench (multimodal), VideoBench (áudio) e Seed-tts-eval (síntese vocal). Essa eficiência torna o modelo viável para aplicações que exigem interação em tempo real com múltiplos formatos de dados.

Impacto e mercado

Apesar do potencial técnico, o modelo está disponível sob licença para uso exclusivamente acadêmico e de pesquisa, impossibilitando sua aplicação comercial sem licença adicional da Alibaba. Isso cria um cenário onde Qwen2.5-Omni-3B se apresenta mais como uma ferramenta para avaliação, prototipagem e pesquisa de viabilidade do que para implementação direta em produtos comerciais.

“Enquanto muitos usuários desejam um modelo Omni menor para implantação, nós então construímos este.”
(“While a lot of users hope for smaller Omni model for deployment we then build this.”)

— Junyang Lin, Equipe Qwen, Alibaba

Para executivos e profissionais de infraestrutura, o lançamento destaca uma alternativa técnica para explorar multimodalidade com recursos reduzidos, mas reforça a necessidade de negociação para usos comerciais. O Qwen2.5-Omni-3B representa um avanço estratégico na acessibilidade da IA multimodal, mas com restrições claras sobre seu uso final.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 04/05/2025Última Atualização 04/05/2025

0 41 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Qwen lança modelo LLM 2.5-Omni-3B para PCs e laptops

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

Unlocking AI: excelência operacional para potencializar algoritmos

OpenAI enfrenta viés de castas em seus modelos de IA

Drone e inteligência artificial moldam futuro nos EUA

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Unlocking AI: excelência operacional para potencializar algoritmos

OpenAI enfrenta viés de castas em seus modelos de IA

Drone e inteligência artificial moldam futuro nos EUA

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

LIGO revela 10 descobertas sobre ondas gravitacionais

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Cientistas recriam incêndio que gera clima próprio em pesquisa

Aura lança digital frame Aspen com recursos inteligentes por US$229

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

Unlocking AI: excelência operacional para potencializar algoritmos

OpenAI enfrenta viés de castas em seus modelos de IA

Drone e inteligência artificial moldam futuro nos EUA

Investigadores dos EUA usam IA para detectar imagens de abuso infantil

Drones da polícia usam inteligência artificial para perseguir furtos

Inteligência artificial e Wikipedia afundam línguas vulneráveis

OpenAI desvenda o código dos chatbots com inteligência artificial

AI pode facilitar relações inesperadas com chatbots

Modelos de IA utilizam dados de artigos retratados

Startup médica utiliza inteligência artificial para diagnósticos

Bose e Skullcandy lançam fones TWS US$99 com design e cancelamento ativo

Robô com mãos soft avança em automação com Kaspar Althoefer

Artigos relacionados

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Cientistas recriam incêndio que gera clima próprio em pesquisa

Aura lança digital frame Aspen com recursos inteligentes por US$229

Adblock detectado