Together AI otimiza AI com 400% mais velocidade de inferência

- Publicidade -

Tiago F Santiago 7 horas atrásÚltima Atualização 10/10/2025

0 23 2 minutos de leitura

Together AI otimiza AI com 400% mais velocidade de inferência — Together AI's ATLAS adaptive speculator delivers 400% inference speedup by learning from workloads in real-time

- Publicidade -

São Paulo — InkDesign News — A crescente adoção de inteligência artificial (IA) e modelos de linguagem (LLM) nas empresas está levando a um novo desafio: o desempenho decrescente em tarefas de inferência. A Together AI apresentou uma solução inovadora, chamada ATLAS, que promete otimizar essas operações.

Tecnologia e abordagem

A ATLAS, ou Sistema de Especulação de Aprendizado Adaptativo, é projetada para superar o problema dos "especuladores estáticos", que se tornam ineficientes conforme as demandas de carga de trabalho mudam. Essa abordagem utiliza um modelo de dois especuladores: o especulador estático, um modelo robusto treinado em dados abrangentes, e o especulador adaptativo, um modelo leve que aprende continuamente com o tráfego ao vivo, adaptando-se a novos padrões de uso.

“Se você é uma empresa que produz agentes de codificação, e a maioria dos seus desenvolvedores começa a escrever em Rust ou C, você verá a redução de velocidade.”
(“If you’re a company producing coding agents, and most of your developers have been writing in Python, all of a sudden some of them switch to writing Rust or C, then you see the speed starts to go down.”)

— Tri Dao, Cientista Chefe, Together AI

Aplicação e desempenho

A arquitetura dual da ATLAS permite escolher dinamicamente entre os dois especuladores, aumentando a eficiência durante o processo de inferência. Em testes, a ATLAS atingiu uma taxa de 500 tokens por segundo utilizando GPUs Nvidia B200, uma performance que rivaliza com chips de inferência especializados. Essa solução não apenas reduz a latência, mas também melhora a utilização do hardware, convertendo capacidade de computação em ganhos de velocidade.

“O software e a melhoria algorítmica estão conseguindo fechar a lacuna com hardware realmente especializado.”
(“The software and algorithmic improvement is able to close the gap with really specialized hardware.”)

— Tri Dao, Cientista Chefe, Together AI

Impacto e mercado

Em um cenário onde as cargas de trabalho estão em constante evolução, a necessidade de soluções adaptativas se torna evidente. Empresas que utilizam a ATLAS podem se beneficiar de um aumento de até 400% na velocidade de inferência, sem a necessidade de hardware personalizado caro. Esta abordagem, que implica uma mudança fundamental na forma como as plataformas de inferência devem operar, pode ser um divisor de águas para a indústria de IA.

À medida que a tecnologia continua a evoluir, empresas que adotarem algoritmos adaptativos podem obter vantagens competitivas significativas, elevando suas capacidades de inteligência artificial a um novo patamar.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 7 horas atrásÚltima Atualização 10/10/2025

0 23 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Together AI otimiza AI com 400% mais velocidade de inferência

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

Google constrói ecossistema de dados para AI em larga escala

Nvidia aprimora raciocínio de LLMs com técnica de pré-treino

Google e AWS oferecem AI no ambiente de trabalho com soluções integradas

OpenAI revela LLM que transforma o aprendizado de máquina

Echelon utiliza AI para desafiar modelos de consultoria

G2 revela que agentes de AI impulsionam ROI nas empresas

Zendesk lança capacidades de AI na Resolution Platform

Inteligência artificial potencializa serviços profissionais autônomos

Novo framework de memória melhora AI em cenários imprevisíveis

Notion reformula stack para escalar AI agentiva

Google constrói ecossistema de dados para AI em larga escala

Nvidia aprimora raciocínio de LLMs com técnica de pré-treino

Google e AWS oferecem AI no ambiente de trabalho com soluções integradas

OpenAI revela LLM que transforma o aprendizado de máquina

Echelon utiliza AI para desafiar modelos de consultoria

G2 revela que agentes de AI impulsionam ROI nas empresas

Zendesk lança capacidades de AI na Resolution Platform

Inteligência artificial potencializa serviços profissionais autônomos

Novo framework de memória melhora AI em cenários imprevisíveis

Notion reformula stack para escalar AI agentiva

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

LIGO revela 10 descobertas sobre ondas gravitacionais

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Edifier lança caixa de som com design inspirado em gaming

Aura lança digital frame Aspen com recursos inteligentes por US$229

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

Google constrói ecossistema de dados para AI em larga escala

Nvidia aprimora raciocínio de LLMs com técnica de pré-treino

Google e AWS oferecem AI no ambiente de trabalho com soluções integradas

OpenAI revela LLM que transforma o aprendizado de máquina

Echelon utiliza AI para desafiar modelos de consultoria

G2 revela que agentes de AI impulsionam ROI nas empresas

Zendesk lança capacidades de AI na Resolution Platform

Inteligência artificial potencializa serviços profissionais autônomos

Novo framework de memória melhora AI em cenários imprevisíveis

Notion reformula stack para escalar AI agentiva

Nanoprecise fortalece postura de segurança contra ransomware

Pesquisa avalia tecnologia que transforma corpos em solo

Artigos relacionados

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Edifier lança caixa de som com design inspirado em gaming

Aura lança digital frame Aspen com recursos inteligentes por US$229

Adblock detectado