Modelos de AI dividem tarefas e reduzem espera por prompts

- Publicidade -

Tiago F Santiago 21/07/2025Última Atualização 21/07/2025

0 47 2 minutos de leitura

Modelos de AI dividem tarefas e reduzem espera por prompts — Credit: Pixabay/CC0 Public Domain

- Publicidade -

Com o avanço dos modelos de linguagem, como o ChatGPT, a pesquisa em machine learning busca atender às crescentes demandas por respostas mais rápidas e precisas a prompts complexos.

Contexto da pesquisa

Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) e do Google desenvolveram uma nova abordagem para a decodificação paralela em modelos de linguagem. O desafio tradicional reside na forma como os modelos decodificam as respostas, gerando cada token sequencialmente, o que resulta em um tempo de espera significativo para solicitações mais complicadas.

Método proposto

A equipe introduziu o método de PASTA (Parallel Structure Annotation), que utiliza um processo de aprendizado para identificar e decodificar partes semanticamente independentes do texto em paralelo. Esse método se afasta de regras rígidas e permite que os modelos reconheçam automaticamente oportunidades de paralelização. O processo inclui uma linguagem de anotação, chamada PASTA-LANG, que instrui os LLMs (Modelos de Linguagem de Grande Escala) a etiquetar partes de suas respostas que podem ser geradas simultaneamente.

“Os LLMs tradicionais são como um único cozinheiro fazendo uma lasanha, passo a passo. O PASTA ensina o cozinheiro a reconhecer quando diferentes partes da lasanha podem ser preparadas ao mesmo tempo, levando a um processo muito mais rápido.”
(“Traditional LLMs are like a single cook making lasagna, one step at a time. PASTA teaches the cook to recognize when different parts of the lasagna can be prepared simultaneously, like mixing a subset of ingredients while the oven preheats, leading to a much faster process overall.”)

— Tian Jin, Autor Principal, CSAIL

Resultados e impacto

Em testes realizados com o benchmark AlpacaEval, o modelo autônomo de paralelização apresentou aumentos de desempenho geométricos chegando a quase duas vezes mais rápido, com mudanças mínimas na qualidade da resposta (variando de um ganho de 2% a uma queda de 7%). Isso sugere que os usuários podem esperar respostas quase duas vezes mais rápidas sem redução significativa na precisão ou coerência.

“Foi surpreendente ver esse comportamento de um LLM orquestrando seu próprio comportamento em tempo de inferência. Foi iluminador — e, de certa forma, mágico — observar como aumentar a computação nesses algoritmos resulta em um comportamento de auto-orquestração cada vez mais sofisticado.”
(“It was surprising to see this behavior of having an LLM orchestrate its own inference-time behavior. It was illuminating—and in a way, magical—to see how throwing more compute at these algorithms yields increasingly sophisticated self-orchestration behavior.”)

— Tian Jin, Autor Principal, CSAIL

Com o PASTA, a pesquisa aponta para um futuro em que a latência de decodificação em modelos de linguagem pode ser significativamente reduzida, o que poderia democratizar o acesso a esses modelos de AI a um público mais amplo. Jin e sua equipe estão otimistas quanto às implicações mais amplas de sua descoberta, que inclui a possibilidade de reduzir as exigências de recursos computacionais para esses poderosos modelos.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 21/07/2025Última Atualização 21/07/2025

0 47 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Modelos de AI dividem tarefas e reduzem espera por prompts

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

LLMs representam sentenças como humanos, revela estudo

One-shot federated learning alia proteção de dados e eficiência

AI gera desafio triplo para moderadores do Reddit

Modelo AI eleva inteligência robótica com reconhecimento de objetos

AI poisoning: máquina aprende a enganar sistemas de ML

Machine learning personaliza preços, mas pode falhar

Machine learning garante ética em tecnologias de smart city

LLM da OpenAI enfrenta desafios com pedidos de chips

LLM impulsiona coleta de novo grande dataset

Machine learning prevê melhor risco de infarto em pacientes

LLMs representam sentenças como humanos, revela estudo

One-shot federated learning alia proteção de dados e eficiência

AI gera desafio triplo para moderadores do Reddit

Modelo AI eleva inteligência robótica com reconhecimento de objetos

AI poisoning: máquina aprende a enganar sistemas de ML

Machine learning personaliza preços, mas pode falhar

Machine learning garante ética em tecnologias de smart city

LLM da OpenAI enfrenta desafios com pedidos de chips

LLM impulsiona coleta de novo grande dataset

Machine learning prevê melhor risco de infarto em pacientes

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

LIGO revela 10 descobertas sobre ondas gravitacionais

Ataques a ONGs aumentam com ransomware globalmente

STF valida alta programada e fim do auxílio-doença do INSS

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Python aplica Transformada de Fourier em modelagem de ML

Aura lança digital frame Aspen com recursos inteligentes por US$229

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

LLMs representam sentenças como humanos, revela estudo

One-shot federated learning alia proteção de dados e eficiência

AI gera desafio triplo para moderadores do Reddit

Modelo AI eleva inteligência robótica com reconhecimento de objetos

AI poisoning: máquina aprende a enganar sistemas de ML

Machine learning personaliza preços, mas pode falhar

Machine learning garante ética em tecnologias de smart city

LLM da OpenAI enfrenta desafios com pedidos de chips

LLM impulsiona coleta de novo grande dataset

Machine learning prevê melhor risco de infarto em pacientes

Microsoft lança patch emergencial para falha zero-day no SharePoint

Anduril levanta US$ 24M para modernizar logística militar

Artigos relacionados

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Python aplica Transformada de Fourier em modelagem de ML

Aura lança digital frame Aspen com recursos inteligentes por US$229

Adblock detectado