LLM acelera inferência com novo framework de machine learning

- Publicidade -

Tiago F Santiago 07/08/2025Última Atualização 07/08/2025

0 2 2 minutos de leitura

LLM acelera inferência com novo framework de machine learning — Schematic diagram of SPECTRA and other existing training-free approaches. Credit: Nguyen Le Minh from JAIST

- Publicidade -

Contexto da pesquisa

A pesquisa em machine learning avança rapidamente, especialmente no domínio dos modelos de linguagem de grande escala (LLMs). Recentemente, uma equipe de cientistas da Japan Advanced Institute of Science and Technology (JAIST) desenvolveu um novo framework, denominado SPECTRA, que visa acelerar a geração de texto, essencial para aplicações como chatbots e assistentes de código.

Método proposto

O SPECTRA utiliza um método de decodificação especulativa que permite que um modelo menor de LLM faça várias suposições sobre os tokens de texto simultaneamente, os quais são então verificados pelo modelo original. Isso reduz significativamente o tempo necessário para a geração de respostas. O framework é composto por dois módulos: o módulo central SPECTRA-CORE, que se integra facilmente aos LLMs, e um módulo de recuperação opcional SPECTRA-RETRIEVAL que melhora ainda mais o desempenho.

“O framework consiste em dois componentes principais: um módulo central (SPECTRA-CORE), que se integra perfeitamente aos LLMs de maneira plug-and-play, e um módulo de recuperação opcional (SPECTRA-RETRIEVAL) que melhora ainda mais o desempenho.”
(“The framework consists of two main components: a core module (SPECTRA-CORE), which integrates seamlessly into LLMs in a plug-and-play manner, and an optional retrieval module (SPECTRA-RETRIEVAL) that further enhances performance.”)

— Nguyen Le Minh, Professor, JAIST

Resultados e impacto

A equipe de pesquisa testou o SPECTRA em seis tarefas, incluindo conversas de múltiplas interações, geração de código e raciocínio matemático, utilizando três famílias de LLM: Llama 2, Llama 3 e CodeLlama. Os resultados mostraram um aumento de desempenho de até 4x, superando métodos avançados de decodificação não treinada, como REST, ANPD e Lookahead. O SPECTRA demonstrou ser confiável em diversos modelos e conjuntos de dados, otimizando as taxas de aceleração.

“Ao integrar nosso módulo SPECTRA-CORE, que utiliza armazenamento N-gram em múltiplos níveis e busca bidirecional, com o módulo SPECTRA-RETRIEVAL, que seleciona pistas externas de alta qualidade por meio de filtragem baseada em perplexidade, conseguimos obter acelerações substanciais (até 4,08x) em diversas tarefas e arquiteturas de modelos, preservando a qualidade do output original.”
(“By integrating our plug-and-play SPECTRA-CORE module—which leverages multi-level N-gram storage and bidirectional search—with the refined SPECTRA-RETRIEVAL module that selects high-quality external cues via perplexity-based filtering, we were able to achieve substantial speedups (up to 4.08×) across diverse tasks and model architectures while preserving the original model’s output quality.”)

— Nguyen Le Minh, Professor, JAIST

O SPECTRA oferece uma solução prática para sistemas comerciais e de pesquisa que utilizam LLMs, potencialmente melhorando a acessibilidade e a sustentabilidade de IAs de alto desempenho a longo prazo. Futuras pesquisas podem explorar integrações adicionais e otimizações para expandir ainda mais o escopo de aplicações deste framework.

Fonte: (TechXplore – Machine Learning & AI)

- Publicidade -

Etiquetas

Tiago F Santiago 07/08/2025Última Atualização 07/08/2025

0 2 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

LLM acelera inferência com novo framework de machine learning

Contexto da pesquisa

Método proposto

Resultados e impacto

Tiago F Santiago

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Contexto da pesquisa

Método proposto

Resultados e impacto

Ler o Próximo

Machine learning ainda não supera vendedores humanos

LLM influencia normas da indústria em festivais de cinema

Deep learning detecta incêndios rapidamente em câmeras comuns

Sakana AI usa deep learning inspirado na natureza

Redes neurais físicas treinam mais eficientemente com luz

Modelos de AI calculam palavras de maneira inovadora

Swarm intelligence melhora soluções com machine learning

Modelo de AI anima filme para estreia no Cannes

Mistral fortalece liderança em IA na Europa com investimento

Sistema de banco de dados relacional impulsiona machine learning

Elden Ring revela na datamine sua maior atualização até agora

MacBook Pro 2024 pode corrigir problema de tela

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado