Pesquisadores otimizam custos em LLM com retrain parcial

- Publicidade -

Tiago F Santiago 3 horas atrásÚltima Atualização 13/10/2025

0 23 2 minutos de leitura

Pesquisadores otimizam custos em LLM com retrain parcial — Researchers find that retraining only small parts of AI models can cut costs and prevent forgetting

- Publicidade -

São Paulo — InkDesign News — Pesquisadores da Universidade de Illinois em Urbana-Champaign desenvolveram uma nova abordagem para o ajuste fino de modelos de linguagem de grande porte (LLM), visando mitigar o fenômeno conhecido como "esquecimento catastrófico". Esse comportamento ocorre quando LLMs perdem habilidades previamente adquiridas após serem refinados para novas tarefas.

Tecnologia e abordagem

O estudo destaca dois modelos específicos, LLaVA e Qwen 2.5-VL, que geram respostas a partir de imagens. Os pesquisadores introduziram um método que permite o re-treinamento de partes específicas do modelo em vez de reformular a totalidade, almejando economizar custos de processamento. A equipe afirma que o "esquecimento catastrófico" não é uma perda permanente de memória, mas o resultado de um desvio de viés na distribuição de saída.

Aplicação e desempenho

Para investigar o fenômeno, os pesquisadores definiram um conjunto de tarefas-alvo e avaliaram os modelos durante e após o ajuste fino. Inicialmente, observaram uma queda significativa em benchmarks independentes, mas notaram que os modelos conseguiam recuperar parte de suas habilidades. Isso foi especialmente evidente ao treinar para uma tarefa de contagem, seguido de uma recuperação nas avaliações de PathVQA. Durante experimentos de mitigação do esquecimento, ao ajustar apenas as camadas de projeção de autoatenção, os pesquisadores obtiveram resultados positivos sem perdas de desempenho.

“O que parece ser esquecimento ou interferência após o ajuste em uma tarefa-alvo restrita é na verdade um viés na distribuição de saída devido à mudança na distribuição de tarefas.”
(“what looks like forgetting or interference after fine-tuning on a narrow target task is actually bias in the output distribution due to the task distribution shift.”)

— Equipe de Pesquisa, Universidade de Illinois Urbana-Champaign

Impacto e mercado

A pesquisa sugere que ao focar em segmentos restringidos do modelo, as empresas podem reduzir significativamente os custos de computação e controlar melhor a deriva da saída. Essa abordagem também traz maior reprodutibilidade no ajuste fino de modelos de IA. Contudo, a limitação da pesquisa a apenas dois modelos — um significativo desafio, considerando a diversidade da IA — levanta questões sobre a aplicabilidade em outros contextos.

O avanço na mitigação do "esquecimento catastrófico" pode abrir novas perspectivas no desenvolvimento de aplicações práticas em diversas áreas, reforçando a importância de abordagens econômicas em um cenário de IA em rápida evolução.

Próximos passos incluem a validação da técnica em outros modelos e contextos, potencialmente ampliando seu impacto na indústria.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 3 horas atrásÚltima Atualização 13/10/2025

0 23 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Pesquisadores otimizam custos em LLM com retrain parcial

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

MIT aprimora técnica SEAL para modelos de linguagem AI

Inteligência artificial demanda futuro com SSDs para desempenho

Inteligência artificial cria consumidores gêmeos digitais

AI transforma indústria farmacêutica com algoritmos inovadores

Desafios na implementação de AI e como superá-los

Salesforce aposta em AI para resolver problema de US$ 7 bi

Inteligência artificial e seus agentes: o que realmente são?

Vibe coding impacta futuros engenheiros em AI

Raindrop lança Experiments para avaliar atualização de AI

ScottsMiracle-Gro economiza $150M com inteligência artificial

MIT aprimora técnica SEAL para modelos de linguagem AI

Inteligência artificial demanda futuro com SSDs para desempenho

Inteligência artificial cria consumidores gêmeos digitais

AI transforma indústria farmacêutica com algoritmos inovadores

Desafios na implementação de AI e como superá-los

Salesforce aposta em AI para resolver problema de US$ 7 bi

Inteligência artificial e seus agentes: o que realmente são?

Vibe coding impacta futuros engenheiros em AI

Raindrop lança Experiments para avaliar atualização de AI

ScottsMiracle-Gro economiza $150M com inteligência artificial

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

LIGO revela 10 descobertas sobre ondas gravitacionais

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Lanterna EDC revela design inovador com luz UV integrada

Aura lança digital frame Aspen com recursos inteligentes por US$229

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

MIT aprimora técnica SEAL para modelos de linguagem AI

Inteligência artificial demanda futuro com SSDs para desempenho

Inteligência artificial cria consumidores gêmeos digitais

AI transforma indústria farmacêutica com algoritmos inovadores

Desafios na implementação de AI e como superá-los

Salesforce aposta em AI para resolver problema de US$ 7 bi

Inteligência artificial e seus agentes: o que realmente são?

Vibe coding impacta futuros engenheiros em AI

Raindrop lança Experiments para avaliar atualização de AI

ScottsMiracle-Gro economiza $150M com inteligência artificial

Ministério da Saúde investiga 32 casos de intoxicação por metanol

STF nega recurso para revogação da prisão domiciliar de Jair Bolsonaro

Artigos relacionados

Uerj revoga título a Médici em ação contra governo militar

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

Lanterna EDC revela design inovador com luz UV integrada

Aura lança digital frame Aspen com recursos inteligentes por US$229

Adblock detectado