LLMs produzem nonsense fluente fora da zona de treinamento

- Publicidade -

Tiago F Santiago 19/08/2025Última Atualização 19/08/2025

0 2 2 minutos de leitura

LLMs produzem nonsense fluente fora da zona de treinamento — *The data distribution lens Source: GitHub*

- Publicidade -

São Paulo — InkDesign News — Um novo estudo da Arizona State University (ASU) reexamina a eficácia do raciocínio “Chain-of-Thought” (CoT) em Modelos de Linguagem Grande (LLMs). Os pesquisadores sugerem que essa abordagem pode ser menos uma demonstração de inteligência genuína e mais uma “miragem frágil”, unindo-se a um corpo crescente de pesquisas que questionam a profundidade do raciocínio em LLMs.

Tecnologia e abordagem

O modelo CoT envolve direcionar um LLM a "pensar passo a passo", o que inicialmente resulta em desempenhos impressionantes em tarefas complexas. Contudo, investigações mais detalhadas revelam inconsistências lógicas que colocam em dúvida essa visão. Os LLMs frequentemente dependem de semântica superficial e padrões já vistos durante o treinamento, o que leva a erros quando se deparam com tarefas não familiares ou informações irrelevantes.

A equipe da ASU utilizou um novo framework chamado DataAlchemy para treinar LLMs menores em ambientes controlados, testando assim a capacidade de generalização do CoT em três dimensões de “mudança de distribuição”: generalização de tarefas, comprimento e formato.

Aplicação e desempenho

Os resultados indicaram que o sucesso do CoT não decorre de uma verdadeira capacidade de raciocínio, mas sim da habilidade do modelo em generalizar para casos fora da distribuição de treinamento. Conforme mencionado, “o raciocínio CoT é mais uma forma sofisticada de correspondência de padrões que depende da distribuição de dados” que o modelo viu durante o treinamento, afirmando que a performance colapsa assim que o modelo é inserido em contextos que divergem dessa distribuição.

Contrapõe-se a isso a observação de que ajustes finos (fine-tuning) em um pequeno conjunto de novos dados não levam a um raciocínio mais abstrato, mas apenas a memorização de novos padrões, um processo que os pesquisadores descreveram como um “remendo”.

“O avanço da ciência deve permanecer centrado no ser humano — as máquinas podem ajudar, mas a descoberta ainda prospera na humanidade e na curiosidade.”
(“The advance of science should remain human-centered—machines can assist, but discovery still thrives on humanity and curiosity.”)

— Chengshuai Zhao, Doutorando, ASU

Impacto e mercado

O estudo traz implicações importantes para desenvolvedores de aplicações que utilizam LLMs. Os autores alertam sobre o risco de depender excessivamente do CoT como uma solução universal para tarefas de raciocínio e enfatizam a importância de auditorias por especialistas da área. Eles recomendam que as validações padrão não são suficientes, sugerindo testes rigorosos que explorem falhas nas dimensões de tarefa, comprimento e formato.

Os desenvolvedores devem tratar o fine-tuning como uma solução pontual e não uma abordagem abrangente. Essa estratégia é crucial para garantir que as capacidades de correspondência de padrões de um modelo estejam alinhadas de maneira precisa com as demandas específicas de uma tarefa empresarial.

Assim, investir em avaliações rigorosas pode transformar as limitações atuais em oportunidades para melhorias direcionadas, mantendo assim uma aplicação eficaz de LLMs em cenários controlados.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 19/08/2025Última Atualização 19/08/2025

0 2 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

LLMs produzem nonsense fluente fora da zona de treinamento

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Q Timex reinterpreta design acessível em reedição de 1972

Deel vence processo, mas não contra Rippling no setor B2B

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado