Anthropic lança ferramenta que revela falhas em LLMs

- Publicidade -

Tiago F Santiago 05/06/2025Última Atualização 05/06/2025

0 52 2 minutos de leitura

Anthropic lança ferramenta que revela falhas em LLMs — *Circuit tracing on Neuronpedia (source: Anthropic blog)*

- Publicidade -

São Paulo — InkDesign News —

A recente abertura do circuito de rastreamento pela Anthropic marca uma evolução significativa na pesquisa de inteligência artificial, especialmente no contexto de modelos de linguagem de grande escala (LLMs). Essa abordagem busca enfrentar os desafios da "caixa-preta" desses modelos, oferecendo aos desenvolvedores uma visão clara de seu funcionamento interno.

Tecnologia e abordagem

O circuito de rastreamento desenvolvido pela Anthropic foca em “interpretabilidade mecanicista”, um campo que se dedica a desvendar o funcionamento dos modelos de IA a partir de suas ativações internas, ao invés de apenas observar entradas e saídas. Essa ferramenta gera gráficos de atribuição, que são mapas causais das interações entre características internas à medida que o modelo processa informações. Isso permite não apenas a identificação de erros inexplicáveis, mas também a realização de experimentos de intervenção, onde pesquisadores podem modificar essas características internas e observar os impactos nas respostas do modelo.

Essa ferramenta permite que investigadores analisem erros inexplicáveis e comportamentos inesperados em modelos com pesos abertos.
(“This tool allows investigators to investigate unexplained errors and unexpected behaviors in open-weight models.”)

— Fonte: Anthropic

Aplicação e desempenho

Recentemente, a equipe da Anthropic utilizou essa ferramenta em modelos como Gemma-2-2b e Llama-3.2-1b, demonstrando capacidades avançadas em raciocínio multi-etapas. Por exemplo, conseguiram rastrear como um modelo inferiu “Texas” a partir de “Dallas” antes de chegar a “Austin” como a capital. Os insights obtidos através do circuito de rastreamento podem otimizar processos dentro de empresas, melhorando a eficiência em tarefas complexas, como análises de dados e raciocínio jurídico.

A rastreabilidade dos circuitos revela como os modelos realizam operações aritméticas, utilizando caminhos paralelos para chegar a resultados.
(“Circuit tracing explains how LLMs perform sophisticated multi-step reasoning.”)

— Fonte: Anthropic

Impacto e mercado

A introdução do circuito de rastreamento possui implicações que vão além da simples resolução de problemas em modelos existentes. Ao promover uma melhor compreensão das operações numéricas e da consistência multilingue, os resultados podem ser aplicados em auditorias internas de cálculos e na resolução de desafios de localização. Com essa clareza, as organizações podem identificar as origens de erros e implementar correções direcionadas, garantindo a integridade dos dados.

Enquanto a ferramenta enfrenta desafios, como custos altos de memória e a complexidade de interpretação dos gráficos de atribuição, ela representa um passo significativo para democratizar o entendimento e a aplicação de LLMs em ambientes empresariais. A transparência e a explicabilidade dos sistemas de IA se tornam cada vez mais críticas à medida que esses modelos são integrados em funções-chave de negócios.

Assim, a próxima fase envolve uma maturação das ferramentas de interpretabilidade, permitindo que as organizações desenvolvam sistemas de IA mais confiáveis, auditáveis e alinhados aos seus objetivos estratégicos.

Fonte: (VentureBeat – AI)

- Publicidade -

Etiquetas

Tiago F Santiago 05/06/2025Última Atualização 05/06/2025

0 52 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Anthropic lança ferramenta que revela falhas em LLMs

São Paulo — InkDesign News —

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Tiago F Santiago

Ler o Próximo

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

São Paulo — InkDesign News —

Tecnologia e abordagem

Aplicação e desempenho

Impacto e mercado

Ler o Próximo

Terapia com ChatGPT: como a inteligência artificial influencia clientes

Desafios da inteligência artificial na eficiência energética

Peak Ji impulsiona aplicações globais de inteligência artificial

Inteligência artificial transforma o futuro dos bancos

Synthesia aprimora IA que pode interagir de forma expressiva

Inteligência artificial transforma o futuro das empresas

MIT desenvolve algoritmos para engajar o cliente conectado

Inteligência artificial melhora eficiência em provedores de saúde

Therapeutas usam GPT em consultas, clientes se sentem impactados

AI doppelgänger auxilia na otimização de tarefas profissionais

BladedFeline permanece em rede por 8 anos com malware

AI em debate: Reddit processa Anthropic por uso de conteúdo

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado