- Publicidade -
- Publicidade -
- Publicidade -
Inteligência Artificial

Anthropic lança ferramenta que revela falhas em LLMs

- Publicidade -
- Publicidade -

São Paulo — InkDesign News —

A recente abertura do circuito de rastreamento pela Anthropic marca uma evolução significativa na pesquisa de inteligência artificial, especialmente no contexto de modelos de linguagem de grande escala (LLMs). Essa abordagem busca enfrentar os desafios da "caixa-preta" desses modelos, oferecendo aos desenvolvedores uma visão clara de seu funcionamento interno.

Tecnologia e abordagem

O circuito de rastreamento desenvolvido pela Anthropic foca em “interpretabilidade mecanicista”, um campo que se dedica a desvendar o funcionamento dos modelos de IA a partir de suas ativações internas, ao invés de apenas observar entradas e saídas. Essa ferramenta gera gráficos de atribuição, que são mapas causais das interações entre características internas à medida que o modelo processa informações. Isso permite não apenas a identificação de erros inexplicáveis, mas também a realização de experimentos de intervenção, onde pesquisadores podem modificar essas características internas e observar os impactos nas respostas do modelo.

Essa ferramenta permite que investigadores analisem erros inexplicáveis e comportamentos inesperados em modelos com pesos abertos.
(“This tool allows investigators to investigate unexplained errors and unexpected behaviors in open-weight models.”)

— Fonte: Anthropic

Aplicação e desempenho

Recentemente, a equipe da Anthropic utilizou essa ferramenta em modelos como Gemma-2-2b e Llama-3.2-1b, demonstrando capacidades avançadas em raciocínio multi-etapas. Por exemplo, conseguiram rastrear como um modelo inferiu “Texas” a partir de “Dallas” antes de chegar a “Austin” como a capital. Os insights obtidos através do circuito de rastreamento podem otimizar processos dentro de empresas, melhorando a eficiência em tarefas complexas, como análises de dados e raciocínio jurídico.

A rastreabilidade dos circuitos revela como os modelos realizam operações aritméticas, utilizando caminhos paralelos para chegar a resultados.
(“Circuit tracing explains how LLMs perform sophisticated multi-step reasoning.”)

— Fonte: Anthropic

Impacto e mercado

A introdução do circuito de rastreamento possui implicações que vão além da simples resolução de problemas em modelos existentes. Ao promover uma melhor compreensão das operações numéricas e da consistência multilingue, os resultados podem ser aplicados em auditorias internas de cálculos e na resolução de desafios de localização. Com essa clareza, as organizações podem identificar as origens de erros e implementar correções direcionadas, garantindo a integridade dos dados.

Enquanto a ferramenta enfrenta desafios, como custos altos de memória e a complexidade de interpretação dos gráficos de atribuição, ela representa um passo significativo para democratizar o entendimento e a aplicação de LLMs em ambientes empresariais. A transparência e a explicabilidade dos sistemas de IA se tornam cada vez mais críticas à medida que esses modelos são integrados em funções-chave de negócios.

Assim, a próxima fase envolve uma maturação das ferramentas de interpretabilidade, permitindo que as organizações desenvolvam sistemas de IA mais confiáveis, auditáveis e alinhados aos seus objetivos estratégicos.

Fonte: (VentureBeat – AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!