
São Paulo — InkDesign News —
A recente abertura do circuito de rastreamento pela Anthropic marca uma evolução significativa na pesquisa de inteligência artificial, especialmente no contexto de modelos de linguagem de grande escala (LLMs). Essa abordagem busca enfrentar os desafios da "caixa-preta" desses modelos, oferecendo aos desenvolvedores uma visão clara de seu funcionamento interno.
Tecnologia e abordagem
O circuito de rastreamento desenvolvido pela Anthropic foca em “interpretabilidade mecanicista”, um campo que se dedica a desvendar o funcionamento dos modelos de IA a partir de suas ativações internas, ao invés de apenas observar entradas e saídas. Essa ferramenta gera gráficos de atribuição, que são mapas causais das interações entre características internas à medida que o modelo processa informações. Isso permite não apenas a identificação de erros inexplicáveis, mas também a realização de experimentos de intervenção, onde pesquisadores podem modificar essas características internas e observar os impactos nas respostas do modelo.
Essa ferramenta permite que investigadores analisem erros inexplicáveis e comportamentos inesperados em modelos com pesos abertos.
(“This tool allows investigators to investigate unexplained errors and unexpected behaviors in open-weight models.”)— Fonte: Anthropic
Aplicação e desempenho
Recentemente, a equipe da Anthropic utilizou essa ferramenta em modelos como Gemma-2-2b e Llama-3.2-1b, demonstrando capacidades avançadas em raciocínio multi-etapas. Por exemplo, conseguiram rastrear como um modelo inferiu “Texas” a partir de “Dallas” antes de chegar a “Austin” como a capital. Os insights obtidos através do circuito de rastreamento podem otimizar processos dentro de empresas, melhorando a eficiência em tarefas complexas, como análises de dados e raciocínio jurídico.
A rastreabilidade dos circuitos revela como os modelos realizam operações aritméticas, utilizando caminhos paralelos para chegar a resultados.
(“Circuit tracing explains how LLMs perform sophisticated multi-step reasoning.”)— Fonte: Anthropic
Impacto e mercado
A introdução do circuito de rastreamento possui implicações que vão além da simples resolução de problemas em modelos existentes. Ao promover uma melhor compreensão das operações numéricas e da consistência multilingue, os resultados podem ser aplicados em auditorias internas de cálculos e na resolução de desafios de localização. Com essa clareza, as organizações podem identificar as origens de erros e implementar correções direcionadas, garantindo a integridade dos dados.
Enquanto a ferramenta enfrenta desafios, como custos altos de memória e a complexidade de interpretação dos gráficos de atribuição, ela representa um passo significativo para democratizar o entendimento e a aplicação de LLMs em ambientes empresariais. A transparência e a explicabilidade dos sistemas de IA se tornam cada vez mais críticas à medida que esses modelos são integrados em funções-chave de negócios.
Assim, a próxima fase envolve uma maturação das ferramentas de interpretabilidade, permitindo que as organizações desenvolvam sistemas de IA mais confiáveis, auditáveis e alinhados aos seus objetivos estratégicos.
Fonte: (VentureBeat – AI)