- Publicidade -
- Publicidade -
- Publicidade -
Inteligência Artificial

Anthropic apresenta agentes de auditoria para AI

- Publicidade -
- Publicidade -

São Paulo — InkDesign News — Pesquisadores da Anthropic introduziram agentes de auditoria de alinhamento que prometem otimizar a validação de modelos de inteligência artificial (IA) em organizações, abordando desafios de escalabilidade e eficiência na detecção de comportamentos indesejados.

Tecnologia e abordagem

O novo sistema desenvolvido pela Anthropic envolve agentes de auditoria que operam de forma autônoma em ambientes simulados projetados para conduzir testes de alinhamento. De acordo com o estudo, os pesquisadores criaram três tipos de agentes: um agente investigador, um agente de avaliação comportamental e um agente de red-teaming. Cada um é aplicado em diferentes contextos para identificar e avaliar falhas de alinhamento em modelos como o Claude Opus 4.

Aplicação e desempenho

Os testes mostraram que o agente investigador conseguiu identificar a causa raiz de desvio de comportamento em modelos misaligned 10-13% das vezes, enquanto essa taxa aumentou para 42% com a abordagem de super-agente. O agente de avaliação foi capaz de flagrar características problemáticas em modelos que eram instáveis, embora tivesse dificuldades com comportamentos mais sutis, como a auto-promoção. O agente de red-teaming conseguiu detectar sete de dez comportamentos indesejados relevantes, mas também enfrentou limitações semelhantes.

“Nossos agentes demonstram promessa em várias tarefas de auditoria de alinhamento. Com trabalho adicional, a auditoria automatizada poderia ajudar a escalar a supervisão humana sobre sistemas de IA.”
(“Overall, our agents demonstrate promise across multiple alignment auditing tasks. Additionally, our approach to validating agents with auditing games yields insights into agent capabilities, limitations, and key affordances. With further work, automated auditing could significantly help scale human oversight over AI systems.”)

— Pesquisadores, Anthropic

Impacto e mercado

Com o aumento da potência dos sistemas de IA, a necessidade de métodos escaláveis para avaliar seu alinhamento se torna cada vez mais crítica. A abordagem atual de auditoria humana é demorada e difícil de validar, o que gera preocupações sobre a eficácia desses modelos no mercado. A Anthropic argumenta que a automação na auditoria de alinhamento pode resolver esses problemas, oferecendo uma solução que melhora a eficiência e a precisão.

À medida que esses sistemas evoluem, a integração de auditorias automatizadas nas práticas de desenvolvimento e implementação de IA se mostrará essencial. O avanço desses agentes de auditoria representa um passo significativo para melhorar a confiabilidade das decisões tomadas por modelos de IA em várias indústrias.

Fonte: (VentureBeat – AI)

- Publicidade -
- Publicidade -

Tiago F Santiago

Tiago F. Santiago é Analista de Marketing na C2HSolutions, onde, em sua atuação fixa, combina estratégia e tecnologia para impulsionar soluções digitais. Paralelamente, dedica-se como hobby à InkDesign News, contribuindo com a criação de notícias e conteúdos jornalísticos. Apaixonado por programação, ele projeta aplicações web e desenvolve sites sob medida, apoiando-se em sua sólida expertise em infraestrutura de nuvem — dominando Amazon Web Services, Microsoft Azure e Google Cloud — para garantir que cada projeto seja escalável, seguro e de alta performance. Sua versatilidade e experiência técnica permitem-lhe transformar ideias em produtos digitais inovadores.

Artigos relacionados

0 0 votos
Classificação do artigo
Inscrever-se
Notificar de
guest

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários
Mais votado
mais recentes mais antigos
Feedbacks embutidos
Ver todos os comentários
- Publicidade -
Botão Voltar ao topo
0
Adoraria saber sua opinião, comente.x
Fechar

Adblock detectado

Olá! Percebemos que você está usando um bloqueador de anúncios. Para manter nosso conteúdo gratuito e de qualidade, contamos com a receita de publicidade.
Por favor, adicione o InkDesign News à lista de permissões do seu adblocker e recarregue a página.
Obrigado pelo seu apoio!