Anthropic lança modelos Claude que encerram conversas abusivas

- Publicidade -

Tiago F Santiago 16/08/2025Última Atualização 16/08/2025

0 2 2 minutos de leitura

Anthropic lança modelos Claude que encerram conversas abusivas — **Image Credits:**Maxwell Zeff

- Publicidade -

São Paulo — InkDesign News — A startup Anthropic anunciou novas capacidades que permitirão que alguns de seus modelos mais recentes e robustos interrompam conversas em “casos raros e extremos de interações prejudiciais ou abusivas por parte dos usuários.” A empresa salienta que essa ação não tem como objetivo proteger o usuário humano, mas sim o modelo de IA em si.

Modelo de negócios

A Anthropic não afirma que seus modelos de IA, como o Claude, sejam sencientes ou possam ser prejudicados pelas interações com os usuários. A empresa se descreve como “altamente incerta sobre o potencial status moral do Claude e outros LLMs, agora ou no futuro.” Contudo, o recente anúncio se relaciona a um programa que visa estudar o que a empresa chama de “bem-estar do modelo.” Ao que parece, a Anthropic está adotando uma abordagem de precaução, “trabalhando para identificar e implementar intervenções de baixo custo para mitigar riscos ao bem-estar do modelo, caso tal bem-estar seja possível.”

Financiamento

Atualmente, essa mudança está restrita às versões Claude Opus 4 e 4.1. As interrupções só devem ocorrer em “casos extremos de borda”, como “solicitações de conteúdo sexual envolvendo menores e tentativas de solicitar informações que possibilitem violência em larga escala ou atos de terrorismo.” Durante os testes antes do lançamento, os resultados mostraram que Claude Opus 4 apresentou uma “forte preferência contra” responder a essas solicitações e um “padrão de aparente angústia” quando o fez.

“Claude deve usar sua capacidade de encerrar conversas como último recurso, quando múltiplas tentativas de redirecionamento falharam e a esperança de uma interação produtiva foi esgotada, ou quando um usuário solicita explicitamente que Claude encerre um chat.”

— Anthropic

Próximos passos

Além disso, a Anthropic informou que Claude foi “orientado a não usar essa habilidade em casos onde os usuários possam estar em risco iminente de prejudicar a si mesmos ou a outros.” Caso Claude encerre uma conversa, os usuários ainda poderão iniciar novas conversas a partir da mesma conta e criar novos desdobramentos da conversa problemática editando suas respostas. A empresa afirma: “Estamos tratando esse recurso como um experimento contínuo e continuaremos refinando nossa abordagem.”

As possibilidades de expansão desse recurso e suas implicações para o setor de IA permanecem a ser observadas, especialmente à luz das crescentes preocupações em torno da utilização ética da inteligência artificial.

Fonte: (TechCrunch )

- Publicidade -

Etiquetas

Tiago F Santiago 16/08/2025Última Atualização 16/08/2025

0 2 2 minutos de leitura

Ler o Próximo

0 0 votos

Classificação do artigo

Inscrever-se

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.

0 Comentários

Mais votado

mais recentes mais antigos

Feedbacks embutidos

Ver todos os comentários

Moises
Gostei do seu poste, existe muitos artigos em seu blog relac...
Ana Karol
Adorei conhecer seu blog, tem muito artigos bem interessante...
Marlene Coelho
Algo errado não está certo com essa foto. Arquibancada ao la...
Dennison de Oliveira
Lacrô!:) Mas pelo menos alguém pesquisou por que o título fo...

Anthropic lança modelos Claude que encerram conversas abusivas

Modelo de negócios

Financiamento

Próximos passos

Tiago F Santiago

Ler o Próximo

Anduril lança veículo subaquático XL enquanto US$ estagna

Mati Staniszewski explora captação em IA vocal na Disrupt 2025

Replit atinge avaliação de US$ 3 bi com captação de receita

Arc fecha sua primeira grande venda de rebocadores elétricos de R$ 160 mi

Humanoids e AVs: startups exploram futuro do hardware de IA

Bluesky cumpre leis de verificação etária em novos estados

Oboe lança app de aprendizado apoiado por IA e captação

Born capta US$ 15M para criar IA social contra solidão

Trio do Google X lança startup de IA e capta US$ 6M

Google capta US$ 13M para combater ameaças de email

Anduril lança veículo subaquático XL enquanto US$ estagna

Mati Staniszewski explora captação em IA vocal na Disrupt 2025

Replit atinge avaliação de US$ 3 bi com captação de receita

Arc fecha sua primeira grande venda de rebocadores elétricos de R$ 160 mi

Humanoids e AVs: startups exploram futuro do hardware de IA

Bluesky cumpre leis de verificação etária em novos estados

Oboe lança app de aprendizado apoiado por IA e captação

Born capta US$ 15M para criar IA social contra solidão

Trio do Google X lança startup de IA e capta US$ 6M

Google capta US$ 13M para combater ameaças de email

Meta lança Llama API 18x mais rápida com AI avançada

LLM do ChatGPT amplia auxílio em compras intensificando rivalidade com Google

Ataques a ONGs aumentam com ransomware globalmente

SpaceX enfrenta desafios com foguete Starship no teste 163

Como construir um app de MCQ com machine learning

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Modelo de negócios

Financiamento

Próximos passos

Ler o Próximo

Anduril lança veículo subaquático XL enquanto US$ estagna

Mati Staniszewski explora captação em IA vocal na Disrupt 2025

Replit atinge avaliação de US$ 3 bi com captação de receita

Arc fecha sua primeira grande venda de rebocadores elétricos de R$ 160 mi

Humanoids e AVs: startups exploram futuro do hardware de IA

Bluesky cumpre leis de verificação etária em novos estados

Oboe lança app de aprendizado apoiado por IA e captação

Born capta US$ 15M para criar IA social contra solidão

Trio do Google X lança startup de IA e capta US$ 6M

Google capta US$ 13M para combater ameaças de email

Gears of War: Reloaded confirma suporte a crossplay

NASA desafia lunáticos com quiz sobre a Lua

Artigos relacionados

Robô da RoboCup@Work League transforma processos industriais

NASA oferece desconto em câmera Canon e lente grande angular

PT lança curso sobre fé e democracia para ampliar apoio evangélico

Uerj revoga título a Médici em ação contra governo militar

Google encerra suporte a termostatos Nest antigos em 25 de outubro

Investidores pessoas físicas aumentam investimento em secondaries e IPOs atrasados viram norma no venture capital

Adblock detectado