
O avanço constante em machine learning tem gerado debates acalorados entre plataformas de conteúdo e empresas de inteligência artificial. Recentemente, o Reddit processou a Anthropic, alegando que a empresa utilizou dados de usuários sem autorização.
Contexto da pesquisa
A competição em torno do uso de dados de redes sociais para o treinamento de modelos de AI tem se intensificado. O processo, movido na Califórnia, destaca a crescente tensão entre provedores de conteúdo e empresas de tecnologia, especialmente na era do deep learning.
Método proposto
A Anthropic, fundada por ex-executivos da OpenAI, afirma que está comprometida com o desenvolvimento ético de inteligência artificial. Contudo, o Reddit afirma que seus dados foram extraídos sem permissão. O modelo da Anthropic, conhecido como Claude, é um modelo de linguagem (LLM), que utiliza grandes volumes de dados para gerar respostas contextuais.
Resultados e impacto
De acordo com a ação judicial, a Anthropic foi acusada de realizar mais de 100.000 acessos ao conteúdo do Reddit, mesmo após a promulgação de restrições. O Reddit busca compensações financeiras e uma injunção que obrigue a Anthropic a respeitar seus termos de uso. Esta disputa levanta questões sobre a propriedade de dados e os direitos dos criadores na era digital.
“Este caso aborda as duas faces da Anthropic: a face pública que tenta conquistar a confiança do consumidor e a face privada que ignora regras que atrapalham seus interesses.”
(“This case is about the two faces of Anthropic: the public face that attempts to ingratiate itself into the consumer’s consciousness with claims of righteousness and respect for boundaries and the law, and the private face that ignores any rules that interfere with its attempts to further line its pockets.”)— Reddit, Processo Judiciário
Além disso, outras plataformas como Google e OpenAI já firmaram acordos de licença com o Reddit, permitindo o uso de seus dados sob termos que garantem privacidade e compensação.
À medida que a indústria de AI continua a evoluir, as repercussões jurídicas de disputas como essa poderão moldar o futuro do desenvolvimento de modelos de linguagem e o uso de dados.
Fonte: (TechXplore – Machine Learning & AI)