Deep learning avança com apoio judicial ao uso de livros protegidos

Decisão judicial em caso de uso de livros para treinar IA pode mudar o cenário de copyright
São Paulo — InkDesign News — Uma recente decisão de um juiz federal dos EUA deu suporte a empresas de inteligência artificial, permitindo que a Anthropic utilize livros protegidos por direitos autorais para treinar seus modelos de machine learning, levantando questões sobre a ética e a legalidade no uso de dados.
Contexto da pesquisa
O juiz do Tribunal de Distrito William Alsup decidiu a favor da Anthropic em um processo que envolvia o treinamento de seus modelos de IA Claude com livros adquiridos ou pirateados, alegando que isso se enquadrava na doutrina de “uso justo” (fair use) da Lei de Direitos Autorais dos EUA.
Método proposto
O modelo Claude, assim como outros modelos grandes de linguagem (LLMs), depende de vastas quantidades de dados para treinamento. A Anthropic utilizou uma combinação de livros comprados e documentos digitalizados de fontes piratas, acumulando uma biblioteca digital em grande escala para alimentar suas IAs.
A utilização dos livros em questão para treinar Claude e seus predecessores foi “exceedingly transformative and was a fair use” (excessivamente transformadora e constituiu uso justo).
— William Alsup, Juiz do Tribunal de Distrito dos EUA
Resultados e impacto
O juiz destacou que o uso transformador da IA é comparável ao aprendizado humano, mas ao mesmo tempo, rejeitou a proteção geral que a Anthropic buscava, afirmando que a coleta de milhões de livros pirateados para criar uma biblioteca digital permanente não é justificada sob as proteções de uso justo.
A decisão poderá estabelecer um precedente importante, já que outras empresas de IA enfrentam processos semelhantes por utilizar dados sem a autorização dos autores. A necessidade de grandes conjuntos de dados para modelar a IA gera um dilema ético, especialmente quando direitos autorais estão em questão.
Estamos satisfeitos que o tribunal reconheceu que usar “trabalhos para treinar LLMs foi transformador” (usos de obras para treinar LLMs é transformador).
— Porta-voz da Anthropic
O caso agora avança para um julgamento sobre danos relacionados às cópias piratas, enquanto a Anthropic avalia suas opções legais. A decisão destaca uma tensão crescente entre inovação tecnológica e direitos autorais, um tema que continuará a ser debatido como a IA se torna mais prevalente em diversas indústrias.
Fonte: (TechXplore – Machine Learning & AI)