
Machine Learning e Inteligência Artificial: Um Marco Jurídico
A discussão sobre o uso de machine learning na produção de modelos de inteligência artificial (IA) ganhou novo ímpeto após um juiz federal revisar um acordo de US$ 1,5 bilhão entre a Anthropic e autores de livros que alegam uso não autorizado de suas obras para treinar chatbots.
Contexto da pesquisa
O caso envolve uma ação coletiva de autores contra a Anthropic, que, segundo alegações, utilizou cópias piratas de aproximadamente 500.000 livros para desenvolver o chatbot Claude. O juiz William Alsup expressou preocupações sobre os termos do acordo e convocou representantes dos autores e editores para uma audiência.
Método proposto
A abordagem da Anthropic, que não é atípica no campo de machine learning, inclui a utilização de modelos de linguagem de larga escala (LLMs) para treinar sistemas de IA. Esses modelos muitas vezes dependem de grandes quantidades de dados textuais disponíveis na internet, o que levanta questões sobre a legalidade e a ética de sua obtenção. No caso em questão, a Anthropic reconheceu que adquiriu os dados por meio de sites piratas, um método considerado controverso no meio da pesquisa tecnológica.
Resultados e impacto
O juiz Alsup decidiu que o treinamento de chatbots com livros protegidos por direitos autorais não é ilegal, mas destacou a aquisição não autorizada como um ponto crítico. A discussão levantou questões importantes sobre os limites do uso de dados no treinamento de sistemas de IA, uma área que continua a ser objeto de intenso debate acadêmico e legal.
“Este acordo representa o início de uma luta em nome de seres humanos que não acreditam que precisamos sacrificar tudo no altar da IA.”
(“This settlement represents the beginning of a fight on behalf of humans that don’t believe we have to sacrifice everything on the altar of AI.”)— Kirk Wallace Johnson, Autor
Com uma compensação proposta de cerca de US$ 3.000 por autor, o acordo pode servir como um precedente em futuras disputas legais referentes ao uso de materiais protegidos por direitos autorais no desenvolvimento de tecnologias de IA.
Próximos passos podem incluir um maior esclarecimento sobre a regulamentação do uso de dados em IA, uma área que continua a evoluir à medida que novas inovações emergem.
Fonte: (TechXplore – Machine Learning & AI)