7 млн — столько пиратских копий книг использовала компания Anthropic для обучения нейросети Claude
Одна из ведущих ИИ-компаний Anthropic выиграла суд, который признал законным использование книг, защищенных авторским правом, для обучения ИИ. Однако, также выяснилось, что компания обучала свой ИИ Claude на миллионах пиратских книг — а это уже нарушение закона. Об этом сообщает Business Insider.
Судья Уильям Алсап заявил, что соучредитель Anthropic Бен Манн скачал «не менее 5 миллионов копий книг из Library Genesis» в 2021 году, полностью осознавая, что материал был пиратским. Год спустя компания скачала не менее 2 миллионов копий книг из Pirate Library Mirror, также зная, что они были пиратскими.
«Anthropic не имела права использовать пиратские копии для своей центральной библиотеки. Создание постоянной библиотеки общего назначения само по себе не было добросовестным использованием, оправдывающим пиратство Anthropic», — написал судья.
При этом суд постановил, что использование компанией Anthropic книг, защищенных авторским правом, для обучения своих моделей искусственного интеллекта квалифицировалось как добросовестное использование.
Кроме пиратских книг Anthropic скупал напечатанные книги, которые затем разрезали и сканировали для обучения ИИ. На это компания потратила миллионы долларов. После миллионы оригинальных книг выбрасывали, а их цифровые копии хранили в специальной библиотеке. Такое использование книг суд признал законным.