7 млн — столько пиратских копий книг использовала компания Anthropic для обучения нейросети Claude

Одна из ве­ду­щих ИИ-ком­па­ний An­thropic вы­иг­ра­ла суд, ко­то­рый при­знал за­кон­ным ис­поль­зо­ва­ние книг, за­щи­щен­ных ав­тор­ским пра­вом, для обу­че­ния ИИ. Од­на­ко, так­же вы­яс­ни­лось, что ком­па­ния обу­ча­ла свой ИИ Claude на мил­ли­о­нах пи­рат­ских книг — а это уже на­ру­ше­ние за­ко­на. Об этом со­об­ща­ет Busi­ness In­sider.

Су­дья Уи­льям Ал­сап за­явил, что со­учре­ди­тель An­thropic Бен Манн ска­чал «не ме­нее 5 мил­ли­о­нов ко­пий книг из Li­brary Gen­e­sis» в 2021 году, пол­но­стью осо­зна­вая, что ма­те­ри­ал был пи­рат­ским. Год спу­стя ком­па­ния ска­ча­ла не ме­нее 2 мил­ли­о­нов ко­пий книг из Pi­rate Li­brary Mir­ror, так­же зная, что они были пи­рат­ски­ми.

«An­thropic не име­ла пра­ва ис­поль­зо­вать пи­рат­ские ко­пии для сво­ей цен­траль­ной биб­лио­те­ки. Со­зда­ние по­сто­ян­ной биб­лио­те­ки об­ще­го на­зна­че­ния само по себе не было доб­ро­со­вест­ным ис­поль­зо­ва­ни­ем, оправ­ды­ва­ю­щим пи­рат­ство An­thropic», — на­пи­сал су­дья.

При этом суд по­ста­но­вил, что ис­поль­зо­ва­ние ком­па­ни­ей An­thropic книг, за­щи­щен­ных ав­тор­ским пра­вом, для обу­че­ния сво­их мо­де­лей ис­кус­ствен­но­го ин­тел­лек­та ква­ли­фи­ци­ро­ва­лось как доб­ро­со­вест­ное ис­поль­зо­ва­ние.

Кро­ме пи­рат­ских книг An­thropic ску­пал на­пе­ча­тан­ные кни­ги, ко­то­рые за­тем раз­ре­за­ли и ска­ни­ро­ва­ли для обу­че­ния ИИ. На это ком­па­ния по­тра­ти­ла мил­ли­о­ны дол­ла­ров. По­сле мил­ли­о­ны ори­ги­наль­ных книг вы­бра­сы­ва­ли, а их циф­ро­вые ко­пии хра­ни­ли в спе­ци­аль­ной биб­лио­те­ке. Та­кое ис­поль­зо­ва­ние книг суд при­знал за­кон­ным.