1. Новости

Reddit подает в суд на Perplexity и еще три компании за сбор данных с сайта

Red­dit по­да­ет в суд на Per­plex­ity и трех «по­став­щи­ков услуг по сбо­ру дан­ных», что­бы «оста­но­вить неза­кон­ный об­ход за­щи­ты дан­ных в про­мыш­лен­ных мас­шта­бах груп­пой недоб­ро­со­вест­ных лиц, ко­то­рые не оста­но­вят­ся ни пе­ред чем, что­бы за­по­лу­чить цен­ный за­щи­щен­ный ав­тор­ским пра­вом кон­тент на Red­dit». Об этом со­об­ща­ет The Verge со ссыл­кой на иск ком­па­нии.

В иске Red­dit срав­ни­ва­ет ком­па­нии по сбо­ру дан­ных Ser­pApi, Oxy­labs и AWM­Proxy с гра­би­те­ля­ми бан­ков. Так­же Red­dit утвер­жда­ет, что Per­plex­ity яв­ля­ет­ся кли­ен­том как ми­ни­мум од­ной из ука­зан­ных ком­па­ний и, «по всей ви­ди­мо­сти, го­то­ва на всё, что­бы по­лу­чить дан­ные Red­dit, ко­то­рые ей от­ча­ян­но необ­хо­ди­мы для под­пит­ки её «ма­ши­ны от­ве­тов».

В мае 2024 года Red­dit на­прав­ля­ла Per­plex­ity об­ра­ще­ние с прось­бой пре­кра­тить со­би­рать дан­ные с сай­та. То­гда в Per­plex­ity за­яви­ли, что не ис­поль­зу­ют кон­тент с сай­та для обу­че­ния ИИ и ува­жа­ют тре­бо­ва­ния ком­па­нии. Од­на­ко, с тех пор ко­ли­че­ство ци­ти­ро­ва­ния ИИ по­стов с Red­dit толь­ко вы­рос­ло.

Дан­ные Red­dit — по­сты на са­мые раз­ные темы, на­пи­сан­ные и ран­жи­ро­ван­ные людь­ми, — чрез­вы­чай­но по­лез­ны для обу­че­ния мо­де­лей ИИ, и ком­па­ния это зна­ет. Red­dit за­клю­чил со­гла­ше­ния Ope­nAI и Google, и, как со­об­ща­ет­ся, хо­чет по­лу­чить бо­лее вы­год­ные усло­вия.

Глав­ный юри­ди­че­ский ди­рек­тор Red­dit Бен Ли за­явил: «Ком­па­нии, за­ни­ма­ю­щи­е­ся раз­ра­бот­кой ис­кус­ствен­но­го ин­тел­лек­та, во­вле­че­ны в гон­ку за ка­че­ствен­ным кон­тен­том, со­здан­ным людь­ми. Это дав­ле­ние при­ве­ло к раз­ви­тию эко­но­ми­ки „от­мы­ва­ния дан­ных“ в про­мыш­лен­ных мас­шта­бах. Сбор­щи­ки дан­ных об­хо­дят за­щи­ту сай­тов и по­хи­ща­ют дан­ные, а за­тем про­да­ют их кли­ен­там, жаж­ду­щим обу­ча­ю­щих ма­те­ри­а­лов».