Reddit подает в суд на Perplexity и еще три компании за сбор данных с сайта
Reddit подает в суд на Perplexity и трех «поставщиков услуг по сбору данных», чтобы «остановить незаконный обход защиты данных в промышленных масштабах группой недобросовестных лиц, которые не остановятся ни перед чем, чтобы заполучить ценный защищенный авторским правом контент на Reddit». Об этом сообщает The Verge со ссылкой на иск компании.
В иске Reddit сравнивает компании по сбору данных SerpApi, Oxylabs и AWMProxy с грабителями банков. Также Reddit утверждает, что Perplexity является клиентом как минимум одной из указанных компаний и, «по всей видимости, готова на всё, чтобы получить данные Reddit, которые ей отчаянно необходимы для подпитки её «машины ответов».
В мае 2024 года Reddit направляла Perplexity обращение с просьбой прекратить собирать данные с сайта. Тогда в Perplexity заявили, что не используют контент с сайта для обучения ИИ и уважают требования компании. Однако, с тех пор количество цитирования ИИ постов с Reddit только выросло.
Данные Reddit — посты на самые разные темы, написанные и ранжированные людьми, — чрезвычайно полезны для обучения моделей ИИ, и компания это знает. Reddit заключил соглашения OpenAI и Google, и, как сообщается, хочет получить более выгодные условия.
Главный юридический директор Reddit Бен Ли заявил: «Компании, занимающиеся разработкой искусственного интеллекта, вовлечены в гонку за качественным контентом, созданным людьми. Это давление привело к развитию экономики „отмывания данных“ в промышленных масштабах. Сборщики данных обходят защиту сайтов и похищают данные, а затем продают их клиентам, жаждущим обучающих материалов».