Платформа Reddit подала иск против Perplexity и трех поставщиков услуг веб-скрапинга — SerpApi, Oxylabs и AWMProxy — обвинив их в массовом несанкционированном сборе конфиденциальных данных с сайта социальных сетей для обучения искусственному интеллекту (ИИ). В иске утверждается, что Perplexity, разработчик поисковой системы искусственного интеллекта, использует данные, полученные через этих посредников, вместо того, чтобы заключать прямое соглашение с Reddit, как это сделали некоторые другие компании, занимающиеся искусственным интеллектом.
Согласно иску, The Verge стало известно, что в мае 2024 года Reddit направил Perplexity официальный запрос о прекращении противодействия, на который компания ответила, что не использует данные Reddit для обучения своих моделей ИИ и соблюдает правила, изложенные в файле robots.txt. Однако вскоре после этого, по словам истца, количество цитирований Reddit в ответах Perplexity увеличилось.
Reddit подчеркивает, что миллионы постов, созданных пользователями, представляют значительную ценность для обучения ИИ, и компания даже заключила соглашения с OpenAI и Google, а также представила платный API в 2023 году, стремясь получить компенсацию за использование своих данных.
Бен Ли, главный юрисконсульт Reddit, заявил, что «Компании, занимающиеся искусственным интеллектом, вступили в гонку вооружений за высококачественный контент, созданный людьми, и это давление подпитывает экономику отмывания данных в промышленных масштабах.В качестве типичных примеров такой противоправной деятельности он также назвал литовский скрапер Oxylabs UAB, ботнеты AWM Proxy и SerpAI, которые открыто рекламируют методы обхода мер безопасности. Он утверждает, что эти компании (фигуранты дела), не имея прямого доступа к Reddit, маскируют свои скрипты и местоположение для кражи контента через результаты поиска Google, и что Perplexity сознательно приобретает эти украденные данные, избегая законных сотрудничество.
Джесси Дуайер, руководитель отдела коммуникаций Perplexity, рассказал The Verge, что компания еще не получила иск, но намерена решительно защищать право потребителей на свободный и справедливый доступ к публичной информации. Он подчеркивает, что Perplexity остается принципиальным и ответственным и не потерпит угроз открытости и общественным интересам.
Ранее Reddit подал в суд на Anthropic на аналогичных основаниях, утверждая, что боты Anthropic получали доступ к платформе Reddit даже после того, как Anthropic заявила, что этого не было.
Напомним, что Reddit решил заморозить свои планы монетизации субреддита и намерен стать поисковой системой. Таким образом, помимо монетизации ценного контента платформы посредством различных контрактов с отдельными AI-компаниями, компания как поисковая система создаст еще один источник дохода.

