Компании, собирающие открытые данные из Интернета для обучения больших языковых моделей, все чаще ищут новые источники трафика. Одним из них является Bright Data, оператор глобальной прокси-сети. Компания выпустила SDK для приложений Smart TV, который позволяет использовать устройства пользователей для сбора данных из Интернета.
Оказалось, что код Bright Data был обнаружен в ряде приложений Smart TV. По запросам журналистов разработчики этих приложений либо отказались от комментариев, либо удалили интеграцию прокси-сервера из своих приложений.
Bright Data позиционирует свою платформу как инструмент, позволяющий превратить веб-сканирование в структурированную систему «доставки данных». На практике это означает, что веб-трафик от клиентов компании может маршрутизироваться через домашние интернет-соединения обычных пользователей. В рекламных материалах утверждается, что SDK обеспечивает «100-процентную монетизацию» аудитории при сохранении привычного пользовательского опыта.
SDK встраивается в приложения Smart TV, после чего пользователю предлагается согласиться на участие в прокси-сети. Если он согласится, соединение может быть использовано для пропуска стороннего трафика через его домашнее подключение к Интернету. Собранные таким образом данные затем передаются на серверы Bright Data и продаются компаниям, занимающимся искусственным интеллектом.
Компания заявляет, что ее SDK не собирает личные данные напрямую и что участие полностью добровольное — пользователь может отказаться в любой момент.
Bright Data продолжает сотрудничать с экосистемами Smart TV на базе ОС Tizen и webOS. По словам источника, функция прокси-сервера сбора веб-данных потенциально может присутствовать в сотнях приложений для этих платформ.
Бизнес-модель Bright Data сравнивают с IPIDEA, крупной прокси-сетью, базирующейся в Китае, которую Google закрыл в начале этого месяца. Критики говорят, что распределенные прокси-сети могут быть использованы в злонамеренных целях, но Bright Data заявляет, что ее платформа предназначена для законного доступа к данным и исследовательских приложений.
Несмотря на это, поставщики платформ, похоже, ужесточают ограничения на фоновую активность SDK. Сообщается, что Google начал запрещать приложениям запускать постоянные фоновые процессы SDK, в то время как Amazon предприняла шаги по блокировке приложений, которые полагаются на сторонние прокси-механизмы, такие как интеграция Bright SDK.
Все важное из мира технологий прямо на ваш почтовый ящик.
Подписываясь, вы принимаете наши Условия и Политику конфиденциальности. Вы можете отказаться от подписки одним щелчком мыши в любое время.

