Специалисты Центра цифровой журналистики Tow Digital для обзора журналистики Columbia исследовали, как именно поисковые системы искусственного интеллекта определяют источники новостей. Результаты не являются обнадеживающими: когда службы искусственного интеллекта пытаются найти название статьи, название издания или дату публикации по фрагменту текста, они ошибаются в более чем 60% случаев.
Проблема особенно актуальна на фоне растущей популярности таких инструментов. Авторы исследования Клаудия Джаринска и Исавария Чандрацекар обнаружили, что каждый четвертый американский предпочитает искать информацию, а не через традиционные поисковые системы, такие как Google или Bing, но используя системы искусственного интеллекта.
В ходе эксперимента эксперты тестируют 8 сервисов, способных обрабатывать реальные запросы поиска. Графика ясно показала масштаб проблемы: Grok 3 установил анти -рекорд в 94% случаев. Поиск CHATGPT дал неверные ответы на 67% запросов (134 из 200) Даже лидер точности (Система недоумения) допустил ошибки в 37% инспекций.
Методология испытания не оставила места для неоднозначности: аналитики скопировали точные выдержки из опубликованных статей и попросили каждую систему идентифицировать исходный источник материала — чтобы найти название, издатель, время публикации и веб -адрес. В ходе исследования они провели 1600 таких тестов, отметив не только точность ответов, но и степень уверенности, с которой они предоставили алгоритмы.
Вместо того, чтобы распознавать пробелы в знаниях, машины создали правдоподобные, но совершенно вымышленные ответы — SO — называемые. Конфуляции. Они без колебаний генерировали не существующие цитаты или придумали убедительно выглядящие даты публикации. Такое поведение наблюдалось во всех протестированных программном обеспечении.
Парадоксальный факт: дорогие оплачиваемые поисковые системы показали хуже, чем бесплатно. Например, подписка PROPLEXITY PRO за 20 долларов США и GROK 3 долл. США за 40 долл. В месяц значительно снижали надежность результатов. В отличие от основных версий, которые открыто сообщают о неспособности найти ответ, услуги премиум -класса стремятся ответить на каждый вопрос, даже если он требует воображения. Выводы очевидны: деньги не гарантируют надежную информацию.
Отдельная проблема заключается в том, как системы искусственного интеллекта игнорируют основные правила Интернета. Это стандарт robots.txt — специальный файл на веб -сайтах, который указывает роботов поисковых систем, какие страницы могут быть индексированы, а какие нет. Этот протокол служил основным инструментом для защиты контента в течение многих лет. Тем не менее, новые услуги искусственного интеллекта просто игнорируют это. Бесплатная версия недоумения легко найден и обрабатывается 10 статей National Geographic, которые были защищены от индексации — хотя публикация явно запретила услуги с ИИ от доступа к его содержанию.
Алгоритмы часто перенаправляют читателей не на оригинальные статьи, а на агрегаторы, такие как Yahoo News. Это даже происходит с материалами публикаций, которые подписали официальные соглашения с разработчиками ИИ. Эксперты отмечают, что эта практика лишает издателей законного трафика и доходов от рекламы.
Более половины ссылок, предлагаемых Google Gemini и Grok 3, приводят к не существующим страницам. Статистика последнего особенно плоха: из 200 осмотренных адресов 154 доказали, что они не работают.
Таким образом, издатели оказываются в настоящем тупике. Запретить алгоритмы индексации материалов через robots.txt означает потерять авторские ссылки, поскольку программное обеспечение все еще найдет публикации на других сайтах. Предоставление разрешения не означает какую -либо гарантию того, что аудитория достигнет оригинального источника.
OpenAI и Microsoft получили результаты исследования, но предпочитали выбраться из официальных ответов. Openai только повторил свое обещание помочь издателям. Компания процитирует свои материалы, даст прямые ссылки и всегда указывает на источники. Microsoft, в свою очередь, заявила, что соответствует правилам robots.txt и слушала пожелания владельцев авторских прав.