Согласно новому исследованию Европейского вещательного союза (ЕВС) и BBC, ведущие помощники по искусственному интеллекту искажают содержание новостей почти в половине своих ответов, пишет Reuters. Исследование показало, что около 45 процентов проанализированных ответов ИИ-помощника содержали по крайней мере одну существенную ошибку, а в 81 проценте ответов содержалась какая-либо проблема.
В опросе приняли участие 22 государственные СМИ из 18 стран, включая Францию, Германию, Испанию, Великобританию и США. Эксперты EBU и BBC проанализировали 3000 ответов на новостные вопросы от ведущих ИИ-помощников на 14 языках, включая ChatGPT, Copilot, Gemini и Perplexity, которые оценивались по точности, источнику информации и способности отличать мнение от факта.
О проблеме галлюцинаций, когда модели ИИ генерируют ложную или вводящую в заблуждение информацию, часто из-за таких факторов, как недостаток данных, ранее сообщали OpenAI и Microsoft. Однако в компаниях отметили, что работают над решением проблемы. Со своей стороны, сервис Perplexity AI утверждает, что один из его режимов «Глубокого исследования» обеспечивает точность 93,9%, когда дело доходит до сопоставления фактов.
Согласно исследованию, 1/3 ответов ИИ-помощников содержали серьезные ошибки в источнике данных, такие как отсутствие, вводящая в заблуждение или неправильная атрибуция.
Около 72% ответов на Gemini, ИИ-помощник Google, указывают на серьезные проблемы с источником данных, по сравнению с менее чем 25% для других ИИ-помощников. Около 20 процентов ответов имели проблемы с точностью, в том числе содержали устаревшую информацию.
Согласно отчету о цифровых новостях Института Рейтер за этот год, около 7% всех пользователей онлайн-новостей и 15% людей в возрасте до 25 лет используют ИИ-помощников для чтения новостей. По мнению Европейского вещательного союза, поскольку ИИ-помощники все чаще используются вместо традиционных поисковых систем новостей, доверие общества к ним может быть подорвано. Поэтому исследователи призвали компании, занимающиеся искусственным интеллектом, улучшить качество обработки новостных запросов своими продуктами.


