Исследование BBC: чат-боты с искусственным интеллектом неправильно воспринимают новости в 45% случаев

Анализ, проведенный BBC и другими европейскими новостными агентствами, показал, что около 45% ответов чат-ботов на базе искусственного интеллекта на новостные запросы содержат ошибки.

OpenAI, Google, Microsoft и другие технологические компании активно поощряют пользователей взаимодействовать с агентами ИИ при поиске в Интернете. Хотя разработчики потратили годы, пытаясь свести к минимуму вероятность ложных ответов от чат-ботов, анализ показывает, что ИИ все еще далек от надежной и стабильной работы.

В рамках исследования BBC и 22 других правительственных информационных агентства из 18 стран и на 14 языках предоставили чат-ботам доступ к своему контенту. Ошибки были обнаружены почти в половине контента, созданного ИИ, включая искаженные предложения и цитаты, устаревшую информацию и проблемы с алгоритмами поиска.

Чат-боты часто предоставляют ссылки, которые не соответствуют реальным источникам, на которые они ссылаются. Даже при наличии точных ссылок модели ИИ часто не могут отличить мнение от факта, а сатиру от обычных новостей.

Помимо фактических ошибок или неправильных цитат, чат-боты медленно обновляют информацию о политике и политических лидерах. Например, ChatGPT, Copilot и Gemini ошибочно заявляют, что нынешним Папой является Папа Франциск, которому наследовал Лев XIV. Второй пилот даже правильно сообщил дату смерти Франциска, продолжая называть его нынешним папой. ChatGPT также выдавал устаревшие ответы при упоминании имен нынешнего канцлера Германии и генерального секретаря НАТО.

Google Gemini оказался менее точным, чем ChatGPT, Copilot и Perplexity. 72% ответов содержали ошибки. OpenAI однажды объяснила эти ошибки тем, что ранние версии ChatGPT обучались только на данных до сентября 2021 года и не имели доступа к реальному Интернету. Однако сейчас ситуация изменилась и теоретически таких ошибок быть не должно. Скорее всего, проблема кроется в алгоритмах и не может быть легко устранена.

Более поздние результаты показывают улучшение по сравнению с февральским опросом BBC. С тех пор доля ответов с серьезными ошибками снизилась с 51% до 37%, но Gemini по-прежнему существенно отстает.

Кроме того, исследователи обнаружили, что значительная часть пользователей продолжает доверять ответам чат-ботов. Более трети взрослых британцев и почти половина взрослых в возрасте до 35 лет доверяют искусственному интеллекту передачу точных новостей. Более того, если ИИ искажает содержание источника новостей, 42% взрослых либо будут винить и ИИ, и первоисточник, либо меньше доверять источнику.

Похожие записи