Baidu представила модель с 24 триллионами параметров, превосходящую по производительности GPT-5.1 и Gemini 2.5

Согласно недавним тестам, китайский чат-бот Baidu Ernie Bot 5.0 (Wenxin Yiyan) превзошел OpenAI и ведущие модели обработки текста Google. Новая версия с 2,4 триллионами параметров использует новую архитектуру для одновременного и комплексного обучения с помощью текста, изображений, видео и аудио. Компания утверждает, что это обеспечивает более глубокое понимание контекста.

Модель объединяет обработку всех типов данных в одной системе, не разделяя ее на отдельные модули. В разработке приняли участие 835 экспертов из областей технологий, финансов, медицины, образования и гуманитарных наук.

Как объясняет Ву Тянь, вице-президент Baidu и заместитель директора Национального инженерного центра технологий глубокого обучения, большинство мультимодальных ИИ используют подход «позднего слияния», при котором разные типы данных, будь то текст или видео, обрабатываются отдельно, а результаты объединяются только на финальном этапе. Вэньсинь 5.0 работает по-другому: он построен на единой авторегрессионной архитектуре и обучается одновременно с текстом, изображениями, видео и аудио. Это позволяет модели более глубоко интегрировать данные и лучше понимать контекст.

Кроме того Эрни Бот 5.0 использует архитектуру смешанных экспертов с «ультраредкой» активацией. Менее 3% параметров активируются в любой момент времени. Baidu утверждает, что это сохраняет мощь модели и одновременно ускоряет ее.

Новая версия особенно эффективна в мультимодальном понимании, программировании и творческом письме.

В качестве примера Baidu указывает на способность Ernie 5.0 имитировать стиль классического китайского романа «Сон в Красной башне», известного своим сложным сюжетом. Модель связывает литературный контекст с современными деловыми ситуациями, что демонстрирует способность улавливать ключевые идеи и творчески интерпретировать их.

Согласно последнему рейтингу LMArena, модель Ernie 5.0 занимает первое место среди китайских моделей и восьмое место в мировом рейтинге по производительности обработки текста, опережая ведущие американские модели, такие как OpenAI GPT-5.1-High и Google Gemini 2.5-Pro.

Частные пользователи могут получить доступ к Ernie 5.0 через официальное приложение и веб-сайт Baidu. Корпоративные клиенты и разработчики могут использовать эту модель через облачную платформу Qianfan.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
Прокрутить вверх