406 миллиардов параметров: Tencent AI представляет Hunyuan 2.0 — новую модель искусственного интеллекта, меняющую правила игры

Китайский технологический гигант Tencent запускает языковую модель HY2.0Think с архитектурой «экспертного микса» и 406 миллиардами параметров. Модель поддерживает сверхдлинный контекст до 256 тысяч токенов и демонстрирует ведущие результаты в задачах, требующих сложных логических рассуждений: математика, программирование, естествознание. Параллельно Tencent интегрировала модель DeepSeek V3.2 в свою экосистему.

HY2.0 построен на основе архитектуры «смесь экспертов» (MoE): при общем размере до 406 миллиардов параметров в любой момент времени задействовано только 32 миллиарда. Модель поддерживает сверхдлинные контексты — до 256 тысяч токенов, что позволяет ей работать с большими документами и сложными цепочками рассуждений. HY 2.0 Think использует «стратегию штрафа за длину», чтобы избежать создания чрезмерно подробного вывода. Tencent ставит его в число лидеров отрасли по эффективности и скорости вывода.

В отличие от предыдущей версии Hunyuan-T1, версия HY2.0Think обучается на основе улучшенных данных предварительного обучения и обновленных методов обучения с подкреплением. Он улучшил производительность в задачах, требующих логического рассуждения, включая математику, естественные науки, программирование и точное следование инструкциям.

HY2.0Think показал отличные результаты в различных тестах, включая задачи уровня Международной математической олимпиады IMO-AnswerBench и HMMT 2025, соревнование Гарвардского технологического института.

Обновленные данные перед обучением также позволили решать тесты, требующие глубоких знаний, такие как «Последний экзамен человека» (HLE) и ARC AGI.

Для задач, где важно точно следовать инструкциям и работать с длинными текстами, HY2.0Think устраняет разрыв между обучением и фактическим использованием модели, используя метод «коррекции выборки по важности». Это помогает стабилизировать обучение с подкреплением при обработке длинных контекстов и повышает производительность при выполнении сложных многошаговых и многовариантных задач.

В области программирования и интеллектуальные агенты Tencent разработала масштабируемые среды тестирования и синтетические наборы данных. Это улучшило возможности модели по написанию кода, вызову сложных инструментов и выполнению задач агента. HY2.0 показал высокие результаты в практических тестах SWE-bench Verified и Tau2-Bench, ориентированных на реальные сценарии применения.

Tencent также постепенно внедряет модель DeepSeek V3.2 в свою экосистему. Обе модели были впервые выпущены в собственных приложениях AI Yuanbao и ima. При этом Tencent Cloud открыла к ним доступ через API и облачные сервисы.

Запуск HY2.0 и интеграция DeepSeek V3.2 отражают стратегию Tencent по укреплению собственной платформы искусственного интеллекта, от собственных приложений до облачных сервисов. DeepSeek недавно выпустил открытую модель, которая показывает результаты, соответствующие уровню золотой медали Международной математической олимпиады, которую обычно присуждают лишь около 8% участников.

`, // — БАННЕР 2 (Новости Google) — `

`, // — БАННЕР 3 (Viber) — `

` ); const randomIndex = Math.floor(Math.random() * Banners.length); document.getElementById(‘kaldata-random-banner’).innerHTML = баннеры(randomIndex); })();

Комментируйте статью на нашем форуме. Чтобы первыми узнавать самое важное, поставьте лайк нашей странице в Facebook и подпишитесь на нас в Google News, TikTok, Telegram и Viber или загрузите приложение по адресу Калдата.com для Android, iOS и Huawei!

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
Прокрутить вверх