Новый переводчик ИИ выиграл тест WMT25.
Китайская компания Tencent открыла исходный код новых языковых моделей Hunyuan-MT, специально оптимизированных для услуг перевода. Разработчики говорят, что алгоритмы работают лучше, чем Google Translate на популярном сравнительном тесте WMT25.
В серии есть четыре модели, в том числе два флагмана — Hunyuan-MT-7B и Hunyuan-MT-CHIMERA-7BКаждый из которых содержит 7 миллиардов параметров. Кроме того, представлены две сжатые версии, которые используют меньше памяти, но работают с минимальными потерями в качестве перевода.
Tencent использует четыре набора учебных данных. Два из них включают тексты на 33 языках без переводов, в то время как два других включают несколько миллионов пар фраз и их переводы. Этот подход позволил объединить языковые знания с общей эрудицией.
Эффективность модели была проверена с использованием теста Mmlu-proпредназначен для оценки общих знаний. Hunyuan-Mt показал лучше, чем Llama-3-8B-база, хотя параметров меньше.
После первоначального обучения модели проходят дополнительную фазу с использованием обучения подкреплению. Tencent предложил им задачи и обратную связь о качестве перевода, что повысила точность.
Качество было оценено отдельной системой искусственного интеллекта, которая проанализировала семантическую согласованность перевода с исходной и правильным использованием терминологии в разных областях.
Первая модель серии, Hunyuan-MT-7B, основана на классической архитектуре языковых моделей. В варианте химеры-7B используется ансамблевая метод-сервисные нейронные сети, обрабатывая запрос одновременно, после чего их ответы объединяются в окончательной версии более высокого качества.
В тестах WMT25, сравнивая переводы из 31 языковых пар, Hunyuan-MT превосходит Google Translate в 30 случаях. В отдельных парах результат на 65% выше.
Кроме того, серия Tencent выполнялась лучше, чем GPT-4.1 антропного и Claude 4 Sonnet в большинстве языковых пар в одном и том же сравнительном тесте.