Google представил TranslateGemma, семейство моделей искусственного интеллекта с открытым исходным кодом для перевода на 55 языков.

Google выпустила три версии своей модели искусственного перевода TranslateGemma, обеспечивающей перевод десятков языков на портативные и мобильные устройства. Версия алгоритма с 4 миллиардами параметров оптимизирована для использования в мобильных устройствах, версия с 12 миллиардами параметров предназначена для использования в потребительских ноутбуках, а версия с 27 миллиардами параметров предназначена для использования в облачных серверах на базе одного AI-ускорителя или тензорного процессора Nvidia H100 (ТПУ).

Google тестирует новые алгоритмы на своей платформе MetricX, которая отслеживает ошибки перевода (чем ниже балл, тем лучше). AI-модель TranslateGemma с 12 миллиардами параметров набрала 3,6 балла, превзойдя результат базовой версии Gemma 3 с 27 миллиардами параметров, которая в этом тесте набрала 4,04 балла. По сравнению с версией Gemma 3 с 12 миллиардами параметров, набравшей 4,86 ​​в MetricX, процент ошибок снижен примерно на 26%. Значительное улучшение качества перевода наблюдалось для всех 55 протестированных языковых пар, включая некоторые менее популярные языки. Например, уровень ошибок при переводе с английского на исландский сократился на 30%, а при переводе с суахили на 25%.

Двухэтапное обучение алгоритмов позволяет перенести знания Gemini в более компактные модели ИИ. На первом этапе алгоритмы обучаются на параллельных данных, как переведенных человеком, так и сгенерированных другими инструментами ИИ. На втором этапе качество перевода оптимизируется за счет интенсивного обучения, когда несколько нейронных сетей с автоматической оценкой проверяют данные без необходимости перевода вручную. Отдельная модель оценивает, насколько естественно звучит получившийся перевод.

Чтобы модели ИИ оставались гибкими, несмотря на их специализацию, 30% обучающей выборки составляют общие данные. Это означает, что модели TranslateGemma AI могут работать аналогично знакомым чат-ботам. Оценка профессиональных переводчиков в целом подтвердила улучшения, за одним исключением: при переводе с японского на английский было отмечено снижение качества, которое Google объяснил ошибками в обработке имен собственных.

Все три модели ИИ сохраняют мультимодальные возможности Gemma 3. Они могут переводить текст с изображений даже без дополнительного обучения. Тесты в тесте Vista показали, что улучшения в переводе текста распространились и на перевод изображений. Для получения оптимальных результатов Google рекомендует использовать подсказки, указывающие, что модель ИИ должна выступать в роли «профессионального переводчика», учитывающего различные культурные нюансы. Все три новые модели TranslateGemma AI доступны на платформах Kaggle и Hugging Face.

`, // — БАННЕР 2 (Новости Google) — `

`, // — БАННЕР 3 (Viber) — `

` ); const randomIndex = Math.floor(Math.random() * Banners.length); document.getElementById(‘kaldata-random-banner’).innerHTML = баннеры(randomIndex); })();

Комментируйте статью на нашем форуме. Чтобы первыми узнавать самое важное, поставьте лайк нашей странице в Facebook и подпишитесь на нас в Google News, TikTok, Telegram и Viber или загрузите приложение по адресу Калдата.com для Android, iPhone, Huawei, Google Chrome, Microsoft Edge и Opera!

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
Прокрутить вверх