Китайский гигант электронной коммерции Alibaba сделал свою модель ИИ для создания видео и изображений WAN 2.1. С этим шагом компания создала условия для своей массовой реализации и способствовала увеличению конкуренции в области ИИ.
Публикация моделей ИИ с открытым исходным кодом является распространенным шагом в II-индустрии; Одним из самых замечательных игроков здесь является стартап DeepSeek. Alibaba выпустила четыре варианта WAN 2.1: T2V-1.3B, T2V-14B, I2V-14B-720p и I2V-14B-480p-TheSe Models генерируют видео и статические изображения на основе текстового запроса или модели, которые могут быть изображением. Обозначения «1,3b» и «14b» показывают, что эти варианты содержат 1,3 миллиарда и 14 миллиардов параметров соответственно.
Модели доступны для пользователей по всему миру в Huggingface и Modelcope (часть Alibaba Cloud) для академических, исследовательских и коммерческих целей. Alibaba представила последнюю версию своего генерального поколения видео в январе, которая первоначально называлась WANX, но позже переименован в WAN. Проект получил высокие оценки в тестах vbench, предназначенных для видео генераторов, в частности, он стал лидером в критерии взаимодействия сайта.
Alibaba также запустила предварительную версию QWQ-MAX, которая является логической моделью, которая также будет запущена в качестве проекта с открытым исходным кодом позже. Компания планирует инвестировать не менее 380 миллиардов юаней (52 миллиарда долларов) в течение следующих трех лет в поддержку облачных расчетов и инфраструктуры искусственного интеллекта.