Небольшой стартап встряхнул индустрию открытой моделью с 400 миллиардами параметров

Arcee AI, стартап со штатом всего 30 сотрудников, бросил вызов технологическим гигантам. Компания представила Trinity Large, одну из крупнейших языковых моделей с полностью открытым исходным кодом, созданную в США. Флагманская нейросеть с 400 миллиардами параметров была обучена всего за 33 дня на новейших чипах Nvidia Blackwell и уже сравнима с лидерами рынка по результатам тестирования. Выпустив Trinity под свободной лицензией Apache, стартап намерен положить конец доминированию закрытых систем.

Trinity Large — это модель базового языка с открытым исходным кодом под лицензией Apache. В своей текущей версии он работает с текстом и предназначен для задач программирования, логического рассуждения и многоэтапных процессов, таких как операции агента. В будущем планируется добавить обработку изображений и преобразование речи в текст.

До Тринити Ларгe, Arcee AI выпустила модели меньшего размера: Trinity Mini с 26 миллиардами параметров, предназначенных для решения задач рассуждения, и Trinity Nano с 6 миллиардами параметров для расширения коммуникационных возможностей ИИ. Все они прошли шестимесячное обучение с использованием 2048 графических процессоров Nvidia Blackwell B300 с бюджетом в 20 миллионов долларов из 50 миллионов долларов, собранных стартапом.. Флагманская платформа Trinity Large завершила предварительное обучение всего за 33 дня на наборе данных из 17 триллионов токенов.

Результаты испытаний показывают, что Trinity сравнима с Llama 4 Maverick 400B от Meta и GLM-4.5 от Z.ai с точки зрения программирования, математики, здравого смысла и логики. В некоторых тестах модель даже немного превосходит конкурентов..

Trinity доступна в нескольких версиях: Большая база — базовая модель без постобработки, Большой предварительный просмотр с минимальной постобработкой для работы в чатах и TrueBaseпредназначенный для дополнительного обучения и адаптации под задачи пользователя. Все версии можно загрузить бесплатно, а Trinity Mini API теперь доступен в бесплатном плане и платных опциях по цене от 0,045 до 0,15 доллара США за запрос.

Arcee AI была основана как небольшой стартап, специализирующийся на модернизации существующих моделей искусственного интеллекта для крупных корпоративных клиентов, таких как SK Telecom. Компания использует готовые решения с открытым исходным кодом, включая Llama, Mistral и Qwen, и адаптирует их для удовлетворения потребностей клиентов посредством постобучения и обучения с подкреплением. По мере роста клиентской базы стартап осознал необходимость создания собственной модели снижения зависимости от зарубежных технологий.

Основатели компании подчеркивают стратегическую важность Троица. Создание открытой модели позволяет американским разработчикам не зависеть от китайских или ограниченно лицензионных решений. В ближайшие планы стартапа входит выпуск коммерческих API для основных версий Trinity в течение шести недель и расширение функциональности модели.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
Прокрутить вверх