Новые продукты обещают меньше нагрузки на память и высокую эффективность токенов.
IBM представил Гранит 4.0 — Новые языковые модели с открытыми весами, включая версии с параметрами от 3 до 32 миллиардов.Ранний доступ к моделям был предоставлен для искусственного анализа, который провел тесты и отмечал сильные стороны нового семейства, в частности высокую эффективность токенизации.
Издание включает в себя четыре модели: Гранит 4,0 ч маленький (32B/9B Активные параметры), гранит 4,0 ч крошечный (7B/1B), гранит 4,0 ч микро (3B/3B) и гранит 4,0 микро (3B/3B). В отличие от классических трансформаторов, Granite 4.0 сочетает в себе небольшое количество стандартных слоев внимания с преобладающими слоями мамбы, что снижает требования к памяти без заметной потери производительности.
В Сравнительные тесты Для искусственного анализа Granite 4,0 H Small показал индекс интеллекта 23 в режиме Nonzonance, который на 8 баллов больше, чем результат предыдущего гранита IBM 3.3 8b. Этот результат ставит модель перед Gemma 3 27B (22), но все еще стоит за Mistral Small 3,2 (29), Exaone 4.0 32B (30) и QWEN3 30B A3B (37). Гранит 4,0 микрока получает 16 баллов, опередив Джемму 3 4B (15) и LFM 2 2,6B (12).
Еще одним преимуществом серии является экономическое использование токеновS Granite 4,0 H Small потребляет 5,2 -метровые токены, чтобы пройти тест, а гранит 4,0 микро — 6,7 млн. Для сравнения, предыдущий гранит 3.3 8b требовал больше ресурсов, а также большинству других моделей с открытым весом с параметрами ниже 40b.
Все четыре модели уже доступны в обнимании лица. Granite 4,0 H Small также публикуется в репликации и стоит 0,06 долл. США за миллион входных токенов и 0,25 долл. США за миллион токенов. Модели имеют контекстное окно из 128 000 токенов, а лицензия — Apache 2.0.

