Google представил Gemini 2.5 Flash-Lite: самая быстрая и самая доступная модель в семье

Очевидно, что компания знает, что многие разработчики готовы отказаться от идеальной точности ответов в пользу более низких затрат на получение токенов.

22 июля Google официально представил стабильную версию Близнецы 2.5 Flash-Lite -Самая быстрая и наиболее финансово наиболее доступная модель искусственного интеллекта из семьи Gemini 2.5. Представители интернет -гиганта заявили, что Lite-версия стоит всего 10 центов (0,10 долл. США) за 1 миллион входных токеновВ то время как основная модель флэш -модели для того же миллиона входных токенов требует 30 центов, а Gemini 2.5 Pro стоит 1,25 доллара, т.е. В 12,5 раза дороже, чем Gemini 2,5 Flash-Lite.

Но что еще более важно, «выходная» информация в этом случае также стоит значительно меньше.

Например, в то время как стоимость одного миллиона Gemini 2,5 токенов Pro (в случае выходной цены) составляет 10 долларов США, а на Flash-Lite Gemini 2,5, стоимость генерации составляет всего 40 центов. Это позволяет обрабатывать большие объемы из разных запросов по относительно доступной цене (от запуска предварительной версии этой модели Google удалось снизить стоимость проверки аудио на 40%). Кроме того, что важно, новая компактная версия модели обрабатывает задачи, установленные намного быстрее, чем старые версии одной и той же семьи.

В официальном блоге говорится, что 2.5 Flash-Lite имеет более низкую задержку 2,0 Flash-Lite и 2,0 Flash при выполнении широкого диапазона запросов. Хотя Google называет 2,5 Flash-Lite «самая быстрая модель» и указывает на самую высокую скорость в новой таблице производительности (в разделе Speed (Speed) 2.5 Flash-Lite имеет три значка ракета против одного для одного для 2.5 Pro), разработчик не предоставляет никаких точных данных, чтобы обеспечить значимое сравнение параметров. И, что является наиболее интересным, инновация со всеми его преимуществами имеет бонус в виде высококачественных ответов на заданные вопросы.

Компания утверждает, что 2,5 Flash-Lite побеждает Flash-Lite 2.0 в области программирования, математики, науки, рассуждений и мультимодального восприятия. И эти преимущества уже используются небольшими начальными -для выполнения реальных сценариев мира -например, Сатлит применяет новую модель для обработки и использования спутниковых данных для быстрого обобщения телеметрии с орбиты, анализ спутниковой связи и многое другое. Компактный 2,5 Flash-Lite позволил компании сократить потребление энергии на 30%, снизив задержку на 45%.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
Прокрутить вверх