Google представила свою новейшую и мощную модель искусственного интеллекта Gemini 2.0, которая является чрезвычайно гибкой. Он может генерировать текст, звук и изображения и предлагает новые мультимодальные возможности, которые открывают путь к следующему большому этапу развития искусственного интеллекта — агентам, способным буквально заменить пользователя в рутинных операциях. Новая модель также заметно более производительна и энергоэффективна.
Как и любая другая компания, участвующая в так называемом В гонке искусственного интеллекта Google лихорадочно встраивает искусственный интеллект во все, что может, в попытке создать успешные коммерческие продукты. В то же время компании необходимо настроить всю свою инфраструктуру, чтобы дорогие решения искусственного интеллекта не обанкротили ее. Между тем, другие технологические гиганты Amazon, Microsoft, Anthropic и OpenAI также вкладывают миллиарды долларов в решение практически такого же набора проблем.
Gemini 2.0 был представлен примерно через 10 месяцев после выпуска версии 1.5, и генеральный директор Google DeepMind Демис Хассабис очень высоко оценил новую модель, назвав ее «всеобъемлющей», хотя Gemini 2.0 все еще находится на стадии «экспериментального обзора» в Google. терминология.
Однако Хассабис уверен, что новая модель обеспечит совершенно другой уровень возможностей, особенно в области агентного искусственного интеллекта. Под агентным ИИ понимаются ИИ-боты, которые могут полностью выполнять действия от имени пользователя. Например, Project Astra от Google — это визуальная система, которая может распознавать объекты, помогать ориентироваться в мире и находить потерянные предметы. По словам Хассабиса, в Gemini 2.0 возможности Astra многократно возросли.
Другой пример — Project Mariner от Google, экспериментальное расширение для браузера Chrome, которое буквально заменяет пользователя при работе в Интернете. Агент Jules помогает разработчикам находить и исправлять плохой программный код. Выпущен даже агент, который помогает вам лучше играть в видеоигры.
«Мы действительно рассматриваем 2025 год как истинное начало эры агентов — Gemini 2.0 является ее основой».
говорит Хассабис
Он также отметил повышенную производительность и энергоэффективность новой модели, особенно на фоне общего замедления прогресса в индустрии искусственного интеллекта.
План Google относительно Gemini 2.0 — использовать его абсолютно везде. Целью Google было включить как можно больше функций в одну модель, а не выпускать множество отдельных изолированных продуктов.
По мнению Хассабиса, с наступлением эпохи агентов ИИ придется решать как новые, так и старые проблемы. Старых проблем много — они связаны с производительностью, эффективностью и стоимостью вывода. Новые связаны с рисками безопасности и конфиденциальности. Gemini 2.0 в настоящее время находится на экспериментальной стадии и доступна только в облегченной версии Gemini 2.0 Flash. Финальную версию планируется выпустить в начале следующего года.