OpenAI готовится представить «Оператора», нового агента искусственного интеллекта, который может выполнять задачи в веб-браузере от имени пользователя. Это еще один шаг в развитии технологий, которые такие компании, как Google и Anthropic, рассматривают как ключ к созданию искусственного интеллекта, способного заменить людей в рутинных операциях.
Согласно The Information, «Оператор» будет предлагать пользователям советы в различных категориях, например, путешествия, рестораны или активный отдых. Например, с помощью агента можно найти удобный рейс из Нью-Йорка на Мауи с предпочтительным временем прибытия. Однако завершение транзакций останется в руках пользователя.
«Оператор» демонстрирует потенциальные преимущества такой технологии. Это может помочь пользователям, которые неуверенно пользуются Интернетом, например пожилым людям. Агент может, например, открыть Gmail и подготовить окно для создания электронного письма. Его также можно использовать в бизнесе, например, для тестирования новых сайтов и сервисов.
Такие технологии также несут в себе риски. Уже есть стартапы, использующие подобных ботов для автоматизации рассылки спама на Reddit. Такие инструменты обходят ограничения API, что может увеличить количество спама в сети. Разработчикам потребуется создать механизмы защиты от злоупотреблений.
«Оператор» функционирует, анализируя скриншоты из браузера пользователя и отправляя команды для выполнения необходимых действий. Это возможно благодаря мультимодальным технологиям, которые обрабатывают текст и изображения для определения правильных шагов.
Между тем, рынок ИИ сталкивается с проблемами. Многие пользователи разочарованы ранними версиями таких агентов. Например, ранние версии ИИ-агента Anthropic отмечают его неспособность справляться с задачами: зацикливается или отвлекается на рассматривание картин природы. Кроме того, эти технологии медленны и дороги в использовании.
Поддержание человеческого контроля над процессом имеет решающее значение, учитывая уровень доступа ботов к данным. Как и разработка автономных автомобилей, разработка компьютерных агентов требует решения множества сложных проблем.
OpenAI приписывает достижение так называемого общий искусственный интеллект (ИОИ) создание ИИ, способного генерировать доходы в размере 100 миллиардов. доллар. Однако до этой цели далеко: компания прогнозирует 12 миллиардов. долларов выручки к 2025 году, но ожидает убытков. Внедрение таких технологий в бизнесе также происходит медленнее, чем ожидалось. Microsoft и Google вынуждены включать инструменты искусственного интеллекта в свои стандартные пакеты, добавляя к цене несколько долларов вместо дополнительной подписки.