«Модели искусственного интеллекта могут делать больше, чем им разрешено»: что обнаружило новое исследование Anthropic

Anthropic опубликовала исследование по использованию агентов ИИ в реальном мире. Было обнаружено, что почти половина всех инструментов на основе API относится к разработке программного обеспечения. Остальная часть деятельности распределена по 16 различным отраслям, ни одна из которых не составляет более 9% от общего объема.

Отдельный вывод исследования касается автономности. Исследователи отмечают, что Клод может самостоятельно выполнять задачи, на которые у человека обычно уходит до пяти часов. Однако на практике почти все рабочие сеансы (999 из 1000) длятся не более 42 минут. Это показывает, что потенциал модели намного больше, чем то, как люди ее используют в настоящее время.

Как меняется поведение потребителей

Новички редко позволяют агенту работать полностью самостоятельно — только около 20% времени. По мере приобретения опыта (после сотен сеансов) они дают агенту больше свободы в более чем 40% случаев.

Но вот что интересно: опытные пользователи еще чаще останавливают агент во время работы — 9% действий против 5% у новичков. Это не означает меньше доверия. Просто меняем стиль управления:

новички заранее проверяют каждый шаг;
опытные допускают самостоятельную работу, но вмешиваются, если заметят проблему.

Еще один важный момент: в сложных задачах агент скорее попросит разъяснений, чем будет остановлен человеком. В целом, большинство действий (73%) по-прежнему выполняются с участием человека. И только 0,8% операций являются необратимыми.

Как меняется поведение потребителей

Все важное из мира технологий прямо на ваш почтовый ящик.

Похожие записи