Инженеры проигрывают ИИ: модель Claude Opus 4.5 справилась с антропной задачей лучше любого человека

Вчера Anthropic объявила о выпуске своей новой флагманской модели искусственного интеллекта Claude Opus 4.5. Позже компания сообщила, что в двухчасовом задании, предложенном самой Anthropic при наборе на инженерные должности, Opus 4.5 превзошел участников живого тестирования.

По мнению Anthropic, производительность ИИ достигается за счет многократного решения каждой задачи и выбора лучшего ответа. Хотя тест не охватывает все компетенции, необходимые для того, чтобы стать инженером, превосходство модели над сильными кандидатами в ключевых технических областях предполагает, что искусственный интеллект может изменить инженерную профессию в будущем, сообщает Business Insider.

Подробности содержания теста не разглашаются, но отзывы на Glassdoor свидетельствуют, что в 2024 году он включал четыре уровня и требовал внедрения конкретной системы с последующим добавлением функционала. Неизвестно, использовался ли аналогичный формат задач при оценке новой версии Claude Opus 4.5, которая включает улучшения не только в генерации кода, но и в создании профессиональных документов, включая электронные таблицы Excel и презентации PowerPoint.

По мнению экспертов, эта версия продолжает укреплять лидирующие позиции Anthropic в области программирования ИИ. Даже Meta Марка Цукерберга, конкурент в гонке искусственного интеллекта, использует Claude для поддержки своего внутреннего помощника по программированию под именем Devmate.

Компания держит в секрете свои методы обучения моделей ИИ. Однако Эрик Саймонс, генеральный директор стартапа Stackblitz, разработавшего сервис Bolt.new, ранее предполагал, что Anthropic может использовать искусственный интеллект для написания и выполнения кода, а затем анализировать результаты с помощью инструментов как человека, так и искусственного интеллекта. Это описание подтвердила Дайан Пенн, руководитель отдела управления продукцией, исследований и передовых технологий в Anthropic, назвав его «в целом правда«.

В октябре генеральный директор Anthropic Дарио Амодей объявил, что AI Claude теперь пишет 90% кода для большинства команд компании. Однако он отмечает, что это не приведет к уменьшению количества инженеров, а, скорее, увеличит спрос на них, поскольку люди смогут сосредоточиться на самых сложных 10% работы или на управлении группой моделей ИИ.

Напомним, что Anthropic бросила вызов Gemini 3, представив мощную AI-модель Opus 4.5. Кроме того, Claude Opus 4 теперь может прекращать диалог с токсичными пользователями. То есть ИИ теперь может завершить диалог самостоятельно, если посчитает, что ситуация угрожает не человеку, а ему самому.

`, // — БАННЕР 2 (Новости Google) — `

`, // — БАННЕР 3 (Viber) — `

` ); const randomIndex = Math.floor(Math.random() * Banners.length); document.getElementById(‘kaldata-random-banner’).innerHTML = баннеры(randomIndex); })();

Комментируйте статью на нашем форуме. Чтобы первыми узнавать самое важное, поставьте лайк нашей странице в Facebook и подпишитесь на нас в Google News, TikTok, Telegram и Viber или загрузите приложение по адресу Калдата.com для Android, iOS и Huawei!

Похожие записи