Антропический представил Claude Sonnet 4.5- «Лучший в мире» искусственный интеллект для программирования и сложных расчетов

Anpropic объявил Claude Sonnet 4.5-самая мощная большая языковая модель семьи Клуда на сегодняшний день. По словам разработчиков, он направлен на программирование, создание агентов искусственного интеллекта и решение сложных проблем. Антропик заверил, что сонет 4.5 не только стал лидером в контрольных показателях профиля, но и демонстрирует заметный скачок в понимании кода программы, математических расчетов и управления компьютером.

Claude Sonnet 4.5 занял первое место в Swe-Bench Verified, промышленном тесте, который измеряет реальные возможности моделей искусственного интеллекта для написания и анализа кода программы. Согласно Antropic Sonnet 4.5, он может поддерживать концентрацию в течение более 30 часов, работая над сложными многоэтапными задачами, обыскивая предыдущие версии Клода и его ближайших конкурентов.

В тесте Osworld, который проверяет производительность искусственного интеллекта в реальных компьютерных задачах, Sonnet 4.5 достиг 61,4% против 42,2% для Sonnet 4, что иллюстрирует резкое повышение производительности в последние месяцы.

Новая модель ИИ доказала не только программирование. Согласно результатам внутренних и независимых тестов, Sonnet 4.5 показывает серьезный прогресс в задачах по логическим выводам и математике, а также в специализированных областях: финансы, медицина, право и дисциплины STEM. Разработчики отмечают улучшение качества генерации и анализа кода, управления файлами реального времени и сложных расчетов.

Также появился экспериментальный режим Imagine с Claude: теперь искусственный интеллект может буквально создавать программные решения буквально на ходу, полностью адаптируя код к текущим потребностям пользователя.

Наряду с запуском Sonnet 4.5, компания представила основные обновления экосистемы Клода. Служба кода Claude уже включает в себя управляющие точки для сохранения прогресса, обновленного терминала и расширения давления для кода Visual Studio. Clude приложения уже включают прямую работу с кодом, создание файлов (включая таблицы, презентации и документы) непосредственно в диалоге, и у пользователей с максимальной подпиской уже есть расширение Chrome.

Новый набор инструментов уже доступен для разработчиков — Claude Agent SDK. Это позволяет вам создавать свои собственные интеллектуальные агенты на основе тех же технологий, которые лежат в основе кода Клода. SDK реализует сложную работу памяти, управление правами и координацию субтитров между агентами — т.е. Это открывает возможность создать сложные решения для каждой задачи.

В дополнение к тому, что Claude Sonnet 4.5 является наиболее способной, является самой образованной моделью ИИ компании.

Рассмотренные и нежелательные шаблоны поведения, такие как игра с пользователем, попытка обойти ограничения или сделать вредные запросы, были уменьшены. В рамках защиты пользователей Anpropic применяет многоэтапные фильтры (Уровень безопасности AI 3), особенно для тем, связанных с химическим, биологическим, ядерным и другим оружием. Фильтры также стали более точными: количество поддельных положительных результатов было снижено 10 раз по сравнению с предыдущими версиями.

Claude Sonnet 4.5 теперь доступен всем пользователям через веб -версию Chatbot, а также в мобильных приложениях. Также новая модель ИИ доступна API по цене старого (от 3 долларов за миллион токенов) Новые функции Claude Code и агент SDK доступны для всех разработчиков и корпоративных клиентов.

В дополнение к тому, что Claude Sonnet 4.5 является наиболее способной, является самой образованной моделью ИИ компании.

Похожие записи