Nvidia объявляет о новой семье Llama Nemotron с расширенными возможностями рассуждений. Основываясь на моделях открытых кодов мета -платформ, модели NVIDIA предназначены для того, чтобы предоставить разработчикам основу для создания сложных агентов искусственного интеллекта, которые могут работать независимо или с минимальным контролем подключенных команд для решения сложных проблем.
«Агенты — это автономные программные системы, предназначенные для того, чтобы мыслить, планировать, действовать и критиковать свою работу», — сказала Кэрри Британская, вице -президент по управлению программными продуктами для создания искусственного интеллекта в Nvidia, на брифинге в прессе, сообщает VentureBeat. «Как и люди, агенты должны понимать контекст, чтобы разделить сложные запросы, понимать намерения потребителей и адаптироваться в режиме реального времени», — добавила она. По словам Бритски, принимая ламу в качестве базы, Nvidia оптимизировала модель с точки зрения вычислительных требований, сохраняя точность ответов.
NVIDIA заявила, что усовершенствовала новые модели семейных рассуждений во время предварительной подготовки для улучшения множества математических расчетов, кодирования, рассуждений и сложных решений. Его Повышенная точность ответов на модели до 20% относительно базовой модели и увеличила скорость притока пять раз по сравнению с другими ведущими моделями рассуждений с открытым исходным кодом.С Улучшенная производительность вывода означает, что модели могут справиться с более сложными задачами рассуждения, улучшают возможности принятия решений и снижают эксплуатационные расходы предприятий, объясняет компания.
Модели Llama Nemotron доступны в Nano, Super и Ultra Versions и используйте процессоры NVIDIA NIMС Они оптимизированы для различных сценариев реализации: Nano для персональных компьютеров и периферийных устройств, поддержание высокой точки зрения, Super для оптимальной производительности и точности у одного ускорителя и Ultra для максимальной «точности агента» в средах со многими ускорителями в центрах.
Согласно Nvidia, обширное предварительное обучение проводилось с использованием услуги NVIDIA DGX Cloudиспользуя высококачественные синтетические данные из лечения, генерируемые NVIDIA NEMOTRON Другие модели с открытым исходным кодом, а также дополнительные наборы данных Cure, созданные совместно с помощью NVIDIA. Обучение включало 360 000 часов заключения с использованием ускорителей H100 и 45 000 часов человеческой аннотации для улучшения возможностей рассуждений. По словам компании, будут свободно доступны инструменты, наборы данных и методы оптимизации, используемые для разработки моделей, что дает предприятиям гибкость создания собственных моделей рассуждений.
Одной из ключевых особенностей Nvidia llama nemotron является возможность включать, выключать и регулировать уровень рассуждений. По словам компании, это новая возможность на рынке искусственного интеллекта. Антропический Клод 3.7 имеет несколько сходную функциональность, хотя запатентованный шаблон закрыт. Среди моделей IBM Granite 3.2 с открытым исходным кодом есть также переключатель рассуждений, который IBM вызывает «условные рассуждения».
Что делает гибридным или условным рассуждением особенным, так это то, что это Позволяет системам устранить расчетливо дорогие шаги рассуждения для более простых запросов.