Бросая вызов общепринятому мнению, генеральный директор Nvidia Дженсен Хуанг заявил, что ИИ-чипы его компании превышают исторический рост производительности, определенный законом Мура. Это заявление, сделанное во время его программной речи на выставке CES в Лас-Вегасе и повторенное в интервью, сигнализирует о потенциальном сдвиге парадигмы в мире вычислений и искусственного интеллекта.
На протяжении десятилетий закон Мура, придуманный соучредителем Intel Гордоном Муром в 1965 году, был движущей силой развития вычислительной техники.
Он предсказывает, что количество транзисторов в компьютерных чипах будет примерно удваиваться каждый год, что приведет к экспоненциальному увеличению производительности и резкому снижению затрат. Однако в последние годы действие этого закона начало замедляться. Хуанг представил иную картину ИИ-чипов Nvidia.
«Наши системы развиваются гораздо быстрее, чем закон Мура».
он рассказал TechCrunch, указав на новейший суперчип компании для центров обработки данных, который, как говорят, более чем в 30 раз быстрее, чем его предшественник.
Хуанг объясняет такой ускоренный прогресс целостным подходом Nvidia к разработке чипов.
«Мы можем создавать архитектуру, чип, систему, библиотеки и алгоритмы одновременно. Если вы сделаете это, то сможете двигаться быстрее, чем закон Мура, потому что вы сможете внедрять инновации во всем стеке».
он объяснил
Эта стратегия явно дала впечатляющие результаты. Хуанг утверждает, что сегодняшние ИИ-чипы Nvidia в 1000 раз более совершенны, чем те, которые компания производила 10 лет назад, что намного опережает темпы, установленные законом Мура.
Отвергнув идею о том, что прогресс в области ИИ застопорился, Хуанг обозначил три активных шага по масштабированию ИИ: предварительное обучение, постобучение и вычисления во время тестирования. Он подчеркнул важность расчетов во время тестов, которые происходят на этапе вывода и дают моделям ИИ больше времени «подумать» после каждого вопроса.
Во время своего выступления на выставке CES Хуанг представил новейший суперчип Nvidia для центров обработки данных — GB200 NVL72, заявив, что его производительность в рабочих нагрузках искусственного интеллекта в 30–40 раз выше, чем у его предшественника H100. Он утверждает, что этот скачок в производительности со временем сделает дорогие модели искусственного интеллекта, такие как o3 от OpenAI, более доступными.
«Прямым и немедленным решением для сравнительного анализа вычислений, как с точки зрения производительности, так и с точки зрения доступности, является увеличение наших вычислительных возможностей».
Хуан сказал
Он добавил, что в долгосрочной перспективе модели ИИ можно будет использовать для создания более качественных данных для предварительного и последующего обучения других моделей ИИ.