Depepeek обновила свою большую языковую модель V3, обозначенную V3-0324, который, как сообщается, обеспечивает лучшие возможности программирования, устанавливая новые стандарты для точности и эффективности, пишет Bloomberg. Обновление было опубликовано на платформе объятия без официального сообщения.
Модель V3 была введена в конце прошлого года. Он построен на основе смеси архитектуры экспертов (Мо) с общей суммой 671 миллиарда параметров.
Затем компания объявила, что обучение V3 стоит 5,5 млн. Долл. США, что значительно ниже затрат других технологических компаний, таких как OpenAI, для обучения аналогичных и моделей. Несколько недель спустя Deepseek выпустила R1, модель, способную мыслить, которая, несмотря на скромный бюджет на разработку, превзошел Openai O1 в некоторых сравнительных тестах по ряду ключевых показателей.
В январе приложение DeepSeek превысило чат -бот Catgpt Artificial Intelligence и стало более популярным среди бесплатных приложений в Apple App Store в Соединенных Штатах. Достижения китайского начала подняли вопросы среди инвесторов об действительности огромных затрат американских компаний по разработке технологий II, что привело к краху на рынке ИИ, что привело к значительному снижению акций компании. В частности, лидер рынка Nvidia потерял 593 миллиарда долларов на свою рыночную стоимость за день, что стало крупнейшим однодневным снижением в истории фондового рынка.