На этой неделе разработчики DeepSeek публикуют интересные данные о ожидаемой прибыльности своих крупных языковых моделей V3 и R1 в течение условного 24-часового периода. По мнению авторов расчетов, эти модели делают в шесть с половиной раза больше денег, чем они тратят на найм вычислительной мощности.
Фактически, на основе информации, опубликованной представителями DeepSeek на страницах Github, компания потратила 87 072 долл. США на найд вычисления акселераторов для случайного выбранного 24 часа, в то время как потенциальные модели V3 и R1 могут принести 562 027 долл. США за тот же период.
Сравнивая эти значения, авторы расчетов получили условную прибыльность 545%.
Тем не менее, важно понимать, что расчеты этого метода предполагают ряд допущений. Прежде всего, потенциальный доход рассчитывается без учета скидок, и ценовая политика более дорогого I-модели R1 была принята в качестве основы. Во -вторых, не все общедоступные услуги DeepSeek монетизированы и взимаются. Если доступ к ним взимается по коммерческому тарифу, количество пользователей может быть уменьшено, что уменьшило бы получение дохода.
Наконец, расчеты в этом примере не учитывают затраты на DeepSeek на электроэнергию и аренду средств для хранения данных, а также для исследований и разработок как таковых. В любом случае, эта попытка продемонстрировать потенциальным инвесторам, его перспективы и платежеспособность должны вдохновить представителей других стартовых -публиковать такие расчеты. До сих пор в области искусственного интеллекта требуется огромные затраты инвесторов, а финансовая доходность очень эфемерна и отдалена с течением времени.
DeepSeek объясняет, что компания достигла высокой эффективности своих услуг за счет ряда оптимизаций. Во -первых, трафик распределяется между несколькими центрами обработки данных максимально равномерно. Во -вторых, время обработки запроса пользователя гибко. В -третьих, обработанные данные сортируются в партии для оптимизации нагрузки инфраструктуры.