突发!DeepSeek 被曝首次对外融资,3 亿美元起,估值 100 亿美元
(来源:AI信息Gap)
「不差钱」的 DeepSeek,今天终于张口要钱了。
The Information 独家披露,DeepSeek 正在洽谈首次对外融资。
融资金额至少 3 亿美元。估值不少于 100 亿美元。
上一次传 DeepSeek 融资,还是 14 个月前。
2025 年 2 月 7 日,阿里 100 亿估值投资 10 亿美元入股 DeepSeek 的消息流出。阿里副总裁颜乔当晚就在朋友圈亲自辟谣,「外界流传阿里投资 DeepSeek 的信息是假消息」。
12 天后 The Information 又爆料 DeepSeek 内部在讨论是否接外部资本,DeepSeek 相关人士也回了一句,「融资相关均为谣言」。
去年 2 月的热闹,就这么被压下去了。
今天再次传出的这条消息,暂时还没人跳出来辟谣。
估值 100 亿,是不是卖便宜了
有意思的是这个估值数字。
100 亿美元,比 2025 年初外界估的 34 亿翻了三倍,听着很猛。
但其实不然。
Kimi 三月份的新一轮估值,180 亿。智谱和 MiniMax 更猛,1 月双双在港股上市,市值一度都冲到 400 亿美元这一档,MiniMax 甚至短暂超过了百度。
被资本追着跑的几家头部国产大模型公司,估值都在 180 亿到 400 亿美元之间。曾经全球 AI 圈讨论度最高的 DeepSeek,开出来的价却只有他们的一半到四分之一。
幻方养不动了?
DeepSeek 能「不融资」走到今天,靠的是一个别家模型公司都没有的外挂。
它的母公司,幻方量化。
幻方管理规模 100 亿美元以上,2025 年平均收益 56.6%。
幻方一年在二级市场赚的钱,随手就够 DeepSeek 烧。
金沙江创投朱啸虎去年也表过态。
「我肯定会投啊!这个价格已经不太重要了。」
那会儿 DeepSeek 没松口。
这次的 3 亿美元融资如果属实,就是这条路变了。
V4 要来了。
据爆料,这一代 V4 是一个万亿参数的 MoE,支持原生多模态。它也是 DeepSeek 第一个专门为国产芯片优化的模型。
从英伟达彻底换到国产芯片,整套技术栈都要重写。据报道 V4 已经因为软件栈磨合不顺,推迟过两次。烧钱量级跟过去的 DeepSeek 不是一个级别。
幻方能养一个专心搞研究的 DeepSeek,但一个既要换国产芯片、又要支持全球 API 调用、还要做多模态的 DeepSeek,就不一定了。
这两天,DeepSeek 还干了另一件事
就在融资消息传出的前一天,DeepSeek 负责「榨干显卡性能」的开源项目 DeepGEMM 悄悄更新了。
一个万亿参数的大模型里,可能有几百个「专家」。你问个问题,系统先判断「该找哪几个专家」,然后把活派给他们,他们算完,再汇总答案。派活、计算、汇总,三步。
传统方法是一步一步来,前一步没干完后一步就得等。显卡部分时间在空转。
融合算子 Mega MoE 把这三步整合成了一步。计算的同时,显卡之间传数据的通道(NVLink)也不闲着,同步把下一批数据传过去。
「让同样的显卡,跑出更多算力。」
这正是 DeepSeek 最擅长的事。别人猛堆硬件,它优化底层。
完全开源,免费。
The Information 报道,「DeepSeek 之前多次拒绝了中国顶级 VC 和科技公司的投资意向。这次摆上台面,态度确实有所松动。」
对资本来说,DeepSeek 可能是那种最罕见的标的之一。
模型 TOP,成本够低,品牌有全球影响力,还不折腾。
只要故事还没讲完,钱就会继续往头部堆。
后面就差 V4 兑现了。
我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。