新浪科技

万亿Token,喂出了千亿新贵

盒饭财经

关注

来源:盒饭财经

定价权,最终会落在谁手上?

作者 | 姚赟

头图及封面来源 | 网络及即梦制作

4.69万亿Token,是什么概念?

根据澎湃新闻报道,Seedance 2.0生成一条720p、15秒的标准视频,大约消耗 30.888万Token。4.69万亿Token除以30.888万,约等于1520万条15秒短视频。1520万条15秒视频,总时长约2.28亿秒,也就是大概7.2年的视频内容。也就是说,从现在开始连续播放,能播到2033年。

这样的换算还有很多。

按照AI行业通用的换算标准,1个Token约等于0.75个汉字,这大约相当于3.52万亿个汉字。如果具象化来看,这等于将120万字的《战争与和平》从头到尾翻阅整整293万遍。一个普通人类哪怕每天苦读8小时,也需要耗费近6.6万年才能读完。

但在2026年3月的某一周中,MiniMax M2.5、阶跃星辰Step 3.5 Flash、DeepSeek V3.2和Kimi K2.5,一周的Token调用量就达到了4.69万亿。

OpenRouter截图

3月16日,面向AI应用开发者的全球大模型聚合路由平台OpenRouter的周度(3月9日至3月15日)数据显示:中国AI大模型的周调用量连续两周超越美国,前者上周调用量上升至4.69万亿Token,后者周调用量则下滑至3.294万亿Token。

Token的吞吐和燃烧,换来了千亿市值。

3月10日,受“养虾热”催化,MiniMax股价两天暴涨超51%,市值站上3826亿港元,一举超越百度(3322亿港元)、携程、快手等老牌互联网巨头。同日,智谱市值为2895亿港元。

两家公司自2026年1月上市以来,已经历了“狂飙、回调、再冲高、剧烈波动”的过山车行情。三个月不到,他们带着技术突破、OpenClaw概念催化以及港股AI稀缺性等多重buff,市值从百亿突破至千亿。

OpenClaw掀起的这股“养虾热”,带来不止情绪和市值,它带着大模型企业暂时脱离了“拿着锤子找钉子”的窘境。

过去三年,大模型公司空有强大的能力,困于无法忽略的算力成本,商业化和应用场景一直是被诟病的主要地方。直到OpenClaw的横空出世,赋予了AI执行力。Token也不再是单纯的计算机领域的数字标识符,逐渐成了AI时代的“新货币”和度量衡。

这些“龙虾”接管了人类的鼠标,在云端飞速穿梭,读取税务报表,穿透复杂的ERP系统,机器与机器之间每秒钟都在进行着数以十万次计的对话与循环推理。

在这庞大算力流水的冲刷下,以MiniMax、智谱为代表的中国大模型新贵们,迎来了一举超越老牌互联网巨头的分野时刻。

37岁,身价已超900亿港元

“屠龙少年”超越老东家的爽文剧本,在科技界并不罕见。

2014年夏天,百度校园官方账号发布了一条微博:“现在进行答辩的是来自中科院自动化所的闫俊杰同学,他的研究方向是人脸检测与识别,期待他的精彩表现。”

不足50字的微博,配了两张图。图中更青涩的闫俊杰,和现在的形象并没有太多不同,依旧黑框眼镜、光头和T恤。那年,25岁的闫俊杰进入百度AI研究院实习。实习结束后,他进入商汤。

这一期间,大模型技术路线已经确立,关键技术在科研领域得到突破。2017年谷歌团队发表论文《Attention is All You Need》,提出Transformer架构,最终成为大语言模型的核心基础。也是在这个阶段,月之暗面创始人杨植麟,看到了变化和机会,回国创业。

2021年,彼时的闫俊杰已是商汤科技的副总裁。那是“AI 1.0”时代的末期,摆在明面上的困境是——人脸识别和计算机视觉模型只能在安防闸机或打卡系统里赚取微薄的定制化辛苦钱,商业模式重如泰山。

闫俊杰是行业内较早一批觉醒的叛逆者。那时“生成”的概念已有雏形,生成式AI的概念在海外已初露锋芒,少数人逐渐意识到通向AGI(通用人工智能)的密码,或许不是精雕细琢的小作坊算法,而是大道至简的“暴力美学”——Scaling Law(规模法则)。

逻辑简单粗暴:只要把足够多的算力、足够庞大的数据,塞进那个被称为Transformer的黑盒子里,喂给它足够大的参数,让它日复一日地拼命预测下一个Token,传说中的“智能涌现”,就会发生。

2021年12月,当时还在商汤的闫俊杰看到了AIGC的技术前景,毅然离职创业,创立了MiniMax。

事实证明,闫俊杰出来的时机,刚好。

一年后的2022年11月,ChatGPT发布,验证了“大算力+大数据=涌现能力”的Scaling Law。生成式AI(GenAI)取代了传统的判别式AI(如人脸识别),成为不可逆的终极路线。

不久后,群雄逐鹿的格局逐步形成。硅谷,形成了OpenAI、Anthropic、谷歌三足鼎立的格局。国内,不仅有BAT等互联网大厂的通义、文心、混元入局,更诞生了被称为“AI六小龙”的纯血创企——零一万物、百川智能、智谱AI、MiniMax、月之暗面和阶跃星辰。

在经历了AI的多轮洗牌后,智谱和MiniMax,先后上市。

2026年1月8日,智谱在香港联合交易所挂牌上市,成为“全球大模型第一股”。一天后,1月9日,成立四年的MiniMax,正式在香港联交所主板上市,刷新了AI领域公司最快的上市纪录

上市首日,截至首日收盘,智谱股价报131.5港元,总市值578.9亿港元。次日,智谱继续加大涨幅,收盘报158.6港币,市值近700亿港元。同日,MiniMax上市首日,最终收盘大涨109.09%,股价报345港元,市值攀升至1067亿港元。

此时,AI产业已经历了两大标志性事件:第一,OpenAI发布o1模型,标志着AI从“快问快答”进入了“深度强化学习推理”时代;第二,2024年底至2025年初,中国大模型DeepSeek-V3与R1横空出世。它们不仅在性能上匹敌甚至超越了GPT-4o/o1,更可怕的是其极端低廉的训练与推理成本。这一事件震动了整个硅谷,打破了“堆算力才能赢”的迷信,证明了算法架构优化的巨大威力。

推理已觉醒,成本也已重构。“马后炮”的视角来看,这些都为OpenClaw的火爆搭建好了基础。

受益于OpenClaw引发的“养虾”热,2026年2月20日,农历马年首个交易日,两家公司市值双双突破3000亿港元大关。3月2日,MiniMax发布上市后首份财报:2025年营收7904万美元(+159%),净亏损18.7亿美元(其中16亿美元为非现金亏损)。次日股价一度大涨19%,总市值突破2800亿港元。

3月10日港股收盘,上市未满3个月的MiniMax单日大涨22.37%,总市值达3826.35亿港元,首次超越百度,后者当时市值为3322亿港元。根据《新财富杂志》估算,按MiniMax当时的市值3826亿港元计算,闫俊杰身家为970亿港元。

“龙虾”喂出的千亿新贵们

OpenClaw这一只小小的“龙虾”,为何会重构AI行业的赚钱逻辑?

惊叹单周4.69万亿Token时,不容忽视的是:如之前的测算,作为一个普通人类用户,根本消耗不掉这么多Token。哪怕MiniMax的C端产品“海螺AI”在全球拥有上亿活跃用户,哪怕人类再怎么喜欢和AI语音闲聊,也绝不可能在七天内刷出数万亿级别的调用量。

受命运眷顾的人,瞌睡了就会来枕头。

2025年末,一个奥地利开发者Peter Steinberger的“周末项目”Clawdbot(后改名OpenClaw)悄然上线。没人预料到,这个项目会在短短60天内斩获超过25万GitHub Star,成为AI历史上增长最快的开源项目。

如果说ChatGPT是“你问我答”,OpenClaw则是“你说我做”。OpenClaw不只是聊天机器人,而是一个自主执行任务的智能体——和过去产品的最大差异也在这里。

这种从“问答”升级为“做事”的直观体验,瞬间掀起了一股“龙虾热”。国外,OpenAI以收购OpenClaw创始人的方式直接入局;Anthropic收购Vercept强化Computer Use。国内,大众掀起“养虾风潮”,各大相关企业先后宣布进入。

行业瞬间形成了一个共识:ChatGPT等GenAI产品是AI的“后端”,而OpenClaw所代表的Agent才是AI的“前端”。

单从技术层来说,OpenClaw并不复杂。

在我们之前发布的文章《还在部署OpenClaw?有人开始用AI当“赛博皇帝”了!》中,分析了OpenClaw的项目结构。OpenClaw的特殊之处,就是人格式,它拥有灵魂。“灵魂”的来源,就是来自目录结构中的人格(SOUL)、记忆(MEMORY)、身份(IDENTITY)等维度。

OpenClaw 的架构由四个核心模块组成

但在这样的架构和模式下,Token调用量就会指数级增加。前文提及的OpenRouter显示的周调用量4.69万亿Token,也与此密切相关。

OpenRouter周度(3月9日至3月15日)详细数据:该周内,Token调用量前三的模型均为中国大模型,分别为MiniMax M2.5、阶跃星辰Step 3.5 Flash和DeepSeek V3.2。其中,MiniMax M2.5周调用量为1.75万亿Token;阶跃星辰Step 3.5 Flash周调用量为1.34万亿Token;DeepSeek V3.2周调用量为1.04万亿Token。Kimi K2.5位于第九位,周调用量为0.56万亿Token。

这也是MiniMax M2.5连续第五周蝉联榜首,并持续保持Token周调用量在万亿级以上。

当千千万万个像“代账Agent”“程序员Agent”“客服Agent”被部署在企业的服务器和个人的电脑上时,大模型的计费接口就像一台台转速拉满的印钞机。或许正是看到了这条从“人类受限”跨越到“机器无限”的指数级变现路径,市场才给出了数百倍的市销率。

被送上神坛的“千亿新贵”,不只是MiniMax和智谱。

2025年12月,月之暗面完成5亿美元C轮融资,投后估值43亿美元。2026年2月,市场传出其已完成超7亿美元新一轮融资,估值跃升至100亿美元。仅一个月后,3月中旬,Kimi再度被曝出正以180亿美元投前估值进行新一轮10亿美元融资。

据每日经济新闻报道:Kimi估值已上升至180亿美元,公司估值在3个月内翻了4倍,新一轮10亿美元融资正在进行中。受Kimi K2.5模型及Kimi Claw火爆出圈带动,1月底以来,Kimi 20天收入超2025年全年。

据全球支付巨头Stripe数据,Kimi个人订阅用户1月支付订单数环比增长8280%,2月环比再涨123.8%,进入Stripe全球榜单前十。

站在“龙虾”的肩膀上

3月11日,Hunter Alpha悄然上线OpenRouter,标注为“stealth provider”(隐身提供者),没有任何厂商标识。由于其知识截止时间为2025年5月,与DeepSeek模型相近,且推理风格相似,开发者社区一度猜测这是“DeepSeek V4”的早期测试版本。

OpenRouter截图

OpenRouter平台介绍,Hunter Alpha是一个1万亿参数+100万Token上下文前沿智能模型,专为代理使用而构建。它擅长长效规划、复杂的推理和持续的多步任务执行,具有OpenClaw等框架所需的可靠性和指令遵循的精度。

对于这些猜测,技术分析师Till Freitag在其博客中给出了一个观点:无论它最终是谁,一个免费的超大模型都宣告了一个新时代的来临,AI推理正在成为一种低成本乃至零成本的商品,竞争的核心已不可逆地转移到上层的应用与智能体工作流。

3月19日凌晨,谜底揭晓。

小米认领了Hunter Alpha,证实其为旗舰模型MiMo-V2-Pro的内部测试版本。小米MiMo大模型负责人罗福莉发文称,这是一次“悄无声息的伏击”:“并非因为我们事先策划,而是因为从聊天模式到智能代理模式的转变发生得太快,连我们自己都难以置信。”

实际上,1万亿参数+100万token上下文+OpenClaw匹配,还有免费——这几个条件摆在一起,无论是谁家出的,对使用者来说都值得尝试。

在这场Token调用战中,品牌似乎还不是进入核心的参考维度。谁好用,谁便宜就能抢到用户,品牌忠诚度在目前的竞争中作用有限。

这里需要引入一个概念:模型路由(Model Routing)。

模型路由,模型路由是一种动态分发机制,充当用户请求与各类大模型之间的“调度指挥官”。

粗暴直接一些的理解,就是“杀鸡焉用牛刀”。假如你的Agent是在后台疯狂干活的“数字员工”,那么,模型路由就像一个“超级包工头”或“项目经理”。当用户或Agent系统发出一个任务请求(Prompt)时,路由系统会瞬间评估这个任务的难度,然后将其分配给“性价比最高、最合适”的大模型去执行。

比如,一个简单的任务,从PDF中提取数据生成报表。这个“项目经理”就会把这个任务派给“实习生”,类似一些免费或极度便宜的百亿参数开源小模型。速度极快,成本几乎为零。但面对一个相对复杂的任务时,这个“项目经理”会把任务派给垂直专家,类似一个较贵的千亿或万亿参数旗舰大模型。虽然贵,但能保证质量。

OpenClaw这样的Agent框架中,一个看似简单的操作,比如自动订机票,在后台就会被拆解成几十个步骤的“思考-执行”循环。如果不加干预,连最简单的任务也用顶级模型去跑,成本会迅速失控。

也就是说,模型路由让每一分算力都用在刀刃上。但硬币的另一面是:当所有模型都可以被路由系统无缝调度,AI企业的定价权和利润空间就会被挤压。

当Token成为硬通货,巨头也开始围绕它重构组织。

3月16日,阿里巴巴正式成立Alibaba Token Hub(ATH)事业群,建立以“创造Token、输送Token、应用Token”为核心目标的新组织,由阿里巴巴CEO吴泳铭直接负责。

这个Alibaba Token Hub,包括了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部,覆盖从基础模型研发、模型服务平台,到个人与企业端AI应用的完整布局。

吴泳铭,来源:网络

“当下正处于AGI爆发前夜。大量数字化工作将由数以百亿计的AI Agent来支撑,而这些AI Agent将由模型产生的Token支撑运行,成为人类与数字世界交互的主要载体。”从吴泳铭内部信的片段中,不难看出阿里将Token摆到了足够高的战略位置。

当地时间2026年3月16日,英伟达(NVIDIA)GTC大会,黄仁勋将Token与大宗商品直接挂钩,表示推理的拐点已经到来,Token将成最值钱的大宗商品。

英伟达(NVIDIA)GTC大会上的黄仁勋,来源:直播截图

大宗商品的特点是什么?

高度同质化与可互换性,价格由市场供需决定而非生产者,低毛利率与规模驱动,以及需求刚性但缺乏客户忠诚度。

而这些还是市场可预判的、静态的那一面。

定价权与用户忠诚度:向左苹果?向右电信?

我们正在经历的这场AI浪潮,是绝对的“无人区”,无论是砸入的真金白银,还是已见到的生活和工作中的细枝末节。

进入“无人区”,意味着没有可参考的对照物,意味着虽然时时刻刻能看到眼前的变化,但难以锚定什么。于是,迷茫和焦虑就会充斥其间。看似理性的组织,依旧是众多个体的外延。

当Token已成为大宗商品时,我们做一个极致的假设——某一天,Token就像现在的手机流量一样,无处不在、极度廉价、按量计费。那时候,MiniMax们会是如何?

它们可能成了“智能操作系统”。

这个世界里,Token虽然便宜,但模型持续迭代,应用层全面爆发。

MiniMax们不再只是卖Token的厂商,而是变成了“AI时代的操作系统”——M2.5进化到M25,模型本身成了所有应用的中枢。开发者基于MiniMax们的模型开发Agent、构建服务,用户为智能付费,而不是为Token付费。就像今天的智能手机,你买iPhone不是为了交话费,而是为了用iOS生态。话费是电信运营商的事,与它们无关。

它们也可能成了“高级管道”。

这个世界里,Token越来越标准化。GPT-10的Token和M10的Token,在大多数普通用户眼里没什么区别——反正都能让Agent干活。价格成了唯一的竞争维度。

云厂商掌握了定价权。在这个世界里,MiniMax们成了拉网线的“电信”。

变量是什么?Token的定价权在谁手里?用户忠诚的到底是什么?

3月11日,腾讯云智能体开发平台宣布,将对部分模型的计费策略进行优化调整。这次调整涨幅高达400%。据科创板日报折算,以Tencent HY2.0 Instruct输入价格为例,由原先的0.0008元/千tokens调整为0.004505元/千tokens,涨幅高达463.13%。

依旧是在今年的GTC大会上,黄仁勋给出了Token的分层定价体系:免费层吸引用户,基础层每百万3美元,进阶层6美元,高速层45美元,顶级服务150美元。

但他没说的是:这个定价权,最终会落在谁手上?

参考资料:

1.《智谱720亿、MiniMax超900亿,AI大模型商业化加速》,福布斯

2.《从K2.5到Claw:Kimi最新估值升至180亿美元 AGI赛道估值集体冲高》,每日经济

3.《曾是百度实习生,如今身家970亿,力压李彦宏,37岁闫俊杰和他的MiniMax为何异军突起?》,新财富杂志

4.《梳理748个备案、692亿融资后,我们发现AI热潮背后的力量》,贝壳财经

5.《MiniMax上市后首份成绩单公布》,第一财经

6.《Kimi爆火,估值飙升至1200亿元,3个月内翻了4倍!但挑战远未结束》,新财富杂志

7.《涨幅高达400%!腾讯云官宣AI模型调价 “龙虾”爆火或强化Token通胀》,科创板日报

8.《腾讯发布AI含量最高财报,管理层详解微信AI、“养虾”、开支等详细AI战略》,界面新闻

9.《罗福莉自曝“Hunter Alpha”:不是DeepSeek V4,是她的作业》,腾讯科技

10.《Hunter Alpha: The Largest Free AI Model Ever–Is DeepSeek V4 Behind It?》,Till Freitag

11.《黄仁勋最新2万字演讲实录:推理的拐点已经到来,Token将成最值钱的大宗商品》盒饭财经

加载中...