刚刚!小米罗福莉回应模型降价99%:手握3倍利润,如今仍能收支平衡
(来源:智能纪元AGI)
小米也开始做“Token价格屠夫”了。
5月27日凌晨,小米MiMo-V2.5系列宣布降价,最高降幅达到99%。
与此同时,小米Token Plan计费体系同步优化,定价不变,可用量提升至原来的5至8倍。
在此之前,5月22日,DeepSeek宣布V4 Pro模型永久降价。
对于降价原因,时隔21小时后,小米MiMo大模型负责人罗福莉发长文,解释MiMo API 降价背后的原因。
罗福莉表示,此次降价力度最大达到 99%,主要针对缓存命中的输入场景。目前我们的推理框架完成升级,支持 SWA 分层 KV 缓存优化,实测缓存令牌容量翻了 5 倍,直接把缓存成本砍掉 80%。再加上模型多模块缓存读取的叠加优化,整体成本还能再往下压。
她提到,MiMo 本身推理成本就远低于行业水准,定价时预留了 2 到 3 倍的利润空间。如今 API 价格大幅下调,即便引擎跑至接近满负荷,依旧能基本实现收支平衡。
“此前我们也提醒过同行,别一味跟风打价格战。多数模型和推理方案根本撑不住低价,很容易陷入亏损。如果业内都能做出更省算力、优化缓存的架构,搭配成熟的推理基建降本,整个行业才能进入良性发展。”
总结来说,罗福莉说的意思就是:小米MiMo成本低、性能强,你们可别再乱跟降价了。
我们尝试寻找了罗福莉在算力层面的论文。
其中,去年10月,小米AI团队携手北京大学联合发布一篇聚焦MoE与强化学习Paper,引发关注。
今年3月,我们发表了罗福莉领导的小米MiMo大模型团队,与北京大学联合研发出的统一资源管理系统ARL-Tangram。
这套系统可以将平均ACT提高高达4.3 分。可将强化学习训练的步骤持续时间缩短至多1.5倍,并节省高达71.2%的外部资源。
简单来说,罗福莉的这套异构算力系统ARL-Tangram,可以让Agent效率提升。
所以,在模型侧,性能、成本、效率,这三个要素当中,罗福莉在认真贯彻执行——性能不断提升、成本大幅下降、推理算力效率提升。
罗福莉指出,输入(缓存未命中)和输出的价格也下调了60%-80%。这主要得益于模型架构带来的极端 1:7 全注意力:
SWA 稀疏比率(70 层 MiMo-V2.5-Pro 的预填充计算量大致相当于 10 层 GQA 模型)。
“这让我们的原始推理成本一直远低于行业平均水平,自然在定价中留下了 2 倍-3 倍的利润空间。此次价格调整只是将这些结构性成本效率直接回馈给开发者的决定。”
罗福莉强调,更关键的是,价格亲民的高性能模型 API 将驱动真实、持续且大规模的推理需求。
“这一上游需求将拉动整个 AI 基础设施链的发展——包括芯片、服务器、光收发器、PCB、液冷、电力、储能和数据中心——从而成为 AI 硬件系统性重新估值战略支点。从长远看,这将为训练和推理管道注入更多价格亲民且易获取的计算资源,加速全球 AGI 在多区域和多技术路线上的并行演进。”
值得一提的是,昨天小米发布财报,提到一季度研发支出90亿元,同比增长33.4%。
小米承诺,今年AI投入至少160亿元,未来三年投入将超600亿元,以加速推进“人车家”全生态AI闭环。
小米集团总裁卢伟冰在财报会议上表示,目前AI商业化刚开始,现重点是强化基础模型能力,以及推动MiClaw的跨端执行。
“在AI Token这一块,我们不会急于马上追求AI变现,会更加务实地做AI,在AI的投入方面确实下定决心。”卢伟冰表示。
根据Artificial Analysis榜单上,小米MiMo-V2.5-Pro综合智能指数和Agent指数同时跻身全球开源模型前列——至少排在第五名,如果是第一名有点过分了。
事实上,小米高调押注 AI:
三年砸 600 亿、2026 年单年 160 亿,自研 MiMo 大模型、全力冲“人车家”全场景AI。
但资本市场不买账。
其实从市场角度来看,大家不太看好小米一边亏损、另一边大量投AI的情况:
截至5月27日下午收盘,小米股价跌4.57%,年内累跌超过27%。
这一数据较高点腰斩、市值蒸发超千亿港元。
这形成“战略乐观、股价悲观”的强烈反差。
那么,市场到底在担心什么?
首先,市场怕小米AI变成“烧钱黑洞”:
毕竟AI投入周期长、不确定性大,600亿砸下去,万一做不出第二增长曲线,反而拖垮主业。
其次,市场怕小米AI“丢了西瓜捡芝麻”:
手机基本盘不稳、汽车亏损扩大,此时All in AI,会不会顾此失彼。
最后,市场怕小米AI商业化只是“概念”:
MiMo降价99%、API 低价走量,增收不增利,难证盈利能力。
当然,就雷军和卢伟冰的话来看,其实我们对小米MiMo的判断依然处于“雾里看花”阶段。
但我们想问:
小米AI如何寻找商业化?如何得到回报?
是通过手机和汽车增值,还是其他的方式落地,这依然很难说。
然而,我们很明显看到,小米正在把身家押在 AI 上,砸钱换未来。
但资本市场似乎不吃画饼那套,比较偏短期。
所以那句话说得挺好的:先活下去,再谈星辰大海。