小米发布MiMo-V2.5-Pro UltraSpeed模式,3倍价格10倍输出体验
(来源:IT之家)
IT之家 6 月 9 日消息,小米 MiMo 官方昨日宣布,与 TileRT 联合发布 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致 Codesign,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。
▲ 10 秒,做一个贪吃蛇小游戏
MiMo-V2.5-Pro-UltraSpeed API 同步上线,采用限时体验价,定价为 MiMo-V2.5-Pro 的 3 倍,同时提供输出速度约 10 倍的提升(仅支持 API 体验,不支持 Token Plan)。官方称之为 3 倍价格提升,10 倍输出体验。
作为参考,小米 MiMo-V2.5-Pro 每百万 tokens 输入 0.025 元(缓存命中)/ 3 元(未命中缓存),每百万 tokens 输出 6 元。
▲ 1 分钟,复刻一个 macOS 系统
官方表示,由于高速推理资源供给有限,本次 MiMo-V2.5-Pro-UltraSpeed 采取申请制限时开放,申请通过的用户可限时接入 API 体验,时间仅限 2026 年 6 月 9 日至 6 月 23 日 23:59。
由于资源紧张,本次试用名额有限,提交申请后不承诺审核时效性和审核通过率;小米将优先审核具备真实业务需求的企业与专业开发者场景。
通过审核的用户可获得限时免费的 Chat 体验(两周开放窗口内有效),为保障资源受限条件下的体验质量与使用公平性,试用服务规则如下:每个账号每日最多成功进入队列 10 次;单次会话时长上限 30 分钟;如会话空闲超过 5 分钟,系统将自动释放资源。