新浪财经

【国联民生AI体验官】MiniMax M2.7实测

计算机司令部

关注

1.MiniMax M2.7介绍

MiniMax最新推出的M2.7最值得关注的地方,不是聊天更顺了,也不是文风更像人了,而是开始具备一种更现实的能力——Agent原生模型(不是普通LLM)。即M2.7≠ChatGPT类模型,M2.7=“带执行能力的AI操作系统”,编程+Agent+工程能力已达国际一线水平。它的核心能力不是“回答”,而是:

  • 拆任务

  • 调工具

  • 写代码

  • 自己检查

  • 继续执行

甚至——能优化自己

关键性能指标

MiniMax当前公开文档里更完整披露的M2系列模型:统一支持204.8K上下文,普通版大约60 tps、高速版约100 tps;官方则持续围绕coding、tool use、interleaved thinkingagent workflow展开优化,即M2.7的核心是“执行升级”。

MiniMax原创了MM-Claw(MiniMax Claw Benchmark)专属基准测试集,是一套专业用来评估“大模型在AI Agent智能体任务上能力”的测试体系。本次M2.7在MM-Claw上得分62.7%,非常接近Claude Sonnet的表现,意味着它能帮助用户稳定高效的完成多工具调用、长链路任务、多步骤执行和多角色协作。M2.7在40个复杂skills环境中指令遵循率97%,即任务基本不会“跑偏”且能稳定执行长流程任务。

2.MiniMax M2.7功能实测

测试1 投研场景:它已经能搭建基础架构

提示词:

任务:分析紫金矿业未来3年业绩

要求:

1. 收集公开信息(假设已有)

2. 构建收入拆分模型(按数据中心/海外/客户)

3. 做三种情景(乐观/中性/悲观)

4. 输出:

  - Excel结构

  - PPT提纲

  - 投研报告(Word风格)

5. 自动检查逻辑矛盾并修正

结果呈现:

M2.7最终生成的Excel不是一张简单总表,而是主动拆成了“封面摘要、假设参数、收入拆分-业务板块、收入拆分-地区、情景分析-收入、情景分析-利润、敏感性分析”七张工作表。这个结果说明,M2.7已经知道一个研究底稿不该只是堆数字,而应该先有关键假设,再有拆分维度,再有情景分析和敏感性分析。从研究流程看,这一步其实很重要,因为真正耗时间的往往不是填数字,而是先把框架搭好搭对。

但这份紫金矿业的财务模型依旧存在可以改进的地方:第一,缺少公式联动,更像静态表格;第二,跨表口径不一致;第三,个别摘要数字与总收入之间存在冲突。也就是说,M2.7已经能初步把模型搭出来,但距离经得起复核还有最后一公里。

测试2 工程场景:它比多数模型更像工程师

提示词:

你现在是资深SRE/后端工程师,请基于下面日志做一次正式排障。

要求:

1. 先给出一句话结论

2. 再给出“现象—证据—根因”的证据链

3. 区分“直接原因”和“更深层原因”

4. 给出短期止血方案(30分钟内能做的)

5. 给出长期修复方案(架构/配置/监控层面)

6. 列出你还需要补充观察的3个指标

7. 最后输出一版适合发给研发群的事故说明,语气专业简洁

注意:不要泛泛而谈,必须引用具体日志字段来支撑判断。

结果呈现:

M2.7给我的故障排查报告截图,反而能非常好地体现该模型的价值。它不是简单复述日志,而是自动整理成一份完整的故障分析文档:先给一句话结论,再按“现象—证据—根因”组织证据链,然后补上短期止血方案、长期修复方向、监控指标和正式事故说明。这种输出已经不是“把报错翻译成人话”,而是在模拟工程团队首轮排障时的工作方式。官方公开资料里,MiniMax对M2系列的定位本来就高度强调复杂编码、工具调用、长链路任务执行与真实工作流productivity,从这次实测看,这条路线并不是空喊口号。

但这份故障报告缺少经过验证的最终闭环:它完成了定位、归纳和建议,但还缺数据库侧验证、回滚后指标恢复确认,以及高风险动作的容量约束。但M2.7已经能高效高质量的把“日志噪音”迅速整理成“可讨论、可执行的问题框架”了。

3.MiniMax M2.7测试结论

M2.7最接近的角色,不是“最终负责人”,而是一个非常强的执行型高级助理。在投研里,它能先把模型基础搭起来;在工程里,它能先把事故分析框架理顺。它最强的地方,不是一步到位给出完美答案,而是先把工作往前推动一大截。这恰恰也是我认为它比很多“只会说得漂亮”的模型更值得重视的原因。如果说GPT是“大脑”,Claude是“思考者”,那M2.7无疑更像是“打工人+项目经理+工程师”的组合体,让人禁不住更加期待下一个版本的更新!

计算机团队介绍

吕伟:执业证书:S0590525110033

国联民生证券计算机行业首席分析师,北京大学理学硕士,2021年加入民生研究院,2025年加入国联民生研究所

分析师承诺

本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并登记为注册分析师,基于认真审慎的工作态度、专业严谨的研究方法与分析逻辑得出研究结论,独立、客观地出具本报告,并对本报告的内容和观点负责。本报告清晰准确地反映了研究人员的研究观点,结论不受任何第三方的授意、影响,研究人员不曾因、不因、也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。

重要提示

《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号/本账号发布的观点和信息仅供国联民生证券的专业投资者参考,完整的投资观点应以国联民生证券股份有限公司(下称“国联民生证券”)发布的完整报告为准。若您并非国联民生证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号/本账号中的任何信息。本订阅号/本账号难以设置访问权限,若给您造成不便,敬请谅解。国联民生证券不会因为关注、收到或阅读本订阅号/本账号推送内容而视相关人员为客户;市场有风险,投资需谨慎。

免责声明

国联民生证券股份有限公司(下称“国联民生证券”)已获中国证监会许可的证券投资咨询业务资格,本平台推送观点和信息仅供国联民生证券研究服务客户参考,完整的投资观点应以国联民生证券研究所发布的完整报告为准。若您非国联民生证券研究服务客户,为控制投资风险,请勿订阅、接受、转载或使用本平台中的任何信息,若给您造成不便,敬请谅解。国联民生证券不会因订阅本平台的行为或者收到、阅读本平台推送内容而视相关人员为客户。任何未经国联民生证券同意或授权而对本平台内容进行复制、转发或其他类似不当行为均被严格禁止。对于使用本平台包含信息所引起的后果,国联民生证券概不承担任何责任。

本平台及国联民生证券研究报告所载资料的来源及观点的出处皆被国联民生证券认为可靠,但国联民生证券不对其可靠性、准确性、时效性或完整性做出任何保证。本平台推送内容仅反映国联民生证券研究人员于发出完整报告当日的判断,本平台所载的资料、意见及推测有可能因发布日后的各种因素变化而不再准确或失效,国联民生证券不承担更新不准确或过时的资料、意见及推测的义务,在对相关信息进行更新时亦不会另行通知。在任何情况下,本平台所载信息、意见不构成对任何人的投资建议,所述证券或金融工具买卖的出价或征价,评级、目标价、估值、盈利预测等分析判断亦不构成对具体证券或金融工具在具体价位、具体时点、具体市场表现的投资建议。本平台所包含的观点及建议并未考虑获取本平台包含信息的机构及个人的具体投资目的、财务状况、特殊状况、目标或需要,客户应当充分考虑自身特定状况,进行独立评估,并应同时考量自身的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专家的意见,不应单纯依靠本报告所载的内容而取代自身的独立判断。在法律允许的情况下,国联民生证券及其关联方可能持有本平台推送内容中提及的公司所发行证券的头寸并进行交易,也可能为这些公司提供或正在争取提供投资银行、财务顾问、咨询服务等相关服务。客户应充分考虑可能存在的利益冲突,勿将本平台推送内容作为投资决策的唯一参考依据。对任何直接或间接使用本平台所载信息和内容或者据此进行投资所造成的任何一切后果或损失,国联民生证券及/或其关联人员均不承担任何形式的法律责任。

法律声明

本微信号及其推送内容的版权归国联民生证券所有,国联民生证券对本微信号及其推送内容保留一切法律权利。未经国联民生证券事先书面许可,任何机构或个人不得以任何形式转载、翻版、复制、刊登、发表、修改、仿制或引用本订阅号中的内容。任何订阅人如引用或转载本平台所载内容,务必注明出处为国联民生证券研究所,且转载应保持完整性,不得对内容进行有悖原意的引用和删改。转载者需严格依据法律法规使用该文章,转载者单方非法违规行为与我司无关,由此给我司造成的损失,我司保留法律追究权利。

国联民生证券研究所:

上海:上海市虹口区杨树浦路188号星立方大厦7层;邮编 200082 

北京:北京市西城区丰盛胡同20号丰铭国际大厦B座5F;100005

深圳:深圳市福田区中心四路1号嘉里建设广场1座10层 01室;邮编518048

加载中...