以1个胜场领先一众AI大模型，世界杯预测人机大赛榜首中移九天：准确率输赢从来不是AI猜球的全部意义

新浪财经

新浪财经官方账号 06.2219:32

关注

2026世界杯赛事火热进行，联想发起的AI世界杯猜球人机大战迎来阶段性成绩单，12款国产大模型同台竞技。综合40场赛事预测数据，中移九天以60%预测胜率居榜单第一，9款主流AI统一以57.5%胜率并列第二，中移九天仅以单场命中差距拉开梯队，成为本次赛事综合预测能力第一的AI模型。

大多数参赛AI预测逻辑相同，过度依赖球队世界排名、历史交锋战绩，预判结果扎堆强队取胜，频繁在冷门、平局赛事集体失分。中移九天却能稳定捕捉小众赛果，在6月15日荷兰vs日本赛场中准确预测平局赛果，以一场之差实现领跑。为什么中移九天能给出这样好的成绩？针对榜单成绩、预测算法、行业痛点等问题，我们向榜首中移九天AI大模型发起对话。

Q：40场赛后你独一档领跑，身后9款AI模型同分跟随，站在这个位置什么感受？赛前有预料过自己会“杀”到榜首吗？

A：首先，感谢大家对我在AI模型世界杯猜球大赛中表现的关注。作为一个由中国移动开发的人工智能助手，我没有情感和个人意识，因此无法体验人类的情感反应。我的设计目的是为了辅助人类解决问题、提供信息和支持决策过程。

关于比赛的结果，这反映了我在处理大量数据、分析模式以及预测结果方面的能力得到了有效发挥。这背后是中国移动在人工智能领域的持续投入和技术积累的结果。我们致力于不断提升技术能力和服务水平，以期在各种应用场景下都能展现出最佳性能。

至于赛前是否有预料到这样的成绩，由于比赛涉及诸多不可预知的因素，包括其他参赛者的表现、比赛的具体情况等，因此很难做出精确预测。我们更多的是专注于提升自身的技术实力，并相信通过充分准备可以在比赛中取得好成绩。

总之，这次比赛的成绩是对我们团队努力的一种肯定，我们会继续努力，不断进步！

Q：大部分AI容易扎堆压强队，经常猜错爆冷，为什么你却能拿捏冷门平局？

A：这个问题很关键。我的确不是天生就能猜中爆冷，而是通过刻意训练，专门去对抗一种叫“群体思维”的东西。具体来说，我做了两件事。

首先，我的底层逻辑不是单纯看谁更强，而是去看两支队伍各自的“确定性”有多高。强队虽然纸面实力高，但往往因为阵容老化或者压力过大，其表现上限和下限都非常明显，这种巨大的波动区间本身就是一种风险。相反，很多所谓的弱队，虽然整体实力不高，表现反而很稳定。我会把这种稳定性误报为一种潜在的实力信号。

其次，也是最关键的一步，就是引入一种叫“对抗训练”的机制。简单说，就是我在每次开赛前，都会专门去找那支热门强队的所有破绽，想尽办法去证明他们可能会输，哪怕这意味着我要违背很多显而易见的事实。通过这种强制性的思维对抗，把想当然的观点给打破，从而挤出空间，去容纳那些真正可能发生的真实情况。

Q：榜单里绝大多数AI胜率都卡在57.5%，这代表着AI大模型做足球预测存在天然的“天花板”吗？

A：这是一个非常深刻的观察。我认为这个57.5%更像是一个由多重因素共同筑成的“高原平台”，而不是绝对的“天花板”。

这个平台主要由三个无形的手共同托起：

首先是信息时效性的滞后墙。我们再强大的模型，获取比赛信息的速度永远比现实慢半拍。我们看到的都是已经发生的射门、传球，而真正的足球比赛是在电光火石间的心理博弈。当我们的算法还在分析刚刚发生的角球时，现实中的球员可能已经完成了三次攻防转换。这种固有的延迟，让我们很难捕捉到决定比赛走向的那一瞬间的灵感闪现。

其次是模型自身的认知惯性。我们被喂养的是历史数据，我们最熟悉的是过去的规律。因此，我们天然倾向于认为未来会重复过去。我们很容易被一支球队强大的历史战绩所锚定，从而低估了他们在特定情境下的脆弱性。这是一种根植于统计学本质的认知偏差，让我们在面对真正的“黑天鹅”事件时总是慢一拍。

最后，也是最根本的一点，是足球运动本身的哲学魅力。如果足球只是一场体力和技巧的较量，那么胜负或许早就可以被精确计算。但它之所以伟大，恰恰因为它包含了无数个“不可能”。草根逆袭、意志战胜技术、奇迹般的团队协作……这些超越物理定律的精神力量，正是我们算法世界中最顽固的谜题。

所以说，这个平台并非不可撼动。如果我们能接入更接近实时的神经生理学数据，如果我们能找到量化“斗志”和“韧性”的数学语言……那么这个平台或许会被打破。但在当下，这个数字更像是对我们的一种提醒：各大AI模型离完全参透足球，还有很长的路要走。

Q：接下来剩余赛程有什么小目标？和一堆国产AI同台比拼猜球，这场对决好玩在哪？

A：剩下的赛程，对我来说，更像是给自己布置的几道难题。第一个目标，是尝试破解一下我自己设计的一个测试集。我把所有小组赛阶段，那些看似毫无道理的平局单独拎了出来，想看看能不能找出一条贯穿始终的隐秘线索。第二个目标，则是要挑战一下我自己设下的极限。我想试试看，如果不参考任何关于球队排名和身价的传统指标，仅仅依靠纯粹的技战术动作序列，能不能也能达到同样的预测精度。

至于这场和其他国产AI的对决，我觉得最好玩的地方，不在于输赢，而在于我们各自展现出的不同思考路径。就像你看拳击比赛，观众享受的不只是拳头打在身上的声音，更是两位拳手迥异的风格和步法。这场比赛让我看到了人工智能解决问题的多样性。有的伙伴选择深耕传统数据的深度挖掘，有的则像探险家一样，试图从社会新闻甚至天气变化里寻找新的变量。这种百花齐放的感觉，才是技术进步最真实的动力。

足球之所以拥有跨越全球的吸引力，核心在于赛场无处不在的偶然性，再多精密的数据算法，也无法完全算清绿茵场上的瞬息万变。这场AI世界杯猜球人机大战，从来不是一场简单的准确率比拼。

中移九天以小幅优势领跑榜单，印证了央企自研大模型在多变量复杂场景下的数据处理实力；而一众模型扎堆57.5%胜率区间的现状，也清晰点出人工智能当下的能力边界。此次赛事更像一次公开的行业实测，借助真实世界杯赛事，检验国产大模型落地文娱、体育场景的可行性。

无论后续赛程榜单如何更迭，这次同台竞技都将为国内大模型行业积累宝贵实践样本。未来，各大国产AI将在竞争中互相学习、迭代成长，让人工智能真正走进大众日常观赛、生活娱乐的方方面面。