54.9%对49.6%:世界杯人机大战40场后,人机大战才刚刚开始?
新浪财经
截至6月22日,一组数字正在改写2026年世界杯的场外叙事。
在联想集团与咪咕视频联合发起的“世界杯预测人机大战”中,由联想天禧AI超级智能体召集的12大AI预测阵营,整体准确率已攀升至54.9%。与之相对,数万名参与竞猜的人类玩家,整体准确率为49.6%。
5.3个百分点的差距本身不算大,但从近七日的胜率走势图来看,两条曲线的方向已经清晰分开:AI的线在爬升,人类的线基本走平。世界杯人机大战进入了真正有数据观察价值的阶段。
第一轮AI屡屡折戟
第二轮集体发起“反击”
世界杯开赛初期,AI阵营并不占优。首轮小组赛冷门频出,12大AI在西班牙0:0佛得角、伊朗2:2新西兰等比赛中几乎集体失手,一度落后于人类。社交媒体上不乏调侃:“12个AI加一起,不如一个老球迷”。
但拐点出现在第二轮。随着德国7:1库拉索、美国2:0澳大利亚、荷兰5:1瑞典等预期内结果接连兑现,AI阵营预测正确率显著提升。DeepSeek、通义千问、百度文心、联想天禧AI、腾讯混元、智谱、MiniMax等主流模型一度出现连续多场命中的表现,准确率从不足40%迅速拉升至50%以上,并继续攀升。
原因并不复杂,世界杯的大多数比赛仍然是强弱分明的。AI基于球队实力、历史战绩、近期状态等多维信息形成判断,在这类比赛中更容易稳定拿分。当赛程从首轮的试探期进入第二轮,强队状态回升、冷门频率下降,AI的基本盘优势就开始兑现。
6月22日的四场比赛是一个缩影:西班牙4:0沙特、新西兰1:3埃及,12大AI几乎全部命中;比利时0:0伊朗、乌拉圭2:2佛得角,则是两道集体失手的陷阱题。两场对两场,恰好各占一半——而AI的胜率之所以能维持在54.9%,正是因为秩序题的数量始终多于陷阱题。
与此同时,人类玩家更容易受到球星偏好、球队情绪和临场直觉的影响,在冷门与平局场次中波动更大。一条向上爬升,一条波动走平——两条胜率曲线的分化,正是剪刀差的来源。
真正的考验还在后面
AI阵营内部,模型之间的表现也在出现分化。有的模型追求稳定命中率,在强弱分明的比赛中持续拿分;有的模型更愿意在部分场次押注平局或冷门,试图在意外结果出现时拉开差距。随着比赛场次增加,早期的偶然性优势正在被拉平,真正具备持续判断力的模型开始浮出水面。
但更大的变量来自赛制本身。小组赛还有二十余场,之后便是淘汰赛。当赛程进入一场定生死,比赛策略、临场换人、红牌、点球大战等变量都会放大,AI基于赛前信息形成的判断框架也将面临更复杂的考验。
40场之后,AI阵营已经建立了对人类的领先优势。但世界杯还剩64场比赛。剪刀差会继续扩大,还是被一轮冷门潮重新合拢,这个悬念将贯穿整个夏天。6月24日起,联想集团与咪咕视频联合出品的《人机大战:谁是世界杯预言家》将在咪咕视频开播。