预测奥运
21世纪网
我的一位朋友很喜欢说:“预测是一件很难的事,尤其是牵涉到对未来的预测。”然而,人们常常期望自然科学能提供准确的预测,例如我们常常希望天气预报是准确的,一旦预测有所偏差,我们就会嘲笑它。渐渐地,人们开始期望社会科学也能提供准确的预测。尽管分析人类行为的出错几率要远高于对自然的分析。人们还是期望得到准确的经济预测。
14年前,我和我的同事决定用大众话题对经济预测做一些测试。我当时刚离开哈佛大学,是威尔斯利女子学院的一名经济学教授,而阿里是一名非常出色的大学生,同意协助我用经济学原理解释为什么国家能获得奥运奖牌。或许用“国家获得奖牌”的字眼有些不恰当,因为国家是不会获奖的,只有运动员才能获奖,他们最快、最强和最有天赋。然而,国家以其运动员为荣,期待在奥运会上获得成功,成功与否,则是用奖牌或者金牌数量来衡量的。
在经济学里,我们用“模型”这个词来描述一系列的数学公式,以及对现实的表述,这些表述能描述我们世界里的一些重要方面。好的模型是直观的(也是情理之中的),准确的(描述过去的事情)和有用的(帮助我们理解未知的事情)。最重要的是,好的模型应具有可复制性。意思是,我们可以在不同地点和不同时间测试得出相似的结论。例如,你在不同地方将水加热,可以发现水的沸腾温度都是一样的(在其他条件保持不变的情况下)。此外,在我们的意识中,好的模型还应该具有简洁性和预测性。
我们用了仅仅五个直观因素来建立一个衡量是否在奥运会中成功的简单模型。我们分析了每个国家在奥运会上获得奖牌数量,其中只用了宏观经济变数,包括人均收入、人口总数、气候、政治体制和主办国优势。直观来看,每个变数都对成功起影响作用。较富有的国家应该获得更多的奖牌数量,因为它们能支付更好的设备和训练支出,它们的体育开支可以更多而不用专注在农业和交通开支上,它们拥有更优质的运动员,因为民众普遍的身体状况较好;人口较多的国家应能获得更多的奖牌,因为他们有更多的运动员,自然会有更大的机会发掘出具有非凡能力的顶级选手;此外,气候的影响也很大,因为处在寒冷地区的国家对冬季运动更具经验,而热带国家则在夏季运动上更有优势,也可能是因为温带国家在农业和大众健康方面的开支要比热带国家少;政治的影响不容忽视,这一点任何看过前苏联参加奥运会的人都会同意。举国体制的国家即使人数和收入较少,也能创造出不同凡响的成功,可能是源自中央集权的组织结构能够为运动员提供良好的训练和设备;最后,主办国及其邻国相比于其他参赛国家更具优势。主办国的运动员能够在本土进行更长时间的练习,花较少时间适应当地食物、时区和文化。而主办国也拥有更多属于本国的、为运动员欢呼的拉拉队。
我们在1999年建立这个模型,收集了从1952-1998年的收据以测试其准确性。经过一系列的实验,这个模型的良好表现及其呈现出的实用性令我们震惊,因此,在与其他核实工作的学者分享后,我们运用这个模型去预测2000年悉尼奥运会的奖牌数目。当年,世界媒体报道的奖牌数目,和我们所预测的结果相差无几,这令我们惊讶不已。
我们的预测能力在第一年达到了96%,这意味着实际奖牌数目与预测数目的相关性为0.96。在大多数情况下,我们不能预测到详细而准确的奖牌数目,但也只是几个奖牌的偏差。同时,我们还可以准确地预测哪些国家会获得最多的奖牌,以及哪些国家只能获得很少的奖牌。
作为科学家,我们以批判性的态度去厘清一个更为重要的事实:每个影响奖牌数目的独立的因素都是极其重要的。运用这种知识,我们可以告诉国家,经济衰退可能造成的影响(极少),政治革命可能造成的影响(很大),作为奥运会主办国所产生的影响(所有影响中最大)。在某种程度上,我们可以把美国和墨西哥的比赛场地置于同一水平,举例说,解释每个国家有能力获得多少块奖牌及原因。如果美国在夏季奥运会中获得的奖牌数只是墨西哥奖牌数的两倍,这应该被视作是墨西哥的成功。(或者是美国的失败,抑或是两者俱有,这要视乎他们获得的确切奖牌数目而定。)
近几年来,该模型的准确性略微下降,在2010年温哥华冬季奥运会中,模型的准确性只有87%。今年春天,科罗拉多大学一位聪慧的学生,拉斐尔·阿隆索·阿瑞纳斯协助我采集更多的数据和运行更多的测试来改良、重新校对此模型。我们发现,在过去十年里面,许多事情已然改变,仅有的一些仍有意义的因素是人均收入、人口总数、主办国优势和暗含的文化因素。最后一个因素融合了一系列难以测量的证据:本土消遣方式(如:玩曲棍球的印度人不会获得奥运会奖牌;打跆拳道的韩国人则会赢得许多奥运会奖牌);运动花费(如:澳大利亚慷慨大方,卢森堡一毛不拔);政治架构(如:一党制政治架构在当下和在1980年的含义对比,则显得愈发模糊);气候。因此,为了让这个模型预测的准确性最大化,我们允许这个模型去判断估计文化因素的重要性。我们的目标是尽可能简化该模型,但仍能使之准确而有用。
我应该提到还有另外一种更加简单的模型,而且能够提供更加准确的预测。然后,我们已经拒绝了这个模型,因为它简直就是毫无价值的。你能够猜到它是什么吗?就是根据历史来做预测。如果你简单地预测今年奥运会的奖牌榜会和上届的一模一样,你就拥有了最准确的模型。衡量国家成就的最好标准就是它过去所取得的成就。有时候这个模型是不准确的,但总体来说,伟大的运动员都会在下一次比赛中继续竞技,或者成功地指导和训练其他运动员去争夺胜利。各种帮助这些伟大的运动员在过去比赛中取得成功的因素,通常会得以延续。然而,我们发现这个论据虽是正确的,但却毫无用处,因为它所能够解释的很有限。如果人们只因昨天下雨,而简单预测今天也会下雨,我们可能是对的,但不能从根本上了解降雨的真正原因所在。我们的目标是做合乎科学之事,以求达到被人们所理解。
我想在这里与你共享我的预测模型。这个新模型由从1952年采集的数据设计而成,其原理非常简单:每个数字的计算均运用了多元回归分析。特别地,这个模型被运用到即将到来的2012年伦敦奥运会。(见特4)
对于2012的预测,这就是我的全部依据。请把它们当成是基准点,而非预测。换句话来说,如果从每个国家来的每位运动员都有期待中的表现,那么这就是奖牌榜看起来的样子。幸运的是,运动从来都是不可预测的,因为运动员会有令人惊讶的表现,或者犹如一匹黑马般冲刺到让人意想不到的高位。不同运动员的训练方式可能会适应不同的场馆,或者一个国家在训练花费中比预想的投入得更多。我认为,那是我对奥运会最喜爱的一部分,希望这个模型会戏剧性地不准确。
(翻译 唐学鹏/朱志超)