新浪财经

新春伴读|大年初六,回归常识,远离错觉

导读:

今天已经初六,眼看假期余量见顶,我们也要开始整装待发,奔赴商业丛林。生活与工作越来越无界,炫酷的科技,也给我们很多错觉,陷入虚拟世界无法自拔。

本书作者通过“史密斯测试”和“得州神枪手谬误”等实例说明,挖掘和拷问数据的时间够长、数量够大,得到总是自己想要的结果,然而这是相关关系却并不是因果关系,只是自我选择偏好,并没有理论基础也没有实用价值。

当我们更多相信计算能力和数据指引时,更应该回归常识,珍惜人与人之间朴素的智慧。

祝福大家新的一年,少一些错觉,多一些踏实。

书摘:

谷歌AI最初认为是鸭子,当鸭子嘴向上转到10点方向,很快谷歌AI就认为画里面是兔子了。

数据挖掘算法有两个根本问题。一方面,如果算法是专利机密,我们则无法检查算法所使用数据的准确度。如果黑匣子式算法被告知你有贷款未偿清,而真正欠款的是跟你同名的另一个人,但你不会知道这是个误会或其实是可以改正的。另一方面,如果算法是公开的,大家就能摆弄系统,就会有损模型的有效性。如果算法发现,未付清贷款的人都常常使用某个词,那么大家都会不再使用这个词,这样的话,无论不还贷的概率是多少,申请都能获得批准。

想要低汽车保险费率的人,可以在脸书上列清单;想要获取假释机会的囚犯,可以改变自己手环的大小;不想被逮捕的罪犯,可以整容。人们一旦了解系统,就能摆弄它,这样也会有损系统。这种摆弄现象太常见了,以至于还有个名字——古德哈特定律,取自英国经济学家查尔斯·古德哈特。该定律的内容是:当一项政策成为目标,它就不再是好政策。古德哈特是英格兰银行的经济顾问,他的观点是“设定货币目标会引起人们以损害目标有效性的方式,改变自己的行为”。现在,我们都知道这个定律也被应用于很多其他情况。

苏联的中央规划局下令要求制钉厂生产一定数量的钉子,企业为了降低成本,会尽量生产最小的钉子——也是用处最小的钉子。因此,制定目标会损害目标的有效性。

现在,全美国的学校都以标准考核来管理,该考核用于评估学生、教师和学校。教得好的老师会获得奖金,教得不好的就会被辞退。办得好的学校会吸引学生,获得更多资金来源,办不好的就会被国家接管。因此,老师和学校的回应也在意料之中:实行应试教育,(极端情况下)直接给学生正确答案或篡改答案卡。

因此,制定目标会损害目标的有效性。

大学院校也会以不同的方式摆弄系统。我任教的波莫纳学院入选了《美国新闻与世界报道》发布的全球最佳大学排行榜后,申请人数大幅增加,因为《美国新闻与世界报道》为其做了免费宣传。全美国甚至全世界的学生都申请波莫纳学院,因为他们看到它在《美国新闻与世界报道》的排名榜上非常靠前。申请人数的增加,反过来又让波莫纳学院的筛选越来越严格(现在的录取率不足7% ),这又进一步提高了该校在《美国新闻与世界报道》的排行榜上的排名。富者愈富。

知道了这一点后,有些大学便企图摆弄系统。《美国新闻与世界报道》的排名标准可以轻易获得,某些院校便能使些计谋。

有些计谋的代价很高,例如,《美国新闻与世界报道》会计算教师薪酬和师生比,但学院要想在这些方面做出改变就要花大价钱。其他衡量指标更容易操控。比如,两个重要的衡量标准是录取率(申请人被接收的比例,越低越好)和入学率(被录取学生选择入校的比例,越高越好)。一所二等小院校的招生办主任告诉我他是如何提高自己院校的这两个指标的:假设该院校有1000名申请人,想要招200  名大一学生。可以将这1 000  名申请人按照成绩高低均分为五组,每组含有20%  的申请人。如果该学院录取前40%  的申请人(录取率为40% ),可能只有次优秀的那20%的申请人会入学(即入学率为50% )。最优秀的20%  的申请人只是将这所院校当作备选,以防没能进入更好的学校。一旦他们能选择更好的学校,就肯定会去的。

该主任这种势利的策略是拒绝最优秀的那20% ,因为他们对该院校来说太优秀了,只录取次优秀的那20% ,他们全都会选择入学的。因此,该主任将录取率缩减了一半(从40%  降为20% ),还使入学率翻倍了(从50%  到100% )。那些数字并非像这个虚构例子一样,是预先定好的,但其原理是一样的。主任拒绝了最优秀的申请人,认为如果录取了他们,他们中的大多数人还是不会入校,从而降低了录取率。这种方式让他这所二等院校

的筛选更加严格,更值得申请。因此,制定目标会损害目标的有效性。

《美国新闻与世界报道》的另一个重要衡量标准是学生少于20  人的班级比例。我知道有所大学利用这个衡量标准来摆弄系统,迅速提升了自己在《美国新闻与世界报道》的排行榜上的排名。

具体而言,假设经济系开设一门导论课,每学期有300  名学生选修。该学院可以将这门课分为10  个小班,其中9  个班的人数上限为19  人,第10  个班的人数为129  人。那么,这所大学就可以报告说,学校班级少于19  人的比例是95% ,尽管有43%  的学生都挤在一个129  人的大班上课。因此,制定目标会损害目标的有效性。

这就是人工智能程序的内在问题,它利用我们目前的行为来预测未来的行为。我们会改变自己的行为:戴不同的手环,访问不同的网站,改变自己的笑容。如果评估贷款申请人的依据是账单支付记录,有些人会及时支付账单,以获取更高的信用评分。

不过这也还好,因为贷方就是想要申请人及时还贷。如果计算机根据手机充电频率来评估贷款申请人,有些人会通过频繁充电来摆弄系统。这就不是预测他们是否会还贷的合理指标。

书名:《错觉:AI如何通过数据挖掘误导我们》

作者:加里·史密斯

加载中...