“数据战争”如何演变?——以史为鉴:加利福尼亚淘金热
19世纪中期,美国西部淘金热的发展史,能够在一定程度上预示当前的这场大数据热或者“数据战争”将会如何进一步演变与发展。
美国西部的“淘金热”
19世纪30年代,“淘金热”在多国兴起,其中美国加利福尼亚州的淘金热规模最为庞大,其影响力也最甚。
1803年,约翰·奥古斯都·萨特出生于一个德国中产家庭,虽然幼年生活富足,但他成年之后的事业发展却并不顺利。1834年,由于在瑞士的生意宣告破产,萨特被迫离开瑞士,来到美国西部的萨克拉门托地区居住。他于1839年在萨克拉门托河畔建立了一个城堡和锯木厂,从事边境贸易,并且取得了不错的收入。
在萨特的锯木厂中,有一个名为詹姆斯·W.马歇尔的颇有手艺和眼力的木匠。1848年1月24日,马歇尔在检查锯木厂的水道时,发现锯木厂旁的亚美利加河中有一些闪亮的光点。他好奇地蹚过河道,拾起一片发光的金黄色小薄片,经过揉捏、敲打和牙咬,马歇尔发现这些小薄片虽然可以被改变形状,却又很有韧劲,不会轻易折断,根据经验判断他认为这些河道中的物体很有可能是黄金。在拿给他的雇主萨特看了之后,两人确认了这些黄色物体确实是纯度很高的黄金。深感震惊的萨特嘱咐马歇尔千万不要向外透露他们发现黄金的消息,与此同时开始偷偷招募工人进行秘密淘金。
作为当地地主,萨特担心一旦消息被透露,将会有大批人加入搜寻黄金的行列,不但影响他自己的淘金行动,也会影响他后续的事业发展计划。但是,世界上从来没有不透风的墙,萨克拉门托地区发现黄金的消息还是不胫而走。最开始,萨特锯木厂里的其他工人知道了在附近的河岸有黄金的“秘密”,纷纷丢下工作去河道寻找黄金,这使萨特的锯木厂濒临停业;不久之后,发现黄金的消息又传到了附近的旧金山市,一开始民众还不敢相信这个消息是真的。直到1948年3月,一家报纸进行了相关报道,而当地一家商店的老板也在城镇游行时向人们展示了他从萨特地盘发现的黄金,这两件事终于让人们确定了黄金的存在。至此,“淘金热”真正开始,旧金山地区的居民争先恐后地加入了淘金的队伍。据记载,到了1949年6月,大约3/4的旧金山居民都离开了家园涌向萨克拉门托地区,整个旧金山城镇几乎为之一空。在后来的几年里,来自美国各地甚至世界各地的淘金者纷纷来到加利福尼亚州,加利福尼亚淘金热达到顶峰。
在淘金热刚刚开始的一段时间,能够“淘”到的黄金就在地表层,只要拿一个脸盆儿就能从河水中冲掉沙子淘出金块,淘金活动的边际回报相当可观。在当时,一个淘金者平均每天能有大约20美元的收入,相当于当时美国东部工人日工资的20倍,而富矿区的日均收入甚至还要更高。但是这样的日子并没能持续多久。随着越来越多的淘金者涌入,地表的金沙变得越来越少,而想要获得等量的黄金需要投入的精力与时间都迅速上升,在后期开采一天能够获得的黄金的价值,甚至已经难以覆盖成本。
由于越来越多的人慕名而来,加利福尼亚矿区变得日益拥挤,每个人能够分到的“淘金”区域也越来越小,不但生活环境艰苦险恶,淘金者围绕矿区资源也展开了一系列竞争和抢夺,各类违法犯罪行为屡见不鲜。此外,因为淘金者的大量涌入也导致当地的商品稀缺,萨克拉门托地区各种商品的涨价幅度令人嘡目结舌。除了淘金者,当地各类商人和小贩成为这场淘金热最直接的受益者。
记者爱德华·古尔德·巴福姆在其1850年出版的纪实作品《金矿中的六个月》中,对于当时金矿区的物价上涨作出了十分详尽的描述。
“淘金热开始之前,矿工们使用的平底锅价格仅为20美分,之后暴涨到了8美元,按购买力平价计算相当于今天的250美元——如果你乐于烹饪,正好可以用250美元买一款德国高端厨具品牌菲仕乐的进口不粘锅;当然,在各地的小超市里依然有价值8美元的平价锅待你挑选。”
根据巴福姆在书中的描述,淘金热爆发之后,“淘金”最重要的工具——铲子一度涨价到36美元,换算成今天的价格约为1000多美元,而这个价格在今天可以购买一种数据时代最为重要的工具:一台性能不错的笔记本电脑。除了与淘金相关的工具,其他物价也都奇高无比。巴福姆与友人在当地吃的一顿早餐——包括面包、奶酪、黄油和沙丁鱼,还有两瓶啤酒,就花费了他43美元,换算成当前物价在1300美元左右——这几乎是中国三线城市的平均房价。高昂的物价消耗掉了绝大多数淘金者辛苦挖到的黄金,却让各种物资的经销商赚得盆满钵满。
如果将19世纪的“淘金热”与21世纪数据科学发展的前中期进行对比,可以发现两者之间存在惊人的相似性。在数据科学刚刚兴起之时,通过数据分析可以获得关于市场规律和消费者行为的大量信息与知识,数据分析的直接回报很高,这正如“淘金热”刚刚开始之时;而当几乎所有企业都开始招募数据分析团队、在数据库和数据科学上增加投入之后,试图通过数据分析得到具有独到价值的信息就变得越发困难,企业只有在数据规模(大数据)和分析技术(人工智能)上进行大量投入,才有可能获得数据优势,“数据淘金”的成本不断增加。
大数据热的未来发展
通过对加利福尼亚淘金热的回顾以及将其与当前的大数据热进行对比,我们可以得出对于当前大数据热后续将会如何发展的四个预判。
第一,能够在大数据热的早期占据领先地位的国家、地区和企业,将取得持续性的竞争优势。如果没有加利福尼亚淘金热,可能就不一定会有在今天仍为美国人口第一大州,同时也是GDP最高州的加利福尼亚州。同时,美国西部的基础设施建设、农业发展和工业化进程也都会减缓许多。进一步地,美国可能也不会和真实历史中一样,在1890年成为全球第一大经济体。当然,也可能不会有李维斯牛仔裤、富国银行以及斯图德贝克汽车公司等大型企业的崛起。
在当前的大数据热中,中国的互联网企业和数字经济行业也在许多领域具有一定的领先地位。而在大数据技术发展与监管的过程中,我们应当采取有效手段尽可能地保持这一领先地位,在鼓励竞争、保护创新的大前提下,力争形成一批具有显著数据优势的企业和地区,以此作为中国经济未来20年的重要增长点。
第二,随着数据资源的逐渐丰富,利益分配将成为至关重要的问题。先前淘金热的故事中,我们并没有介绍到地主萨特和工人马歇尔的结局。实际上这两位黄金的发现者均没有在淘金热中获得大量财富。由于黄金信息的走漏,萨特的土地、城堡和其他不动产不断受到淘金者的入侵,致使他的财物和牲畜纷纷被盗走。1852年,淘金热尚未完全结束,萨特却已经不得不宣布破产,被迫离开了加利福尼亚州。而木匠马歇尔的晚年穷困潦倒,最终在一个不避风寒的小屋中默默离世。
事实上,绝大多数的淘金者都没有在这个过程中真正发财,那些真正获得巨大利润的恰恰是那些将工具和生活用品卖给淘金者的商人(如销售耐磨的牛仔裤的商人),用纸币兑换黄金的金融家,以及组织淘金行为、控制矿场的大企业主。不仅如此,淘金热的兴起还干扰了周边地区一些无关人群的正常生活。在大量外来移民迁入加州之前,加州原本住着许多被称为“四九人”(以1849年命名,即淘金热移民的高峰年)的原住民族群。但是由于淘金者的涌入,这些土著美国人的平静生活被打破,他们被淘金者袭击,许多人被迫背井离乡,从此移居他乡。
可以预见,当下的大数据热通过对数据的挖掘、分析和充分应用,必将创造出大量财富。而淘金热的历史告诫我们,围绕数据进行的收入初次分配未必会是合理、公平的。考虑到数据作为一种虚拟资源,以及其权利边界不清、权益分配规则不明、纠纷解决机制不健全的特点,数据相关的收入分配切实需要政府介入,并制定保护数据弱势群体的规则和制度,以避免大数据热导致的收入不平等加剧。
第三,大数据热将促进各项生产资源的跨国、跨区域和跨行业流动,进而促进一批新的职业和就业岗位的产生与发展。在加利福尼亚淘金热期间,约有30万人从世界各地来到加利福尼亚,他们有些是从陆路到达,主要是从美国中东部经由加利福尼亚步道和希拉河谷步道;而另一些人则是通过海路到达,其中就包括来自拉丁美洲、欧洲、澳大利亚的淘金者以及中国的数千名工人,其中甚至有些是被贩卖到加利福尼亚的。无论是以何种形式,是自愿或是非自愿,淘金热确实间接地推动了旧金山“唐人街”的形成,以及加州地区经济、文化的多样化发展。而当下的大数据热,也是如此。
谢康等(2020)强调,数据从可能的生产要素成为现实的生产要素,其关键是在一定的ICT使用强度下,通过与劳动结合形成知识积累,进而更好地与管理相结合,促进企业组织效率提升和产品创新。因此,大数据热必将带动其他生产要素在国家、行业、区域、企业乃至个人层面的大范围流动,从而深入改变现代经济结构。此外,正如淘金热创造了淘金工和运输金融等职业与工作,大数据热也必将创造出一系列全新的职业,进而形成新的工作机遇,改变教育导向和人力资本积累。
2019年4月,中国人社部、国家市场监管总局和国家统计局正式向社会发布了13个新职业信息,这是自2015年版《国家职业分类大典》颁布以来首次新增职业,分别是:人工智能工程技术人员、物联网工程技术人员、大数据工程技术人员、云计算工程技术人员、数字化管理师、建筑信息模型技术员、电子竞技运营师、电子竞技员、无人机驾驶员、农业经理人、物联网安装调试员、工业机器人系统操作员、工业机器人系统运维员。不难看出,这些新增职业中绝大多数都和大数据或者人工智能相关,大数据热正在触发劳动力市场的深层次结构变化。
第四,数据相关基础性行业的发展能否跟上数据规模的扩张,将决定大数据热的持续时间和发展程度。加利福尼亚淘金热可谓“来得快,去得也快”,从1848年到1853年,仅仅五年就基本结束。在萨克拉门托地区的金矿被挖掘殆尽之后,淘金者迅速将目光转移到新发现金矿的科罗拉多州,以及内华达州北部等地区,在将这些地区的黄金资源开采完毕后他们又转移到其他地方,直到淘金不再是一门赚钱的生意为止。
在这一点上,大数据热与历史上的淘金热显著不同。虽然随着数据挖掘的不断深入,新的知识的产生速度将可能有所放缓,但是永远无须担心数据或者数据所蕴含的信息和知识面临“枯竭”。此外,随着本章前述的5G技术、边缘计算以及量子计算等技术的进一步发展和普及,数据分析和处理能力将在规模、速度、广度、深度等多个方面得到进一步的提升。由此我们可以大胆预测,大数据热不仅不会轻易结束,而且将可能随着各项新技术的产生和推广,如潮水般一波又一波地席卷我们所处的社会。
作者:徐翔 来源:《数字经济时代:大数据与人工智能驱动新经济发展》,人民出版社2021年8月版。