新浪财经 产经

畅销书《暗知识》作者王维嘉:AI时代不懂技术,投资会踩到陷阱

新浪财经

关注

来源:亚布力中国企业家论坛

如果说疫情会重新定义时代,那么AI也将成为重新定义时代的新引擎。人工智能赋能产业升级,各界行业巨头竞相分羹。如今疫情的暴发再次引热其在大健康领域的全新商机。那么AI技术在医疗健康领域有哪些具体应用?当AI与疫情交互影响,又会给医疗健康产业带来怎样的未来?

5月8日,Aim Top Ventures创始合伙人王维嘉做客【空中亚布力】,就“疫情和AI将如何重塑医疗健康行业”做了分享。

下为王维嘉博士的精彩分享(有删减):

作为投资人,要懂得人工智能的产业生态,即了解该产业里有哪些不同的组成部分,它们之间的关系是什么。

2010-2020年是人工智能的第一阶段,也是尝试阶段。2020-2030年是人工智能的第二阶段,即再造产业阶段。这个阶段的AI开始落地与各个产业结合并产生价值。

‘判断AI可应用领域的三个依据’

当下我们正处在AI应用的“黄金十年”。AI可以应用在哪些领域呢?三个判据:第一,该行业要能产生大量的数据,没有数据AI就无用武之地;第二,该行业目前的效率还有很大的提升空间;第三,该行业要具备较大的市场规模,没有利润大家不会贸然进入其中。

AI在医疗健康行业的应用就符合以上三点。医疗健康行业是美国第一大行业,占美国GDP的16%,每年花费3万亿美元。人工智能在这方面的应用可分为四类:一是在精准医疗方面的应用。即可根据每个人不同情况做出精准诊断,并且提供个性化的治疗方案;二是在新药发现方面的应用,AI可以大大加快新药发现的速度。这次疫情全球有120多个团队在研制疫苗、几百家公司在竞争“新药发现;三是在先进医疗设备方面,许多医疗设备都需要用到AI;四是在个人的健康管理方面。

人工智能的投资有别于传统行业。以互联网行业为例,互联网行业主要投资的是商业模式,无论是投滴滴、Uber阿里巴巴,还是亚马逊,弄懂其商业模式就可以进行投资。但人工智能不同,它不仅要求投资人熟悉商业模式,还要求他们得懂技术。不懂技术就无法了解AI在行业上的应用场景,也无法预估它的投入产出率和风险。

‘AI技术促使暗知识浮出水面’

AI技术的本质是什么?简单一句话:就是从海量数据中抓出数据之间的相关性。所有的生命都是由蛋白质构成的,这次我们在新冠疫情中研发特效药或疫苗,实际上就是要阻断新冠病毒和人体细胞上一个叫ACE2的受体蛋白质的结合,如果能阻断它,病毒就无法感染我们。过去要想了解蛋白质的三维结构非常困难,现在谷歌却可以根据它的基因算出蛋白质,这是基因技术的AI对生命认识的巨大进步。

但我们发现了人工智能的新问题:它能知其然,但不知所以然。举例来说,我们都知道阿法狗下围棋可以战胜人类,但它具体是怎么下赢的?阿法狗、阿法狗的工程师、我们所有人都不知道这个问题的答案。AI只会告诉我们结果,却不能告诉我们是如何得到这个结果的。这就促使我们思考:是否存在人类还未觉察到的一类新的知识?

我们把知识分成两个维度:是否可表达和是否可感受。有一类知识既可感受也可表达,如阿基米德的浮力定律。我们躺在水里可以感受,也可以用很简单的公式把浮力定律写出来,同理,牛顿的三大定律也是如此,它们都是既可感受又可表达的知识;还有一类是我们可以表达但无法感受的知识。如广义相对论、量子力学、微观世界的运动规律等,我们无法感受它们,它们却能清晰地用数学方程式表达出来。

第二类知识就是70年前发现的“默知识”:可以感受不可表达。如我们骑自行车的知识。用这个分类我们发现还可能存在一种既不可感受也不可表达的知识,我们称之为“暗知识”,这就是今天人工智能、神经网络发现的一类新知识。比如阿法狗下围棋,机器发现蛋白质结构,人脸识别的那些知识。能用文字表达的明知识只是所有知识里的冰山一角,那些绝大多数藏在脑子里的默知识就像水面下的冰山。而我们无法感觉更无法表达的暗知识,就像整个海洋。

‘压抑疫情二次反弹的唯一方法’

这次全球危机和以前所有的危机最大的不同在于,它不是由经济产业和金融本身的因素造成的,完全是因为外来因素,所以这次疫情是全球危机的主变量。不了解疫情,你就根本没法去预测下一步经济形势。所以,如果一个经济学家、金融学家对疫情、病毒、药物和疫苗都不懂,那他的预测基本上可以不听。

长期来看,疫情的终结还是要靠疫苗,但疫苗研发非常困难。不同于一般药物,疫苗对安全性的要求极高,因为它是给全世界70亿的健康人口接种,但凡出了一点问题,造成的损失不可估量。所以疫苗在开发过程中要做大量安全性的实验。

中期来看,应对疫情主要靠药物。但所谓人民的救星、氯喹等等药物对某些人有效果,却并非绝对有效。

短期来看,一两年之内,我认为唯一能压抑住疫情二次反弹的应对方法就是检测、跟踪、隔离和戴口罩。

‘AI大幅提升药物研发速率’

人工智能在医疗行业有哪些应用?在疫情期间,AI能做些什么帮助我们共渡难关? 

任何疾病的成因都很复杂。美国每年大约有5000万例误诊。为什么会有这么高的误诊率?大家去医院看过病就知道,你去三甲医院挂了专家门诊号,专家每天至少要看几十个病人,从看病历到跟你说话不会超过10分钟。所以在此情况下,碰上复杂的疾病,医生对你的其他病史又不熟悉,只能做出大致的判断,因此也就容易出错。

我们投资了一家叫“世界上最有经验的医生”的公司,它就把历史上所有病人的病历都学习一遍,对你的病情了如指掌,相当于一个医生已经看了几百万个病人,你再去看病时,只要把你的数据告诉它,它就基本上能判断病情。

去年8月,我们这台机器参加了美国医生的资格考试考了85分,比平均分75分还高出10分。再有经验的医生终其一生,最多能看几千个病人,但AI却可以看几百万个病人。它会从大量的数据里抓取相关性并不断积累。

我们投资的另一家公司聚焦的是新药发现。美国的制药产业大约有一万亿美元的规模,一半是小分子化合药,一半是抗体药或大分子化合药。我们是做小分子化合药的公司。平均一款新药的研发成本是30亿美元也就是200亿人民币。那么药厂为了收回成本,一开始药就卖得非常贵。

开发新药大约要花十年的时间,其中,找小分子就要花2-3年的时间。寻找新药的过程是这样的:假如我是医药化学家,你告诉我这个蛋白质的结构什么样,我就会尝试哪些分子可以卡进去,再到库中一个个试验,有点像爱迪生发明电灯泡,他试了几百种材料,最后才发现钨丝,新药发现也是反复尝试的过程。

在十几年前,我们从100万种化合物中试验新药,一天试几百个,一两年总能试出来。但到2020年,我们的化合物已经快速增长到了1000亿个,换言之,哪怕一天试一千个化合物,我们得试1亿天,所以人工是不可能完成这个任务的。

当下唯一的办法是让机器学习,让机器把历史上所有成功的药物都学一遍。这就像一个成功匹配了几百对婚姻的媒婆,非常有经验, 给她一个姑娘,她能迅速根据姑娘的长相、年龄、家庭背景、职业、兴趣、爱好各方面找到一个比较合适的小伙子。同理,你给个目标蛋白质,AI就能快速找到化合物分子与它配对。

机器把过去人类迄今为止所有成功的药物都学了一遍,所以它找新药时间就会非常快,它可以把两年的时间缩短到两个星期。像礼来、诺华、辉瑞这样的世界大公司用传统的方式研究药物也只能研究不到100个靶点,而我们现在研究1000个靶点,一个靶点就是一个蛋白质,同时就可以研究1000种药物。中国的科学家在疫情暴发初期就向全世界公布了新冠肺炎的基因组织,有了这个基因序列后,我们就可以找到它蛋白质的结构开发疫苗和药品。

现在疫苗的开发主要有几种不同的思路:

1. 传统的灭活疫苗或减活疫苗;

2. DNA、RNA疫苗;

3. 用一种病毒把疫苗的RNA带到人体内,从而产生抗体。

除了诊断和制药,还有检测和成像。检测很重要的一点就是成像,看肺的CT片子是此次疫情判断的一个重要依据。在X光、CT和核磁共振之后的三十年,基本上没有出现任何新的医疗成像仪器,但最近几年发现了新的磁粒子成像。磁粒子成像能完成所有的传统成像方法做不了的事。它可以在细胞水平上成像,细胞有了任何变化都可以在图像中看到,这对细胞、炎症、靶向药等方面作用明显。我们可以观察到癌症细胞的变化,这对于我们研究免疫系统非常重要。

‘人工智能领域没有赢者通吃 ’

AI如同互联网一般,它也蕴藏着很大的创新机会,它与互联网之间最大的区别就是:互联网的生意是To C;而人工智能的生意是To B。互联网公司如抖音短短两三年之内就能从0做到几十亿用户,发展非常快,因为它的网络效应,如同阿里巴巴,店越多顾客越多,顾客越多店越多,形成螺旋向上的循环。

但To B的生意没有网络效应。客户是企业、政府,它可能受到人际关系亲疏等因素的影响,很多生意需要自己一步步开拓。二者的区别也造成了过去几年在AI领域的投资泡沫。

很多投资人的思维还局限在互联网时代,依然认为赢者通吃,认为头部公司价值很大,第一名比第二名值钱10倍。但事实并非如此。在人工智能领域,没有赢者通吃的概念。只有真正理解了AI的本质,才能理解它的场景应用,进而了解它能解决什么问题,最终理解这家公司的价值。

总体而言,在AI时代从事投资,你必须了解AI技术本身,如果不懂技术,你一定会踩到陷阱里。

互动问答

Q1:美国是新技术的高地,医疗资源也极为发达,在全球卫生安全指数中位列应对流行病准备最充分的国家之首,为什么反而成为新冠确诊病例最高的国家?

王维嘉:不仅是美国,整个欧美发达国家的应对都非常糟糕。造成疫情失控的主要原因并非技术,首先是因为美国不重视。其次,它们防控疫情的思路不对。欧美政府的顾问团队要负一定责任。英国首先提出群体免疫,现在来看,这是完全错误的。当然美国检测手段的准备工作也做得不好,先是放弃德国最初的检测方法想要自行开发,结果开发的检测方法根本无法使用,整整耽误了一个月的时间,白白损失了无辜生命。

Q2:在应对疫情时,美国各州有一定的自主权,您认为哪些州的经验值得研究?

王维嘉:较早采取居家隔离政策的是俄亥俄州和加州,它们的州长也挨骂最多。开饭馆的商人会反对居家隔离,认为这影响了它们的商业经营。但今天这些曾经挨骂的州长现在获得的点赞率却最高。因为他们的远见避免了很多无辜人民的死亡。

虽然各州使用的方法不一样,但整体而言,美国各州都对检测、追踪、隔离做得不够。目前加州相对来说做得最好。加州政府现在募集了一个2万人的追踪团队,专门打电话追踪疫情的密切接触者,相对来说算是做的比较好的州之一,现在全美国逐渐在学加州的防控疫情的经验。

Q3:在防控疫情工作中,疫情监测侵犯了个人隐私。危机时刻个人权利否要让位于公共利益,非常时期采用非常方法,可以成为惯例吗?

王维嘉:追踪这件事如果用心做,可以不侵犯隐私。政府和个人在筛选、通报疫情感染的相关信息时,可以将人名、性别等关键信息隐去,确保你能知道可能接触到了哪些确诊人群的关键信息就好,至于确诊者的身份、地位等详细信息则不需要全盘告知。

在特殊情况下,为了大家的安全,有时也不得不牺牲一部分个人利益,这是可以理解的。但即便因为现实原因需掌握更多涉及隐私的个人信息,也要明确此类情况只是临时应对的紧急措施,不能成为惯例。当疫情过去,要归还个人的隐私空间,因为隐私属于我们的个人权利。

责任编辑:刘万里 SF014

加载中...