新浪财经

AI经济学 | 第十二章:AI风投从领先到落后的创新金融启示

中金点睛

关注

规模定律意味着大模型需要大投入。从融资模式看,公益性捐赠难以支撑OpenAI的成功,风险投资至关重要。在Transformer算法刚提出的2017年,中国AI风投金额(约256亿美元)及其占风投总额的比例(高达29%)在主要经济体中均位居第一。此后到ChatGPT吸引全球关注的2022年,五年间中国AI风投从领先变成了落后,被美国反超且差距持续拉大,欧盟、印度也对中国形成加速追赶态势。从技术、劳动、资本的产业三要素来看,我们认为中国AI风投逆转可能难以用Transformer算法源发于美国的技术进步视角来解释,2022年之前中国AI优秀人才回流增加,与AI风投转而落后的走势不同。事实上,风投这种由领先到落后的变化不只存在于AI领域,整个中国风投市场培育“独角兽”的能力也有所下滑,不但被美国反超,也在一些方面被印度等国家加速追赶。

从募、投、管、退四环节来看,中国风投市场从领先到落后的转变可能与过去几年的募资困难有关。资管新规推出后,风投市场摆脱了金融风险较高的募资途径,但也一定程度上造成了风险资本不足的约束。风投资金约束既减少了可用的风投资金总量,也抑制了风投风险偏好,导致过去几年难以支撑ChatGPT这种不确定性较高的引领式创新。投资端,前文第六章指出大模型的规模定律与大型科技企业天然更匹配。从金额看,2018年之前中国大型科技企业参与的AI风投远高于美国,此后被美国反超,平台企业、金融领域投资意愿下降的原因值得重视,资本市场退出渠道有待完善的影响也不容忽视。

全球化放缓背景下,中国有必要在AI领域加速追赶和进步,我们认为需着重构建两类创新金融模式:算力等基础设施追赶需要“大企业+大银行+大政府”的追赶式创新金融模式,创新悖论意味着无需过于担忧产融分开的大型科技企业市场势力;大模型商业应用可考虑构建“中小企业+资本市场+制度建设”的引领式创新金融模式,在严格事后反欺诈基础上增加资本市场包容性,以构建硬科技与软创新、科技与消费相辅相成的创新生态,更好发挥资本市场筛选效应。

关于中美在本轮AI进步中差距拉大的原因,第二章从技术层面的算力、数据、人才/算法,以及产业层面的需求、融资等多个维度进行了综合分析。本文从产业创新的一般规律角度,对融资问题展开进一步探讨。从科研成果扩散的角度看,产业创新大致遵循着从基础研究到应用研究,再到试验开发,最后进入到生产阶段的基本模式。其中,基础研究往往是不预设研究目标的探索性研究,应用研究则是具有预设目标的实用性研究,两者通常统称为科学研究。与科学研究不同,试验开发是以产业化为导向,强调通过工程开发生产出产品原型、原始样机及装置等,是将科学研究和实践经验中获得的知识,用于生产新材料、新产品或新设备,建立新的工艺、系统和服务,或是大幅改进已经生产或安装的设备等。也就是说,试验开发是运用既有科研成果服务于工程开发目标、最接近产业化的研发环节,因而也是科学研究转化为生产力的关键一步[1]。从这样一个划分来看,2017年出现的Transformer算法[2]可以看作是典型的科学研究成果,2022年出现的ChatGPT则是基于Transformer算法进行试验开发的产业结果。

在不同的产业创新阶段,关键生产要素与核心驱动力并非一成不变。从供给侧来看,科学研究阶段的核心要素是人才,试验开发通常要耗费更多的资源,因而融资模式在这个旨在迈向产业化的过程中扮演着更重要的角色。例如,ChatGPT的成功开发不仅有赖于Transformer算法,也有赖于大量数据与算力的投入,需要耗费大量资金。与此同时,驱动产业化的核心动机,与驱动科学研究的动机(例如好奇心等科学家的个人偏好)有很大不同,本质是为了获取经济利益。也就是说,对于创新成果产业化而言,创新不过是换取利润的手段,利润才是创新成果产业化的目的[3]。而试验开发成果最终能够实现多少利润,很大程度上取决于需求侧的市场激励。总之,市场激励下的供给侧融资模式,对于科研成果成功转化为现实生产力而言虽不是唯一决定因素,但不可或缺。

但是,从2017年Transformer算法提出到2022年ChatGPT成功,支撑这五年试验开发过程的融资模式,似乎与上述有关产业创新的一般规律并不一致。2017年,中国在AI领域的风投[4]金额是高于美国的,AI风投金额占国内风投总额的比例也是高于美国的。如果按照上述产业创新的一般融资规律,中国似乎更有能力支持Transformer算法走向试验开发。但结果并非如此,这是创新中常见的偶然现象,还是有些值得探讨的内在逻辑?尤其是作为ChatGPT开发方的OpenAI最早是依托于公益捐赠成立的,其宗旨并非追求盈利,而是致力于“创建造福全人类的通用人工智能(AGI)”[5]。从融资模式的角度看,这是否意味着应将此轮AI进步更多归功于公益文化,市场激励下的供给侧融资模式不再重要?这对于产业后发者思考应对措施而言又是什么含义?对此,本文将从OpenAI的融资历程出发,对相关问题展开探讨。

一、OpenAI融资历程:产业引领式创新需要风投支持

(一)启动资金来自于富豪公益捐赠,初始目标是公益性地造福全人类

OpenAI的初期资金主要来源于富豪群体的公益捐赠。2015年,OpenAI以非营利组织的形式成立,其创始团队包括Sam Altman(科技企业创业加速器Y Combinator前总裁)、Elon Musk(特斯拉及SpaceX联合创始人)、Greg Brockman(数字支付公司Stripe高管),以及人工智能专家如Ilya Sutskever和Wojciech Zaremba。在创始人中,Sam Altman和Elon Musk曾强调成立OpenAI的目的是防止AI技术被少数大公司垄断,促进AI领域的开放和合作。在这一宗旨的推动下,OpenAI还获得了包括Reid Hoffman(LinkedIn联合创始人)、Jessica Livingston(Y Combinator联合创始人)和Peter Thiel(PayPal联合创始人)在内的个人以及Amazon Web Services、Infosys等机构的早期支持。这些创始者和支持方承诺提供总额10亿美元的公益捐赠资金支持,确保OpenAI可以进行不受短期财务目标限制的研究,以造福全人类[6]。

然而事实是,如果仅依靠公益捐款,OpenAI在成立不久后可能会面临资金约束的严峻挑战。根据OpenAI公开的数据,截至到2024年5月,承诺公益捐赠的10亿美元实际只到位了约1.3亿美元[7]。与此同时,在前文第二章,中金公司研究部对于GPT-4的开发成本进行了估算(包含算力、人工、电费、数据购置等):在自购算力的情况下,OpenAI的算力成本大概在3亿到10亿美元之间;即使是租赁算力,GPT-4单次训练的算力成本也大约需要1500万到5000万美元。这意味着,如果OpenAI一直等待捐赠资金到位才进行开发,大概率难以在2023年3月开发出GPT-4。

这种挑战根源于大模型的规模定律。所谓规模定律,简单说即是AI模型的参数规模越大,模型效果越好。要支撑模型持续扩大,就要持续地推动算法优化、算力增长与数据积累,每一项都需要大量的成本投入。数据方面,大模型训练需要高质量数据,要求投入大量成本进行数据收集、清洗和加工。算力方面,根据OpenAI的研究,在2012年至2017年间,最大规模的AI训练任务的算力需求增长超过了30万倍,大概每3到4个月就要翻一番[8]。算法方面的核心生产要素是人才,少数富豪群体虽可以为OpenAI设立造福全人类的目标,但这个公益目标并不能在更广泛层面有效激励优秀人才。

(二)大模型需要大投入:OpenAI于2019年改制,商业性风投成为主要资金来源

总之,规模定律意味着大模型要有大投入,OpenAI创建初期的公益融资模式难以支撑其持续探索大模型的边界。最终,OpenAI在2019年对其组织架构进行了重大调整,由一家非盈利组织转型为具有“非营利母公司-股权基金-利润上限子公司[9]”架构的新型商业组织。该组织架构共有三层[10]:①顶层为原有的非营利性组织OpenAI Nonprofit;②中间层是新成立的股权基金,该基金的普通合伙人(GP)是OpenAI Nonprofit,而有限合伙人(LP)包括OpenAI Nonprofit、OpenAI的员工及外部投资者;③底层是利润上限子公司,负责OpenAI的商业化运营活动,其股份主要由中间层的股权基金持有。为尽量兼顾初期创始人、捐赠人为全人类创造有益AI技术的使命诉求,OpenAI对利润上限子公司设置了一些兼容性规定,例如:要求利润上限子公司完全由其母公司OpenAI Nonprofit控制;中间层股权基金的投资者的回报上限被设定为其投资金额的100倍,超过此限额的利润分红将归属于OpenAI Nonprofit,用于资助AI科研和慈善活动。

更重要的是,此次组织变革允许OpenAI的员工和外部投资者通过持有股权基金的份额间接持有利润上限子公司的股份,事实上赋予了OpenAI进行商业化运营进而获取外部股权融资的能力。此后,OpenAI融资模式出现根本性变革,即从初期的依靠公益性捐赠,转变为主要依靠商业性风投,有效支撑了需要耗费大量资源的大语言模型开发。如图表12.1所示,自2019年改制到2024年1月,OpenAI的主要融资历程大致可以分为三个阶段。第一阶段是在2019年,主要由一些风投公司和微软参与。2019年3月,OpenAI改制后的首轮融资参与者包括科斯拉风投(Khosla Ventures)[11]。当年4月,马修布朗风投(Matthew Brown Companies)又向OpenAI投资了1000万美元。当年7月,微软与OpenAI签署了合作协议,承诺大部分以云服务的形式投资10亿美元[12]。

第二个阶段是在2021年。当年1月,OpenAI进行了一轮估值高达150亿美元的融资,参与者包括老虎全球管理基金(Tiger Global Management)、红杉资本(Sequoia Capital)等[13]。同年,微软也进一步加深与OpenAI的合作关系,追加了20亿美元投资[14]。

第三个阶段是在2023年之后。当时OpenAI公司于2022年底推出的ChatGPT已引发全球AI热潮,也为自己吸引了一大波新的投资支持。当年1月,微软承诺在未来10年内继续主要以云计算服务的形式向OpenAI追加投资总额100亿美元[15]。当年4月和8月,OpenAI又从多家风投公司募集了约3亿美元资金,此时OpenAI估值已介于270亿至290亿美元之间[16]。到了2023年11月,由兴盛资本(Thrive Capital)牵头的投资者群体对OpenAI员工股份进行了要约收购,估值高达860亿美元[17]。虽然此次收购未为OpenAI带来新的现金流入,但增加了员工持股的流动性,为其招募更多优秀人才提供了便利。

图表12.1:从融资模式角度看,风险投资在OpenAI开发大模型过程中发挥着关键作用

注:以上融资信息基于公开报道整理。

资料来源:OpenAI,微软,CNBC,PitchBook,aceventurefunds.com,finance.yahoo.com,siliconangle.com,crunchbase.com,semafor.com,techcrunch.com网站,中金研究院

二、中美AI风投对比:结构问题还是总量问题?

以上梳理表明,至少就OpenAI将Transformer算法开发成ChatGPT而言,单纯依靠公益捐赠难以满足规模定律下大模型的大投入需要,商业性风险投资才是支撑OpenAI成功开发大语言模型的关键融资模式。随之而来的问题是,为什么中国风投未能支持将Transformer算法率先开发成大语言模型?有两种解释比较有代表性:一种是强调结构原因,即中国风投的风险偏好较低,导致支持作为引领式创新的大语言模型开发的意愿也较低;另一种是强调总量原因,即中国风投面临募资困难,没有足够资金来支持大模型的大投入。哪种更有道理,或者兼而有之?

(一)2017-2018年:中国AI风投从领先到落后的转折点

对于大语言模型的成功开发,OpenAI曾在2020年将其归结为规模定律[18]。沿着规律定律这条路,后续很多追赶者也复制了OpenAI的成功,以至于在当下只要不是寻求突破既有前沿的大模型开发,似乎都变成了风险不那么高的投资。需要强调的是,现在各界愿意相信规模定律更多是因为它在OpenAI实践中取得了成功,但在成功开发出ChatGPT之前,无论规模定律的逻辑多么自洽,将作为科研创新的Transformer算法试验开发成作为产业创新成果的ChatGPT,依旧是一个充满高度不确定性的高风险活动。因为规模定律只能方向性地说明模型性能会随着参数规模的扩大而改善,却无法精确地告诉开发者规模定律S曲线涌现式的第一拐点究竟会在哪个阶段到来(见第六章图表6.9)。这种高度不确定性根源于引领式创新的原创性特点,即风险很大程度上来自于没有先例可循,因而需要高风险偏好的资金予以支持。这是引领式创新与追赶式创新的根本区别,也决定了追赶ChatGPT的风险与原创ChatGPT的风险不可同日而语。

图表12.2:中美风投的投资阶段对比(投资笔数结构)

注:此处是投资笔数的占比。按照PitchBook定义,天使及种子期是天使轮和种子轮的汇总(未做进一步区分),天使轮指的是之前没有VC或PE的投资、且投资金额少于一定金额的投资(对于美国企业为100万美元,对于中国企业未指明标准)、或公司方宣称的天使轮,种子轮是指公司方宣称的种子轮、或者投资金额在特定金额区间的情况(对于美国企业为100万美元和1000万美元之间,对于中国企业未指明标准);初创期一般指的是A轮和B轮融资;成长期一般指的是C轮和D轮融资;成熟期一般指的是E轮及以后的融资。

资料来源:PitchBook,中金研究院

从这个角度看,将中国风投未有效支撑过去几年的大语言模型开发归结为风险偏好较低的结构性因素,或许有一定道理,似乎也能够得到一定的数据佐证。通常而言,可以将风险投资划分为天使及种子期、初创期、成长期、成熟期四个阶段,投早投小的天使及种子期、初创期的占比越高,通常意味着风投的风险偏好也越高。如图表12.2所示,2022年中国风投中天使及种子期、初创期的投资笔数占整体的比重为58%,同期美国是70%。似乎确实能够印证中国风投的风险偏好低于美国。不过,我们认为这也许并不能佐证中国AI风投的风险偏好较低。按照AI风投的投向差异,可以大致划分为基础模型层、中间层和垂直应用层三个方面,如果风投侧重于更容易变现的垂直应用则通常意味着风险偏好较低,如果投资侧重于离商业应用较远的基础模型层则通常意味着风险偏好较高。从图表12.3来看,似乎并没有确凿的证据表明中国AI风投的风险偏好低于美国。

图表12.3:2023年中美AI风投结构比较

注:左图基于PitchBook数据库,统计范围为2023年新成立的Generative AI 公司所获得投资,金额占比中未计入未披露金额的投资,次数占比以平台披露的所有相关投资次数计算。右图基于IT桔子数据库,统计范围为2023年新成立的AIGC公司所获得投资,金额占比中未计入未披露金额的投资,其中披露金额不详细的以披露金额区间的平均数计入,次数占比以平台披露的所有相关投资次数计算。基础模型层、中间层、垂直应用层由作者手动划分、统计,其中基础模型层是具有自研模型的企业;中间层包括了多模型调用、数据管理平台、算力平台等;垂直应用层是AI在具体领域的应用。

资料来源:IT桔子,PitchBook,中金研究院

当然,对图表12.3的另一个可能解释是,由于OpenAI的大语言模型在2022年底即已开发成功并向全世界公布,因此2023年的基础大模型风投从事的是追赶式创新,风险相较于2022年前的引领式创新已经大幅下降。因此,判断风投的风险偏好不应该用ChatGPT已经成功问世后的2023年数据,而应该用Transformer算法出现后但ChatGPT还未成功吸引全球关注前的数据,也即2017年至2022年的数据。如图表12.2所示,在Transformer算法刚推出的2017年,中国天使及种子期、初创期的风投笔数占比为76%,美国同期也是76%,两者并无差距。也就是说,从过去十年的历史数据来看,中国风投的风险偏好似乎并不是一直比美国低,尤其是在Transformer算法刚出现的2017年,两国风投的风险偏好基本是在同等水平。

既然如此,风险偏好的结构视角是否还能够解释风投在本轮AI进步中的两国差异?对此,大概有三种解释。一是,衡量风险偏好不应该看天使及种子期和初创期的加总,而是应该主要看对最早的天使及种子期的支持力度。我们认为这种说法不无道理,美国风投对天使及种子期的支持力度确实也远远大于中国(图表12.2)。但是,除了天使及种子期、初创期均属于高风险偏好投资的共识外,更关键的是对于OpenAI而言其天使及种子期的资金支持来自于公益捐赠而非风投,在2019年OpenAI改制后开始接受风投的阶段,已经属于初创期而非天使及种子期。第二种有可能的解释是图表12.3的数据统计有问题,未能真实反映中美风投的风险偏好差异。这种观点也有一定道理,因为作为对非公开上市企业的投资,风投本就属于私募领域的投资活动,很多数据没有股票市场那种公开的、权威统计。但是,一方面还是因为本文尽量采用了具有一定共识性的中外风投数据库的数据,另一方面如果2017年的数据不能证伪风险偏好的结构原因,那么2022、2023年的数据也不能证实这个原因。

因此,本文无意否定前两个解释因素,但更倾向于从第三个角度去解释,也即并非是中国风投的风险偏好一直低于美国,才导致未能像美国风投那样支持大语言模型的引领式创新,而是因为在最需要高风险偏好资金支持的阶段,也即从Transformer算法出现的2017年到ChatGPT成功的2022年,中国风投的风险偏好出现了快速下降(图表12.2)。值得注意的是,这种变化不仅出现在以投早投小占比衡量的风投整体风险偏好上,也体现在以AI风投的绝对金额及其占风投总金额比重来衡量的AI风投热情方面。如图表12.4所示,在Transformer算法刚推出的2017年,中国AI风投金额约为256亿美元,超过美国的182亿美元,在主要经济体中位居第一;AI风投占中国风投总金额的比重是29%,超过美国的19%,在主要经济体中也是位居第一。但值得关注的是,恰恰是在Transformer算法拉开大语言模型开发的序幕后,中国风投对AI的投资热情似乎开始下滑了,AI风投金额在2018年被美国反超,随后两国距离持续扩大;中国的AI风投占风投总金额的比例也是持续下滑,不但与美国的差距扩大,也被欧盟反超,还曾一度被印度反超。

图表12.4:中美欧印AI风投金额及其占各经济体风投总金额比例

注:根据Preqin中被投资公司的细分类别Artificial Intelligence,对属于这一类的公司获得的投资进行汇总。

资料来源:Preqin,中金研究院

(二)归因分析:技术限制、人才减少,还是资金缺乏?

综上,在Transformer算法刚提出的2017年,中国风投整体的风险偏好与美国持平,以AI风投金额及其占风投总金额比重来衡量的中国AI风投热情更是远高于美国。与此同时,从OpenAI成功开发ChatGPT的经验来看,风险投资是引领式创新的最主要融资方式。因此,假如历史时钟能够回拨到2017年,至少从融资模式的角度看,似乎中国比美国更有希望率先开发出大语言模型。但随后五年的事实并非如此,中国AI风投也从全球领先变成了落后。由于风投是在产业创新阶段介入的,对于背后原因可能也需要从产业创新的驱动因素层面来进行探索。如前述,2017年出现的Transformer算法是科学研究成果,2022年的ChatGPT则是基于Transformer算法进行试验开发的产业结果。对于产业创新而言,技术、人才、资金是基本的三要素,因而可能的解释也有三种。

第一种可能是2017年后中国AI发展面临着技术限制,抑制了AI投资。根据“供给创造需求”的技术推动理论,技术进步通常会带来新的投资机会,因而投资减少可能反映了在某些领域关键技术的停滞[19]。据此,一个似乎合理的猜测是,作为本轮技术进步的核心算法突破,2017年Transformer算法率先出现在美国,而后的2018年中美贸易摩擦增加,可能导致中国在学习AI先进技术方面面临一些障碍,减少了AI投资的机会。从数据上看这个理由似乎能够得到一定印证,例如中国与美国有关AI的跨国学术合作占中国在AI领域所有对外学术合作的比例,从2018年的近60%下降到了2023年的近40%[20]。不过,需要说明的是,尽管这种下降趋势在学术研究合作中比较明显,但作为一种科学研究成果,Transformer算法是公开发表的,因此其传播外溢受国际竞争的影响较小。而且即使在中国没有设立法人实体的情况下,作为Transformer算法原始开发者的谷歌也通过代理机构在中国提交了大量相关知识产权申请[21],这意味着虽然Transformer算法率先出现在美国,但国际竞争并没有阻碍该算法作为一种科研成果向中国的扩散,中国因无法获得Transformer算法而无法进行相关风险投资的可能性并不大。

图表12.5:中美AI风投的投向结构

注:此处无人驾驶、聊天机器人、深度学习、机器学习来自Preqin的AI类别下的进一步细分,Preqin在具体细分时存在同时属于多个细分类别的情况。Transformer相关投资使用LLM、Transformer、Attention Mechanism等作为关键词进行搜索,对搜索结果中不符合条件的投资再手工删除。

资料来源:Preqin,中金研究院

更重要的是,中美在Transformer方面的风投大幅增长都是在2022年底ChatGPT成功吸引了全球关注后出现的,在2022年之前的中美AI风投主要还是集中在非Transformer的传统AI领域(图表12.5),相关的算法基本上都是基于传统深度神经网络。根据美国安全与新兴技术研究中心(CSET)2021年的研究,在传统深度神经网络主导的时代,中美在AI算法方面是互有长短的[22]。然而在2017年到2022年间,中国和美国在基于传统神经网络的AI风投细分领域,几乎均呈现美国风投金额上升、中国风投金额下降的态势。因此,无论是从传统的深度神经网络还是新兴的Transformer算法的角度看,均难以从技术限制角度理解中国AI风投在2017年到2022年出现的逆转性变化。

图表12.6:主要经济体AI优秀人才来源地和工作地

注:此处是Macropolo对于AI优秀研究者的来源地和工作地的统计,AI优秀研究者的界定是被人工智能顶级会议NeurIPS接收文章的作者,来源地是研究者本科毕业学校所在地,工作地是研究者工作机构总部所在地。

资料来源:Macropolo.org,中金研究院

第二种可能的原因是人才流失。针对为什么作为大语言模型核心的Transformer算法率先出现在美国,一个基本的共识是美国在AI人才方面具有优势,美国不但自己培养了大量AI人才,而且吸收了包括中国在内的大量AI人才去美国发展。图表12.6有关AI优秀人才来源地和工作地的数据也可以印证这一点,在2019年到2022年间,全球优秀AI人才的主要工作地是美国,而从人才来源地的角度来看,中国则是全球培养AI人才最多的国家。与此同时,中国AI优秀人才占全球AI优秀人才来源地的比例是持续远高于工作地的比例,而美国AI优秀人才占全球AI优秀人才来源地的比例持续远低于工作地的比例。也就是说,即便是在中国AI风投领先全球的时期,中国大概率也是AI优秀人才的输出国,当时的人才外流情况并没有成为制约中国AI风投繁荣的因素。更重要的是,在2019年至2022年年间,虽然整体看中国依旧是AI优秀人才流出国,但在中国工作的AI优秀人才比例从11%大幅增加到了28%,而在美国工作的AI优秀人才的比例则是从59%减少到了42%。也就是说,过去几年中国AI领域的人才状况其实是改善的,人才外流、短缺可能也难以作为同期中国AI风投逆转的主要解释因素。

综上,从产业三要素来看,除了技术限制与人才流失的两大流行看法外,风投市场资金短缺可能是第三个值得重视的备选解释。值得注意的是,中国AI风投虽在2017年后出现逆转,但这种变化并不局限于AI领域,更像是整个风投市场变化在AI风投方面的一个体现。以新增独角兽企业数量为例,在2017年之前,中美每年新增独角兽企业的数量是差不多的,甚至中国还略有领先,但此后被美国反超并显著拉开差距。在2021年和2022年,美国每年新增独角兽企业的数量甚至达到了中国的三倍以上(图表12.7)。也就是说,从大模型开发角度看,在2017-2022年最需要风投支持的阶段,中国风投培育优秀初创公司的能力相对美国却显著下降了。从募、投、管、退的风投四环节来看,募资即便不是造成这种结果的唯一因素,也是不容忽视的因素。

图表12.7:当年新增独角兽企业的数量

注:关于独角兽,PitchBook的定义是获得风险投资后估值达到十亿美元以上的初创公司。

资料来源:PitchBook,中金研究院

如图表12.8所示,美国在新冠肺炎疫情期间实施的宽松财政和货币政策推动了美国风投募资在2020年至2022年间的进一步增长。然而,中国风投市场的募资困难则早在2018年后便已显现。由于这一时期刚好和中美贸易摩擦重叠,因此曾有观点认为是美元基金撤出导致了风投的募资困难。对此,《创新金融:并非资本市场独角戏》一文曾进行过专门研究,发现内资自2008年后就已经占到了中国风投募资金额的一半以上,而且募资中外资绝对金额及其占比在2018年-2021年间是上升的。也就是说,过去几年风投募资乏力的主要原因在于内资,而不是外资。从股权投资基金的LP结构来看,2018年之后主要是来自于金融机构的资金出现了大幅下降[23]。2018年的资管新规明确要求[24]:“金融机构不得为其他金融机构的资产管理产品提供规避投资范围、杠杆约束等监管要求的通道服务。资产管理产品可以再投资一层资产管理产品,但所投资的资产管理产品不得再投资公募证券投资基金以外的资产管理产品”。

图表12.8:中国、美国风投的年度募资金额

注:此处为PitchBook于2023年统计的中美各年度的VC募资金额。 资料来源:PitchBook,中金研究院

需要强调的是,从过去几年实践来看,资管新规起到了治理金融乱象、防范系统性金融风险的良好效果,是完全必要的,这有利于风投机构摆脱潜在金融风险较大的传统募资方式,但也一定程度上造成了风险资本不足的约束。当募资变得困难时,风投机构在项目投资时自然也会变得更加谨慎,由此形成了对风险偏好的抑制作用。这或许也可以解释为什么过去几年风投金额与风投的风险偏好同时下降,这几年恰恰也正是新一轮AI技术进步亟需高风险偏好资金支持的时期。因此,2017年以来风投面临的募资总量问题日益严峻,或在一定程度上能够解释为什么中国风投未能有效支持这一轮的AI进步。不过,如果仅仅是募资总量困难,可能还不足以解释为何AI风投占中国风投整体的比重也在过去几年明显下滑,而非保持比重不变。对此,下文将结合大型科技企业的投资倾向进行探讨。

三、规模经济VS范围不经济:大企业的风险投资很重要

前文有关OpenAI融资模式的分析表明,对于将作为科学研究成果的Transformer算法试验开发为产业创新成果ChatGPT,风险投资发挥了关键作用,但资金来源不只是独立风投机构,还有微软这种大型科技企业。从规模定律的角度看,大型科技企业通过风险投资深度介入大语言模型开发的现象并非偶然,既有必要也很重要。但在过去几年,中国大型科技企业在AI领域的投资热情却出现下降,可能也是造成中国AI风投由领先到落后的原因之一。本文试图对这一现象进行深入探讨,以期总结出一些有启发性的创新金融含义。

(一)规模定律下的规模经济VS引领式创新的范围不经济

前文第六章从技术层面的规模定律带来经济层面的规模经济效应角度,阐述了AI与大企业互相赋能的逻辑,这是自深度神经网络占据AI主导技术路线以来就已经存在的规律,有关德国企业创新调查数据和美国企业投资与业绩表现的实证研究也印证了这一点[25]。大模型具有比传统深度神经网络更强的规模效应,因此逻辑上应该与大企业有更好的匹配性,微软在2019年后积极参与对改制后OpenAI的风险投资在一定程度上也能说明这一点。但这里还有个问题需要回答,如果大模型因为规模定律而天然地与大型科技企业更匹配,为什么率先开发出Transformer算法的谷歌,作为在AI领域有深厚积淀的大型科技公司,却未能将Transformer算法率先开发成大模型,而是由OpenAI这样一个初创公司完成了这一步?对此,我们认为一种可能的解释在于引领式创新对大企业有一定概率造成范围不经济的效果。

作为一种引领式创新,AI大模型具有原创性、颠覆性,是有别于当前主流产品的新产品。而大企业之所以是大企业,恰恰因为其产品正是当下的主流产品。因此,引领式创新天然带有颠覆大企业现有产品的属性。而企业规模越大,越意味着与现有产品绑定的内外利益共同体越多,也越意味着企业内部的交易成本较高、主动拥抱引领式创新的阻力越大。如果企业高管无视绑定在旧路径下的大多数利益共同体的利益,强行推动颠覆性的引领式创新落地,结果难免会产生范围不经济,例如IBM在发展个人电脑时,新产品的出现对于企业的有形资产、无形资产乃至管理构架而言,都一度起到了范围不经济的效果[26]。

谷歌在提出Transformer算法后,对于是否将其开发成大语言模型也面临着范围不经济的挑战。一方面,大模型可能冲击搜索引擎广告这一谷歌核心业务,Google Brain共同创始人曾表示“谷歌商业模式的核心动力是返回链接并将广告链接放在结果旁边,如果谷歌现在只是直接从模型中返回答案,这可能对广告商业模式造成影响”[27]。另一方面,引领式创新的颠覆性可能引发舆情风险,冲击谷歌无形资产。公众关注作为一种稀缺资源,通常更多集中在大型企业身上,这是大企业有别于小企业的无形资产,也有可能成为其从事颠覆性很强的引领式创新的阻碍。这在谷歌Duplex引发的舆情风险中体现得尤为明显。2018年谷歌推出用于预订餐厅的AI程序Duplex,该程序会模仿人类说话的语气,和ChatGPT均属于聊天机器人这一类的产品。相比于ChatGPT推出后收获的广泛赞誉,Duplex推出后曾引发了舆论不安,媒体一度大肆报道AI程序是如何欺骗人类的,《纽约时报》更是称Duplex“有些令人毛骨悚然”[28]。根据福布斯报道,Duplex事件可能是导致谷歌在发布人工智能产品方面进展缓慢的众多因素之一[29]。2019年时任谷歌人工智能主管Jeff Dean也表示,谷歌会因为推出一个犯错误的或输出不当内容的生成式人工智能工具而损失更多[30]。

接下来的问题是,既然大公司从事引领式创新可能面临着范围不经济的挑战,为什么同样是大型科技公司的微软,愿意开发ChatGPT呢?事实上,微软虽然也是大型科技公司,但与谷歌占据全球搜索引擎业务的91%相比(2024年4月数据)[31],微软在这个市场上仅是一个份额较小的追随者,它与小企业有类似的诉求,即通过弯道超车似的引领式创新,来颠覆占据主导地位的大企业。更重要的是,微软开发ChatGPT的方式并不是在自身内部以自研方式直接进行的,而是通过向小企业提供风险投资的方式进行的。小企业内部组织成本较小,不但不存在大企业那种范围不经济的风险,反而更有意愿通过引领式创新颠覆主导性大企业的市场地位。与此同时,创新的正外部性以及苹果公司站在巨人肩膀上成功进行引领式创新的案例,意味着小企业即便在技术上不够领先,也并不妨碍小企业将引领式创新的意愿落地为引领式创新的产品[32]。在此次大语言模型的开发上也有类似体现,与谷歌这种AI积淀雄厚的大公司相比,OpenAI在技术储备上虽存在先天不足,但可以通过雇佣开发出Transformer算法的谷歌研究人员的方式补齐短板[33]。

总之,从规模定律的角度看,大模型与大型科技公司是可以相互赋能、实现规模经济效应的。但是,大模型开发又是一种引领式创新,颠覆性较强,容易给大企业带来范围不经济。面对这种矛盾,大型科技公司采取向小企业提供风险投资的方式便成了一种相对理想的折中选择,既有望分享创新成功的规模经济收益,又可以实现自身与创新颠覆性的一定程度隔离,有利于弱化因为舆情风险等因素造成的范围不经济。对于直接推动引领式创新的小企业而言,以接受风险投资的方式引入大企业帮助,既在一定程度上有助于避免作为大企业内部研发部门而承受过高的大企业内部组织成本,又可以在一定程度上因分享大企业的资源而尽快聚齐大模型涌现所需要的资源。例如微软对OpenAI主要以云服务的形式进行投资,而算力正是大模型规模定律发挥作用不可或缺的因素。

事实上,这种协同作用也是企业系风投(CVC)相比于独立风投(IVC)的优势。一般而言,独立风投的资金大多来自于市场投资者,进行风险投资的目的大多是通过项目退出获取直接收益,通常有比较明确的投资期限。企业系风投则不同,无论是否设立专门的投资子公司或者投资部门,企业对非上市公司的投资资金主要来自于企业自身,投资目的不只是在被投标的上获取直接收益,而是更多服务于企业的整体发展战略。与独立风投相比,只要企业本身的存续不存在问题,企业系风投通常拥有更强的耐心和更灵活的投资期限,更有能力投资于研发周期长、不确定性高的创新项目。有研究基于2129家由风投支持的企业数据,比较了CVC和IVC对创新水平的不同影响,结果表明,在得到第一笔风险投资后,两组企业的专利数量及专利被引用次数均逐年提升;相较于IVC,CVC支持下的企业在专利数量和专利被引用次数方面的增幅更大[34]。

(二)在这一轮AI进步中,为什么中国大型科技企业的投资意愿不足?

如前述,大模型等AI技术的规模定律与大型科技企业能够实现相互赋能,因此大企业应该对投资AI持有积极态度,美国的情况基本上印证了这一点,但中国大型科技企业的投资热情似乎不及美国。以2023年英伟达的GPU订单量(市场预计值)为例,虽然腾讯是中国订单量最大的企业,但其数量仅为微软或Meta的三分之一。即便是中国四大头部互联网企业BBAT(字节跳动、百度、阿里巴巴、腾讯)的总订单量加起来,也不及微软或Meta一家的订单量(图表12.9上图)。这种差距可能由多种原因造成,一种常见解释是与芯片供应的限制有关。美国从2022年开始对面向中国的GPU实施了出口限制,规定超过一定标准的高性能AI芯片禁止向中国出口[35]。这或许影响了英伟达的高性能AI芯片对中国科技企业的供应。

图表12.9:中美大型科技企业2023年对英伟达H100芯片的采购量(预计值)及在AI领域的风险投资结构

注:上图为2023年英伟达H100出货数据(市场预计值);下图企业与上图企业基本一致,仅以英伟达替换了Lambda Labs和CoreWeave两家云服务器提供商。下图左为Preqin收录的各家公司在投资类别为Artificial Intelligence下的投资,每笔投资金额是各公司所参与的该笔投资(可能含其他投资人)的总金额,且不包括金额未披露的投资;下图右为Preqin收录的各家公司在投资类别为Artificial Intelligence下的投资,下图右为各公司所参与投资笔数的占比,包括金额未披露的投资。

资料来源:aibusiness.com[36],Preqin,中金研究院

值得注意的,美国对中国GPU“卡脖子”开始于2022年底,但中国大型科技企业对于AI的投资热情似乎是在2017年之后就降温了。本文以图表12.9中大量购买GPU的四家中国大型科技企业BBAT(字节、百度、阿里、腾讯)和六家美国大型科技企业加上GPU供货商英伟达(简称七巨头,包括Meta、特斯拉、谷歌、英伟达、甲骨文、亚马逊、微软)为样本,分析了过去十年间中美大型科技企业的AI风投情况。2017年以前中国BBAT的AI风投金额常年大幅超过美国七巨头,此后中国大型科技企业AI风投规模明显下降。2021年则是具有标志性的一年,美国七巨头的AI风投金额总和超过了中国BBAT。到了2022年,中国BBAT的AI风投金额规模在中美十一家大型科技企业中的比例已经不足40%(图表12.9下左图)。有关投资笔数的结构统计也印证了类似的变化(图表12.9下右图)。这些中美大型科技企业AI风投金额与笔数的占比变化,在一定程度上说明了GPU“卡脖子”或许不是造成中国大型科技企业AI投资意愿不足的主因。

图表12.10:平台企业CVC及其他VC的月平均投资次数变化

资料来源:Rong et al. (2023),中金研究院

原本积极投资AI的大型科技公司,为什么过去几年的AI风投偏好突然降低了?有三个因素的作用可能值得关注。第一个或许与规范平台发展有关。在经过初期的野蛮生长后,过去几年持续推出了一系列旨在规范平台发展的措施。以平台反垄断为例,2021年2月出台了平台经济领域的反垄断指南[37],旨在预防和制止平台经济领域垄断行为,保护市场公平竞争,对于促进平台经济规范有序创新、健康发展具有重要意义。事实上,针对平台企业的反垄断当时也是中、美、欧三大经济体的共同动向。一项研究发现[38],2021年2月后平台企业进行的CVC月均投资数量开始收缩(图表12.10)。这或许是因为大型科技企业的风投行为能够比较有效地与被投企业实现协同效应。

图表12.11:2018前后五年中美AI领域年均风投金额的行业分布

注:此处为Preqin中分类为Artificial Intelligence的投资在各行业中的分布情况。

资料来源:Preqin,中金研究院

第二个是原本的重点AI风投领域增长乏力。如图表12.11所示,网约车等交通服务曾是中国AI风投重点投资的产业,2014-2018年间的年均风投金额达到了51.4亿美元,位居AI风投首位;2019-2023年间的年平均风投金额下滑了近74%,仅有13.4亿美元。除了网约车外,金融也是影响AI风投的重要领域。2018年之前中国的金融科技投资活动非常活跃,对AI的应用也极为看重,2014-2018年间的年均风投金额约15.5亿美元,此后金融领域的AI风投出现大幅下降,2019-2023年间的年均风投金额仅为1.6亿美元,下滑近90%。

不过,从图表12.11有关2018年前后五年的年均AI风投金额比较来看,由领先向落后的转变主要原因倒并非因为中国AI风投的绝对金额下降,而是因为美国增长的速度在过去几年远超中国。当然,中国也有增长的领域,例如汽车零部件、电子等硬科技领域的AI年均风投金额,由前五年的8.5亿美元、4.4亿美元分别上升后五年的37.5亿美元、13.9亿美元。美国之所以增长更快,不只是汽车零部件、生物技术等硬科技领域的增长比较快,更重要的是软件领域投资增长较快。软件不仅是美国2018年对AI进行投资最多的行业,前五年的年均风投金额大约是62.5亿美元,后五年的年均风投金额高达307.0亿美元,增长了近四倍。与此同时,软件领域虽然在2018年前也是中国第二大的AI风投的目标领域,但在后五年中似乎出现了失速问题,年均风投金额从前五年的24.7亿美元增加到了后五年的31.4亿美元,涨幅仅有27%。

图表12.12:2018年后,中国风险投资结构由软创新为主走向硬科技为主

注:此处根据清科私募通整理的股权投资九大热门行业(互联网、IT、电信及增值服务、娱乐传媒、生物技术/医疗健康、清洁技术、机械制造、半导体及电子设备、金融)的投资数据进行分类,我们将互联网、IT、电信及增值服务、娱乐传媒归类为软创新,将生物技术/医疗健康、清洁技术、半导体及电子设备归类为硬科技,将机械制造单独归为一类。

资料来源:清科私募通,中金研究院

也就是说,从行业结构看,软件领域的AI风投增长乏力是过去几年中美AI风投形势逆转的主要原因。与此同时,软件恰恰是中国大型科技企业业务的主要承载形式,美国也不例外。除了英伟达和特斯拉外,软件也是Meta、谷歌、甲骨文、亚马逊、微软等五家美国大型科技企业业务的主要承载形式,如果考虑到特斯拉并非传统的汽车制造企业,智驾软件是其重要的卖点,那么软件在美国大型科技企业业务中扮演的角色将越发重要。与此同时,无论是在模型层还是应用层,软件也都是AI的主要承载形式;即便是在未来人形机器人大量普及的阶段,未来人形机器人区别于传统机器人的关键也是在于软件而非硬件。由此而来的问题是,聚焦软件开发的创新通常被认为是软创新,过去几年资本市场的投资理念强调支持硬科技的同时对软创新重视程度不足(图表12.12),这或许构成了为什么大型科技企业AI投资热情下降的第三个解释因素。

四、思考与启示

从2017年Transformer算法提出到2022年ChatGPT成功,支撑五年试验开发的融资模式表明,大模型的规模定律意味着要有大投入支持,仅靠公益捐赠难以支撑OpenAI的成功,风险投资的作用至关重要。2017年中国AI风投金额(约256亿美元)及其占风投总额的比例(高达29%)在主要经济体中均位居第一,但在随后的五年这两项指标快速下降,不但AI风投金额被美国反超且差距日益拉大,AI占风投总额的比重也被美国甚至欧盟反超,印度也形成对中国AI风投的加速追赶态势。中国AI风投从领先变成了落后,在一定程度上影响了中国在本轮AI进步中抢占先机。风投这种由领先到落后的变化不只存在于AI领域,中国风投市场培育“独角兽”的能力也有所下滑,在被美国反超的同时,也在一些方面被印度等国家加速追赶。

从募、投、管、退四环节来看,中国风投市场从领先到落后的转变可能与过去几年的募资困难有关。资金约束既减少了可用的风投资金总量,也抑制了风投风险偏好,导致中国风投过去几年难以支撑ChatGPT这种不确定性较强的引领式创新。另一方面,大型科技企业投资积极性下降的影响也不容忽视,这会影响风险投资市场的投资、管理效率。规模定律作用下,大模型或将比传统深度学习更有利于大企业。从大型科技企业的AI风投金额来看,2018年之前中国远高于美国,此后被美国反超。总之,过去几年中美AI产业发展差距拉大的原因比较复杂,AI风投由领先变成落后是其中不容忽视的原因之一。至于未来是否需要奋起直追,目前各界也是存在分歧的。对此,有关AI发展究竟是先发优势还是后发优势的分析或许能给出一些启发。本文从算力层、模型层、应用层三个方面进行一些初步探讨。

①算力层:传统摩尔定律面临极限,芯片制程进入规模报酬递减阶段,新计算架构、非硅基半导体等新技术路线尚处于研发初期,我们认为中国存在加速追赶的可能性;芯片制造规模效应决定了大企业应是追赶主力,大国需求有利于支撑我国构建大企业主导的追赶式创新金融模式。②模型层:大模型进入涌现阶段,涌现作为规模定律的规模报酬递增阶段,意味着美国存在先发优势。与此同时,美国政府直接干预相关人才、算力乃至数据的自由流动,意图通过政策干预强化这种先发优势。在这种背景下,中国本就存在后发劣势,美国政府的政策干预有可能进一步增加中国相关企业的追赶难度。考虑到全球化放缓的挑战后,中国在这种局面下不宜被动等待先发者的模型层突破,而是需要通过政策助力推动积极探索大模型前沿,为后续追赶打下基础,避免再次出现手机操作系统突然断供式的被动。③应用层:美国在内的很多国家均在探索大模型应用场景,成熟的成功案例尚少,美国在大模型的应用层暂时尚未建立起Oracle、Office那种已经实现规模经济、范围经济的先发优势。值得注意的是,OpenAI于2024年5月发布了GPT-4o,显示出美国也在加速应用层的探索,意味着这个有利于后发者追赶的因素存在削弱风险。有鉴于此,中国可考虑充分利用好应用场景丰富、潜在需求多样的大国规模优势,加速孕育具有原创性引领性的应用层创新。这需要克服一系列挑战,例如风投募资困难、大型科技企业投资意愿不强、先进算力不足、有效需求不足等。综上所述,以大模型为代表的本轮AI技术进步方兴未艾,考虑到全球化放缓的背景后,我们认为中国比较理想的做法是尽快追赶,这需要一系列有助于算力层与模型层加速追赶、应用层不断探索引领式创新的政策支持。

除需要财政资金更多支持有利于AI进步的需求扩张外,前文分析表明更需要推动制度建设以破除不利于AI加速发展的供给侧约束,构建双支柱创新金融模式即是其中的重要一环。①完善算力等AI基础设施需要“大企业+大银行+大政府”的追赶式创新金融模式。具体而言,需要发挥大企业在创新要素积累(更多的知识产权、人力资本、研发投入)方面的优势,同时由大银行为大企业的追赶式创新活动提供长期、稳定、大量的资金支持。此外,政府部门可以通过合理的制度设计来加速追赶式创新,例如协调大企业组成一体化的追赶式创新集团、协调大银行为大企业追赶式创新提供资金支持、通过政府(国企)采购等方式打破需求侧路径依赖进而为“卡脖子”的国产替代品打开销路等。在AI领域可考虑:构建大型半导体企业集团以尽快突破芯片产业链、算力层“卡脖子”问题;由大型科技企业通过购买等多种形式加速提升算力自给能力,并建议接受政策性金融资助的大型算力平台,以普惠价格重点满足中小企业算力需求,支持模型层、应用层的探索与创新;在统筹考虑数据等要素安全可控的情况,着重支持大型科技企业探索大模型前沿。

根据前文研究,此处需要对如何看待大型科技企业的市场势力进行一些探讨。对于科技行业而言,企业如果无法持续提升创新能力,或者说如果创新失败,有可能会被市场竞争淘汰;即便企业能够持续地成功创新,也有可能成为自身市场地位的颠覆者。也就是说,相比于不是通过创新获得的市场势力而言,创新型企业的市场势力具有内在不稳定性,这即是科技企业的“创新悖论”[39]。以美国标普500为例,1995年日常消费品市值排序前十的企业,有七家仍位列2020年的市值排序前十;但在信息技术行业,1995年市值排序前十的企业,只有两家在2020年仍跻身市值排序前十之列(图表12.13)。也就是说,创新悖论意味着大型科技企业的市场势力具有内在不稳定性,无需过于担忧。此外,在大模型时代,大型科技公司事实上已经成为国际竞争的重要载体,在衡量其市场势力问题时也可考虑兼顾内外竞争的需要。

图表12.13:美国标普500信息技术和日常消费行业市值排名前十的公司

资料来源:Bloomberg,《企业边界、萨伊定律与平台反垄断》(2021),中金研究院

②对于探索大模型的产业化应用而言,很多情况下没有先例可循,需要“中小企业+资本市场+制度建设”的引领式创新金融模式支持。这里有必要对资本市场促进引领式创新的机制进行一般性探讨。首先需要认识到中小企业是引领式创新的主力军,营造有利于中小企业进行引领式创新的制度环境至关重要。我们认为这一方面需要构建有利于不同所有制、不同规模企业公平竞争的市场条件,另一方面需要防范大企业对中小企业利益的侵害,注重保护中小企业合法权益。美国在促进中小企业创新方面的一些做法可能值得参考,包括通过财政拨款和担保融资等方式着重资助小企业的研发,或者在10万美元以下的政府研发采购合同中明确要求优先考虑小企业,严厉打击大企业对小企业知识产权的侵犯行为等[40]。

其次,引领式创新金融模式的关键在于充分发挥资本市场的生态效应和筛选效应。通常而言,为科技创新进行融资的模式大致可以分为财政主导、银行主导与资本市场主导三类。这三类模式各有其优劣:苏联是财政主导创新融资模式的典型代表,长处是能够精准服务政府意图、支持公共品创新,不足在于难以有效促进经济利益导向的产业创新,可持续性不足[41];日本、德国是银行主导创新金融模式的典型代表,长处是能够有效支撑产业的追赶式创新,但无法有效支持引领式创新,难以摆脱追赶者的地位[42];美国是资本市场主导型创新金融模式的典型代表,虽然资本市场融资规模通常比不上银行体系、服务政府意图的精准性也比不上财政,而且由于对制度建设水平有较高要求因而通常难以回避交易成本较高的问题,但其长处是能够有效促进引领式创新[43]。之所以支持引领式创新既不适合风险偏好较低的银行,也不适合追求精准服务政府意图的财政,很大程度上是因为它具有较强的原创性、颠覆性,因而不确定性较大。

这种不确定性体现为动、静两个维度。静态维度来看,不完全理性决定了人类不可能精准、完整认识到任一时点上万事万物之间的所有逻辑联系,这意味着如果在培育引领式创新的过程中追求精准、采取“指哪打哪”的思路,则可能会经常面临“有意栽花花不发,无心插柳柳成荫”的问题。例如作为一种“卡脖子”的硬科技,GPU发明之初并不是为AI模型训练服务的,而是满足游戏这种软创新对于高清画质的需求[44]。从反事实假设的角度看,如果电子游戏因为种种原因而发展受限或被禁止,则GPU的发展乃至本轮AI进步都可能会滞后。类似的问题不只出现在软创新与硬科技之间的关系上,也出现在如何认识需求扩张与科技创新之间的关系上。通常而言,硬科技之所以重要并非因为它是硬科技,而是因为它是满足需求不可或缺的中间投入品。以芯片为例,之所以很重要并非因为它是硬科技或者存在“卡脖子”问题,而是因为它是满足电子产品等消费需要不可或缺的中间投入。

AI也有类似的问题,人类之所以需要AI通常并非为了直接消费AI,而是因为AI作为一种技术有助于更好地满足消费等需求。如图表12.14所示,2018年AI行业的业务收入格局表明,来自于互联网、金融、安防、消费电子、教育、医疗等方面的需求,是支撑AI发展的最主要驱动力。由于种种原因,过去几年这些方面的需求出现了放缓或明显下降,在一定程度上抑制了AI风投的积极性。因此,对于促进创新尤其是原创性颠覆性较强的引领式创新而言,应当客观地认识到人类的不完全理性问题,承认横截面上万事万物间可能存在尚未认识到或无法精准认识到的逻辑联系。

图表12.14:2018年中国AI市场构成

资料来源:赛迪顾问,中金公司研究部[45],中金研究院

基于这种静态不确定性认识,可能有必要反思“只有支持硬科技才是支持创新、只能支持科技不能支持消费”的资本市场投资观念。实际上,硬科技和软创新、需求侧与供给侧、生产与消费都是资本市场创新生态中不可忽视的组成部分。这种资本市场促进引领式创新的生态效应,或许也在一定程度上解释了,为什么在科技进步较快的时期,美国资本市场给予融资支持最多的不是那些技术进步最快的制造业,而是公用事业、金融等技术进步较慢的部门[46]。在当前大模型尚未探索出成熟应用场景的情况下,尤其需要重视商业模式创新等软创新问题。正如罗默所指出的:最重要的创新是商业模式的创新[47]。企业不断地去尝试、有取舍地进行商业模式创新,这是真正能够促进内生增长的因素。中国在互联网时代的成功经验也表明,商业模式的创新在推动行业进步、满足市场需求乃至形成新的生产力方面都发挥着至关重要的作用。总之,硬科技与软创新、科技进步与需求扩张、生产与消费之间的相辅相成生态,是资本市场能够有效支持引领式创新的重要优势之一。

除了前述静态不确定性外,引领式创新还存在动态不确定性的问题。所谓动态不确定性,也是来源于引领式创新的原创性、颠覆性,这意味着没有人能够在事前准确预知当前技术路径与未来能否成功之间的因果联系,甚至连模糊的因果方向都难以确定。这与追赶式创新有很大不同。以AI大模型为例,当OpenAI成功开发出大语言模型后,后发者开发大语言模型时所面临的追赶式创新风险,与OpenAI当年所面临的引领式创新风险不可同日而语。这根本的差别就在于OpenAI作为原创者没有先例可循,追赶者却可以从先发者的成功案例中知道大致的探索方向。我们认为支持这样一种具有高度动态不确定性的引领式创新,既不适合追求精准的财政资金,也不适合追求低风险的银行资金,而是需要发挥资本市场的筛选效应。

大模型的发展历史从一个正面展示了资本市场筛选效应的重要性。当前,各界都已经知道基于Transformer框架能够研发出大语言模型,这是因为OpenAI在2022年发布的ChatGPT已经证明了这一点。但对于2022年前有意支持大语言模型开发但追求精准的投资者而言,不但面临着Transformer和非Transformer技术路线并存的研发局面,即便是在Transformer架构下,大语言模型开发也没有在2017年后形成统一的技术探索方向。如图表12.15所示,从2018年到2020年,Transformer框架下存在三个不同的大模型开发具体方向,即“Encoder-Only”路径、“Encoder-Decoder”路径以及“Decoder-Only”路径,OpenAI的技术路径也在其中。更有意思的是,在2022年ChatGPT成功发布之前,一度更受各界青睐的并非OpenAI选择的那条道路[48]。面对如此巨大、复杂的动态不确定性,对于2022年前追求精准的低风险偏好投资者而言,如何能够先验地预知Transformer框架会成功?即便能够幸运地选择了支持Transformer框架,又如何能够无视主流而在事前就能够精准选择出那条必然会成功的技术路径?

图表12.15:回到ChatGPT开发成功之前,应该筛选出哪条技术路线?

注:图中左侧灰色的分支是不基于Transformer算法的技术路线。

资料来源:Yang et al. (2024),中金研究院

事实上,由于这种动态不确定性的存在,即便是资本市场也无法在事前做到对引领式创新的精准筛选。那为什么看起来经常是资本市场而非财政或者银行,在成功培育一个又一个的引领式创新?虽然不能排除少数睿智投资者慧眼独具的贡献,但更大贡献可能来自于资本市场筛选效应的分布式特点。作为一种直接融资模式,资本市场的投资者高度多元化,这是与财政主导、银行主导科创融资模式的重要不同之一,意味着资本市场对创新路径的筛选是高度分布式的,这有利于从两个方面提高对引领式创新的支撑效率:一方面引领式创新风险分布高度分散,由风险偏好高度分散的资本市场投资者去筛选,能够提高各类创新路径均能获得金融支持的可能性,有利于降低筛选失败的概率,例如图表12.15中的各条技术路线事实上都有风险投资者在给予资金支持[49];另一方面引领式创新是否能够成功最终由需求方决定,一个参与者构成具有广泛代表性的资本市场,与需求方重叠性更高,由资本市场去筛选有利于提升筛选成功的概率。

总之,为提升资本市场促进引领式创新的能力,建议在严格反欺诈的基础上,重视发挥资本市场的生态效应与筛选效应,尤其是需要注重实现风投与股市有效互动的创新生态,让多元化的投资者去分散做出筛选。研究表明,风投是促进引领式创新的主战场,股市作为风投最重要的退出渠道之一,繁荣的股市是提升风险投资意愿、促进长线资金入市的关键所在[50],因而也是资本市场促进引领式创新的关键一步。在股市繁荣的基础上,参考OpenAI的融资经验,可以进一步调动大企业与高风险偏好人群的投资意愿,以解决风投市场长线资金不足问题;更多元化的投资者结构,也有利于进一步丰富投资者的风险偏好分布,提升资本市场的筛选效应。尤其值得注意的是,鉴于AI规模定律与大企业天然更匹配,因此有必要充分重视大型科技企业风投的积极作用。如前述,由于研发驱动的大型科技企业存在“创新悖论”,因而以市场份额衡量的市场势力具有内在不稳定性。对于大型科技企业的反垄断思考,我们认为或需摒弃结构主义的市场份额视角,更多关注行为主义的可竞争性视角。也是从这样一个可竞争性视角出发,对于大型科技企业资本扩张行为是否无序的关注,或可更多看其是否介入了存在政府担保的存贷款业务/准银行类金融业务。因为这类业务的市场壁垒来自于行政垄断,具有相当程度的不可竞争性。如果大型科技公司不存在这类产融结合问题,则无需要太担心风投对于其市场势力的增强作用。

另一方面,股市作为风险投资者重要的退出渠道,股市繁荣与否不但影响了风投市场的活跃度,股市IPO偏好也会直接决定风投市场的投资偏好。也就是说,增加股票市场注册制包容性,不仅是发挥资本市场兼顾硬科技与软创新、科技与消费、供给与需求等创新生态优势的重要一步,也是资本市场筛选效应能否正常发挥作用的关键所在。当然,这需要建立在于严格的反欺诈等中小投资者保护制度的基础上。现代资本市场的研究表明,大股东可能会利用控制权,通过资金占用、关联交易、兼并收购等方式掏空上市公司资产,实现利益输送[51]。由于有限责任制度导致大股东和中小投资者处于天然的不公平交易地位。即便是资金实力雄厚的长线投资机构而言,在具有实控地位的大股东面前依旧是处于中小投资者的地位。从这个角度看,没有严格的中小投资者保护制度,将不利于提振长线资金入市意愿,进而不利于资本市场创新生态的构建与筛选效应的发挥。但要说明的是,将资本市场反欺诈重点放在事后而非事前,通过构建激励相容的反欺诈生态来实现中小投资者保护目标,本身既是资本市场创新生态的一个重要体现,也有利于为筛选效应留下更大的发挥空间。具体而言,可以考虑构建“上市公司-看门人-监管者-公众”的反欺诈生态,在这样一个生态链中,既需要集体诉讼机制来震慑上市公司与看门人的机会主义动机,也要建立起激励相容的监督机制,设立举报人保护与奖励计划来弥补监管者的信息劣势。在这个过程中,完善信息公开机制,让公众发挥“最终监督者”角色也是不可或缺的[52]。

[1]《中庸策·双支柱举国体制》之“第四章  基于美、苏比较的美国科创举国体制研究”,中金研究院2022年。

[2]Vaswani, Ashish, et al. "Attention is all you need." Advances in neural information processing systems 30 (2017).

[3]《中庸策·双支柱举国体制》之“第五章  美国创新链资助政策及WTO规则兼容性分析”,中金研究院2022年。

[4]通常而言,风投的定义有广义和狭义之分:广义风投包含了独立风投、政府风投、企业风投等投资机构对非上市公司的股权投资;狭义风投通常是指对初创企业的风险投资,与之相并列的还有投资更早期的天使投资以及投资中后期的PE投资。本文所称的风投均是指广义风投,即各类投资者对非上市公司的股权投资,包括了天使、VC、PE等形式。

[5]OpenAI官网:Our mission is to ensure that artificial general intelligence benefits all of humanity. https://openai.com/about

[6]https://openai.com/our-structure/

[7]https://openai.com/our-structure/

[8]https://openai.com/index/ai-and-compute/ 该研究对比的是2012年AlexNet和2017年AlphaGo Zero的算力需求。

[9]即Capped profit company,https://openai.com/our-structure/

[10]https://openai.com/index/openai-lp/

[11]https://finance.yahoo.com/news/vinod-khosla-details-much-venture-134826473.html

[12]https://www.aceventurefunds.com/portfolio-companies/openai; https://openai.com/index/microsoft-invests-in-and-partners-with-openai/

[13]https://www.aceventurefunds.com/portfolio-companies/openai

[14]https://siliconangle.com/2023/05/05/report-openai-weighs-raising-more-funding-losses-doubled-2022/

[15]https://www.cnbc.com/2023/01/10/microsoft-to-invest-10-billion-in-chatgpt-creator-openai-report-says.html

[16]https://techcrunch.com/2023/04/28/openai-funding-valuation-chatgpt/

[17]https://www.cnbc.com/2023/11/30/openai-tender-offer-on-track-despite-leadership-fracas-sources.html

[18]https://openai.com/index/scaling-laws-for-neural-language-models/

[19]Mowery D, Rosenberg N. The influence of market demand upon innovation: a critical review of some recent empirical studies. Research Policy. 1979;8(2):102-153-153. doi:10.1016/0048-7333(79)90019-2

[20]Priem, J., Piwowar, H., & Orr, R. (2022). OpenAlex: A fully-open index of scholarly works, authors, venues, institutions, and concepts. ArXiv. https://arxiv.org/abs/2205.01833

[21]中国国家知识产权局:http://epub.cnipa.gov.cn/,如2024年3月12日谷歌被授予发明专利“基于关注的图像生成神经网络”(授权公告号CN 109726794 B)。

[22]Chahal H, Toner H, Rahkovsky I. Small data’s big AI potential[J]. Center for Security and Emerging Technology, 2021.

[23]《创新:不灭的火炬》之“第十六章 创新金融:并非资本市场独角戏”,中金公司研究部、中金研究院,中信出版社,2022年。

[24]https://www.gov.cn/gongbao/content/2018/content_5323101.htm

[25]Rammer C, Fernández GP, Czarnitzki D. Artificial intelligence and industrial innovation: Evidence from German firm-level data. Research Policy. 2022;51(7). doi:10.1016/j.respol.2022.104555. Babina, Tania, et al. "Artificial intelligence, firm growth, and product innovation." Journal of Financial Economics 151 (2024): 103745.

[26]《创新:不灭的火炬》之“第十六章 创新金融:并非资本市场独角戏”,中金公司研究部、中金研究院,中信出版社,2022年。

[27]https://www.fastcompany.com/90839649/google-not-openai-has-the-most-to-gain-from-generative-ai

[28]https://www.forbes.com/sites/richardnieva/2023/02/08/google-openai-chatgpt-microsoft-bing-ai/?sh=d287dfc4de4f

[29]https://www.forbes.com/sites/richardnieva/2023/02/08/google-openai-chatgpt-microsoft-bing-ai/?sh=d287dfc4de4f

[30]https://www.fastcompany.com/90839649/google-not-openai-has-the-most-to-gain-from-generative-ai

[31]https://gs.statcounter.com/search-engine-market-share(2024年5月18日访问)。

[32]中金研究院、中金公司研究部:《大国产业链》之“第七章 产业链纵横与双支柱举国体制”,中信出版社,2022年。

[33]https://www.forbes.com/sites/richardnieva/2023/02/08/google-openai-chatgpt-microsoft-bing-ai/?sh=74884bd44de4

[34]Chemmanur T J, Loutskina E, Tian X. Corporate Venture Capital, Value Creation, and Innovation[J]. Review of Financial Studies, 2014, 27(8):2434-2473.

[35]美国商务部工业和安全局(Bureau of Industry and Security,“BIS”):Commerce Implements New Export Controls on Advanced Computing and Semiconductor

Manufacturing Items to the People’s Republic of China (PRC) ,2022年10月17日。该禁令发布后,英伟达表示其在2023年9月1日前可以继续通过其香港办事处进行A100和H100订单履行和物流。https://36kr.com/p/1897425081362816

[36]https://aibusiness.com/verticals/nvidia-shipped-half-a-million-gpus-in-q3-for-ai-training

[37]https://www.gov.cn/xinwen/2021-02/07/content_5585758.htm

[38]Rong et al. (2023), Antitrust Platform Tech Regulation and Competition: Evidence from China, working paper.

[39]《中庸策2022·双支柱举国体制》之“第八章 企业边界、萨伊定律与平台反垄断”,中金研究院,2022年12月。

[40]《中庸策2022·双支柱举国体制》之“第五章 美国创新链资助政策及WTO规则兼容性分析”,中金研究院,2022年12月。

[41]《中庸策2022·双支柱举国体制》之“第四章 基于美苏比较的美国科创举国体制研究”,中金研究院,2022年12月。

[42]《大国产业链》之“第七章 应对纵横风险:构建双支柱举国体制”,中金公司研究部、中金研究院,中信出版社,2023年。

[43]《创新:不灭的火炬》之“第十六章 创新金融:并非资本市场独角戏”,中金公司研究部、中金研究院,中信出版社,2022年。

[44]Dally, William J., Stephen W. Keckler, and David B. Kirk. "Evolution of the graphics processing unit (GPU)." IEEE Micro 41.6 (2021): 42-51.

[45]《人工智能:如何把握计算机视觉 公司上市元年的投资机会》,中金公司研究部,2020年12月29日。

[46]Edited by Naomi R Lamoreaux, Kenneth L Sokoloff: Financing Innovation in the United States, 1870 to Present, MIT Press, 2009.

[47]出自罗默在2019年企业内生增长高峰论坛上的发言,https://www.imsilkroad.com/live/p/383436.html

[48]Yang, Jingfeng, et al. "Harnessing the power of llms in practice: A survey on chatgpt and beyond." ACM Transactions on Knowledge Discovery from Data 18.6 (2024): 1-32.

[49]根据PitchBook数据,在图表12.15所示的各个技术路线上都有诸多大企业、独立风投的资金支持。

[50]《创新:不灭的火炬》之“第十六章 创新金融:并非资本市场独角戏”,中金公司研究部、中金研究院,2022年中信出版社。

[51]Stijn Claessens, Disentangling the Incentive and Entrenchment Effects of Large Shareholdings, The journal of Finance, December 2002.。Randall Morck, Management ownership and market valuation: An empirical analysis, Journal of Financial Economics, March 1988. 白重恩等:《中国上市公司治理结构的实证研究》,《经济研究》,2005年第2期。李增泉,孙铮,王志伟,《“掏空”与所有权安排》,《会计研究》,2004年第12期。

[52]《中庸策2023·双支柱金融体系与好的社会》之“第三章 为推动创新,是否应该直接干预估值?”,中金研究院,2023年12月。

本文摘自:2024年7月1日已经发布的《第十二章 AI风投从领先到落后的创新金融启示》

谢超 分析员 SAC 执证编号:S0080520100001 SFC CE Ref:BTM576

李根 分析员 SAC 执证编号:S0080523030009 SFC CE Ref:BUO963

吴云杰 分析员 SAC 执证编号:S0080523020001

白皓 联系人 SAC 执证编号:S0080122080037

颜晓畅 联系人 SAC 执证编号:S0080122070232

蔡志刚 联系人 SAC 执证编号:S0080123040058

陈昊 分析员 SAC 执证编号:S0080520120009 SFC CE Ref:BQS925

于钟海 分析员 SAC 执证编号:S0080518070011 SFC CE Ref:BOP246

李彤玥 分析员 SAC 执证编号:S0080524020005 SFC CE Ref:BTJ991

尹学钰 联系人 SAC 执证编号:S0080123070035

曲博文 联系人 SAC 执证编号:S0080123120025

加载中...