词元经济研究的三个基础
中国经济时报
关于词元经济系列研究的说明
在《一份关于词元经济研究的问题清单》(刊发于本报2026年4月21日)一文中,我们从现实出发,系统性地提出了有关词元经济研究的若干问题。从人工智能实际应用的程度和范围来看,当前我们正在进入智能时代。智能时代的经济运行方式较过去发生了变化,对经济理论研究的创新发展提出了迫切需要;从国家治理的角度来看,也迫切需要深刻理解智能时代的技术经济规律,以更好地在创新与保护、效率与公平、开放与安全间寻求平衡。为此,我们将开启一个关于词元经济的系列研究。本系列研究的直接目的是,为智能时代提供一个系统的经济分析基础框架,最终目的是为构建适应智能时代的治理体系提供理论基础,引导智能时代的生产要素更好参与生产,更好服务于提升全要素生产率,更好促进更加包容共享的发展,实现社会整体福祉的跃升。我们的工作只是一个引子,词元经济所代表的智能经济还只是开始,对智能经济的治理是一个与之相伴的过程,需要根据智能经济的发展而持续发展,也需要社会共同学习和适应。我们希望本系列研究提供的框架,能为此作出一点贡献。今天刊发第一篇。
中国经济时报编辑部
2026年4月27日
图片来源/新华社
词元经济研究的三个基础
■钟时
对词元的本质的研究,是后续研究的基础。
在西方经济学里,对于增长的研究,我们用的是生产函数。其中劳动、资本、土地是传统生产要素,同时把全要素生产率作为技术进步的衡量指标,以此来解释经济的增长。这也就意味着,在西方经济理论中,增长主要来自劳动资本的增长,还有技术的进步。基于西方经济理论产生的国民经济核算,也只考虑用货币来衡量的商品和服务的数量。这就是整个西方经济理论及实践的基本逻辑。这其中有一个很重要的因素——技术进步,在生产函数中没有引起足够的重视,技术进步在实践中的作用却越来越受重视。
我们知道,技术的进步来源于人类知识的进步和积累。然而,知识虽然被认为是经济增长的核心,在经济学分析中却长期处于一种尴尬的地位——人人都说它重要,却没有人能说清它具体是如何“计入”经济增长的。技术进步在增长核算中,常常表现为扣除劳动、资本贡献后的那个神秘的“余值”,经济学家称之为“全要素生产率”。这个“余值”像个黑箱,我们感知到它的力量,却难以打开它看个究竟。人工智能时代的到来,为我们提供了打开这个黑箱的钥匙。
一、知识测量是个千年困境
知识是用语言和符号来表达的。知识的传统载体就是各种各样的文献资料、书籍。在生产中,人们通过阅读、理解、加工、整合,最终体现在各种各样的物品和技术中。在人工智能时代,大模型的本质就是一种新型的知识载体,它把很多人类知识包括其中,而词元的本质就是有具体意义的最小的语言符号单位。
在传统生产中,人利用知识生产的过程难以精确衡量,所以导致无法在生产函数中进行表达。并且在传统生产中,人利用知识有很强的个性特点,有很大的局限性,只限于自身所掌握的知识,并且产出速度与人的生物读写速度相匹配。在人工智能时代,这种情况发生了天翻地覆的变化。人利用知识的方式方法与人的个性的关系明显减弱,能用到的知识范围远远大于一个人甚至一群人的知识内容,并且产出速度是机器速度。这也就是说,在人工智能时代,知识有了新载体,知识的利用也变了。知识的利用不再那么有个性化,而是更加具有社会性。这种社会性不是通过人和人的实际交流产生的,而是通过大模型来实现的,只是这种社会性容易被忽视。
但是,对于知识在人脑中如何利用始终面临着一个根本困境——不可观测和计量。在漫长的历史中,知识主要储存在人脑中,通过口耳相传。人脑学习运用知识,也是知识存储载体,优点是有创造性,但缺点是易逝且高度个体化。一个人学习、思考、产生灵感的过程,就像一场发生在自己大脑里的“思想风暴”,外面的人看不见、摸不着,更无法测量这场“风暴”的强度。后来,文字和印刷术让知识得以记录在书籍、文献中,知识变得可以跨越时空传播,但它依然是静态的、离散的。一本书放在图书馆里,它里面蕴藏的知识被多少人理解、吸收、应用,产生了多少新价值,这个过程依然是模糊的。到了信息时代,知识被数字化,存储在数据库中,获取变得前所未有地方便。但这依然没有解决这个根本问题,当一个人从数据库里调取知识,然后在大脑中进行理解、加工、再创造,这个最关键的价值增值过程,仍然是不可观测的“黑箱”。
正是这种“不可测量性”,导致了经济学在对待知识时的简单化处理。在经典的增长模型中,知识往往被压缩成一个代表“技术水平”的字母,比如“A”,被当作是外生给定的。后来的理论虽然尝试将知识积累内生化,视其为研发投资的结果,但模型中“知识”通常仍是一个笼统的存量概念。我们无法精确刻画知识从储存状态“流动”到生产线、转化为产品和服务的动态过程。这就形成了一个根本矛盾:知识是公认的增长源泉,却是经济分析中最难处理的短板。问题的症结在于,我们一直缺乏一个工具,像衡量一吨钢铁或一小时劳动那样,去衡量“知识”这种特殊的生产要素,究竟是如何直接参与到价值创造过程中的。
二、人工智能让知识变得“可见、可量、可联”
在人工智能时代,特别是大模型出现之后,情况发生了根本性变化。大模型的本质,就是一种新型的知识载体。它不像书籍那样被动存储,也不像数据库那样需要精确查询,而是通过对人类海量语言和知识进行学习,形成了一个能够理解、关联和生成知识的复杂系统。这不仅仅是一个技术工具的革命,更从三个层面,对知识的经济属性进行了重塑,为我们观测和分析知识参与经济活动打开了全新的窗口。
一是知识成为“通用性很高的生产资料”。在过去的生产方式中,知识更多是背景性的。工匠的技艺存在于他的经验和手感中,工程师的智慧体现在他的设计和图纸上。知识融入在人和工具中,但很难被单独剥离出来作为一种标准化的要素投入。人工智能和大模型改变了这一点。它把散落在各处的人类知识,工程化地集成在一个可调用的系统里。当企业或个人可以通过API(应用程序接口)调用同一个大模型的服务来辅助研发、设计、写作时,他们实质上是在直接采购和使用一种新型的具有很高通用性的“知识生产资料”。
这在经济学上的意义是深远的。构建大模型需要天文数字般的固定投入(算力、数据、算法研发),但一旦建成,每多提供一次知识服务的边际成本却非常低。知识正从一种依附于个体的、稀缺的“无形资产”,向一种具有公共基础设施特性的、可规模化供应的“生产资料”转变。这意味着,知识不再是模糊地影响生产的背景,而是可以像用电一样,被清晰计量和购买的直接生产投入。
二是知识的使用变得“可精确计量”。在传统生产中,人利用知识生产的过程是难以精确衡量的。一位科学家苦思冥想一个新理论,一位工程师构思一个复杂结构,其中包含了多少“知识调用量”我们无从得知。这导致知识贡献无法在生产函数中被清晰表达。人工智能时代,这个难题出现了突破的契机。我们与大模型交互,无论是提问还是得到回答,本质上都是“词元”的输入和输出。
一次完整的大模型交互所消耗的输入和输出词元总数,可以近似地衡量这次“知识服务”的规模。这就好比,我们以前知道工厂用电很重要,但不知道每个环节具体用了多少。现在有了智能电表,可以精确记录每台设备消耗的“千瓦时”。“词元”就像知识经济中的“智能电表”,它让知识的使用和消耗,第一次变得可观测、可计量、可加总。人利用知识这种活动,从完全不可捉摸的思维过程,变成了可以通过词元调用量来近似测量的经济行为。
三是知识生产的“社会性”空前增强并显影。在传统生产中,人利用知识有很强的个性特点和局限,主要限于自身所掌握的知识范围、类型和多少。一位顶尖专家,其能力边界也受制于个人毕生所学。但在人工智能时代,任何人通过大模型所能调用的知识范围,都远远超过任何个人甚至顶尖团队的知识储备。更重要的是,这种能力的跃升并非来自个人学习时间的暴增,而是来自对全社会凝聚的集体智慧的接入。
这背后是一种深刻的“社会性”体现。表面看是个人在与机器(大模型)对话,实质是个人通过机器(大模型)这个中介,在与整个人类知识库和智慧网络进行协同。每一次词元调用的背后,都隐藏着跨越时空的社会性知识协作。这种社会性在过去因分散和隐蔽而难以察觉,如今却因所有人都连接同一个或几个大型知识源而变得显著。词元的流动,就像一种特殊的物质,让知识在社会网络中如何被调用、如何流转的隐秘路径,部分地变得可见。
三、词元成为测量知识参与经济活动的新“尺子”
基于上面的分析我们提出,可以将“词元”作为观察和分析智能时代知识参与经济活动的一个基础性的、工作性的概念工具。这一定位需要明确的是,它是一个在现实约束下、便于操作的近似工具,而非一把完美无缺的万能标尺。正如国内生产总值(GDP)是衡量经济总量的一个有力但并非完美(例如它不计量家庭劳动、环境影响)的工具一样,词元是我们理解知识参与经济活动的一个关键性切入点和测量基准。
将词元确立为一个分析单位,主要基于其三大实践优势。首先,它可测量,具有坚实的现实数据基础。每一次对大模型的调用,其输入的提示(即prompt,技术上解释是调用大模型的时候给大模型提出的要求,通俗讲就是调用大模型的时候告诉大模型要干什么)和获得的输出,都可以被转化为具体的词元数量。这与传统经济学中许多关于“知识”“创新”的模糊变量不同,词元数据是机器运行过程中自然产生的、客观的记录,为实证研究提供了前所未有的、高频率、细颗粒度的数据来源。其次,它可加总,具备宏观分析的潜力。个人的搜索、程序员的代码辅助、企业的智能客服,这些分散的经济活动所消耗的词元,理论上都可以在产业、区域乃至国家层面进行汇总,从而形成“知识流量”的宏观指标,让我们有可能绘制出一张国民经济中“知识要素”流动的动态图谱。最后,它可建模,能与现有经济理论框架衔接。经济学家可以尝试将“词元”作为一个新的生产要素变量(例如用T表示),引入从企业生产函数到宏观经济增长模型的分析框架中。这使得我们可以用量化的方式,去追问一些此前只能定性讨论的问题,例如:知识投入的边际产出是多少,它对传统劳动有何替代或互补效应,这对经济增长的长期路径将产生何种影响。
然而,我们必须清醒认识这一工具的核心局限。词元主要测量的是知识“调用”的规模与流量,而非其质量与价值。一万个词元,可能被用来生成一份结构严谨但内容平常的市场报告,也可能在一位科学家的关键性深思中,辅助催生了一个改变行业范式的突破性猜想。两者的“词元成本”或许相近,但其经济价值却天壤之别。词元计数无法直接区分知识的深度、新颖度与应用效能。这就像一个电表能精确记录消耗了多少“千瓦时”的电能,但它无法告诉你这些电能是用于点亮一盏灯,还是驱动一台进行尖端药物研发的超级计算机。因此,词元是一个关于知识“经济能耗”的指标,而非直接的价值创造指标。我们不能过度聚焦于词元数量,可能会有“见量不见质”的风险,甚至可能激励出以刷词元流量为目的的无效知识生产。这是我们使用这一工具时必须警惕的。
尽管存在局限,但综合来看,词元为我们理解知识参与经济活动打开了一扇宝贵的、可操作的观测窗口,其价值是奠基性的。人工智能带来的三重突破,共同指向一个核心结论,即在智能时代,知识作为一种生产要素,其根本经济属性正在发生历史性变化。它因大模型而变得更像是可被直接调用的生产资料,因词元而变得可计量,因社会化的智慧集成而使其固有的社会性空前凸显。这三个特性--可直接用作生产资料、具有可计量性、生产使用社会化显现--构成了“词元经济学”研究的三个理论基石。
四、走向新的分析范式
我们不能说,通过词元就完全破解了知识参与经济活动的全部奥秘。知识中那些最精妙的灵感、最具突破性的创造,其过程可能永远带着一层神秘面纱。但人工智能的发展,确实为我们提供了一套前所未有的观测工具,让我们第一次能够对知识参与经济活动进行系统性的测量和分析。词元,就是这套工具中一把已经在实践中占有主导性的尺子。
将“词元”作为一个基础的分析单位提出,意味着我们为研究智能时代的经济学找到了一个新的起点。这不仅仅是往旧的理论公式里加入一个新字母那么简单。它要求我们从最基础的问题重新思考,例如:微观上个人和企业如何决策使用这种新型知识生产资料;宏观上知识流量的增长如何驱动长期经济增长;在更深的层面,这种高度社会化的知识生产和分配将如何重塑财富创造和分配的逻辑,这对未来的经济制度设计又意味着什么。
在接下来的系列研究中,我们将以这三个理论基石为起点,逐步展开对智能时代经济运行的系统性分析。我们将审视传统经济理论在解释新现象时的力量与边界,也从政治经济学角度思考生产关系的深刻变革,并尝试构建能包含知识要素的新型分析模型,最终探讨如何构建一个促进创新、保障公平、维护安全的治理体系。道路漫长,但第一步的方向已经随着词元的实践变得清晰。词元经济学,正是我们尝试理解并驾驭这个智能新时代的第一次系统性理论探索。
总 监 制丨王列军 车海刚
监 制丨陈 波 王 彧 杨玉洋
主 编丨毛晶慧 编 辑丨蒋 帅