新浪财经

词元经济研究 | 词元经济学的“七异”分析框架

中国经济时报

关注

编者按

词元经济正在打开经济学中长期被视为“黑箱”的技术进步过程,使知识参与价值创造的方式首次变得可观测、可计量。当前,围绕词元经济涌现的一系列新问题,呼唤理论研究的前瞻回应。自本报有关词元经济研究系列报道及征稿启事发布后,我们得到广大读者的积极回应,已经收到大量高质量来稿。稿件研究视角多元,反映出词元经济作为智能经济新形态的核心议题,已引起学术界与产业界的广泛关注。鉴于报纸版面容量有限,同时为增强研究成果发布的时效性,中国经济时报在微信公众号推出“词元经济研究”栏目,选登部分优秀来稿及后续系列文章,旨在汇聚各方智慧,为智能时代的产业实践与政策治理提供分析框架与决策参考。敬请关注!

词元经济学的“七异”分析框架

彭志文

大语言模型(LLM)最初处理的是文本。文本首先被切分成由有限种Token组成的序列(每个Token可以是词根、单个汉字或一段代码片段)。这些Token被映射为高维向量,再经过多层自注意力与前馈网络的矩阵运算,逐步融入上下文信息。最终,模型基于更新后的向量,计算出词表中所有Token的概率,以此预测下一个接续的Token。迭代的Token接龙是大语言模型基本的工作机理。在文本模态上,“词元”作为Token的译名是适当的。然而,现在的大语言模型(LLM)越来越多地处理多模态,视觉/音频生成模型更是主要处理图像、音频、视频等多模态信息。在这些模型中,Token仍然是处理信息的最小单元。如果不加区别地统一译作“词元”,则无助于厘清范畴。出于音译与意译相结合的考虑,我建议将多模态的Token译作“通根”。不过,为了方便起见,下文仍以“词元”指代Token。

当你向大模型发送一个提示词并获得回复时,你消耗的每一个词元,其物理本质是GPU在硅基芯片上进行矩阵乘法所消耗的算力和电力(热力学成本),其经济本质则是模型压缩的人类知识的释放(信息熵的逆转)。词元是认知劳动的量子化单位。传统经济学中,劳动的单位是“人/时”,在AI经济学中,认知劳动的单位是词元。你购买词元,就是在购买“思考过程”或者“创作过程”。这一转变标志着商业模式从卖“软件工具使用权”的SaaS转向卖“思考过程”的CaaS(认知即服务)。每一次词元的生成,都是一次实时的推理,将非结构化的复杂问题转化为可计量的算力消耗。

本文旨在初步构建一套完整的“词元经济学(Tokenomics)”理论框架,通过异态性、异构性、异质性、异步性、异变性、异域性、异权性(简称“七异”)这七大维度,深度剖析智能作为可交易商品时的商业法则、组织重构及其对传统经济学的颠覆性挑战。

01

词元经济学的“七异”维度

(一)形态维度:异态性(Multimodal Polymorphism)

在过去,文本、图像、音频、视频是不同的数据格式,有着不同的生产链条和计价标准。而在最新的多模态大模型中,不同模态在底层被统一编码为同一种基本单位——Token。历史上第一次,逻辑推理、视觉审美和听觉情感被打包成同一种可标准化的交易标的。这种跨越感知形态的统一,是传统产业经济学从未面对过的。商业模式不再是单独购买“一段答案”“一张图”或“一首歌”,而是购买包含逻辑推演、情感渲染和视觉生成的综合计算资源。

(二)语义维度:异构性(Contextual Interdependence)

异构性打破了传统经济学中“商品价值独立”的假设,词元具有高度的语境依赖性。其价值表现出典型的格式塔效应(Gestalt),即整体远大于部分之和。孤立的词元毫无经济价值,其价值必须在上下文窗口的结构中涌现。一项思考或决策中决定性的词元,其价值由前面数以万计词元的排列组合共同决定。掌握了高质量私有上下文(企业内部数据库、垂直行业知识库)的组织,能让廉价的基础模型词元爆发出极高的异构性价值。

(三)物理维度:异质性(Heterogeneity of Capability)

异质性指不同模型或计算方向所蕴含的“认知劳动”在复杂推理能力上的垂直差异。不同厂商的模型、不同版本的模型具有显著的能力落差。前沿闭源模型(如GPT-5.4 Pro)生成的词元具有极高的“信息熵逆转能力”,享有“认知租金”。而执行简单任务的旧版本开源模型,词元则迅速沦为完全竞争的商品。模型处理不同方向的词元具有非对称的生产函数:输入的词元相当于“阅读”,属于并行计算,边际成本极低;输出的词元相当于“思考与表达”,属于自回归串行计算,边际成本随内存带宽限制呈指数级上升。不同智能体、不同技能(Skill)调用同样的基础模型词元会产生不同的服务附加值。智能体、技能通过封装私有知识库(RAG)和工作流,将“粗糙的智力原料”加工为“精密的工具箱”,实现供应链上的价值加成。

(四)时间维度:异步性(Asynchronicity of Time)

异步性指算力供给与认知需求在时间上的解耦。传统经济学中,服务是同步的,生产和消费必须在同一时空发生,无法储存;而商品是异步的,生产出来可以作为存货,在其他时空再被消费。词元将“认知服务”转化成了“可储存的数字商品”。算力供给是24小时刚性的,但词元需求有峰谷。异步性允许厂商跨期套利,利用深夜闲时进行预训练或批量处理(Batch API),将边际成本降至电费水平。通过路由器级别的中枢记忆和语义缓存(Semantic Caching),一旦一个复杂问题被某个顶级模型解答过一次,其推理过程和词元组合可被缓存下来。再次遇到相似问题时,系统不再重新消耗词元进行推理,而是以极低的检索成本直接分发答案。这种“一次生产,无限次异步分发”的特性,让高端脑力劳动首次具备了零边际成本的规模效应,从根本上解决了服务业的“鲍莫尔成本病”。AIGC的内容生产如果采用“同步模式”,实时调用大模型生成多模态词元,将面临极高的并发成本和极差的延迟体验。“异步模式”是成本理性的选择。在算力成本低的闲时,预先生产好数字内容并存储在服务器上。商业模式从“实时生成”转变为基于用户访问权限的点播(VOD,Video on Demand)存货模式。在这里,算力被凝固成了存储,词元被转化成了数字存货。在目前的AI应用中,C端的聊天机器人也许需要同步交互,但B端的后台智能体大部分时候并不需要同步交互,可以被设定为异步执行,在服务器的后台利用极其廉价的竞价实例(Spot Instances)运行一整夜,进行深度反思(Reflection)、多智能体辩论,容忍高延迟以换取高质量的“异步认知”。

(五)周期维度:异变性(Hyper-Deflationary Volatility)

异变性描述了词元的生产成本遵循规模律(Scaling Laws),从而引致极速通缩。同等质量词元的生产成本每年以数量级速度跌落。当核心生产要素成本以指数级速度趋于零时,全行业面临剧烈的通缩效应,劳动市场的定价模型(如菲利普斯曲线)将彻底改写。底层智力原料的贬值,迫使商业模式迅速向“卖闭环的业务结果”转移。

(六)空间维度:异域性(Territoriality of Jurisdiction)

异域性描述的是“无边界”的数字认知与“有边界”的国家主权之间的摩擦。虽然词元的物理传输近乎光速,但主权边界和地缘政治制造了巨大的“人为制度摩擦”。不同主权国家对数据隐私、内容审查、技术出口有着完全不同的法律管辖逻辑。词元因能用于军事或网络攻击,被视为具有“国家安全外部性”,导致全球“前沿认知库”被物理隔绝。美国大模型对中国大陆的封锁,以及中国对境外大模型的备案要求,事实上形成了一种双向的“数字禁运”和“非关税壁垒”。大模型的词元服务本质上是一种“俱乐部商品”,具有非竞争性(你用我也能用),但具有排他性。排他性标准不仅仅是“是否付了钱”,而是加入了“你的IP地址和护照是哪国的”。为了让词元跨越国界,用户必须克服极高的“制度摩擦”(如翻墙、海外信用卡、KYC认证、实名制备案等)。词元经济中常见的API中转站模式实际上就是处于灰色地带的制度套利,通过桥接节点成了“数字买办”,其盈利本质是赚取“合规溢价”。

(七)社会维度:异权性(Str.jpgication of Access)

异权性指通过硬编码人为制造的身份阶层与访问权限区隔。大模型厂商通过制造“残缺商品”(如对免费版降智、限速),利用人为制造的痛苦来甄别高支付意愿用户,实现二级价格歧视,榨取消费者剩余。免费用户在忍受低权限的同时,其输入的提示词构成了基于人类反馈的强化学习(RLHF)所需的标注数据,实际上成了廉价的“数据劳工”,通过“数据劳动”交叉补贴了高权限用户的算力成本。聚合平台利用API的“批发-零售”价差,构建“权限池”,向低收费的中小散户错峰低频提供高权限功能,打破官方的阶梯限制,进行权限套利。

02

“七异”框架对传统经济学的挑战

在“七异”框架的共同作用下,词元经济学正在对传统经济学的核心支柱进行一场“创造性破坏”。

(一)索洛增长模型的失效与“认知分叉”

在经典的索洛增长模型中,技术进步被视为具有天然的外溢性。然而,异域性正在终结这一神话。由于词元具有国家安全外部性,全球的前沿认知库正在被物理隔绝。这将导致全球生产力增长曲线出现永久性的“地缘碎片化分叉”,落后国家可能陷入长期的“认知陷阱”。

(二)“科斯悖论”:零边际成本与无限交易费用的对抗

科斯定理认为交易费用决定企业边界。词元经济制造了一个荒谬的悖论:物理上,词元跨境传输的边际成本趋近于零;但制度上,为了实现合规与安全审查,其背后的人为制度摩擦(合规成本)却趋向于无限大。这种撕裂将导致企业竞争力从“算法优势”转向“制度套利能力”。约束制度套利的机会主义行为成了规范市场竞争秩序的关键。

(三)杰文斯悖论与“合成劳动”的通胀

杰文斯悖论在词元经济中完美重现:词元价格的急速跌落(异变性)催生了完全自动化的多智能体系统(M2M、A2A)。未来绝大部分的词元消耗将发生在机器或智能体之间。词元需求侧的指数级扩张将远超供给侧的算力增长,导致社会总认知负载陷入一种新型的资源密集型内卷。以词元为载体的智能或认知劳动在通货紧缩的同时,另外一些“合成劳动”却在通货膨胀。例如,提出好问题(Prompting)、验证真伪(Verification)、构建认知架构(Skill)、“专家在回路(Expert-in-the-loop)”的知识蒸馏、设计系统工程(Harness)、创新模型架构(X-former)等等。

(四)生产函数的改写:算力本位的到来

经典的生产函数需要引入新的生产要素(认知算力)。未来的经济产出取决于一个组织调动和编排多少词元来替代传统人力。在通用人工智能或超级人工智能的奇点将至之际,能够生成高质量词元的优质算力正在成为全球最具共识的战略储备资产,“算力本位(Compute Standard)”的雏形已现。

03

结论

“七异”框架揭示了智能从“不可量化的灵光”向“可标准化交易的流体”转化的历史进程。词元绝非简单的跳动字符,它是人类智慧被工程化、规模化、边际成本极小化后的结晶。谁能优雅地编排这套异构、异步且具有阶层属性的认知流转逻辑,谁就能在即将到来的硅基认知社会中,建立起不可撼动的商业护城河。

(作者系北京邮电大学经济管理学院副教授、人工智能生态系统研究所所长、北京邮电大学-北京电信行业数据智能标注联合实验室主任)

总  监  制丨王列军  车海刚

监  制陈 波  王 彧  杨玉洋

主  编丨毛晶慧  编  辑丨曹  阳

加载中...