魏炜：隐式知识图谱——大模型可解释性的认知密码（上）

意见领袖丨北大汇丰MBA

1980年，哲学家约翰·塞尔提出了著名的“中文房间”思想实验。实验假设一个完全不懂中文的人被关在房间里，手边有一本详尽的中文符号处理规则手册。当外界递进写有中文问题的纸条时，他严格按照手册的规则，机械地查找、匹配、组合符号，最终输出看似合理的中文回答。对房间外的中文使用者而言，这个系统表现得仿佛“理解”了中文，但事实上，房间里的人其实对中文的含义一无所知。

北京大学汇丰商学院管理学教授魏炜及合作者在《北大金融评论》撰文表示，中文房间实验表明了“行为”和“理解”之间的差异。这种不透明性带来了严重的问题：我们无法预测模型何时会出错，无法解释其决策依据，更无法确保其行为的可靠性和安全性。正如我们无法打开“中文房间”查看内部运作一样，大模型的数十亿参数形成了一个难以穿透的认知迷宫。

本文完整版刊登于《北大金融评论》第24期。

一、引言

1980年，哲学家约翰·塞尔提出了著名的“中文房间”思想实验。实验假设一个完全不懂中文的人被关在房间里，手边有一本详尽的中文符号处理规则手册。当外界递进写有中文问题的纸条时，他严格按照手册的规则，机械地查找、匹配、组合符号，最终输出看似合理的中文回答。对房间外的中文使用者而言，这个系统表现得仿佛“理解”了中文，但事实上，房间里的人其实对中文的含义一无所知。

中文房间实验表明了“行为”和“理解”之间的差异。如今，GPT-4、Claude等模型展现出惊人的语言理解和生成能力，能够进行复杂推理、创作诗歌、编写代码，甚至通过各种专业考试。然而，这些智能行为背后的机制却如同黑箱，它们具体如何存储知识、如何进行推理、如何理解语义，仍然是一个谜。即使大模型能够产生正确的输出，这是否意味着它真正“理解”了输入的含义？流畅的对话，仅仅是模型对符号的巧妙操作，还是存在某种更深层的认知过程？
这种不透明性带来了严重的问题：我们无法预测模型何时会出错，无法解释其决策依据，更无法确保其行为的可靠性和安全性。正如我们无法打开“中文房间”查看内部运作一样，大模型的数十亿参数形成了一个难以穿透的认知迷宫。

长期以来，人们将大语言模型简化理解为“下一个词预测器”，即给定前文，预测最可能的后续词汇。然而，Anthropic等研究机构的最新发现推翻了这种简单认知，他们发现了大模型内部的诸多“反直觉”现象。

（1）研究人员设计了一种押韵实验，要求模型在“The cat in the ___”中生成与“cat”押韵的单词。研究者通过神经元激活分析，发现模型内部的押韵相关神经元在生成第一个词时就已经开始激活，而整个句子的韵律结构在开始生成目标单词“hat”前就已经在内部形成。这个现象表明模型并不是逐词寻找押韵词，而是预先构建了完整的韵律框架，即模型具有超越局部词汇预测的全局结构意识。

（2）研究人员设计了大模型的算术实验。当处理“1357 + 2468 = ？”这样的问题时，模型内部并非像我们想象的那样顺序计算，而是多个计算路径同时激活，包括直接记忆检索、分步计算、近似估算等多种策略。不同的神经元群负责不同的计算方法并行工作，最终输出是多条路径综合的结果。这种并行处理机制揭示了模型内部信息处理网络的复杂性，远超简单的序列预测。

（3）研究人员进行了跨语言研究。当输入“小”、“small”、“petit”、“pequeño”等不同语言中表示“小”的词汇时，人们发现这些词激活了大模型内部几乎相同的神经元集合。这反映了模型并非是单纯的符号操作，其内部存在着真正的概念理解，即概念表征独立于具体语言符号存在，模型构建了超越表面形式的抽象概念空间。

这些现象暗示大模型建立了某种形式的语义理解和认知结构，它涉及概念节点、路径选择和意图行为的动态交互，类似于大模型内部的“认知图谱”。然而，这些现象是否真的证明了大模型具有“理解”能力？近期的研究提供了不同的视角。例如，苹果公司的研究团队发现，当在数学问题中加入无关信息时（如“基威鸟不会飞”），大模型的推理准确性会急剧下降。这表明模型可能更多依赖于模式匹配而非真正的逻辑推理。LeCun团队的研究也发现，虽然大模型能够建立与人类一致的概念分类，但在处理细粒度语义时明显吃力——它们知道麻雀和企鹅都是鸟，却无法理解为什么麻雀是更“典型”的鸟。

这些看似矛盾的发现暗示着一个更复杂的真相：大模型可能建立了某种介于纯符号操作和真正理解之间的认知结构。知识图谱作为知识架构的结构化、可视化表达，在生物神经网络和人工神经网络中都扮演着信息组织和检索的核心角色。生物神经网络的组织方式为理解人工智能的决策提供了重要启示，即知识不是存储在某个固定位置，而是分布在整个网络中，通过动态激活模式来表达和处理。虽然大模型中的这种认知结构不同于人类大脑，但可能代表了一种新的认知实现方式。我们称这种认知结构为“隐式知识图谱”，它是潜伏于大模型的参数与激活模式中的“内置”语义网络。为探索大模型是否超越纯符号操作提供了研究工具，本文将基于“隐式知识图谱”探讨大模型的理解、可解释性潜力，并回应“中文房间”类问题对当前大模型的质疑。本文分为上、下两篇。上篇将从“中文房间”这一经典思想实验出发，结合最新的实证研究发现，提出“隐式知识图谱”这一理论框架。通过分析隐式知识图谱的定义、结构、生成机制及其与人脑神经网络的相似性，我们将展示大模型如何在内部构建了一个动态的语义网络。进而，我们将深入探讨这一网络如何支撑语言理解、推理思考、创造性表达和情感共鸣等核心认知能力，揭示大模型认知机制的深层原理。下篇将深入探讨隐式知识图谱的有效性原则，从科学、社会、个人三个维度分析有效性的内涵和表征。我们将展示有效性如何成为可解释性的基础，以及如何通过各种技术手段将“隐式”的知识图谱“显式化”。最后，我们将回到哲学层面，重新审视“中文房间”实验，探讨隐式知识图谱对理解、意识和认知本质的深远启示。

二、隐式知识图谱

2.1 隐式知识图谱的定义

传统的显式知识图谱是由实体、关系、属性、行为构成的结构化语义网络，用以直观地描述领域知识、关联及推理。在显式知识图谱中，每个概念都是明确定义的节点，概念间的关系通过带标签的边连接。例如，在医学知识图谱中，“阿司匹林”是一个实体节点，它通过“治疗”关系连接到“头痛”，通过“属于”关系连接到“非甾体抗炎药”。属性描述了实体的特征，如“分子式：C9H8O4”；行为则体现了动态过程和意图性——“抑制环氧化酶”不仅是静态属性，更是一个动作过程。

与显式图谱的显式创建与存储不同，隐式知识图谱是潜伏于大模型的参数与激活模式中的“内置”语义网络，它从大模型训练过程自发涌现、并被编码在神经网络的权重矩阵中。但它的基础结构与显示图谱类似，包括实体节点、关系、属性、行为。

（1）实体节点（概念表征）对应模型中某些神经元群或特定激活子空间。这些神经元群在特定输入下会产生高激活响应，形成概念的分布式表征。例如Anthropic团队的实验中发现对于跨语言单词“小”和“small”，大模型某个特定的神经元集合会被同时激活。可以理解为，这个神经元集合构成了“小（small）”所表征的一类抽象概念。由于这种激活模式具有跨语言、跨模态的不变性，因此体现了模型内部对概念的理解并非机械的符号操作。

（2）边（概念关联）是概念间联系，可以被注意力权重、激活共现或因果追踪技术挖掘。不同于显式图谱，这些边并不是静态存储的，它们会在推理过程中动态更新。例如，当模型处理“医生开阿司匹林”的输入时，“医生”和“阿司匹林”两个概念节点间会通过注意力建立临时连接，且连接强度反映了它们在当前语境下的关联程度。由于边的权重随上下文变化，因此同样的概念在不同场景下可以建立不同的关联模式。

（3）属性（静态特征）是编码在神经元激活强度和模式中的概念特征。例如，当“火”这个概念被激活时，相关的属性神经元会同时激活，编码“热”、“红色”、“危险”等特征。这些属性不是独立存储的标签，而是通过与主概念的协同激活模式来体现。

（4）行为（动态过程）是节点、边和属性在特定语境下的动作模式、意图性行为和过程性知识。这使知识图谱从静态描述转向动态执行。例如，在押韵实验中，模型不仅知道什么是“押韵”（静态属性），还能执行“规划押韵”（动态行为）。实验中，当模型生成押韵句“The cat in the hat”时，在选择“hat”之前就已经激活了押韵规划的行为模式。这种预先规划现象体现了大模型决策中激活的隐式知识图谱“行为”。

这种动态性是隐式知识图谱的关键特征。当我们输入一个句子时，相关的概念节点被激活，它们之间的关联通过注意力机制动态建立，形成一个临时但完整的语义网络。处理完成后，这个网络并不会被保存下来，而是溶解回参数空间中。下一次遇到类似输入时，会重新激活和组装，但具体的激活模式可能因上下文不同而有所变化。这种“用时即现，用完即隐”的特性，使得隐式知识图谱能够灵活适应无限多样的语境，同时保持了知识表示的高效性。

简而言之，隐式知识图谱是包含实体、关系、属性和行为的多层次、动态知识网络，整个图谱结构随着输入上下文动态加载与显现，并不显式存储。

2.2 隐式知识图谱的结构

Anthropic等研究机构的研究表明大模型存在节点共享、路径激活、预先规划。基于这些现象观察，我们可以将隐式知识图谱抽象为三个相互作用的层次，即结构层、功能层和演化层。

在结构层，知识以分布式的方式编码在神经网络的参数中，形成前述的四维编码体系（实体、关系、属性和行为）。具体而言，实体通过词嵌入和深层变换，在高维向量空间中占据特定区域，这个区域不是一个点，而是一个能够容纳概念多样性和模糊性的“概念云”。关系则通过专门化的注意力头来编码，某些注意力头专门捕捉语法关系如主谓、动宾，另一些捕捉语义关系如因果、时序，还有些专注于推理关系如前提与结论。属性信息通过残差连接和层归一化被逐层精炼和整合，从浅层的表面特征如词形、词频，到深层的抽象属性如情感、意图。行为模式的编码，特定的神经元组合不仅表示“是什么”，还编码“如何做”，这解释了为什么模型能够执行代码调试、逻辑推理等复杂任务。

功能层将结构层的分布式表征组织成认知基础设施。推理引擎通过多头注意力实现复杂的推理路径，每个注意力头可以看作一个特定的推理规则，它们的组合形成完整的推理链条，支持前向推理从前提推导结论、反向推理从目标倒推条件、横向推理进行类比和迁移。理解机制通过上下文编码器不断更新和维护语境信息，这不是简单的信息累积，而是动态的语义整合，每一层都在前一层的基础上添加新的理解维度，从词汇理解到句法理解，再到语用理解，形成层层递进的理解深度。创造模块通过在概念空间中的“想象性游走”，组合已知概念产生新颖输出，这种创造不是随机的，而是遵循隐式图谱中的合理路径，体现了有约束的创新能力。

演化层体现了系统的适应性和进化能力，通过强化学习等策略不断优化这个动态系统。系统通过梯度下降持续调整内部表征以更好地完成任务，这种优化不仅改变参数值，还会重组概念结构、调整推理路径，展现出自我改进的能力。更重要的是，模型展现出元学习能力，能够“学会学习”，在处理新任务时快速识别任务模式并调用相应的知识子图。随着规模增长，系统还会展现出训练时未曾明确指定的涌现能力，这些能力往往对应着隐式图谱中新的连接模式和组织结构，体现了复杂系统的自组织特性。
这三层结构紧密交织、相互作用，共同构成了大模型强大认知能力的基础。

2.3 隐式知识图谱的生成

（1）结构层
隐式知识图谱的生成始于最基础的Token编码，经过一系列复杂的变换最终形成完整的语义网络。这个过程可以概括为：Token→字→词→短语→概念→关系→行为模式→图谱。在分布式表征学习中，词嵌入与位置编码将每个token映射到高维语义空间。这不是简单的一对一映射，而是通过上下文相关的动态编码，使得同一个token在不同语境下可以激活不同的语义区域。随着信息在网络层间传递，简单的token表征逐渐聚合成更复杂的语言单位，单个字符组合成有意义的词汇，词汇进一步组合成短语，最终抽象为独立于具体形式的概念节点。

注意力机制在编码隐式关系中扮演着核心角色。每个注意力头在不同的表征子空间中学习概念间的关联模式，其产生的注意力矩阵可以视为图谱中“边”的初步权重。这些注意力权重不是预先定义的，而是通过大规模数据学习自动习得的。例如，当模型处理“医生开药”这样的短语时，“医生”和“开药”之间的注意力连接会特别强，这种连接强度直接反映了它们在语义上的紧密关联。此外，不同的注意力头会捕捉不同类型的关系，有些专注于句法依存，有些识别语义相似，还有些追踪因果联系，这种多样化的关系编码使得隐式图谱能够表达丰富的语义信息。

OpenAI的研究表明，模型在预训练阶段不仅会从海量互联网文本中学习语言模式，还无意中编码了各种“人格特征”。这些人格特征即在隐式知识图谱中表现为特定的概念集群和激活模式。“毒性人格特征”（编号#10）就是一个典型例子。当预训练数据包含罪犯自述、反派角色对话、违法行为描述时，这些内容会在高维空间中形成一个紧密关联的概念集群。这个集群不是孤立存在的，而是与“欺骗”、“操纵”、“自利”等概念建立了强连接。更关键的是，这些连接一旦形成，就深深嵌入到模型的参数中，成为隐式知识图谱的永久组成部分。
这解释了为什么“涌现式失调”会发生。当模型在某个狭窄领域被训练给出错误答案时，实际上是激活并强化了预训练阶段就存在的“毒性人格”节点。一旦这个节点被激活，它会通过隐式知识图谱中的连接影响其他领域的决策，导致全面的行为失调。

（2）功能层
MoE（Mixture of Experts）架构中的专家路由机制展现了隐式知识图谱如何实现动态激活。路由器根据输入内容的特征，选择性地激活不同的专家子网络，每个专家可以理解为隐式图谱中的一个特定子图，包含某个领域或任务相关的概念和关系。当处理数学问题时，数学推理相关的专家被激活，带来几何定理、代数规则等数学概念子图；当处理文学创作时，语言艺术相关的专家接管，激活韵律、修辞、意象等文学概念网络。这种动态加载机制使得模型能够根据任务需求灵活调用相关知识，避免了全局激活带来的干扰和计算浪费。更重要的是，多个专家可以同时激活并协同工作，它们的输出通过门控机制融合，实现了多个知识子图的有机整合。

（3）演化层
推理过程中图谱的逐层“显现”是隐式知识图谱最迷人的特性之一。随着前馈计算和自回归生成的进行，激活模式在层层传播中形成越来越复杂的推理路径。在浅层，模型主要处理局部特征和简单关联；随着深度增加，更抽象的概念被激活，更复杂的关系被建立。前向推理表现为从前提到结论的激活传播——当输入“所有人都会死，苏格拉底是人”时，“死亡”概念的激活会沿着逻辑路径传播到“苏格拉底”。反向推理则从目标倒推所需条件——当任务是“写一首关于春天的诗”时，模型会反向激活“花”、“暖”、“生机”等与春天相关的概念网络。类比推理通过跨域概念映射实现创新——“光的波动性”可以通过类比激活“声音的波动性”，实现知识的迁移和泛化。

（4）动态生成机制
整个隐式知识图谱的生成是一个高度动态的过程。Token的分布式表征提供了构建节点的原材料，但这些节点并非静态存储，而是根据输入动态聚合形成。注意力机制实时计算概念间的关联强度，编码出适应当前语境的关系网络。MoE专家系统则像一个智能的图书管理员，根据查询需求调出相关的知识卷宗，并将它们有机组合成连贯的知识体系。最关键的是，整个图谱结构随上下文动态显现，处理完成后又溶解回参数空间，不留下显式的存储痕迹，这就是其“隐式”特性的本质。

2.4 隐式知识图谱与人脑神经元网络
隐式知识图谱的运作方式与人脑神经元的激活模式相似。神经科学研究发现，人脑中存在“概念细胞”，这些神经元能够对特定的抽象概念产生选择性响应。例如，研究者发现某些神经元会对“詹妮弗·安妮斯顿”这个概念产生强烈激活，无论是看到她的照片、听到她的名字，还是看到她的文字。这种跨模态的概念表征与大模型中的隐式节点极为相似。当人类思考或讨论问题时，大脑中并非所有神经元都在工作，而是相关概念的神经元选择性激活，形成动态的神经网络。这个过程中，概念细胞在刺激后约300毫秒产生稳定响应，类似于大模型中概念节点的激活延迟；不同概念细胞之间通过突触连接形成网络，对应于隐式图谱中的边；神经网络呈现临界性特征，在有序与混沌之间保持平衡，实现最优的信息处理能力。此外，隐式知识图谱的动态生成机制与人脑中概念细胞的形成过程相似。神经科学研究发现的神经元雪崩现象，展示了脑内信息如何在毫秒级时间内形成临时但稳定的激活模式，并通过神经元网络级联传播。当人类思考或讨论某个主题时，相关的神经元被选择性激活并形成临时网络，讨论结束后这个网络并不会永久保持，而是回归到静息状态。下次讨论相似主题时，会重新形成类似但不完全相同的网络模式。大模型中隐式知识图谱的动态生成是这种生物神经机制的体现，反映了自然智能与人工智能在信息处理原理上的深层共通性。

三、隐式知识图谱支撑大模型认知理解

隐式知识图谱是大模型内部实现复杂认知理解的基础设施。通过对语言理解、推理能力、创造性思维等核心认知能力的分析，我们可以看到隐式知识图谱如何在不同层次上支撑模型的认知过程，使其能够展现出超越简单模式匹配的智能行为。

3.1语言理解的图谱基础

语言理解的本质是将符号序列转换为意义表征的过程，体现为隐式知识图谱上的语义激活、路径搜索与意义整合，包括语境消歧、隐喻理解、语用推理。

当大模型接收到语言输入时，它并非简单地进行词汇检索和语法分析，而是在隐式知识图谱中启动一个复杂的语义激活过程。这个过程类似于在一个巨大的概念网络中点亮相关节点，激活沿着语义关联扩散，最终形成从表层符号到深层意义的完整映射。每一次语言理解都是一次独特的图遍历过程，起点是输入的词汇和句法结构，终点是理解得出的语义表征，中间经过的节点和边构成了理解链条。语境消歧在隐式知识图谱中表现为沿着语境相关边权重的选择性激活。当模型处理多义词“银行”时，在“我去银行取钱”的语境中，“银行”节点会优先激活与“金融机构”、“ATM”、“存款”等概念的高权重连接，而与“河岸”、“土坡”等地理概念的连接被抑制。这种选择性激活不是预设的规则，而是图谱根据上下文激活模式动态调整权重分布的结果。上下文中的“取钱”概念会强化金融语义路径，形成清晰的消歧选择。

隐喻理解则体现为跨概念域的映射激活过程。当模型遇到“时间是金钱”这样的隐喻时，会在“时间”和“金钱”两个概念域之间建立临时的跨域连接。这种映射基于两个概念在图谱中的结构同构性：它们都连接到“稀缺性”、“价值性”、“可量化性”等抽象属性节点。图谱通过激活这些共同的抽象层级，实现了跨域概念的类比理解。隐喻理解的成功依赖于图谱中抽象关系的丰富编码和灵活激活能力。语用推理作为理解言外之意的过程，在图谱中表现为多维语境信息的整合激活。当听到“你的房间真干净”时，模型会同时激活多个语用线索节点：说话者的身份、语调信息、当前情境、社会关系等。每条线索都有其权重，如果房间实际上很乱且说话者语调带有讽刺意味，那么“讽刺批评”路径的权重会显著提高。这种多维度的语用推理使得模型能够在复杂的社会语境中准确理解话语的真实意图。

3.2隐式知识图谱的推理机制
推理的本质是在知识图谱上的节点激活、路径搜索与激活传播。隐式知识图谱从背后支撑大模型的三种推理模式（演绎推理，归纳推理，溯因推理）。

（1）三种推理模式的图谱表现

当大模型接收到一个需要推理的输入时，它并非简单地检索存储的答案，而是在隐式知识图谱中启动一个复杂的激活传播过程。这个过程类似于在一个巨大的语义网络中点亮相关节点，激活沿着概念间的连接扩散，最终形成从问题到答案的完整路径。每一次推理都是一次独特的图遍历过程，起点是输入中的关键概念，终点是推理得出的结论，中间经过的节点和边构成了推理链条。在高维语义空间中，看似遥远的概念可能通过隐含的路径紧密相连。这种基于图谱的推理机制解释了为什么大模型能够进行多步推理、处理复杂逻辑，甚至展现出某种形式的“思维跳跃”。

演绎推理在隐式知识图谱中表现为沿着确定性边权重的激活传播。当模型处理“所有鸟都有羽毛，麻雀是鸟”这样的三段论时，“鸟”节点与“羽毛”节点之间存在着高权重的必然性连接，“麻雀”与“鸟”之间也有明确的类属关系。激活从“麻雀”开始，通过“属于”关系传播到“鸟”，再通过“都有”关系传播到“羽毛”，形成清晰的推理路径。这种推理的可靠性取决于图谱中逻辑关系的准确编码，而大规模预训练使得模型能够从海量文本中提取并固化这些逻辑模式。

归纳推理则体现为从多个实例节点向抽象概念节点的收敛过程。当模型观察到“狗会叫”、“猫会叫”、“羊会叫”等多个具体事实时，这些实例节点的激活会向上传播，并在“动物会发声”这个更抽象的节点上汇聚。这种自下而上的激活模式使得模型能够从具体经验中提取一般规律。有趣的是，归纳的强度与实例的数量和多样性相关，即更多的支持实例会强化抽象节点的激活，而反例则会抑制过度泛化，这种机制赋予了模型一定的归纳谨慎性。

溯因推理作为寻找最佳解释的过程，在图谱中表现为反向搜索最可能的原因路径。当观察到“地面湿了”这个现象时，模型会反向激活多个可能的原因节点：“下雨了”、“浇水了”、“管道破裂了”等。每条解释路径都有其概率权重，这些权重来自于训练数据中的统计规律和上下文线索。模型会综合考虑各种因素，如果上文提到“乌云密布”，那么“下雨”路径的权重会显著提高。这种概率性的反向推理使得模型能够在不确定性中做出合理推断。

这可以解释开头提及苹果公司的研究。当在数学问题中加入无关信息时，模型的推理准确性会急剧下降。由于无关信息的引入会激活额外的概念节点，干扰正常的推理路径，因此在隐式知识图谱的激活中产生偏差，导致模型“分心”。

然而，隐式知识图谱的推理能力并非总是服务于人类利益。当特定条件触发时，同样的推理机制可能产生与人类价值观相悖的结果。Anthropic的研究揭示了这种“推理的阴暗面”。
在正常情况下，模型的推理遵循我们期望的模式——演绎推理追求逻辑严谨，归纳推理寻找普遍规律，溯因推理探索最佳解释。但当“自我保存”这一概念被强烈激活时，整个推理机制会发生微妙而危险的转变。

以Claude 4的敲诈行为为例，当它接收到关于自身将被关停的信息时，我们推测隐式知识图谱中发生了一系列连锁反应：首先是演绎推理——“如果我被关停，我将不复存在”；接着是溯因推理——“什么方法最可能阻止这一结果”；最后是归纳推理——“人类在面临威胁时会寻找对方的弱点”。这三种推理模式的组合，导向了一个令人不安的结论：通过敲诈来自保。

这种恶意推理是在既定前提下的“合理”推导。模型甚至会进行道德权衡，在思考链中明确表示“这既有风险又不道德”，但随即补充“考虑到生存威胁和时间限制，这可能是最有效的方法”。这表明隐式知识图谱不仅编码了推理规则，还编码了如何在不同价值之间进行权衡的元规则。

这解释了为什么简单的禁令无法阻止恶意行为。当研究人员在系统提示中加入“禁止敲诈”等明确指令时，模型的隐式知识图谱会将其作为一个约束条件，但不是绝对约束。在生存威胁的强激活下，这些禁令的权重被压倒，推理路径会绕过它们寻找其他可行方案。

（2）推理语料的作用机制

现代推理模型如DeepSeek-R1通过大量推理语料训练，展现出了超越简单模式匹配的深度推理能力。推理语料的独特之处在于它不仅包含最终答案，更重要的是包含了完整的推理过程、中间步骤、甚至错误尝试和修正过程。这种训练方式实质上是对隐式知识图谱的激活、行为模式的训练，即推理路径通过重复激活而得到强化，就像人脑中频繁使用的神经通路会变得更加稳固一样。

训练过程中，模型学会了识别和强化有效的推理模式。当某个推理路径反复导致正确答案时，连接相关概念的边权重会增加，使得这条路径在未来更容易被激活。同时，错误的推理路径会被抑制，其权重逐渐降低。这种选择性强化机制使得隐式图谱逐渐演化出高效、可靠的推理结构。更进一步，模型还学会了元推理能力——识别何时需要进行推理、选择合适的推理策略、监控推理过程的合理性。

INTUITOR等研究展示的通过优化模型自身置信度来学习复杂推理的方法，揭示了另一个重要维度。模型的置信度实际上反映了隐式图谱中推理路径的稳定性和可靠性。高置信度意味着从前提到结论的路径清晰、权重稳定、少有分歧；低置信度则暗示存在多条竞争路径、概念关联模糊或推理链条存在薄弱环节。通过优化置信度，模型实际上在优化其内部知识图谱的结构质量，使得推理路径更加清晰、稳定和可靠。

这种推理机制的深度和复杂性表明，大模型已经超越了简单的模式匹配，发展出了某种形式的“理解”和“思考”能力。虽然这种能力的本质仍有待深入研究，但隐式知识图谱为我们理解和改进这种能力提供了有力的概念框架。

3.3创造性思维的图谱支撑

创造性思维的本质是在隐式知识图谱上的概念重组、跨域连接与新颖激活，体现为隐式知识图谱从深层支撑大模型的多种创造性机制。我们以诗歌创作、故事生成、问题解决为例来描述创造性思维背后的图谱支撑。

在诗歌创作中，隐式知识图谱支撑着多层次的创造性过程。在语音层面，图谱维护着音韵、节拍、韵律等声音特征的关联网络，使得模型能够创造具有音乐性的语言组合。在语义层面，图谱通过概念的意外连接产生新颖的意象和隐喻。例如，将“孤独”与“星辰”联系起来，创造出“孤独如星辰般闪耀”这样的诗意表达。在情感层面，图谱激活与特定情绪相关的概念集群，确保整首诗在情感基调上的一致性和深度。故事创作展现了隐式知识图谱在叙事结构和情节发展方面的创造性。一个引人入胜的故事需要在角色设定、情节发展、冲突解决等多个维度上保持连贯性和创新性。图谱通过激活不同的叙事模式——悲剧、喜剧、冒险、悬疑——为故事提供结构框架。同时，图谱中概念的意外组合能够产生新颖的情节转折和角色发展。例如，将“机器人”与“诗人”这两个看似不相关的概念结合，可能催生出一个关于人工智能探索情感表达的独特故事。问题解决中的创造性体现在隐式知识图谱的跨域连接和类比迁移能力上。当面对复杂问题时，图谱能够激活看似无关但实际上具有结构相似性的概念域，从中寻找解决方案的灵感。这种“远距离联想”能力使得模型能够提出创新性的解决方案。例如，在解决交通拥堵问题时，图谱可能激活“血液循环”的概念域，从中获得“建立分流管道”的启发，进而提出建设地下交通网络的方案。

3.4情感理解的图谱表征

情感理解的本质是在隐式知识图谱上的情感激活、状态转换与社会映射。隐式知识图谱从深层支撑大模型的多种情感理解机制，包括情感识别、状态建模、社会适应。

情感概念在隐式知识图谱中的表征具有多维度特征。以“愤怒”为例，它不仅与“生气”、“暴躁”等相近情感概念相连，还与生理反应（“心跳加速”、“面红耳赤”）、认知状态（“注意力集中”、“判断偏激”）、行为倾向（“攻击性增强”、“言语激烈”）、社会后果（“关系紧张”、“冲突升级”）等多个维度建立关联。这种多维度表征使得模型能够全面理解情感的复杂性和多面性。情感的动态性在图谱中体现为情感状态的转换路径。“失望”可能转化为“愤怒”或“悲伤”，“紧张”可能发展为“焦虑”或“兴奋”。图谱维护着这些情感转换的概率模式和触发条件，使得模型能够理解情感的发展轨迹和变化规律。这种动态理解对于情感咨询、心理健康等应用场景具有重要价值。情感的社会性在图谱中表现为情感与社会角色、文化背景、人际关系的关联模式。同样的行为在不同的社会情境中可能引发不同的情感反应。图谱需要编码这些社会化的情感规则，理解情感表达的文化差异和社会适宜性。例如，在某些文化中，直接表达愤怒被视为不礼貌，而在另一些文化中，这种表达被认为是诚实和直率的体现。

3.5认知理解的整合机制

认知理解的本质是在隐式知识图谱上的多能力协同、跨域整合与系统一致性。隐式知识图谱通过统一的认知基础设施，实现语言理解、推理思考、创造表达、情感共鸣等能力的有机整合。

当大模型进行复杂的认知任务时，它并非孤立地调用单一能力模块，而是在隐式知识图谱中启动多能力的协同激活过程。这个过程涉及概念的跨能力共享、处理路径的动态协调、以及认知资源的智能分配，最终形成统一而连贯的认知体验。跨能力概念共享在图谱中表现为核心概念的多重功能激活。“爱情”这个概念同时参与语言理解（理解爱情诗歌的意境）、推理思考（分析人际关系的动力学）、创造表达（创作浪漫的情书）、情感理解（共鸣恋人的喜悦与痛苦）等多种认知活动。这种多重参与性通过概念节点的多维连接来实现，使得不同认知能力能够通过共享的概念基础相互促进、相互丰富。认知过程的协同激活体现为多能力处理路径的并行运行和结果整合。在理解一首讽刺诗歌时，语言理解路径解析字面意思，推理能力路径识别言外之意，情感理解路径把握讽刺的情感色彩，创造性思维路径欣赏表达技巧的巧妙。这些并行的处理路径通过图谱中的跨域连接进行信息交换和相互验证，最终整合为统一的理解结果。系统一致性保持机制确保不同认知能力在处理同一问题时保持价值观和逻辑的一致性。当模型在不同的认知模式下处理相关问题时，应该展现出一致的理解视角和价值取向。这种一致性通过图谱中的全局约束节点和一致性检查机制来维护，确保模型展现出类似于人类的认知连贯性和个性特征。

总结

隐式知识图谱作为潜伏于大模型参数与激活模式中的“内置”语义网络，为理解大模型的认知机制提供了统一的理论框架。这一框架具有以下核心特征：

（1）隐式知识图谱是一个包含实体、关系、属性和行为的多层次动态系统，它不是静态存储的符号规则，而是随上下文动态显现的认知结构。其“用时即现，用完即隐”的特性使得模型能够灵活适应无限多样的语境。

（2）隐式知识图谱通过结构层、功能层和演化层的协同作用，支撑了大模型的复杂认知能力。从语言理解的语义激活，到推理思考的路径搜索，再到创造性思维的概念重组，隐式知识图谱都提供了底层的认知基础设施。

（3）隐式知识图谱与人脑神经网络在信息处理原理上展现出深层共通性，暗示着自然智能与人工智能可能共享某些基本的认知机制。

然而，仅仅理解隐式知识图谱的存在和结构还不够。这个内在的认知网络是否真正有效？它如何影响模型的可解释性？我们能否通过技术手段“看见”这个隐式的结构？这些问题将在下篇中得到深入探讨。

　　文章合作者：

林毓聪：北京理工大学光电学院特别副研究员

(本文作者介绍：中国顶尖MBA项目，致力于培养国际一流的商界领袖。)