金融“五篇大文章”领域统计标准及数据治理研究
◇ 作者:中央结算公司课题组
◇ 本文原载《债券》2026年3月刊
摘 要
2025年4月,中国人民银行等四部门联合印发《金融“五篇大文章”总体统计制度(试行)》,明确提出构建覆盖金融“五篇大文章”领域的统一统计指标体系。但在实践推进过程中,市场仍面临标准不统一、信息披露不足、数据治理难度大等挑战,在一定程度上限制了政策效果量化评估与金融资源的精准引导。本研究紧扣相关统计报送要求,系统开展金融“五篇大文章”领域统计标准与数据治理研究。统计标准层面,基于业务实践,细化金融“五篇大文章”各领域的业务边界,制定统一、可操作的认定标准,并通过典型案例进行实证研究。数据治理层面,构建数据全生命周期的治理体系,创新引入多种数据处理技术对多维数据进行智能识别与验证。本研究为完善统计制度提供方法论支撑,也为金融机构规范数据报送、金融基础设施优化数据服务奠定基础。
关键词
金融“五篇大文章” 统计标准体系 数据治理 债券标签体系 统计指标
研究背景
2023年召开的中央金融工作会议首次提出做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章的战略部署。2025年4月,中国人民银行、国家金融监督管理总局(以下简称“金融监管总局”)、中国证监会、国家外汇管理局联合印发《金融“五篇大文章”总体统计制度(试行)》(以下简称《总体统计制度》)。《总体统计制度》是首部系统覆盖五大领域的综合性统计规范,重点对金融“五篇大文章”领域的统计对象及范围、统计指标及口径、统计认定标准、数据采集、共享及发布、部门分工等作出统一规定。
《总体统计制度》的落地实施给金融机构带来了重要发展机遇:一是标准化的统计体系有助于金融机构优化业务结构,明确资源投向。二是统一的数据基础便于金融机构进行产品与服务创新,例如发行主题债券、创设金融产品、开发客户管理和风控模型。三是标准化的统计体系可以为政策制定、宏观审慎管理提供扎实的决策支持,提升政策效能。
作为重要金融基础设施,中央国债登记结算有限责任公司(以下简称“中央结算公司”)长期以来承担着债券市场中央登记托管结算职能,积累了海量、权威债券数据资源。为助力金融机构落实金融“五篇大文章”相关统计要求,中央结算公司依托长期的监管支持实践及在数据治理领域的扎实基础,聚焦金融“五篇大文章”领域的统计标准与数据治理,深入分析政策落地过程中的具体问题,并提供解决方案和思路。本研究成果既能为金融机构完善内部数据治理框架、提升合规水平与运营效率提供指引,解决统计报送中的实际难题,也能结合实践优化金融“五篇大文章”统计标准体系,为政策评估提供科学依据;同时,推动解决统计标准不统一、数据碎片化问题,提升金融市场服务实体经济的能力,促进金融与经济良性循环。
金融“五篇大文章”的统计要求分析
《总体统计制度》对统计对象及范围、统计指标及口径、统计认定标准等作出统一规定。在该制度发布后,各主管部门陆续在《总体统计制度》的统一框架下出台相关报送文件,并结合行业特点提出差异化要求。
针对债券资产,中国人民银行于2025年6月印发《中国人民银行办公厅关于按模板报送金融“五篇大文章”债券统计数据的通知》,要求相关金融基础设施每季度报送存量债券数据以及金融机构发行、承销、持有金融“五篇大文章”相关债券的数据。
面向资管类机构,金融监管总局于2025年4月印发《资管机构支持金融“五篇大文章”统计指标体系》,对金融“五篇大文章”主题产品和投向金融“五篇大文章”领域资产作出规定,要求理财公司、保险资管公司、信托公司按季度报送数据。统计范围包括资管公司发行的资管产品及其管理的全部资产或自有资金投向相关领域的情况。
面向保险行业,金融监管总局于2025年9月印发《关于开展保险资金支持金融“五篇大文章”相关数据试填报工作的通知》,对保险资金运用支持金融“五篇大文章”情况进行统计,涉及债券、基金、股票、股权、投资性不动产、保险资产管理产品、金融产品等相关类型的资产。
统计报送实践层面,上述统计要求有以下三个特点:一是各领域的报送要求各有侧重。例如,数字金融领域的《工业重点行业领域设备更新和技术改造指南》只在部分监管文件中作为统计标准出现。二是认定口径略有区分。各领域的统计范围不同,识别路径存在区别。例如,对于绿色企业,部分报送要求认可通过企业营业收入占比进行判断的识别路径,而其他监管文件则未作要求。三是对机构实际操作的要求较高。各领域统计要求在指标体系的精细程度、穿透层级等方面存在差异,部分机构需要同时适配多套标签,对其数据治理提出较高要求。
整体来看,当前金融“五篇大文章”的统计实践面临口径有差异、统计颗粒度多样的情况,凸显了在数据治理层面建立相关标准、统一标签体系与识别规则的紧迫性与重要性。
金融“五篇大文章”的统计现状
目前,各类金融机构均已开展金融“五篇大文章”相关统计工作,其驱动因素、开展模式、数据获取和应用情况呈现以下特点:一是监管要求是核心驱动力。对于保险公司、理财公司、信托公司等主体,监管部门已出台相对具体的统计指引,数据统计工作有序开展。与此同时,部分领域尚未出台具体的统计要求,相关能力建设仍处于探索阶段。二是牵头部门以中后台为主,逐步建立跨部门协同机制。据调研,金融“五篇大文章”统计报送工作的牵头部门一般为运营、数据及风险管理等中后台部门,前台业务部门作为需求方和校验方参与。金融“五篇大文章”统计报送体量大,涉及各个投资方向的数据统计,如何建立常态化、制度化的跨部门数据沟通与核查机制,成为多数机构内部数据治理面临的课题。三是数据获取和统计主要依靠外部数据与内部人工判断相结合的模式。考虑到金融“五篇大文章”涉及领域广泛、认定规则复杂、报送要求时间紧,自建全套数据识别体系成本高,部分机构倾向于使用第三方机构的数据服务辅以内部业务校验方式进行统计报送。四是数据治理及应用呈拓展趋势。大型金融机构凭借其充足的资源与人才储备,在统计报送方面投入大,并进一步将统计工作融入前中台,推动其从单纯统计报送向主动应用演进。例如,将金融“五篇大文章”标签数据应用于资产配置、产品创新等领域,体现统计工作价值的正外部性。
作为统计报送的责任主体,金融机构普遍反映面临以下挑战。一是实际操作层面存在一定挑战。例如,产业目录的描述与企业、资产所披露的信息难以精准匹配,可能导致对同一资产或主体的认定存在差异。二是数据质量需要提升。一方面,当前市场上相关数据商的口径与统计要求可能存在偏离与滞后情况,导致机构需要投入较大精力进行校验,且难以确保统计数据与行业具有一致性和可比性;另一方面,第三方数据难以覆盖全部资产领域(如部分非公开募集资产),金融机构需要自行补充收集信息,数据获取难度大、成本高。三是数据治理能力亟须升级。金融机构需要建立维护金融“五篇大文章”主题标签体系,适配一套甚至多套统计标准,这对其源头数据质量、系统对接能力、内控流程等提出了较高要求。
金融“五篇大文章”数据治理研究
(一)金融“五篇大文章”标签化体系设计
中央结算公司持续配合主管部门开展金融“五篇大文章”的统计口径制定及数据治理工作,构建了一套严谨、系统、可扩展的金融“五篇大文章”标签体系。
1.设计原则
本标签体系遵循兼容、审慎的原则,以《总体统计制度》为基础,全面融合各专项统计要求,确保数据的准确性及可比性。标签体系由资产基本信息与主题标签信息两部分构成。
2.资产基本信息
资产基本信息标签字段的选取聚焦两方面:一是经过数据治理后每项资产的身份识别与关联信息,如资产根码、债券代码等;二是可以支撑多维度统计分析的通用信息,如发行人地区、行业分类、债券类型、主题债、募集资金投向等。此类数据的治理难点在于原始数据披露的非标准化。以“发行人地区”字段为例,原始披露信息可能为国家、省、市甚至具体地址等具有不同颗粒度的信息,格式混杂。为此,中央结算公司在数据治理过程中建立了标准化清洗与映射规则,将各类地址信息统一归集至省/市级行政区划代码,确保该字段在统计时具有一致的口径与明确的业务含义。
3.主题标签信息
主题标签信息模块创新性设计了三级递进式标签体系。一级标签(主题层)对应金融“五篇大文章”五大领域,即科技金融、绿色金融、普惠金融、养老金融、数字金融。二级标签(名录层)在一级标签下,依据管理部门规定的产业目录、企业名录等进行细分。例如,在“科技金融”的一级标签下,二级标签可进一步区分高技术产业(制造业)、高技术产业(服务业)、战略性新兴产业、工业战略性新兴产业、知识产权(专利)密集型产业。三级标签(类别层)在二级标签基础上,对资产的具体分类进行区分。例如,对于高技术产业(制造业)的科技金融主题债券,可进一步标注其属于高技术产业(制造业)下医药制造业等7个分类中的具体领域(标签示例见表1)。
本标签体系将分散的政策要求转化为清晰、可执行、可校验的数据规则,可以有效支持多角度数据统计与效果评估,提升行业数据的一致性和可比性。
(二)多维识别与验证机制
1.企业主体的金融“五篇大文章”标签识别与验证
对企业主体的标签识别,可以从企业名录、企业属性、产业目录三个维度进行判断。
企业名录、企业属性的判断主要基于科技型企业名录、中小微企业类型划分标准等,标准明确、指标相对单一,核心挑战在于如何确保所获取的企业名录、员工人数及营业收入等工商数据的准确性和及时性。
对产业目录的判定是标签识别的主要任务与难点。大部分金融“五篇大文章”产业目录虽然与《国民经济行业分类》(GB/T 4754-2017)存在映射关系,但企业自身并不直接具备国民经济行业分类(以下简称“行业分类”)。因此,将非标准化的企业主营业务描述准确归入标准的行业分类,并据此与相关产业目录进行匹配,是识别企业金融“五篇大文章”标签的关键步骤。
基于以上分析,中央结算公司确立了以行业分类为核心的识别方法,具体分为以下两个步骤:
一是基于企业主营业务判断行业分类。系统采集发行人的企业财务审计报告、财务报表,提取其主营业务收入构成、关键产品与服务描述信息。设计融合定量(收入占比)与定性(业务描述)的行业分类判断逻辑,通过对以上文本与数据的清洗、标准化和关键词分析,辅以必要的专家研判,将其与行业分类中的相关分类和定义进行比对,进而判定企业所属的行业分类。
二是构建行业分类与金融“五篇大文章”主题产业规则之间的映射。在识别出企业行业分类的基础上,通过深入研究各类金融“五篇大文章”产业目录的政策内涵与范围界定,构建了从行业分类到金融“五篇大文章”主题产业的匹配规则。以图1中的企业为例,该套规则可将行业小类“集成电路制造”映射至“科技金融”“战略性新兴产业”“新一代信息技术产业”,并匹配上相应的一级、二级和三级标签。
该过程的核心难点在于产业目录与行业分类并非简单的完全对应关系,实际工作中存在完全匹配、不匹配以及部分匹配3种情形。当产业目录条目后带有“*”号时,表明该条目仅包含对应国民经济行业中的部分行业活动。此时,不能仅凭行业分类进行直接认定,必须穿透至企业的具体经营活动层面进行研判。
2.债券资产的金融“五篇大文章”标签识别与验证
债券资产的标签识别有两个路径,一是识别债券发行人,二是识别债券募集资金用途。根据前文已建立的标签识别体系,若债券发行人已被认定是金融“五篇大文章”的主题企业,则其发行的全部债券可被认定为对应的主题资产。
募集资金用途维度的标签认定分为贴标债券和非贴标债券两种情况。对于贴标债券,由于此类债券已在发行时经相关管理机构审批并贴标(如“绿色债券”“科技创新债券”“乡村振兴债券”等),原则上直接采纳其既有标签,并纳入对应主题统计。其核心挑战在于,随着政策深化,标准会进行优化更新,可能导致部分早期贴标债券所依据的认定标准与现行统计标准存在差异。例如,贴标绿色债券方面,2015年和2021年的《绿色债券支持项目目录》与现行统计标准要求存在少量不一致的情况;科技创新债券方面,在2025年5月债券市场“科技板”推出后,对此类债券重新制定了相关标准。为解决上述问题,中央结算公司一是建立贴标债券与历版政策目录的映射关系,明确其发行时所依据的具体规则版本;二是在统计时遵循“新老划断”原则,对于存续债券,原则上按其发行时有效的规则进行归类,保持历史数据的一致性与可比性。
对于非贴标债券,则通过系统化解析募集说明书等文件,提取募集资金投向信息,与各金融“五篇大文章”产业目录进行逐一匹配。若资金用途明确指向某一主题产业目录内的具体项目或领域,则该债券可被认定为对应的主题资产。若涉及复杂或模糊描述,则辅以专业人员进行最终核验。
本识别方法也可以拓展应用于其他标准化金融资产,如公募基金(通过穿透其底层资产组合或产品发行文件,判断是否将金融“五篇大文章”领域作为主要投资方向),为统计金融机构支持金融“五篇大文章”提供了可复用的解决方案。
(三)金融“五篇大文章”数据治理流程
金融“五篇大文章”统计涉及多类数据资源,涵盖金融资产数据、企业主体数据、产业目录、资质认证数据等。其中,金融资产数据以主题债券数据为主,覆盖绿色债券、乡村振兴债券等不同类型的主题债券信息;企业主体数据覆盖企业基本信息、行业分类、财务数据等;产业目录为各部委发布的10余类重点产业目录;资质认证数据包括各类国家级、省级、市级认证数据以及10余项资质认证信息。
1.数据治理
金融“五篇大文章”数据治理流程覆盖数据“采集—接入—加工”全链条,通过建立完善高效的数据治理机制,依托数据仓库的分层治理模式实现口径统一,进而构建覆盖数据生产全流程的质量监控体系。通过数据治理,解决数据格式不统一、披露不标准、口径不明确、数据无法关联等难点,实现数据定义、格式、规则的标准化,形成体系化、可复用的标准基础数据。
2.数据采集
金融“五篇大文章”数据涵盖各种形式和结构的数据披露源,数据内容以非结构化信息为主,采集难度较大。非结构化数据需要结合披露特征、数据使用需求等制定科学、严谨的数据标准和数据采集规范,明确数据采集字段、采集规则及采集案例,将非结构化内容采集为标准的结构化数据。
在采集端,建立“规则校验+人工复核”的双重校验机制。一是通过跟踪实际数据情况,动态增加校验规则,形成完善的规则库,包括格式校验、字段间逻辑校验、字段阈值校验等,借助系统实现自动化数据质量监控,实现数据采集的完整性、准确性与规范性的校验;二是通过人工复核,对非标准化数据进行二次校验,确保采集数据与披露信息的一致性。
3.数据接入
数据接入阶段,通过制定金融“五篇大文章”数据字典,明确数据披露源、覆盖范围、更新频率等;通过制定数据元标准,明确数据口径;通过统一指标编码和指标分类,形成清晰的指标体系;通过记录数据来源,确保数据融合后仍能对数据流溯源,解决多源数据标准不统一、口径不一致、数据孤岛无法关联等问题。
4.数据加工
结合数据使用需求、特定业务规则、数据标准等制定数据加工规范和逻辑,将标准化数据进行衍生加工,形成符合产品口径的数据,并对数据的异动、缺失等进行常态化质量监控,通过数据一致性、逻辑准确性、口径统一性、波动合理性、信息完整性等多种监控手段对结果数据进行巡检,形成完整的逻辑闭环。
(四)金融“五篇大文章”数据应用
基于以上数据治理成果,中央结算公司一是深度参与主管部门统计标准的起草、征求意见、问题答疑、报送培训等全流程工作,提供坚实的数据支持;二是创新研发中债金融“五篇大文章”主题数据库(以下简称“数据库”),从企业、证券、资管产品等角度进行金融“五篇大文章”要素识别,全面覆盖A股及港股上市公司、境内债券发行人以及资产支持证券(ABS)、地方政府债券、公募不动产投资信托基金(REITS)等资产。数据库可支持机构对金融“五篇大文章”领域标的开展多个监管报送口径的统计报送,也可以为机构开展主题投资提供参考。数据库部分页面示例见图2。
数据库推出以来,获得市场的广泛认可。目前,已支持近百家保险机构、理财公司、银行等各类金融机构完成多轮统计报送工作,大幅降低机构的数据治理成本,提升行业统计数据的一致性和可比性,同时也为机构开展相关主题投资、创新业务提供数据支持。
研究的创新点与意义
(一)系统梳理金融“五篇大文章”的统计口径,夯实协同基础
当前,金融“五篇大文章”相关资产及主体的识别认定涉及多个细分领域。各领域的统计指标体系在产业目录引用、识别路径以及数据报送要求等方面存在一定差异。本研究通过系统比对现行统计规范与操作指引,厘清不同统计对象的识别归类逻辑,为后续推动统计标准衔接与口径协调提供扎实的基础。
(二)首创“标准—治理—应用”三位一体的数据治理体系
本研究构建覆盖金融“五篇大文章”识别、标签化、验证的闭环体系。通过结合产业政策、行业分类目录及统计指引,细化五大领域的业务边界与认定规则,建立层级清晰、依据明确的标签体系,为统一统计口径提供可操作、可落地的技术路径。
(三)强化跨域协同与基础设施赋能,服务多方主体需求
基于本研究成果,中央结算公司持续搭建高质量、可追溯的金融“五篇大文章”主题数据库,为监管部门完善统计制度提供方法支撑,为宏观政策效果评估提供数据基础。与此同时,为金融机构规范开展统计报送提供操作指引,有效推动机构打通各业务条线数据治理的堵点,高效推动相关统计工作的落地实施。
未来展望
高质量的数据是金融机构做好金融“五篇大文章”、开展可持续投融资的重要基础。未来,中央结算公司将持续履行金融基础设施职责使命,持续提升标准化、智能化、高效化的资产识别与分类能力,不断提升主题数据库的覆盖范围及数据质量;向市场机构提供包括数据库及识别工具在内的一站式数据服务,助力机构做好相关统计报送与业务创新,为做好金融“五篇大文章”持续贡献中债力量。
注:
1.中央结算公司课题组组长:牛玉锐,组员:魏晓宁、王雷、杨惠心、黄稚渊、黄晨、唐洁珑、杜通、段怡然、黄嘉睿。