10年期国债收益率预测研究：基于ARIMAX与混合模型的对比分析

市场资讯 2025.12.04 16:30

◇ 作者：中央结算公司客服中心　王文龙

◇ 本文原载《债券》2025年11月刊

摘要

本文应用ARIMAX模型及ARIMAX-LSTM混合模型，对10年期国债收益率进行预测。预测变量选择方面，借鉴伯南克三因素选取主要预测变量，并生成国债收益率衍生技术指标作为辅助预测变量。预测结果显示：在上述预测变量下，ARIMAX模型能有效拟合10年期国债收益率与预测变量间的线性关系特征，模型残差为白噪声，且模型预测准确性较好；ARIMAX-LSTM混合模型在预测准确性方面未展现出显著优势。研究表明，ARIMAX模型可作为10年期国债收益率预测的参考模型之一，未来可探索在模型中引入更多预测变量、丰富预测的债券类型和期限，并开展债券收益率预测的国际比较。

关键词

国债收益率预测　ARIMAX模型　伯南克三因素　机器学习

引言

国债收益率是金融市场的重要定价参考指标，不仅反映经济基本面情况，更可为防范化解金融风险提供信号。准确预测国债收益率的变化方向，不仅有助于投资者作出有效决策，也能提示由利率走势变化带来的金融风险。在各期限国债收益率中，10年期国债收益率被市场普遍认为是反映中长期利率的关键指标，具有较高的预测价值。

从现有研究来看，时间序列模型和机器学习模型在国债收益率预测中应用较多。ARIMAX模型是时间序列模型的典型代表，对变量间的线性关系有较强的拟合能力，被广泛应用于利率预测。而长短期记忆网络（LSTM）则是机器学习领域的代表模型，能够有效处理非线性数据，是对时间序列模型预测的重要补充，亦被广泛应用于股价、汇率等预测（Hochreiter & Schmidhuber， 1997）。

在影响国债收益率的诸因素中，伯南克三因素1在众多研究中被证实具有较大作用。基于此，本文拟构建ARIMAX模型和ARIMAX-LSTM混合模型（以下简称“混合模型”），以伯南克三因素为主要预测变量，叠加国债收益率衍生技术指标，进行10年期国债收益率预测。首先，应用ARIMAX模型拟合国债收益率与预测变量间的线性关系，并检验模型预测准确性；其次，应用LSTM模型学习ARIMAX模型中的残差信息，形成“线性建模—非线性修正”的混合预测框架，观察该框架是否有助于改进模型的预测准确性。

数据和变量说明、模型构建与预测设计

（一）数据和变量说明

本文数据来源于万得（Wind）数据库。数据时间跨度为2015年1月1日至2025年7月31日，涵盖被预测变量与预测变量两类指标，具体说明如下。

被预测变量为10年期国债收益率，原始数据为日度频率。为适配中长期收益率预测需求并降低日度数据波动较大对预测造成的干扰，将日度数据转换为月度数据：每月所有交易日的收益率取算术平均值，形成10年期国债月度收益率序列。

预测变量共7个指标。

一是居民消费价格指数（CPI）。本文采用国家统计局公布的CPI月度同比数据，测量通胀率。因原始数据的频率为月度，无需进行频率转换。在预测模型中，使用滞后2期CPI作为预测因子。

二是期限利差。以10年期国债收益率与1年期国债收益率的差值作为预测因子，反映期限溢价。原始数据的频率为日度，将其转换为月度频率。转换时，取月内每个交易日的10年期国债收益率与1年期国债收益率的差值的算术平均值。转换后，在预测模型中，使用滞后2期的期限利差。

三是短期利率。以银行间市场存款类金融机构以利率债为质押的7天期回购利率（DR007）作为短期利率代表，反映短期市场资金成本。原始数据的频率为日度，将其转换为月度频率。转换时，取每月内所有交易日的算术平均值。转换后，在预测模型中，使用滞后2期DR007。

四是被预测变量的滚动10期均值。即t-1期（含）之前10个月10年期国债收益率的算术平均值，反映收益率的中长期趋势。

五是被预测变量的滚动10期标准差。即t-1期（含）之前10个月10年期国债收益率的标准差，反映收益率的中长期波动幅度。

六是t-1期当月国债收益率相比上月的涨跌情况。若t-1期10年期国债收益率高于上月则赋值1，等于上月赋值0，小于上月则赋值-1，反映收益率的短期趋势变化。

七是被预测变量的滚动5期标准差。即t-1期（含）之前5个月10年期国债收益率的标准差，反映收益率的中短期波动特征。

（二）预测模型构建

本文构建ARIMAX模型与混合模型两类预测模型，尝试识别国债收益率的变化规律。

1． ARIMAX模型

ARIMAX模型基于时间序列的自相关性与预测变量的解释力，构建线性预测框架。其核心思想是：通过差分处理将非平稳序列转化为平稳序列，利用自回归项捕捉序列自身的滞后影响，移动平均项平滑随机扰动，同时纳入预测变量以反映宏观经济对国债收益率的系统性影响。模型表达式为：

∆dyt=c+∑pi=1φi∆dyt-i+∑qj=1θjεt-j+∑mk=1βkXt-k+εt（1）

其中，yt为t期国债收益率，∆d为d阶差分算子，p、d、q分别为自回归项、差分阶数、移动平均项的滞后阶数，Xt-k为滞后k期的预测变量，βk为预测变量系数，εt为随机扰动项。

模型构建的步骤如下。首先，对国债收益率时间序列进行ADF平稳性检验，避免出现伪回归问题。检验结果显示，序列非平稳，故而对原序列进行一阶差分2，对差分后的序列再次进行ADF检验，显示序列平稳，由此确定差分阶数d为1。

其次，对全部预测变量进行多重共线性检验，即方差膨胀因子（VIF）检验。检验结果显示，滞后2期DR007、t-1期被预测变量滚动10期均值的VIF值均大于10，表明变量间存在显著共线性。为消除多重共线性影响，对上述变量进行主成分分析，提取特征值大于1的主成分1个，将其作为综合因子纳入模型；保留剩余无共线性的预测变量，包括滞后2期CPI、滞后2期期限利差、t-1期被预测变量滚动10期标准差、t-1期当月国债收益率相比上月的涨跌情况、t-1期被预测变量滚动5期标准差。

再次，基于赤池信息量准则（AIC）3筛选最优p、q值，估计模型参数。AIC判断模型最优参数的标准是，AIC值越小，模型越优。

最后，检验残差序列是否为白噪声4，由此判断模型是否拟合充分。

2．混合模型

混合模型的核心思想是通过“线性—非线性”双层建模实现优势互补：利用ARIMAX模型捕捉国债收益率中可由线性规律解释的部分，再通过LSTM模型挖掘ARIMAX模型残差中可能包含的非线性波动信息，最终整合两类信息以提升预测准确性。具体而言，第一步，通过ARIMAX模型对国债收益率yt进行预测，得到线性拟合值ŷt，ARIMAX及残差et = yt - ŷt，ARIMAX，其中残差可能包含ARIMAX模型未解释的非线性波动信息；第二步，使用LSTM模型继续挖掘残差et的信息，生成LSTM对残差的预测值êt。最终，混合模型的预测结果为 ŷt，= ŷt，ARIMAX+ êt。

（三）预测设计：样本划分与滚动预测机制

为确保时间序列预测的严谨性与真实性，本文采用时序一致性原则进行样本划分，并结合滚动预测机制实现模型参数动态更新，具体设计如下。

1．样本时序划分

按照时间顺序，将数据集的前80%划分为训练集，后20%划分为测试集，以避免随机抽样可能产生的“未来信息泄露”，确保训练基于历史数据进行并对未来预测。对于国债收益率数据，2015年1月1日至2025年7月31日涵盖的月份较多，按照80%和20%的比例划分后，训练集数据能够跨越不同的经济周期，测试集数据则可以有效反映最新的市场环境。

2．滚动预测实施步骤

在预测环节，本文采用滚动预测设计，具体流程如下。第一步，使用训练集数据，估计ARIMAX模型与混合模型的参数，并完成对测试集第一期样本的预测。第二步，将测试集第一期样本的实际值纳入训练集中，更新训练集信息，使模型能够充分吸收市场变化。第三步，基于更新后的训练集重新估计模型参数，对测试集下一期样本进行预测。此环节使模型能够根据新的训练数据调整参数，在最新的市场环境下拟合数据，进行预测，提高预测准确性。最后，重复第二步和第三步，直至完成测试集全部样本的预测。

通过上述滚动预测机制，模型能够保持对市场变化的动态适应。例如，当中国人民银行宣布调整短期利率时，滚动预测机制能够将相应信息纳入训练集，使模型在后续的预测中识别短期利率变化对国债收益率的影响。

预测结果与分析

（一）描述性统计与数据特征

为直观呈现10年期国债及主要预测变量的基本特征，表1显示了主要变量的描述性统计结果。

由表1可知，10年期国债收益率平均值为2.95%，标准差为0.53%，波动幅度中等；最大值为3.94%，最小值为1.64%，说明在2015年1月至2025年7月，既存在过高利率环境，也存在过低利率环境，反映出宏观经济和政策环境经历了较大变化。CPI平均值为1.52%，从长期均值看，通货膨胀水平属于温和状态。国债期限利差的平均值为0.61%，最小值为0.05%，反映曲线向上倾斜，但曾在某个时点极度压缩，接近于零。当月国债收益率相比上月的涨跌均值为负，表明在2015年1月至2025年7月国债收益率整体处于下降趋势。

（二）模型估计结果

1． ARIMAX模型参数估计与残差检验

通过自动参数搜索，确定基于初始训练集的10年期国债收益率的最优ARIMAX模型为ARIMAX（0，1，1），预测变量系数估计结果见表2。

表2显示，涨跌情况的系数为0.0766，在1%的显著性水平下显著，表明t-1期当月国债收益率相比上月的涨跌情况对10年期国债收益率的影响为正。此外，1阶移动平均项的系数为-0.853，在1%的显著性水平下显著，表明1阶移动平均项对10年期国债收益率的影响为负。其他变量的系数均不显著。

残差检验结果显示，ARIMAX模型的残差序列通过了白噪声检验，即Ljung-Box检验p值大于0.1，表明线性模型已充分提取国债收益率序列中的信息，未提取部分主要为白噪声。该结果反映出ARIMAX模型对10年期国债收益率与预测变量间的线性关系特征进行了有效拟合。

2． LSTM模型训练效果

尽管ARIMAX模型残差为白噪声，仍按原设计训练LSTM模型。在LSTM模型训练过程中，回看步数5、层中单元数量6、学习率7、丢弃率8的选择对训练效果有较大影响。经过多次试验，发现回看步数为12、层中单元数量为128、学习率为0.001、丢弃率为0.3时，模型的训练效果较好，向最优参数组合的收敛速度适中，且能够避免过度拟合。早停法的应用也起到了重要作用，即当验证集损失在连续15轮训练中没有明显下降时，停止训练，防止模型过度拟合训练集数据。

训练结果显示，验证集损失在第22轮达到最小值0.0617，但高于ARIMAX残差的方差0.0039，表明LSTM对噪声的拟合可能多于有效信息。这是因为ARIMAX模型已经充分识别了国债收益率中的线性规律，残差主要为白噪声，LSTM模型难以从中进一步提取有价值的非线性信息。

（三）预测效果评估

1．预测误差对比

以测试集为样本，基于滚动预测结果，表3对比了两类模型的多个预测精度指标。其中，预测准确性指标的定义是：如果模型预测的国债收益率变化方向与国债收益率的实际变化方向一致，则为预测准确；如果模型预测的国债收益率变化方向与国债收益率的实际变化方向不一致，但国债收益率的预测值与同期实际值误差在5个基点（BP）以内，亦为预测准确。

结果表明ARIMAX模型与混合模型在所有预测精度指标上的表现都相似。

2．测试集中的预测值与实际值对比

为更直观地展示测试集中的预测表现，表4显示了2023年7月至2025年7月的实际值、预测值、误差细节及预测准确性判断。

表4显示了模型预测结果。ARIMAX模型的平均绝对误差在1~28BP；混合模型的平均绝对误差在0~31BP；预测准确性方面，ARIMAX模型与混合模型的预测判断一致，并且当国债收益率走势出现变化时模型都易出现判断错误。

（四）稳健性检验

本文采用多种方法进行稳健性检验分析。首先，调整训练集、测试集比例。当训练集比例调整为70%、测试集比例调整为30%时，ARIMAX模型对10年期国债收益率的预测准确性为85%，混合模型的预测准确性为85%。当训练集比例调整为90%、测试集比例调整为10%时，ARIMAX模型对10年期国债收益率的预测准确性为73%，混合模型对10年期国债收益率的预测准确性为73%。上述结果说明，调整训练集、测试集比例后，ARIMAX模型和混合模型的预测结果仍相似。

其次，调整LSTM回看步数。当回看步数为8时，混合模型对10年期国债收益率的预测准确性为79%；当回看步数为16时，混合模型对10年期国债收益率的预测准确性为79%。尽管回看步数发生变化，但混合模型仍然显示了较为稳健的预测结果。

上述稳健性检验验证了结论的可靠性——当ARIMAX残差为白噪声时，引入LSTM模型对改善预测准确性并无显著改善，ARIMAX模型与混合模型显示了相似的预测效果。

结论与展望

（一）研究结论

在全球债务高企与金融市场波动加剧的背景下，国债收益率预测技术的创新发展，本质上是完善中国特色金融风险防控体系的重要探索。本文构建了ARIMAX模型和混合模型，以伯南克三因素为主要预测变量和国债收益率衍生指标为辅助预测变量，对10年期国债收益率进行预测，得出以下结论。

一是ARIMAX模型在预测10年期国债收益率方面具有较高的预测准确性。该模型能够有效识别10年期国债收益率与预测变量的线性关系，充分提取了10年期国债收益率序列中的线性规律信息，模型残差序列为白噪声。经测试，该模型能够对10年期国债收益率的变化进行有效预测。

二是混合模型对10年期国债收益率的预测，在预测准确性方面未展现出明显优势。这是因为，ARIMAX模型的残差为白噪声，LSTM模型在训练时更多地学习了该噪声而非有效信息，在这种情况下，混合模型预测准确性与ARIMAX模型相似。

三是根据模型预测结果，当10年期国债收益率走势出现拐点时，ARIMAX模型与ARIMAX-LSTM模型预测准确性较差。

（二）政策建议

对发行人而言，ARIMAX模型对10年期国债收益率的预测结果有助于优化发行安排。该模型对10年期国债收益率的走势进行预测，可以为发行人在安排债务规模、发行时机和发行期限等方面提供科学支持。

对投资人而言，ARIMAX模型对10年期国债收益率的预测结果可为其资产配置决策提供依据。投资人在对不同类别的资产进行配置抉择时，10年期国债收益率的变化方向会对该决策产生重要影响。稳健地预测10年期国债收益率走势，能够有效帮助投资人判断市场情绪，降低投资风险。

对实体企业而言，ARIMAX模型对10年期国债收益率的预测有助于企业作出更明智的融资决策。10年期国债收益率作为我国利率体系的重要组成部分，对市场融资成本具有指示作用。实体企业可参考模型对10年期国债收益率的走势进行判断，研究合理的融资计划，降低融资成本。

（三）研究展望

一是可探索在伯南克三因素和国债收益率滚动均值、滚动标准差、当月国债收益率相比上月的涨跌情况等技术指标外，引入更多的变量作为预测因子，如宏观经济运行情况、债券市场交易情况等，以进一步改善模型的预测准确性。

二是可探索丰富预测的债券种类和期限，如对各期限的国债收益率进行预测，为更多市场参与者的决策提供判断支持。

三是可探索预测国际债券市场中的债券收益率，进行预测准确性的跨市场比较分析，如探究不同国家国债收益率预测的异同点等。（本文为“控风险　御波动　谋长局”主题征文优秀文章）

注：

1．伯南克三因素是美联储前主席本·伯南克（Ben Bernanke）提出的长期利率（如10年期美债收益率）驱动因素分析框架，该框架将长期利率分解为三个独立要素，包括预期的未来实际短期利率、通胀预期、期限溢价。

2．一阶差分是通过计算相邻两个时间点观测值的差值，实现对原始序列的转换，目的是消除原始序列的趋势性波动与提升数据平稳性，为后续建模奠定基础。

3．赤池信息量准则是统计学中用于模型选择的经典准则，帮助从多个候选模型中筛选出解释能力强且简洁的最优模型。

4．白噪声是一种随机信号，残差为白噪声，说明当前模型已充分捕捉了数据中的系统性信息，残差中仅剩随机波动，使用当前模型已无法进一步提取有效信息。

5．回看步数是LSTM模型的参数，指模型进行当前预测时，所依赖的连续历史数据的个数。

6．层中单元数量是LSTM模型的参数，指负责对序列数据进行特征编码、信息存储与动态更新的计算单元总数，反映模型对复杂特征的表征能力。

7．学习率是LSTM模型的参数，指在模型训练阶段，模型根据预测结果与真实结果的误差，调整模型内部参数（权重、偏置）时所采用的参数更新幅度系数，影响模型向最优参数组合收敛的速度与稳定性。

8．丢弃率是LSTM模型的参数，指在模型训练阶段，为抑制过拟合而随机停用部分计算单元的比例，避免模型过度依赖少数单元学习的局部特征，从而提升泛化能力。

参考文献

[1] 郑葵方．我国长期限国债收益率走势预测：基于多因素的实证分析[J]．中国货币市场，2025（7）．

[2] HOCHREITER S， SCHMIDHUBER J． Long Short-Term Memory[J]． Neural Computation， 1997（8）．