新浪财经

宏观逻辑的量化验证:动态因子模型 | 量化专题报告

新浪财经

关注

来源:留富兵法

报告摘要

本报告尝试解决宏观逻辑的结合与配权问题。宏观因素影响资产价格的逻辑与数据链条有很多,各链条影响程度不同。传统的配权方法无法解决链条相关性导致的共线性问题,且从逻辑角度也较难解释和理解。

动态因子模型为宏观逻辑配权提供了解决方案。本报告详细阐述了动态因子模型的理论形式,动态因子模型假设宏观变量是一个由“公共因子”和“特质扰动项”组成的随机变量,通过对“公共因子”的估计能将大量宏观变量进行降维,从而解决宏观数据大N小t导致的参数无法估计的问题,以及宏观变量共线性的问题。其通常用于领先指标研究、经济周期研究、经济指标预测等方面。

关于噪音与信息损失的思考。为了更好的理解“公共因子”的逻辑,我们采用Occam剃刀的原则精简“公共因子”中的宏观因子,能够排除一些噪音干扰。动态因子模型以部分信息的扭曲和损失为代价换来了模型精炼和逻辑的强化,因此我们建议增加主成分遍历和特质波动检验环节弥补信息损失。

通过动态因子模型的降维,大量宏观变量可用于预测资产收益率。我们构建了从基础数据处理到最终收益率预测的完整框架。以400个宏观变量构建了包含787个宏观因子的数据库,并展示了包括大类资产、风格因子、行业因子等部分预测模型的样本内外预测效果,欢迎各位投资者关注。

一、宏观逻辑的结合与配权问题

在上一篇报告中,我们利用状态匹配法初探了宏观经济指标和资产价格变化的映射关系。这类方法都存在一个问题:单一宏观经济指标的状态划分信息量有限,使得资产价格判断的波动性较大,而多个宏观经济指标的状态划分叠加虽然信息量增加了但是划分完后的样本数据过少使得规律的显著性大打折扣。因此这类模型亟需解决一个重要的问题:在数据量较小的情况下,多个单一模型/指标预测结果的结合问题。

从各种研究结果来看,预测合成的结果往往比单个预测的结果要好,同时简单合成方法一般和复杂合成效果差不多甚至更好。但这样的合成方式的逻辑解释都是基于某种数据的处理方式,很难找到实际的经济含义,同时对于各个预测可能的共线性问题(逻辑集中),数据量不足等问题也没有很好的解决办法,相对来说较为粗糙。本报告将探讨一种由Geweke(1977)提出,由Stock与Watson等人发展起来的多变量宏观预测方法,这种方法适用于利用大量经济数据(往往数据个数N相对数据量t较大)进行预测。

二、动态因子模型简介

宏观预测领域,传统的模型只能处理少量的自变量,比如向量自回归(VAR)模型最多也仅能处理10个以下的自变量。这就涉及到变量选择的问题,而变量的选择势必会损失一部分数据的信息。另一种思路则将所有有用信息都导入模型,通过组合去噪得到数据集的主要变化因素再对因变量进行相应的预测。宏观经济学中的现代动态一般均衡模型假设存在少量不可观测变量能够解释宏观变量的大部分波动,而且这些不可观测变量可看作宏观变量的一种“公共因子”。这种思想的代表就是动态因子模型(DFM, Dynamic Factor Model),在利用DFM进行预测时分为两步,首先用大量宏观变量估计出“公共因子”,然后用这些“公共因子”去预测。这样的“公共因子”存在一定解释上的难题,然而仅聚焦于其预测能力避免了这个问题。

2.1 模型的形式:动态与静态

2.2 模型的估计:严格与近似

三、基于动态因子模型的宏观-资产关系建模

资产收益率不仅受到外部宏观因素的影响,部分资产也有较强的自相关性,因此我们在资产预测模型构建中除了动态因子,也将资产收益率的滞后项也加入进来:

模型的构建共分为三步:

第一步:宏观因子选择

利用动态因子模型进行预测,一定要输入“有用”的宏观信息。因此我们首先需要对于每一类我们需要预测的资产,分别进行“有用”宏观因子的筛选。我们通过上篇报告《宏观逻辑的量化验证:映射关系混沌初开》提出的ANOVA方差检验法与择时策略检验法对每类资产各选择出满足显著性条件的关系。

第二步:公共因子的提取

将输入的宏观序列进行降维,利用PCA提取对应解释度最大的部分主成分。直接计算PCA得到的权重受到量纲影响,逻辑意义会受到扭曲,因此为了便于理解主成分的逻辑意义,PCA之前需要对变量进行标准化。

第三步:预测模型的构建

我们对公共因子与待预测资产建立带有外生变量的自回归模型。利用所选择的模型对全样本进行样本内预测,获得的预测值转化为对方向的判断(正值对应看多,负值对应看空),利用预测值进行模拟择时,通过择时得到的结果评价模型的优劣。

四、部分显著模型展示

4.1 大类资产:沪深300

在权益资产中,我们以沪深300作为中国权益市场的代理资产。沪深300的投资者成分复杂,收益率决定因素较多,自相关性弱,需要3个“公共因子”才能相对较好的进行解释。

在样本内DFM模型胜率63.11%,同时我们也做了样本外测试:将样本分为2016年之前和2016年之后两段,通过每月滚动重计算动态因子以及预测模型进行预测,样本外胜率可达61.76%。

将回归系数代入代表“公共因子”的主成分,最终的指标配权如下。可以看到在预测沪深300收益率时,进出口以及外资有相当正向的影响,利率以及上一篇报告中提到的彩电产量具有负向影响。除此之外,模型主要涉及工业企业经济效益、价格指数等宏观变量。

4.2 风格因子:波动率

我们以Barra波动率因子收益率作为波动率因子的代理资产,其受到“公共因子”变化程度的影响较大。

在样本内DFM模型胜率71.29%,同时我们也做了样本外测试:将样本分为2016年之前和2016年之后两段,通过每月滚动重计算动态因子以及预测模型进行预测,样本外胜率为79.41%。但由于样本外波动率因子本身波动不大,还需继续观察验证。

“公共因子”的组成成分较为纯粹,基本为工业企业经济效益指标与企业景气指数。也就是说在经济基本面“加速变好”,经济基本面的变化好于线性外推预期的情况下,低波动的股票具有更高的超额收益。

4.3 行业因子:建筑

我们以建筑(中信)减去沪深300的收益率作为建筑行业因子的代理资产。其由一个“公共因子”决定,并受到自身滞后项的影响,具有一定的动量特征。

在样本内DFM模型胜率68.13%,同时我们也做了样本外测试:将样本分为2016年之前和2016年之后两段,通过每月滚动重计算动态因子以及预测模型进行预测,样本外胜率为64.71%。

“公共因子”中正向贡献的主要为汇率和出口,负向贡献的主要为各类工业增加值和合成洗涤剂的产量。建筑企业签订海外合同时往往约定使用国际通行货币或者当地货币进行结算,实际情况中以美元结算居多。多数建筑公司存在较大汇率风险敞口,因此在人民币贬值的时候,建筑行业的将获得更多的汇兑收益。建筑行业的另一条主线与地产相同,即在工业不景气的时期历史上一般会刺激地产和基建,因此利好建筑行业。

五、关于噪音与信息损失的思考

在宏观因子选择的时候,我们往往会纳入较多的宏观因子进行建模,然而引入过多未在逻辑上充分考虑过的宏观因子容易带来较多的噪音,同时使得模型的结果更不易理解。Occam剃刀的原则是:“如无必要,勿增实体”。我们采用Occam剃刀的原则精简输入的宏观变量,使得模型的可读性增强。

在宏观因子选择的时候,我们的框架已经保证了输入的宏观变量一定程度上是“有用”的,而最大几个特征值对应的主成分确实也能解释这组宏观因子的大部分波动,所以大部分情况从前往后挑选主成分没有太大的问题。然而如果入选的宏观因子代表的驱动因素相关性并不高,部分含有重要信息的宏观因子无法在前几大主成分体现,则会被归入后面的主成分从而被舍去。因此我们建议在挑选主成分的时候,不妨检验一下全部主成分的预测能力,以免遗漏重要预测信息。

DFM有其假设的合理性,但是从数据角度来看,如果入选的宏观因子其具有预测作用的信息并非与其他因子的公共部分,而是宏观因子的特质部分,那么通过主成分降维的“平滑”反倒会使得有用的信息被抹平,就会造成预测信息丢失的问题,因此我们建议检验特质波动项。

风险提示:模型建立基于历史数据,在政策、经济结构等因素变化的情况下模型可能失效。模型建立从数据出发,数量关系未必对应因果关系。

本文节选自国盛证券研究所已于2019年4月8日发布的报告《宏观逻辑的量化验证:动态因子模型》,具体内容请详见相关报告。

叶尔乐

S0680518100003

yeerle@gszq.com

刘富兵

S0680518030007

liufubing@gszq.com

加载中...