“海量”专题(159)——大单因子的行业有效性分析
新浪财经
来源:海通量化团队
高频因子在选股中的应用,我们发布过多篇报告进行探讨。本篇报告主要针对高频数据计算的大单因子,考察其在行业轮动策略中的效果。
1
行业维度大单因子的计算
1.1
因子的计算方式
在计算行业大单因子之前,需要先计算个股的大单数据。在每个交易日对于每个股票单独设定大单筛选阈值。每个交易日,各股票的大单筛选流程如下:1)基于股票买卖单成交量,计算成交量标准差;2)将成交量大于均值1倍标准差的买卖单认定为大单。个股的大单买入金额占比因子为大单买入金额/总成交金额。
行业维度的大单因子,我们总共通过3种方法计算。
1) 行业整体法:(行业内所有股票当日的大单买入金额之和)/(行业内所有股票当日的成交金额之和);
2) 简单平均法:计算每只股票的大单买入金额占比因子,行业内所有股票的该因子进行简单平均;
3) 头部股票平均法:统计全市场大单买入金额占比排名前200的股票,将股票对应到各自所在行业,计算行业内这些股票的平均大单买入金额占比。
针对中信一级行业(旧行业分类29个行业),计算上述三个因子;针对中信二级行业(旧行业分类83个行业),计算行业整体法因子。
在每一个时间节点,通过因子进行行业筛选的时候,针对上述每一个因子,构建三种筛选方法:
1)时点数据:当前时点计算得到的因子,即为采用的最终因子;
2)滚动均值:采用过去10天的滚动数据计算因子均值,得到的为最终采用因子;
3)突破:当前的时点数据-滚动均值,得到的为最终因子。
1.2
因子的考察方式
针对每一个因子,以及每一种筛选方式,考察因子与行业收益之间的RankIC表现,以及因子选到的多头组合和空头组合的收益。(一级和二级行业均选择前/后20%的行业数量。)后文中所展示的IC数据,均为RankIC数据,统一简称为IC。因子的考察周期,分别为持有5、10、20、30、40、60个交易日的收益。
所有样本区间为2014年初至2020年1月底。
2
一级行业整体法因子
2.1
因子表现的敏感性分析
下图中,分别按照计算方法和持有期两种维度,对因子的IC以及ICIR进行汇总,考察因子的敏感性。时点数据以及突破算法,相对而言因子表现更好。从持有期角度,持有期越短,因子ICIR越高。
2.2
因子分组收益
下图中,针对时点算法和突破算法,考察因子的五分组收益。即按照因子值对所有行业进行排序,分为5组考察每一组的平均收益。当持有期为20天以上时,分组收益的单调性较差,每组之间收益差别很小。持有期越短,分组收益单调性越强。
3
一级行业简单平均法因子
3.1
因子表现的敏感性分析
下图中展示因子敏感性。与整体法因子一致,时点算法和突破算法的因子表现较好。5天持有期的因子ICIR最高。
3.2
因子分组收益
从分组收益来看,持有期较短的分组单调性更强。时点算法和突破算法比较,持有期为5天时,突破算法的单调性更优。
4
一级行业头部股票因子
4.1
因子表现的敏感性分析
采用头部股票计算行业因子,依然是时点算法和突破算法较好,5天持有期的因子ICIR最高。
4.2
因子分组收益
从单调性来看,头部股票因子的单调性较差,不如行业整体法和简单平均法单调性明显。
5
二级行业整体法因子
5.1
因子表现的敏感性分析
与一级行业不同,对于二级行业,时点数据和滚动平均算法下,因子ICIR和IC都表现更好。
5.2
因子分组收益
下图中展示了时点算法和滚动平均算法的分组收益,普遍而言,持有期为5天时分组收益单调性最强。
6
大单因子的一级行业组合
6.1
因子累计IC
对于行业组合的操作,通常而言集中在一级行业进行,一级行业的操作建议更容易与个股组合进行结合。本节主要针对一级行业,主要采用行业整体法因子,计算行业组合的表现。
在之前的分析中,发现时点算法和突破算法的因子表现更优,下图中展示了以10天为持有期计算得到的因子IC累计走势。发现在2016年之前,大单因子表现一般,但是2016年之后,因子稳定性很强,持续有效。
6.2
5日换仓行业组合
在前文的分析中我们发现,持有期较短的情况下,因子表现更为稳定,这里以持有期5天为例,主要根据突破算法因子构建组合。每5天进行调仓,选择因子排名前5的行业进行建仓。下图中展示了行业组合相对同期Wind全A的相对强弱走势以及对应的最大回撤。2次的最大回撤发生时间分别为2014年底金融股强势拉升时,以及2015年股市异常波动期间,其他时间的最大回撤在8%左右。
下表中统计了不同年度的组合收益情况以及年化收益表现。超额收益的统计分别以Wind全A和全市场等权加权行业指数两种基准进行展示。从分年度收益来看,2014年行业组合没有跑赢基准,2015年以来稳定战胜等权和市场基准。
6.3
10日换仓行业组合
将持有期调整为10天,继续考察行业组合的表现。历史上的最大回撤,发生在2015年股市异常波动期间,其他时间回撤大部分控制在8%以内。
10天换仓组合自2014年以来,每年均战胜Wind全A以及市场等权基准。年化超额收益约为10%,信息比超过1,最大回撤约为15%。
6.4
持有期对组合收益影响
下表中依然以突破算法因子为例,考察不同的持有期下,行业组合收益表现。相对而言,持有期较短时年化收益更高,但最优的持有期为10天。随着持有期拉长,年化收益会有一定幅度的下降,所以更推荐采用行业维度的大单因子指导10个交易日以内的行业操作。
6.5
持仓数量对组合收益影响
下表中以突破算法因子为例,在持有期为10个交易日的情况下,考察持仓行业数量对于行业组合收益的影响。收益计算基准为等权行业基准。持仓行业数量并非越少越好,行业数量过少,组合暴露的风险更为集中,当出现误判时组合回撤会加大。例如持仓2个行业的组合,最大回撤为-16%,而持仓10个行业的组合,最大回撤为-10%。持仓数量在4-5个时组合最优,组合年化收益约11%,信息比在1.1左右。
下图中展示不同年度,不同持仓数量组合的超额收益分布。在趋势上涨行情中,如2015、2017以及2019年,不同持仓数量的行业组合超额收益差距显著,尤其以2015年最为突出。在这些年度,数量较少的行业组合由于集中的风险暴露,通常而言超额收益位居首位。但这种行业组合在趋势下跌行情中(如2018年),同样的由于风险暴露问题,超额收益表现最差。持仓数量较多的行业,虽然年度超额收益不太能够名列前茅,但基本在各年度均能战胜指数。
7
总结
本篇报告主要针对高频数据计算的大单因子,考察其在行业轮动策略中的效果。
报告计算了三种大单因子:行业整体法大单因子;简单平均法因子;头部股票平均因子。针对每一个因子,均通过三种方式构建最终大单因子:时点数据因子,滚动均值因子,突破因子。
分别考察5、10、20、30、40、60个交易日持有期的因子表现,持有期越短,因子ICIR表现越优,分组收益单调性越强。
从因子表现来看,更推荐行业整体法因子以及简单平均法因子。从计算方式而言,绝大多数情况下,时点数据算法和突破算法的因子表现最优。从因子表现、多头组合以及多空收益来看,更推荐在一级行业层面构建组合。
通过行业整体法构建突破算法的大单因子,10天换仓组合自2014年以来,每年均战胜Wind全A以及市场等权基准。年化超额收益约为10%,信息比超过1,最大回撤约为15%。
以行业整体法下的突破算法大单因子为例,考察不同持有期行业组合收益表现。相对而言,持有期较短时年化收益更高,最优的持有期为10天。随着持有期拉长,年化收益会有一定幅度的下降,更推荐采用行业维度的大单因子指导10个交易日以内的行业操作。
以行业整体法下的突破算法大单因子为例,在持有期为10个交易日的情况下,考察持仓行业数量对于行业组合收益的影响。持仓行业数量并非越少越好,行业数量过少,组合暴露的风险更为集中,当出现误判时组合回撤会加大。例如持仓2个行业的组合,最大回撤为-16%,而持仓10个行业的组合,最大回撤为-10%。持仓数量在4-5个时组合最优,组合年化收益约11%,信息比在1.1左右。
6
风险提示
市场系统性风险、模型误设风险。
联系人:郑雅斌 021-23219395