新浪财经

“海量”专题(159)——大单因子的行业有效性分析

新浪财经

关注

来源:海通量化团队

高频因子在选股中的应用,我们发布过多篇报告进行探讨。本篇报告主要针对高频数据计算的大单因子,考察其在行业轮动策略中的效果。

1

行业维度大单因子的计算

1.1

因子的计算方式

在计算行业大单因子之前,需要先计算个股的大单数据。在每个交易日对于每个股票单独设定大单筛选阈值。每个交易日,各股票的大单筛选流程如下:1)基于股票买卖单成交量,计算成交量标准差;2)将成交量大于均值1倍标准差的买卖单认定为大单。个股的大单买入金额占比因子为大单买入金额/总成交金额。

行业维度的大单因子,我们总共通过3种方法计算。

1) 行业整体法:(行业内所有股票当日的大单买入金额之和)/(行业内所有股票当日的成交金额之和);

2) 简单平均法:计算每只股票的大单买入金额占比因子,行业内所有股票的该因子进行简单平均;

3) 头部股票平均法:统计全市场大单买入金额占比排名前200的股票,将股票对应到各自所在行业,计算行业内这些股票的平均大单买入金额占比。

针对中信一级行业(旧行业分类29个行业),计算上述三个因子;针对中信二级行业(旧行业分类83个行业),计算行业整体法因子。

在每一个时间节点,通过因子进行行业筛选的时候,针对上述每一个因子,构建三种筛选方法:

1)时点数据:当前时点计算得到的因子,即为采用的最终因子;

2)滚动均值:采用过去10天的滚动数据计算因子均值,得到的为最终采用因子;

3)突破:当前的时点数据-滚动均值,得到的为最终因子。

1.2

因子的考察方式

针对每一个因子,以及每一种筛选方式,考察因子与行业收益之间的RankIC表现,以及因子选到的多头组合和空头组合的收益。(一级和二级行业均选择前/后20%的行业数量。)后文中所展示的IC数据,均为RankIC数据,统一简称为IC。因子的考察周期,分别为持有5、10、20、30、40、60个交易日的收益。

所有样本区间为2014年初至2020年1月底。

2

一级行业整体法因子

2.1

因子表现的敏感性分析

下图中,分别按照计算方法和持有期两种维度,对因子的IC以及ICIR进行汇总,考察因子的敏感性。时点数据以及突破算法,相对而言因子表现更好。从持有期角度,持有期越短,因子ICIR越高。

2.2

因子分组收益

下图中,针对时点算法和突破算法,考察因子的五分组收益。即按照因子值对所有行业进行排序,分为5组考察每一组的平均收益。当持有期为20天以上时,分组收益的单调性较差,每组之间收益差别很小。持有期越短,分组收益单调性越强。

3

一级行业简单平均法因子

3.1

因子表现的敏感性分析

下图中展示因子敏感性。与整体法因子一致,时点算法和突破算法的因子表现较好。5天持有期的因子ICIR最高。

3.2

因子分组收益

从分组收益来看,持有期较短的分组单调性更强。时点算法和突破算法比较,持有期为5天时,突破算法的单调性更优。

4

一级行业头部股票因子

4.1

因子表现的敏感性分析

采用头部股票计算行业因子,依然是时点算法和突破算法较好,5天持有期的因子ICIR最高。

4.2

因子分组收益

从单调性来看,头部股票因子的单调性较差,不如行业整体法和简单平均法单调性明显。

5

二级行业整体法因子

5.1

因子表现的敏感性分析

与一级行业不同,对于二级行业,时点数据和滚动平均算法下,因子ICIR和IC都表现更好。

5.2

因子分组收益

下图中展示了时点算法和滚动平均算法的分组收益,普遍而言,持有期为5天时分组收益单调性最强。

6

大单因子的一级行业组合

6.1

因子累计IC

对于行业组合的操作,通常而言集中在一级行业进行,一级行业的操作建议更容易与个股组合进行结合。本节主要针对一级行业,主要采用行业整体法因子,计算行业组合的表现。

在之前的分析中,发现时点算法和突破算法的因子表现更优,下图中展示了以10天为持有期计算得到的因子IC累计走势。发现在2016年之前,大单因子表现一般,但是2016年之后,因子稳定性很强,持续有效。

6.2

5日换仓行业组合

在前文的分析中我们发现,持有期较短的情况下,因子表现更为稳定,这里以持有期5天为例,主要根据突破算法因子构建组合。每5天进行调仓,选择因子排名前5的行业进行建仓。下图中展示了行业组合相对同期Wind全A的相对强弱走势以及对应的最大回撤。2次的最大回撤发生时间分别为2014年底金融股强势拉升时,以及2015年股市异常波动期间,其他时间的最大回撤在8%左右。

下表中统计了不同年度的组合收益情况以及年化收益表现。超额收益的统计分别以Wind全A和全市场等权加权行业指数两种基准进行展示。从分年度收益来看,2014年行业组合没有跑赢基准,2015年以来稳定战胜等权和市场基准。

6.3

10日换仓行业组合

将持有期调整为10天,继续考察行业组合的表现。历史上的最大回撤,发生在2015年股市异常波动期间,其他时间回撤大部分控制在8%以内。

10天换仓组合自2014年以来,每年均战胜Wind全A以及市场等权基准。年化超额收益约为10%,信息比超过1,最大回撤约为15%。

6.4

持有期对组合收益影响

下表中依然以突破算法因子为例,考察不同的持有期下,行业组合收益表现。相对而言,持有期较短时年化收益更高,但最优的持有期为10天。随着持有期拉长,年化收益会有一定幅度的下降,所以更推荐采用行业维度的大单因子指导10个交易日以内的行业操作。

6.5

持仓数量对组合收益影响

下表中以突破算法因子为例,在持有期为10个交易日的情况下,考察持仓行业数量对于行业组合收益的影响。收益计算基准为等权行业基准。持仓行业数量并非越少越好,行业数量过少,组合暴露的风险更为集中,当出现误判时组合回撤会加大。例如持仓2个行业的组合,最大回撤为-16%,而持仓10个行业的组合,最大回撤为-10%。持仓数量在4-5个时组合最优,组合年化收益约11%,信息比在1.1左右。

下图中展示不同年度,不同持仓数量组合的超额收益分布。在趋势上涨行情中,如2015、2017以及2019年,不同持仓数量的行业组合超额收益差距显著,尤其以2015年最为突出。在这些年度,数量较少的行业组合由于集中的风险暴露,通常而言超额收益位居首位。但这种行业组合在趋势下跌行情中(如2018年),同样的由于风险暴露问题,超额收益表现最差。持仓数量较多的行业,虽然年度超额收益不太能够名列前茅,但基本在各年度均能战胜指数。

7

总结

本篇报告主要针对高频数据计算的大单因子,考察其在行业轮动策略中的效果。

报告计算了三种大单因子:行业整体法大单因子;简单平均法因子;头部股票平均因子。针对每一个因子,均通过三种方式构建最终大单因子:时点数据因子,滚动均值因子,突破因子。

分别考察5、10、20、30、40、60个交易日持有期的因子表现,持有期越短,因子ICIR表现越优,分组收益单调性越强。

从因子表现来看,更推荐行业整体法因子以及简单平均法因子。从计算方式而言,绝大多数情况下,时点数据算法和突破算法的因子表现最优。从因子表现、多头组合以及多空收益来看,更推荐在一级行业层面构建组合。

通过行业整体法构建突破算法的大单因子,10天换仓组合自2014年以来,每年均战胜Wind全A以及市场等权基准。年化超额收益约为10%,信息比超过1,最大回撤约为15%。

以行业整体法下的突破算法大单因子为例,考察不同持有期行业组合收益表现。相对而言,持有期较短时年化收益更高,最优的持有期为10天。随着持有期拉长,年化收益会有一定幅度的下降,更推荐采用行业维度的大单因子指导10个交易日以内的行业操作。

以行业整体法下的突破算法大单因子为例,在持有期为10个交易日的情况下,考察持仓行业数量对于行业组合收益的影响。持仓行业数量并非越少越好,行业数量过少,组合暴露的风险更为集中,当出现误判时组合回撤会加大。例如持仓2个行业的组合,最大回撤为-16%,而持仓10个行业的组合,最大回撤为-10%。持仓数量在4-5个时组合最优,组合年化收益约11%,信息比在1.1左右。

6

风险提示

市场系统性风险、模型误设风险。

联系人:郑雅斌 021-23219395

加载中...