“海量”专题(121)——日内分时成交中的玄机
新浪财经
来源:海通量化团队

在前期报告《高频量价因子在股票与期货中的表现》中,我们使用股票的 1分钟量价数据构建了收益率分布、成交量分布、量价复合等多个因子,取得了不错的效果。在本篇报告中,我们将引入“成交笔数”这一新的基础数据,构建日内分时成交系列因子。
1回测参数设置回测区间:2010.01-2019.03;
样本空间:剔除ST、停牌、涨跌停、上市不满6个月、距退市不足1个月的股票;
成交价:次日开盘后半小时VWAP;
交易成本:双边千分之三;
备注:剔除集合竞价期间的成交信息;若股票在某个交易日价格有波动的时间占比不超过25%,则剔除该交易日。
我们在下文中将依次考察原始因子和正交因子的表现,其中正交因子是通过横截面回归剔除行业、市值、非线性市值、反转、换手、特异度、流动性、估值、盈利、成长等因子后得到。
2平均单笔成交金额类因子2.1因子定义


平均单笔成交金额因子选股能力较差,IC均值为-1.6%,多空组合月均收益差为0.29%,主要原因在于该因子与市值因子之间具有较高的正相关性。图 4展示了基于平均单笔成交金额因子将横截面股票等分为10组,每组股票在市值、反转等其他因子上的暴露情况。其中第十组是平均单笔成交金额最大的十分之一股票,同时也在市值因子上具有最大的正向暴露。
该因子正交后有较弱的选股能力,IC和rank IC均值分别为2.7%和 .8%;IC-IR和rank IC-IR分别为1.25和1.75,多空组合月均收益差为1.08%,说明在控制了其他风格因子影响之后,平均单笔成交金额越小的股票未来收益表现越差。

平均单笔流出金额占比因子具有明显的选股效果, 因子的IC和rank IC均值分别为5.8%和7.4%,IC-IR和rank IC-IR分别为2.76和3.08,多空组合月均收益差为1.65%。
从分组特征上看,该因子与非流动性正相关、与换手率、市值、PB负相关,与其他因子相关性较低。


平均单笔流出金额占比因子正交后选股效果仍然显著,多空组合月均收益差为1.09%,因子的IC和rank IC均值均为3.2%, IC-IR和rank IC-IR分别为4.13和3.82。

我们下面使用双重分组法做进一步分析,首先按照每一个控制变量将所有股票等分为五组,在每组中再按新因子由小到大等分成五组,计算5×5个组别中所有股票的平均收益。在每个按新因子分成的组别中,计算5个控制变量组的平均收益。
双重分组平均收益如下表所示,可以发现,控制了常见的因子后,该因子分组收益仍然单调,首尾组合月均收益差均超过1%,统计显著。

Fama-Macbeth截面回归结果显示,平均单笔流出金额占比因子月均溢价为0.31%,相应的t统计量为11.97,统计显著。平均单笔流出金额占比因子每上升1个标准差,股票次月收益率平均上升0.31%。

平均单笔流入金额占比因子在正交后有一定的选股效果,因子IC和rank IC 均值分别为-2.1%和-1.5%,IC-IR 和 rank IC-IR 分别为-2.43 和-1.70,多空组合月均收益差为0.86%。

平均单笔流入流出金额之比因子同样具有明显的选股效果,原始因子和正交因子的rank IC均值分别为-3.1%和-2.4%,rank IC-IR 分别为-2.51和-2.98,多空组合月均收益差分别为-1.17%和-1.05%。

在本章中,我们使用股票的1分钟成交金额、成交笔数和收益率序列构建了平均单笔成交金额类因子。其中平均单笔流出金额占比因子具有较强的选股能力,与股票未来收益正相关,平均单笔流入金额占比与股票未来收益负相关, 但选股能力较弱。我们从以下几个角度对该类因子的反转特性做出解释。
一方面,大单交易可能导致股票在短时间内大幅波动。我们构建的高频偏度因子同样描述了这一现象,高频偏度较低,即日内短时间大幅下跌的股票未来表现相对较好,背后的逻辑可能来自于市场对日内快速下跌风险的补偿。
另一方面,大单交易可能是主力的操纵行为。我们分析盘口挂单数据发现,在2019年1月31日9时43分股票A出现大单买入之前的9时40分,十档委卖总量从11万股大幅跳升至30万股之上。在2019年1月31日14时14分股票B出现大单卖出之前的13时58分,十档委买总量从14万股大幅跳升至80万股之上。这说明,虽然表面上看存在大单主动买入或卖出,实际上却帮助了事先潜伏的大单顺利成交,我们猜测这可能是主力的“对倒” 行为,目的是引诱散户跟风交易。


大单资金净流入率(N=20%)因子具有明显的选股效果,原始因子和正交因子的rank IC均值分别为-5.6%和-2.2%, rank IC-IR分别为-2.77 和-2.39,多空组合月均收益差分别为-1.56%和-0.97%。

双重分组平均收益如下表所示,控制了常见的因子后,该因子分组收益仍然单调,首尾组合月均收益差显著为负。

Fama-Macbeth截面回归结果显示,大单资金净流入率因子月均溢价为-0.26%,相应的t统计量为-8.98,统计显著。大单资金净流入率因子每上升1个标准差,股票次月收益率平均下降0.26%。

大单驱动涨幅(N=30%)因子同样具有明显的选股效果,原始因子和正交因子的 rank IC 均值分别为-8.2%和-3.1%, rank IC-IR =分别为-4.12 和-3.56,多空组合月均收益差分别为-2.23%和-1.08%。


双重分组平均收益如下表所示, 控制了常见的因子后,该因子分组收益仍然单调,首尾组合月均收益差均超过-1%,统计显著。

Fama-Macbeth截面回归结果显示,大单驱动涨幅因子月均溢价为-0.3%,相应的t统计量为-10.93,统计显著。大单驱动涨幅因子每上升1个标准差,股票次月收益率平均下降0.3%。

大单资金净流入和大单驱动涨幅因子在不同参数下的表现如下表所示,因子在各参数下均有明显的选股效果,敏感性相对较低。

在本章中,我们以每日平均单笔成交金额最大的一定比例的分钟 K 线为样本,构建了大单资金净流入率和大单驱动涨幅因子,二者均与股票下月收益率显著负相关。这一结论可能与使用Wind提供的level2行情指标构建的相关因子表现不一致,主要原因在于Wind采用了静态的划分方式,例如挂单金额在100万元以上的为超大单。而本文采取的是动态的划分方式,对于每只股票都提取出一部分行情作为大单交易样本。
4日内分时成交因子对现有模型的改进4.1因子相关性分析日内分时成交因子的相关系数矩阵如以下图表所示,可以发现各因子间相关性普遍较高。因此,我们从三类因子中各挑选一个,分别是平均单笔流出金额占比、大单资金净流入(N=20%),以及大单驱动涨幅(N=30%)。

当同时使用以上三个因子去解释股票下月截面收益时,大单资金净流入因子不再显著,平均单笔流出金额占比和大单驱动涨幅因子依然显著。

接下来我们考察日内分时成交因子对多因子模型的边际影响, 分别构建了一个基准模型和三个改进模型,具体如下所示:
基准模型:市值、非线性市值、反转、换手、特异度、流动性、估值、盈利、成长等 9 因子。因子间两两正交后按过去24个月IC加权。
改进模型1:9因子+平均单笔流出金额占比。
改进模型2:9因子+大单驱动涨幅(N=30%)。
改进模型3:9因子+平均单笔流出金额占比+大单驱动涨幅(N=30%)

加入分时成交因子后,多因子模型的IC、IR、胜率以及多头组合的表现均有所提升。以改进模型3为例,rank IC从13.21%提高至13.64%,rank IC-IR 从4.08 提高至4.26,预期收益率最高的100只股票的等权组合年化收益率由 33.10%提高至34.93%。
5总结日内分时成交具有额外信息, 我们使用1分钟频率的收益率、成交金额以及成交笔数构建了平均单笔成交金额、大单资金流向等多个因子。
平均单笔流出金额占比与股票未来收益正相关,平均单笔流入金额占比与股票未来收益负相关,呈现出明显的反转特征,这可能与风险补偿以及主力操纵行为有关。
我们可以根据平均单笔成交金额大小提炼分钟K线信息,进而构建大单资金流向因子,包括大单资金净流入率和大单驱动涨幅等,也均为反转类因子。
把日内分时成交因子加入现有多因子模型中,具有一定的提升效果。
风险提示:因子失效风险、流动性风险。
联系人:姚石 021-23219443