量化研究新思维(三十三)——机构投资者持股拥挤度因子
新浪财经
来源:海通量化团队
参考文献:
1. Examining Passive Crowding as a Risk Factor. ClearBridge Investments.
2. Examining Active Crowding as a Risk Factor. ClearBridge Investments.
机构投资者凭借自己的专业知识和信息优势,判断股票的内在价值,决定最终的买卖行为。但基金经理并不总是理智的,也会有认知和行为上的偏差,例如,羊群效应和损失厌恶。有理由怀疑,当投资者情绪接近狂热时,这些偏差将导致市场变得极度脆弱。
机构投资者的持股拥挤度可以作为基金经理情绪的晴雨表,它刻画了当前市场对某个特定股票的认知分歧。那些持续被机构投资者买入(卖出)的股票,容易出现高(低)估的倾向,未来的股价表现可能会反转。
1
被动拥挤(Passive Crowding)
1.1
根据被动基金持股的变化构建组合
根据有效市场假说(EMH)的理念,当市场上出现大量买入或卖出指令时,投资者就会重新评估自己对股票的定价,进而通过交易实现相应的调整,市场进入均衡状态。然而,随着被动基金的规模在2008年金融危机后迅速膨胀,这种价格形成机制反而有可能会降低市场的有效性。
指数基金和ETF的交易一般只受资金流入或流出的驱动,至多涉及对某个主题(如,资产类别、行业、因子等)的观点。既然市场无法系统性地识别某个交易指令是由有信息优势的主动基金经理,还是不关注估值的被动基金发出,那么就有理由认为,市场会因被动基金持股的变化,错误地调整了对股票内在价值的评估。理论上,这种定价误差应当能被主动基金经理发现。
为了验证上述假设的正确性,以及在被动基金持股中寻找可能存在的交易信号,本文将被动基金持股的变化与市值进行交叉分组,构建投资组合,并检验其表现。
首先,将所有在美国证券交易所上市交易的股票、REITs和MLPs作为初始的样本空间。随后,剔除滚动3个月的日均成交量在25%分位点以下,或者市值在罗素3000指数成分股20%分位点以下的股票。剩余股票在2018年末的日均成交量最小值约为230万美元,最小市值约为3.5亿美元。以上筛选标准保证了用以构建因子的股票,机构中的基金经理都可以建立有实际意义的头寸。
本文根据市值(大、中、小)和被动基金持股的滚动变化(被动拥挤、中性、被动不拥挤)构建9个组合。首先,按股票市值分组,将大于罗素3000成分股市值83%分位点的股票划分为大盘,66%-83%分位点之间的股票划分为中盘,剩余的股票划分为小盘。其次,在每个市值组别中,按被动基金持有的每个股票占总股本百分比的滚动变化从大到小排序,并将前10%定义为“被动拥挤”,中间的80%定义为中性,后10%定义为“被动不拥挤”。进一步,将不同市值组别中的被动拥挤、中性和被动不拥挤的组合对应合并,得到全样本空间的三个组合。
1.2
组合的业绩表现
本文检验了使用过去1、3、6、9、12个月的被动持股变化构建的组合,在未来1、3、6、9、12个月的持有期上的收益率。在2007年12月至2018年12月期间,被动不拥挤组合的业绩几乎在所有情况下,都优于被动拥挤组合。不失一般性,本文用滚动6个月的被动资金流向构建拥挤度因子,作为演示(见下图)。
利用拥挤度因子构建的多空组合在全样本、大盘、中盘和小盘内的平均收益分别为2.98%、1.92%、4.25%、10.52%(均以年化值表示)。换句话说,根据拥挤度因子,做多不拥挤股票,同时做空拥挤股票的策略,在所有市值组别中均可以获得正收益。
对比不同因子构建期和组合持有期的配对,可以发现,使用滚动3-9个月的被动资金流向能得到更好的业绩,这也与经济学逻辑相符。一方面,投资者最为关注的必然是近期发生的交易,因为这些交易蕴含的信息被全部套利完的可能性较小。另一方面,不同股票短期内资金流动的差异远远小于长期,因为极端值一般只会在较长的周期内出现。下图中,各股票被动资金流的平均截面标准差也证实了这个推断。
既然最优的业绩表现发生在3-9个月这一范围内,那么可以认为,在这其中任意选取回看期构建因子,得到的结果应当是比较稳健的。从回测结果来看,使用滚动6个月的资金流或许是最优选择。当回看期进一步拉长后,多空组合的收益出现了下降。
对于持有期,1、3、6个月的年化收益相对较高。可能的原因是,被动拥挤度因子的变化十分迅速。6个月及以后,信号强度就会出现显著的下降(见下图)。此外,鉴于大约80%的被动拥挤股票在3个月后已不再拥挤,月度再平衡应当在所有市值组别中都能产生比季度再平衡更高的收益。不过,由于缺乏强有力的证据表明这种差异是显著的,可以认为,1到6个月内的任意持有期都是可接受的。考虑到回测的便利性,下文统一假定持有期为一个月。
1.3
被动拥挤度因子
上文的论述表明,滚动6个月的被动持股变化是所有参数中最为有效的一个。由此得到的市值加权因子在所有市值组别中,都能产生正收益。这表明,被动基金有实际意义的买入交易确实会导致股票被高估。如果将被动拥挤度因子在全样本中产生的收益与Fama-French因子回归,能得到正alpha。换句话说,即使在控制了市场beta(MKT)、市值(SMB)、估值(HML)和动量(MOM)因子后,被动拥挤度因子依然可以产生正的风险调整后收益。这说明它不仅是一个稳健的因子,而且不能为其他已知风险因子所解释。
尽管被动拥挤度因子的多空组合可以产生统计意义上显著的正收益,但在实际应用中,它可能更适合用来剔除股票或作为风险管理的指标,而非直接选股。如图6所示,虽然被动不拥挤的股票在统计意义上显著优于被动拥挤的股票,但它们相对中性组的超额收益却非常微弱。考虑到回测期内流入被动产品的资金规模(图7),这一现象也并不令人惊讶。因为即使是被动基金持股变化幅度最小的10%股票,也没有出现极端的负向变化(图8)。而被动不拥挤组合中,40%股票的被动持股变化在100bps以上(图9)。
如果认为未来流入被动基金的资金量会逐渐下降,甚至逆转,那么被动不拥挤或许会成为一个更好的收益预测因子。更进一步,倘若资金流向真的发生逆转,则被动基金持有的每个股票的流通股本数量占总数的比例也会变成一个重要的指标。尽管在本文的回测期内,被动基金持有比例较高的股票,业绩表现并不差。但如果被动基金出现系统性的资金流出,这些股票极有可能面临更高的波动和更低的预期收益。
从构建投资组合的角度来说,被动持股的变化确实是一个有指导意义的信号,但大部分alpha来自于被动拥挤股票糟糕的表现。如下表所示,在全样本及每一个市值组别中分别剔除被动拥挤的股票,组合收益出现了不同程度的提升。
虽然被动拥挤度被用作剔除型因子有一定的效果,但本文并不提倡规避或卖出所有被动拥挤的股票。和任何一个量化因子一样,被动拥挤度在整体层面表现良好,但对特定的个股,其预判成功率并不会比50%高多少。换句话说,被动拥挤度因子可以作为对现有因子选股框架的有益补充,但应当从整个组合的层面进行使用和管理。
1.4
小结
被动拥挤度因子是对股票筛选与组合构建的有效补充。本文的回测结果充分说明,被动拥挤的股票在接下来的1-6个月内,表现显著弱于被动不拥挤的股票。尽管没有证据表明,被动基金的持股数占流通股本的比例能够预测股票收益,但是从经济学逻辑上来说,如果被动投资工具出现大幅的资金净流出,这个因子的有效性应当会得到提升。
2
主动拥挤(Active Crowding)
2.1
主动拥挤的定义
被动拥挤源于过去十年持续流入ETF和指数基金的资金,这些不包含个股观点的交易行为降低了市场的有效性,使得拥挤的股票表现出低于平均水平的预期收益。主动基金经理则刚好相反,他们的交易行为往往包含了从大量信息中提炼的观点,故理论上会使个股的定价变得更加有效。
但现实并非总是如此,贪婪和恐惧常使基金经理的行为产生偏差,过度的买入或卖出同样会造成拥挤或不拥挤。具体地,本文将较长一段时期内大部分基金经理都持积极(消极)观点的个股定义为主动(不)拥挤,并用如下4个子因子度量拥挤度的高低。
主动基金经理重仓持有
将主动管理基金持有的某个股票的权重和同一市值组别中所有股票在全部基金中权重的均值相减,得到的差定义为主动权重。若主动权重排名前20,即认为是重仓股。统计重仓持有该股票的基金数量,用以反映拥挤程度。该指标度量了买方的情绪和一致预期。越多的主动基金经理重仓,意味着主动拥挤。
卖方的买入评级
覆盖某个特定股票的所有分析师中,给出买入评级的占比。该指标度量了卖方的情绪和一致预期。本文规定,一个股票至少要得到5个分析师的评级,该指标才有意义。买入评级的占比越高,意味着主动拥挤。
长期动量
个股滚动两年的累计收益。收益率越高,意味着主动拥挤。
机构交易的持续期
将所有机构投资者有关某个特定股票的交易合计后,统计连续出现净买入和净卖出的季度数。具体方法为,计算机构投资者持有每个股票的数量占其总股本百分比的季度变化,定义前40%为机构净买入,后40%为机构净卖出。该指标同时度量了情绪的方向和持续性。长期的机构净买入,意味着主动拥挤。
一个拥挤的股票也有可能同时具备上述四个特征,即,被许多主动基金经理重仓持有、大部分卖方分析师给予买入评级、两年期高动量和连续几个季度的机构净买入。另一方面,一个不拥挤的股票可能具备的特质是,极少数甚至没有主动基金经理重仓持有、很少或没有卖方分析师给予买入评级、两年期低动量和连续几个季度的机构净卖出。
2.2
主动拥挤度因子
为了更好地研究主动拥挤的后果及其成因,本文分别根据上述四个子因子以及将它们合成后的因子分组,回测组合的业绩表现。样本空间的选取以及市值分组的方法和上文检验被动拥挤度因子时完全相同。
将所有可投资的股票分别按照四个子因子从小到大等分成10组,并赋予1-10的打分。例如,一个股票的滚动两年收益在样本空间中处于前(后)10%,则它的长期动量子因子的得分为10(1)。随后,对至少有2个子因子得分的股票,计算子因子的平均得分,将其所属的十等分组别作为合成后的主动拥挤度得分。定义得分最高的两组为主动拥挤,最低的两组为主动不拥挤,中间的60%为中性。
本文发现,在1999年12月至2018年12月期间,主动不拥挤组合的业绩表现显著优于主动拥挤组合。尤其是当持有期拉长时,差异更为突出。下表给出了主动不拥挤组合与主动拥挤组合在市值加权方式下的平均年化收益之差(滚动计算,月度再平衡)。例如,在大盘股空间中,当持有期为12个月时,做多主动不拥挤组合,做空主动拥挤组合的方式在回测期内的平均年化收益为1.45%。
由上表可见,主动拥挤度因子在不同市值组别中的业绩表现整体十分稳健,尤其是当持有期大于6个月时。但是,每个子因子并未展现出相似的特征。例如,全样本中,主动拥挤度因子在12个月持有期上的平均收益为2.01%,而主动基金经理重仓、卖方买入评级占比、长期收益动量和机构交易持续期四个子因子的平均收益分别为-0.12%、0.83%、3.82%和0.09%。
显然,有两个子因子的收益可以忽略不计。但这一现象既不令人惊讶,也不意味着它们没有价值。事实上,多因子模型背后的大部分推动力就是期望同时使用多个因子可以获得比单个因子更稳健的信号。回到主动拥挤度因子,如果一个股票展现出很强的滚动动量、又被主动基金经理重仓持有,同时卖方的情绪也很积极,那么它出现估值过高,进而表现下滑的可能性,要比那些只在其中一方面表现出拥挤特征的股票大得多。
最优持有期的敏感性比较低,持有6个月以上的业绩表现相对较好。这有可能是因为拥挤特征在时间序列上的持续性很强,要从这个因子中获取收益,必须等股票的情绪逐步正常化,并从相应的拥挤或不拥挤组合中退出。下图展示了拥挤或不拥挤组合的换手率,有助于观察上述过程的演变速度。三个月后,只有大约50%的股票从主动拥挤(主动不拥挤)组合中退出,进入中性或主动不拥挤(主动拥挤)的组别。六个月后,这个数字增长至大约85%。这意味着更为显著的情绪正常化,以及更强的因子有效性。
主动拥挤度因子不仅能在所有市值组别中产生正收益(图11),而且在全样本空间中,和Fama-French因子回归后,依然保持了正的alpha(图12和13)。这表明,主动拥挤度因子的收益并不能为其他风险因子所解释,是一个稳健的因子。此外,所有Fama-French因子的回归系数beta都是显著的,这一现象也符合经济学逻辑。
动量因子的回归系数(-0.07)小于零,是因为主动拥挤度因子的一部分恰好是两年动量的对立面。价值因子的回归系数(0.07)大于零,可能是因为极度乐观的情绪使得拥挤股票的估值迅速上升;同时,极度悲观的情绪又严重压制了不拥挤股票的估值。相同的逻辑也可以用来解释市值因子的正系数(0.05),乐观情绪使股票进入更高的市值组别。市场因子的系数(-0.04)小于零,其效应(绝对值)是所有因子中最小的。
2.3
主动拥挤度因子的应用
既然上文的回测已充分证明了主动拥挤度因子的稳健性,那么一个自然的想法就是把它用于股票筛选和组合构建。如下图所示,在所有市值组别中,主动拥挤组合的收益显著低于中性和主动不拥挤组合。但三者的波动率却十分接近,分别为19%(拥挤组合)、16%(中性组合)、22%(不拥挤组合)。
此外,主动拥挤组合的收益还展现出负偏的特征(图15)。这意味着,当回撤发生时,主动拥挤的股票遭遇的跌幅会更大。相反,主动不拥挤组合的截面收益呈现正偏、尖峰、厚尾(图16)的特征,表明在任意一个时间点,不拥挤组合中被严重低估的股票数量远远大于整个样本空间。
2.4
小结
主动拥挤度因子能够成为选股和风控的有益补充。从回测结果来看,主动不拥挤组合的业绩表现不仅在整体上优于主动拥挤组合,而且包含大量被严重低估的股票。对致力于基本面选股的投资者而言,主动拥挤度因子可以作为一个有用的筛选工具。此外,主动拥挤组合相比中性或不拥挤组合,更容易遭受剧烈的回撤。因此,控制组合在主动拥挤股票上的暴露,有助于降低市场下行时的回撤风险。
3
总结
由于被动投资工具在交易时并不关心估值,因而资金的大量涌入增加了股票出现高估的可能性。本文的回测结果表明,被动拥挤的股票,即,那些被ETF和指数基金大量买入的股票,未来的收益显著低于被动不拥挤的股票。
由此得到的被动拥挤度因子能产生统计意义上显著的alpha,但其中的绝大部分来自被动拥挤股票大幅低于平均水平的业绩表现,因而更适合作为剔除型指标。从组合构建的角度来说,系统性地控制组合在被动拥挤股票上的暴露,有助于提高正alpha。
主动拥挤股票,即,在较长时期内,主动基金经理都持有积极观点的股票,更有可能被高估。本文经过回测后发现,主动不拥挤的股票,未来的业绩表现优于主动拥挤的股票及整个样本空间。此外,主动不拥挤组合的收益特征表明,组合中存在大量被严重低估的股票。
由此得到的主动拥挤度因子,是组合构建过程中的有益补充。一方面,主动拥挤因子可以直接用于股票筛选。另一方面,严格控制组合在主动拥挤股票上的暴露,也可以避免剧烈的回撤。
10
风险提示
市场系统性风险、模型失效风险、海外与国内市场结构差异风险。
特别声明:本篇报告的结果均由数量化模型自动计算得到,研究员未进行主观判断调整;数据源均来自于市场公开信息。
联系人:冯佳睿,021-23219732