主动与量化结合的新形式——股票池优选与因子迭代
新浪财经
来源:量化先行者
报告提要
自2017年以来,随着A股市场逐渐转向价值投资,龙头股与小盘股的收益差急速扩大,在2019年、2020年这种现象更加鲜明。在主动基金规模攀升的同时,量化投资不断受到挑战。在这样的背景下,基本面与量化的融合成为量化投资领域的研究重点。
本文探讨了股票池优选对指数增强模型的影响,提出了系统化的股票池收益增量检验、筛选及应用流程。并且通过动态的因子迭代优选,统一因子权重与组合内的因子方向,从而避免大幅度的因子方向错配风险。
券商组合
证券分析师通常会在周度、月度等报告中发布其所推荐的股票组合,可能涉及特定行业或者多个行业。券商组合经过分析师的主观优选,充分反映了分析师对其投资价值的认可。
从股票池优选的角度,可以通过券商推荐股票调整指数增强模型的选股范围,从而达到系统性提升指数增强模型收益的目的。
券商组合的收益贡献
根据本文提出的股票池检验方法,在控制风格、行业等约束条件下,2013年以来,券商组合相对于沪深300指数的年化超额收益为1.90%,与传统股票池相比超额收益的提升幅度为0.94%至1.28%。
券商组合与沪深300指数增强
将券商组合与分析师上调组合结合,生成“券商金股”。以沪深300指数成分股及券商金股作为选股范围,构建沪深300增强模型。组合年化超额收益为12.49%,信息比为3.01,相对最大回撤为2.97%,相对于传统股票池年化超额收益提升幅度为1.61%至2.03%。归因表明股票池的优选不仅能够通过对优选股票的系统性超配而带来超额收益,也能够改善量化模型在既定空间内的选股表现。
衍生股票池的探索
对其他常见股票池的探索表明,分析师覆盖股票池、分析师买入评级股票池、主动偏股基金重仓持股等对于沪深300增强组合的收益增量非常有限;相比而言,能够带来收益贡献的组合是优秀主动偏股基金的持仓。
根据选股Alpha及基金份额两个因子筛选优秀的主动偏股基金,以基金持仓及分析师上调组合生成“基金金股”组合。在该股票池下,沪深300指数增强模型的年化超额收益为11.67%,相对最大回撤为4.24%,信息比为2.80,相对于传统股票池,超额收益提升幅度为0.7%至1.2%。
目录
自2017年以来,随着A股市场逐渐转向价值投资,龙头股与小盘股的收益差急速扩大,马太效应越演越烈,在2019年、2020年这种现象更加鲜明。然而,在主动基金规模攀升的同时,量化投资受到了巨大的挑战。在这样的背景下,越来越多的量化投资管理人,开始探索多种基本面研究与量化投资的融合路径,希望能够借鉴主动投资的方法论,从广袤的信息中汲取有价值的资源,从而完善投研体系,打破困局。
近年来,越来越多的投资者开始挖掘行业分析师或者主动基金经理的Alpha,尝试用不同方式加工处理分析师研报、公募基金持仓的信息。而在模型的融合中,更多是采取因子化的方式,加入到原有的量化模型中。然而,这种方式看起来简单明了,结果确往往难以达到预期中的提升效果。因此,本报告试图探索主动投资与量化投资结合的新方式。
1
低频量化的突破口——向主动投资取经
1.1 主动研究对量化投资的价值
对于低频量化而言,公司基本面的研究显得尤为重要,包括产业链变动,公司经营情况、竞争格局以及财务状况的边际变化等。而这些并不是传统量化所擅长的领域。量化投资的核心是大样本和概率,而在小样本下(如个股)的深入研究并不是当前量化投资的优势。诚然,“量化”作为一种投资工具也在试图通过大数据、机器学习来处理和挖掘海量的信息,但是这是一条相对曲折漫长并且难以在短时间得见成效的路径。因此,基本面研究就成了量化投资相较于主动投资的短板。
相应地,如何将主动研究的经验或者成果转化为量化模型的一部分,就成为了近年来量化,尤其是低频量化研究的核心。除了公司内部的研究成果外,量化投资能够借鉴的主动研究成果主要来自于券商的研究报告。因而,分析师的行为、研究报告的情绪等就成了因子挖掘的新站场。与以往的研究不同,本报告直接使用分析师推荐的股票,讨论其对于量化投资的启示。
券商研究所的行业及策略报告通常会发布其所看好的股票组合。通常,策略组会联合各行业研究组,给出涉及多个行业的股票组合,如券商发布的月度金股,部分券商还会有周度策略、季度策略、年度策略等。而行业报告中的股票池通常仅涉及特定行业,以表格或者文字形式给出,下图展示了两篇行业报告中推荐的股票池,仅涉及分析师所跟踪的特定行业。
这些经过分析师筛选的股票列表名单,就是本文希望纳入量化模型的额外信息。这一信息不同于传统量化因子,其信息来源可能与量化模型的财务、价量等因子的信息有所重叠,但是也包含了传统量化模型所没有考虑的、但是经过人工处理信息,如产业链、宏观、投资者预期等多种难以量化的维度,因此我们希望能够通过有效的方法将分析师的观点体现在模型中。
1.2 主动观点与量化模型的融合方法探讨
在这样的场景下,对于一个量化基金经理来说,如果其公司内部或者外部的行业分析师经过深入研究,给出了一个推荐的股票列表,此时应当如何将这种信息纳入量化模型中。这就是本文要讨论的核心问题。
1.2.1 因子化
一种常见的处理方法是将信息因子化。将推荐与否或者推荐比例作为因子,类似很多事件类因子的处理方法,根据因子绩效(如ICIR,超额收益等)赋予权重。但是在这种处理方法下我们并没有看到模型的显著改善,并没有体现出分析师推荐股票的增量信息。这与我们的主观认知略显背离。我们猜测,可能这种因子化的处理方法并没有充分利用分析师推荐股票的信息(如中性化、去除共线性过程中的信息损失),因此尝试探索其他整合信息的路径。
1.2.2 贝叶斯α
可以看到,这实际上并不是一个因子化的问题,而是不同模型的融合问题。《量化股票组合管理——积极型投资组合构建和管理的方法》一书对定性信息与因子模型的整合进行了讨论。当投资经理获得一些有用但不会反应在数据集中的投资信息,例如来自定性研究报告,或者口头交流,投资经理通常试图将这类信息转化为常数α,叠加到已有的量化因子模型中。但是这种做法可能有很大的问题,对定性信息赋予数值具有很大的随意性,并且新的信息可能没有与模型的估计有效结合。而贝叶斯理论提供整合不同类别信息集的方法,能够将额外的定性信息与因子模型的估计进行最优整合。
虽然贝叶斯方法能够有效整合数据信息和非数据信息,但是在应用时容易出现违反信息准测的错误,尤其是当先验估计也是从数据信息中提炼出来。如果先验估计是根据数据信息确定的,并且其用到的数据并没有与用于估计模型的数据很好地隔离,那么就会重复使用同一信息。例如,基于市盈率筛选股票,之后基于筛选结果构建先验估计,然后再次使用市盈率作为一个因子来估计因子模型。
而通常,量化模型的盈利预测中包含的信息难以与分析师推荐股票的信息进行分离。因此,除了估计复杂、依赖诸多假设外,这一问题也并不适用贝叶斯方法来估计。
至此,我们讨论了因子化、贝叶斯α两种融合主动观点与量化模型的方法。可以看到,这两种方法都难以令人满意。因此,我们希望探讨其他的路径,既能够充分反应分析师对所推荐股票的认可,又能够发挥量化模型在分散化、稳定性与风险控制中的作用。我们考虑参考分析师推荐的股票列表调整量化选股的股票池,从而达到显著提升量化模型表现的效果。
2
券商组合的特征
本文将分析师推荐的股票统称为“券商组合”。本章对券商组合进行了系统的分析,与量化投资者通常所使用的分析师盈利预测报告不同,券商组合从数据来源、分布、覆盖率等方面均有其独特性。
2.1 数据来源
如前文所述,分析师推荐股票通常以文本或者表格的方式在报告中给出,而收录该数据的数据库较少。由于该数据并非结构化数据,通常使用文本分析获得,所以我们也提示读者在使用时关注该数据的质量以及稳定性。
本文使用“慧博投研资讯”处理的公司股票池,包括报告日期、发布机构、股票池等。下图为该资讯终端中公司股票池的展示形式,可以看到该功能收录了推荐股票池的卖方研究报告,包括策略报告及行业报告,每一份报告包括报告日期、发布机构、股票池、股票池类型等,有些报告还有推荐理由等。在该终端上,能够获得的最早报告为2013年6月。
从具体的数据处理来看,由于股票池以股票简称给出,通常还需要将股票简称转换为对应的股票代码。此外,推荐理由中出现“看空”字段的股票池也应当予以剔除。
在每月末,汇总报告日期在本月的研究报告所包含的股票池,生成得到该期“券商组合”,数据起始自2013年6月。下文从分布、风格、独特性等角度分析了券商组合的特征。
2.2 券商组合的分布特征
从券商组合的数量来看,券商组合数量波动较大,如下左图所示,最高达到2014年11月的634只,最低为2017年5月的57只,中位数为191只,平均值为248只。
从各年度来看,如下右图所示,券商组合数量与年度指数收益率呈现显著的关系,2020年、2014年、2015年券商组合平均数量均为280只以上,其中2020年达到460只。
从机构的角度来看,各期中,各家机构推荐的股票数量平均为25只。下图展示了各期机构推荐的股票数量的中位数及均值,2017年以来,机构推荐股票数量均值均在20只附近波动。从中位数来看,机构推进股票数量在2017年之前较高,在25只附近,而在2017年之后,呈现下降趋势,位于15只附近。
下图展示了券商组合在主要指数间的分布。平均来看,29.45%的券商组合股票为沪深300指数成分股,18.22%为中证500指数成分股,52.33%位于中证800指数成分股之外。
从行业来看,券商组合的分布也呈现明显的差异。下图展示了券商组合的行业分布。
以中信一级行业分类,从绝对数量来看,券商组合中电子、医药、机械、计算机行业的股票较多;而从占行业内股票数量比例来看,银行、国防军工、非银行金融、食品饮料、消费者服务行业居前。
2.3 机构推荐的重合度
从机构推荐股票池的重合度来看,仅少部分股票被多家机构同时推荐,大部分股票仅由一家机构推荐。
机构推荐的重合度定义为,对于每只股票,统计当期推荐该股票的机构数量。下图展现了机构推荐的重合度的分布,其中“1家”表示当期仅一家机构推荐的股票比例,“<=3家”表示当期有2家或3家机构推荐的股票比例,“<=5家”表示当期有4家或5家机构推荐的股票比例,“>5家”表示当期有5家以上机构推荐的股票比例。
平均来看,83.94%的股票仅由1家机构推荐,14.20%的股票由2家或3家机构同时推荐,1.34%的股票由4家或5家机构同时推荐,仅0.51%的股票由5家以上机构同时推荐。
从重合度的时间序列变化来看,机构推荐股票池的重合度在2015年10月之前以及2019年7月之后较高。2019年7月以来,平均7.32%的股票(即平均33只股票)由3家以上机构(即“<=5家”与“>5家”)同时推荐。
因此,机构推荐的股票池并没有我们预想得那样高度重叠,各家机构均会推荐许多“独门股”。推荐股票的多样性对于量化投资来说具有重要的参考意义,从众多股票中筛选出来数量足够多的优质标的,满足了量化投资对样本量和稳健性的要求。
2.4 券商组合的风格特征
与分析师覆盖股票、公募基金持仓类似,券商组合具有鲜明的风格特征。本文比较了各期券商组合(等权)相对于沪深300成分股(等权)及中证500成分股(等权)在主要风格及alpha因子上的相对暴露。
下图展示了券商组合的相对暴露均值。可以看到,券商组合(等权)在波动率、动量、分析师上调、流动性、成长及盈利性上均有显著的正向暴露,在估值因子上的相对暴露为负,即机构倾向于推荐高波动、过去上涨、分析师上调盈利预期、高流动性、高成长性、高盈利能力并且高估值的股票。
2.5 券商组合的独特性
通常量化模型使用的券商研究报告主要为个股报告,包括个股的盈利预测、评级等。在券商组合的报告中,所推荐股票的对应个股报告可能发布于几日内,也可能发布于几个月之前。因此,与常见的通过分析师个股报告(如盈利预测、评级)筛选出来的股票池相比,券商组合具有极大的独特性,充分体现了分析师的主观判断。
作为对比,本文构建了三个与分析师相关的股票池,分别为:过去3个月分析师覆盖的股票池(称作“分析师覆盖”),过去三个月内分析师上调评级的股票池(称作“评级上调”),过去一个月内分析师给出买入评级的股票池(称作“买入评级”)。
下图比较了券商组合与这三个股票池的数量差异。券商组合的数量平均为248只,分析师覆盖的股票数量平均为1856只,评级上调的股票数量平均为172只,买入评级的股票数量平均为829只。从数量上来看,券商组合与评级上调的股票最为接近。
为了进一步比较券商组合与三个分析师组合的差异性,下图比较了每期券商组合中与三个分析师组合重合的股票数量占比,即:重合股票数量/券商组合数量。平均来看,在券商组合中,93.04%的股票在过去三个月内有分析师跟踪,16.94%的股票在过去三个月内出现了分析师评级上调,66.91%的股票在当月分析师给出了买入评级。
从以上数据可以看到,券商组合虽然与分析师的个股报告关系密切,但是仍然存在高度差别,这也正是券商组合的价值所在,体现了分析师对股票的主观筛选。
3
券商组合的收益检验
在量化模型中,因子的检验有多种方式,如因子IC、分组检验、纯因子收益等。而对于股票池的检验方法较少,本文借鉴了事件检验以及纯因子收益的思路,从两个角度检验了券商组合的收益增量。
3.1 等权组合收益的比较
本文希望将券商组合融入到沪深300增强模型中。在纳入之前,首先需要检验券商组合对于沪深300增强的收益贡献。通常,沪深300增强组合以中证800或者全市场为选股范围。在本文的模型下,我们将选股范围进行精选,以沪深300指数成分股及当期券商组合的并集作为选股范围。因此,新的选股范围与传统选股范围主要差别在于沪深300指数成分股以外的部分。
如下图所示,主要需比较股票池中除沪深300指数成分股以外股票收益差别,即图示浅色区域。
因此,为了检验股票池的增量,我们比较了券商组合中沪深300指数成分股以外的股票,与中证500指数成分股,以及与全市场除沪深300指数成分股以外的股票,之间的收益差别。(考虑到实际交易的影响,全市场股票剔除流通市值低于20%分位数的股票。)
下表中,“券商组合(除沪深300)”为券商组合中除沪深300指数成分股以外的股票;“中证500”为中证500成分股,“超额收益(相对中证500)”为“券商组合(除沪深300)”相对“中证500”的超额收益;“全市场(除沪深300)”为全市场流动性高于20%分位数的股票中除沪深300指数成分股以外的股票,“超额收益(相对全市场)”为“券商组合(除沪深300)”相对“全市场(除沪深300)”的超额收益。其中,组合收益均以等权计算。
可以看到,从2013年7月至2021年2月19日,除2014年、2016年以外,在沪深300成分股以外,券商组合均能战胜中证500指数成分股以及全市场其余股票。这初步说明了,研究机构能够从众多的股票中筛选出收益质量较高的标的池。
然而,以上等权组合的检验方式没有考虑到行业、风格等因素的影响。此外,对于指数增强模型来说,尤其是沪深300指数,成分股权重差别较大,等权组合与最终的组合差异较大,并不能说明股票池的调整能够为增强模型带来增量收益。因此,本文以一种更加严谨的方法,验证股票池的收益贡献。
3.2 股票池的收益增量
为了解决基准股票权重差异对因子收益的影响,可以构建单因子的指数增强组合,获得纯因子收益。借鉴这一思路,本文构建了没有收益模型指导的“等权”股票池组合。
在给定股票池下,我们希望构建这样一个组合:由于没有收益模型指导,股票池中的个股没有预期收益的差异,因而组合成分股权重应当尽量接近;相对基准指数保持行业、风格中性;组合个股相对于基准成分股的权重偏离在给定范围之内等。
这一问题可以通过以下优化模型刻画:
该优化问题的目标函数为最小化组合的权重方差,其中 w 为待求解的股票权重向量。模型的约束条件包括组合的风格偏离度、行业偏离度、个股权重偏离度、成分股权重占比、个股权重上限。
根据以上组合构建方式,在不同选股池中以沪深300指数为基准,检测不同股票池的收益增量。组合每个月末调仓,交易费用设为双边0.3%,选股的样本空间为每月末满足如下条件的所有A股:
上市时间6个月以上、退市前3个月以上;
非ST股及ST摘帽后3个月以上;
调仓日收盘非涨跌停且非停牌;
调仓日的流通市值位于市场前80%。
以上优化模型得到的最小方差组合相对于基准的表现,就能够体现出来股票池本身对增强模型的贡献。
下表比较了不同股票池相对沪深300指数的超额收益,区间自2013年7月至2021年2月19日。
在不同股票池下构建的相对沪深300风格、行业中性的“等权”组合(实际并非等权,只是在给定约束条件下尽量减少权重差异)呈现出明显的收益差距。以券商组合为股票池的组合持续优于以中证800指数成分股或者全市场股票为股票池的组合。
以上检验进一步说明了,分析师的优选组合能够有效改善选股空间,并且这种优化具有提升增强模型绩效的潜在能力。下面就以增强模型的实证进行检验。
4
券商金股指数增强模型
结合前文提出的股票池优选方法,本文的券商金股指数增强模型包含两个子模型,分别为股票池模型及指数增强模型。
4.1 股票池模型
本文讨论的股票池以券商组合为核心,但是券商组合披露的日期通常并不固定。例如,在月末时,多数券商可能尚未披露月度金股,而在次月上旬才会陆续披露。
为了避免遗漏分析师对股票的筛选信息,在每月末,将券商组合及过去三个月内分析师上调的股票(评级上调,并且盈利预测调整幅度均值>0)合并作为“券商金股”。以沪深300成分股及券商金股的并集作为选股池。
作为对比,本文使用了两个对比股票池,其一为中证800成分股,其二为流通市值位于全市场前80%的股票。
4.2 指数增强模型
指数增强模型由收益模型与风险模型构成,根据因子收益及因子暴露估计组合预期收益,通过风格、行业偏离等措施控制组合相对基准指数的跟踪误差。具体地,可通过以下优化模型实现:
根据以上组合构建方式,以沪深300指数为基准,每个月末调仓,交易费用设为双边0.3%,选股的样本空间为每月末满足如下条件的所有A股:
上市时间6个月以上、退市前3个月以上;
非ST股及ST摘帽后3个月以上;
调仓日收盘非涨跌停且非停牌;
调仓日的流通市值位于市场前80%。
4.2.1 收益模型
下表为多因子模型使用的因子列表,包括盈利、估值、成长、分析师预期、超预期、技术7类因子。
在对因子进行去极值、中性化、正交化以及标准化后,以因子过去12期的ICIR作为权重进行加权,形成个股预期收益率。
为了确保因子权重与组合内因子方向相一致,避免在特定选股池内错配因子方向,本文使用迭代的方法,对所使用的因子进行动态筛选。具体步骤如下:
1.因子列表为原始因子列表,根据过去12期ICIR确定因子权重;
2.根据优化模型生成组合;
3.对比因子权重与组合内因子方向的差异,将差异过大的因子去掉,生成新的因子列表;
4.根据过去12期ICIR确定新因子列表的因子权重;
5.重复2-4步,直至所使用的因子权重与最终组合中的因子方向均保持一致。
4.2.2 风险模型
在组合的风险控制中,除了常见的风格偏离度、行业偏离度、个股权重偏离度以及成分股权重占比之外,考虑到个股收益率之间的相关性,本文还使用二次约束条件动态地控制组合的预期跟踪误差。
具体地,若组合过去60个交易日的跟踪误差(年化)高于5%,则将跟踪误差的阈值设定为3%;若组合过去60个交易日的跟踪误差(年化)高于4%而低于5%,则将跟踪误差的阈值设定为4%;若组合过去60个交易日的跟踪误差(年化)低于4%,则将跟踪误差的阈值设定为5%。
如下图所示,组合的跟踪误差与市场波动之间联系明显。在2015年、2020年组合均出现了较大偏离,跟踪误差一度超过5%,在这种情况下,说明市场波动升高,历史协方差低估了组合的预期波动,因此给与了非常严格的跟踪误差约束,即3%;当跟踪误差逐渐降低至5%以下,但仍高于4%时,给与相对严格的约束,即4%;而当组合跟踪误差较低,低于4%时,说明市场波动较低,跟踪误差的约束可以相对较为宽松,即5%。
组合预期跟踪误差的估计关键在于股票收益率协方差的估计。本文以过去一年(125个交易日)的股票日度收益率,以Ledoit & Wolf压缩估计方法,估计股票收益率的协方差矩阵。
4.3 回测与绩
本文以样本空间内的券商金股及沪深300成分股作为选股范围,构建沪深300增强组合,称作券商金股模型。为了体现股票池对增强组合的影响,本文还给出了两个组合作为对比,分别为:
中证800模型:选股范围为样本空间内的中证800指数成分股。
全市场模型:选股范围为样本空间内的所有股票。
下表为券商金股模型各年度的收益及风险统计,回测区间自2010年1月至2021年2月19日。组合年化超额收益为12.49%,信息比为3.01,相对最大回撤为2.97%,除2011、2018年以外,各年度超额收益均在9%以上。
下图为券商金股模型的净值及相对沪深300指数的表现,组合能够取得持续且稳健的超额收益。
下表比较了三个模型各年度的收益与风险。2010年以来,券商金股模型的年化超额收益相对于中证800模型提升2.03%,相对于全市场模型提升1.61%。
由于券商组合自2013年6月之后才能够获得,之前年度券商金股为分析师上调样本,因此,主要需对比2013年以来的组合相对表现。可以看到,即使剔除2020年,2013年至2019年,券商金股模型各年度超额收益相对于中证800模型、全市场模型分别平均提升1.90%、2.01%,并且绝大部分年度均呈现正向提升。
因此,使用券商金股调整沪深300增强模型的选股范围,能够带来组合超额收益的稳健提升,超额收益的提升幅度为1.6%至2.0%。
4.4 券商组合维度的业绩归因
本节对以上结果进行简单的归因,进一步探讨股票池对增强模型的影响。
由于加入券商金股的模型对选股范围进行了筛选,因此从理论上,组合中应当有更多的股票处于券商金股中。下图比较了三种模型,每期组合持仓中属于券商金股的股票权重之和。
可以看到,“券商金股模型”对券商金股的持仓权重平均为46.72%,长期高于其他两个模型(中证800模型平均为41.29%,全市场模型平均为41.77%)。
进一步地,根据Brinson归因的思路,可以将券商金股作为一个配置的维度,券商金股模型在券商金股上进行了超额配置。将月度超额收益在配置、选股以及交互项上进行分解,下表列出了月度超额收益Brinson归因的均值。
首先,券商金股模型在配置项上的超额收益均明显高于中证800模型及全市场模型,表明在券商金股上的超额配置给其带了正向的收益贡献。
其次,券商金股模型在选股项上的超额收益也高于其余两个模型,表明不论在券商金股范围内,还是在券商金股范围外,该模型均能够取得更高的收益。
以上收益分解结果说明,股票池的优选不仅能够通过对优选股票的系统性超配而带来超额收益,也能够改善量化模型在既定空间内的选股表现。
5
衍生股票池的探索
沿着这一思路,本文在券商组合之外,对其他常见的股票池进行了探索,包括分析师股票池、公募基金持仓等。具体结果在此不一一展示,主要结论为:分析师覆盖股票池、分析师买入评级股票池、主动偏股基金重仓持股等对于沪深300增强组合的增量非常有限,相比而言,能够带来收益贡献的组合是优秀主动偏股基金的持仓。具体构建思路如下。
5.1 优秀主动偏股基金的筛选
参考报告《天风基金研究:规模因子在FOF组合构建中的应用 20190611》,在每年1、4、7、10月末,在满足如下条件的普通股票型基金、偏股混合型基金中,
(1)成立一年半以上;
(2)基金合计规模大于3亿元
根据基金的选股Alpha以及基金份额两个因子,以2:1的权重进行加权,选择得分最高的若干支基金,形成“优秀主动偏股基金”组合。其中,选股Alpha的因子方向为正向,基金份额的因子方向为负向。下表为基金因子的具体计算方式。
下表为每期选择得分最高的20只基金的等权组合收益,并与沪深300、中证500、普通股票型基金指数进行比较。(经测试,选择20只至50只基金的结果没有明显差异)。可以看到,通过这种方式筛选的基金长期能够战胜普通股票型基金指数,因此我们希望能够借鉴这些基金的持仓,提升量化增强组合的收益。
5.2 基金金股指数增强模型的构建与绩效
需要注意的是,基金收益的alpha能够通过季报持仓解释的部分比较少,还有很大一部分来源于季报间的调仓。因此,从持股角度来看,对于增强组合来说,基金持仓披露是比较滞后的,为了体现机构投资者的持股变化,本文将分析师的观点纳入进来,以完善选股范围。
具体地,在每月末,将最近的优秀主动偏股基金持仓与近三个月内分析师上调的股票池进行合并,作为增强模型的选股范围,称为“基金金股模型”。
按照前文的最小方差方法,首先本文检验了该股票池相对沪深300指数的收益增量。
如下表所示,基金金股组合相对沪深300指数的年化超额收益为1.64%,相比中证800股票池及全市场股票池的超额收益分别提升0.95%、0.75%,具有收益增强。而与前文相比,基金金股组合的收益增量略弱于券商组合。
其次,将基金金股模型与指数增强模型相结合,本文测试了该股票池对于沪深300指数增强的作用效果。
下表为选择20只优秀基金的回测结果(选择20只至50只基金的回测结果均没有显著差异)。基金金股模型的年化超额收益为11.67%,相对最大回撤为4.24%,信息比为2.80。相对于中证800模型及全市场模型,基金金股模型仍然能够带来平均约0.7%至1.2%的超额收益提升。然而也可以看到,基金金股模型没有券商金股模型的收益增量显著,这可能与基金持仓的滞后性有关。
下图为基金金股模型的组合净值及相对沪深300指数的相对强弱,组合超额收益持续且稳健。
此外,我们还尝试使用基准类似沪深300指数的优秀主动基金来调整股票池(参考报告《天风基金研究:目标指数增强类基金的识别及FOF组合构建研究 20200915》),其增强效果弱于优秀主动偏股基金的持仓。
6
总结
自2017年以来,随着A股市场逐渐转向价值投资,龙头股与小盘股的收益差急速扩大,在2019年、2020年这种现象更加鲜明。在主动基金规模攀升的同时,量化投资不断受到挑战。在这样的背景下,基本面与量化的融合成为量化投资领域的研究重点。
本文探讨了股票池优选对指数增强模型的影响,提出了系统化的股票池收益增量检验、筛选及应用流程。并且通过动态的因子迭代优选,统一因子权重与组合内的因子方向,从而避免大幅度的因子方向错配风险。
证券分析师通常会在周度、月度等报告中发布其所推荐的股票组合,可能涉及特定行业或者多个行业。券商组合经过分析师的主观优选,充分反映了分析师对其投资价值的认可。
从股票池优选的角度,可以通过券商推荐股票调整指数增强模型的选股范围,从而达到系统性提升指数增强模型收益的目的。
根据本文提出的股票池检验方法,在控制风格、行业等约束条件下,2013年以来,券商组合相对于沪深300指数的年化超额收益为1.90%,与传统股票池相比超额收益的提升幅度为0.94%至1.28%。
将券商组合与分析师上调组合结合,生成“券商金股”。以沪深300指数成分股及券商金股作为选股范围,构建沪深300增强模型。组合年化超额收益为12.49%,信息比为3.01,相对最大回撤为2.97%,相对于传统股票池年化超额收益提升幅度为1.61%至2.03%。归因表明股票池的优选不仅能够通过对优选股票的系统性超配而带来超额收益,也能够改善量化模型在既定空间内的选股表现。
对其他常见股票池的探索表明,分析师覆盖股票池、分析师买入评级股票池、主动偏股基金重仓持股等对于沪深300增强组合的收益增量非常有限;相比而言,能够带来收益贡献的组合是优秀主动偏股基金的持仓。
根据选股Alpha及基金份额两个因子筛选优秀的主动偏股基金,以基金持仓及分析师上调组合生成“基金金股”组合。在该股票池下,沪深300指数增强模型的年化超额收益为11.67%,相对最大回撤为4.24%,信息比为2.80,相对于传统股票池,超额收益提升幅度为0.7%至1.2%。
风险提示
因子失效风险,模型失效风险,券商推荐股票数据来源与质量不可控风险。
相关报告
《基金研究:目标指数增强类基金的识别及FOF组合构建研究》2020-09-15
《金融工程:分析师预期调整全解析——从因子、事件到组合》2020-09-13
《基金研究:规模因子在FOF组合构建中的应用》2019-06-11
《金融工程:多因子模型的业绩归因评价体系》2018-04-10
《金融工程:基于动态风险控制的组合优化模型》2017-09-21
天风金工专题报告一览
多因子选股系列报告