基于净利润断层的选股策略
新浪财经
来源:量化先行者
报告提要
“净利润断层”的由来
“净利润断层”是一类经典的成长股选股策略。其中“净利润”,指净利润惊喜,也是通常意义上的业绩超预期;“断层”指盈余公告次日股价出现一个明显的向上跳空行为。该策略本质是基本面与技术面共振下的选股模式,具有较强的选股逻辑和较高的可操作性。
业绩惊喜
我们用业绩超预期来刻画业绩惊喜,在刻画股票业绩超预期时,我们没有通过传统定量的方式来比较实际业绩相对预期业绩的差值,而是另辟蹊径通过一种偏定性的方式来刻画业绩超预期:通过分词和词义分析来识别分析师撰写的研究报告标题中是否带有类超预期含义的表达。通过该方法筛选出的超预期样本相对市场能产生三个月以上的持续超额收益,以此触发的股票池相对中证500指数能实现12.31%的超额收益。
盈余公告跳空因子(JOR)
我们用盈余公告跳空因子JOR来刻画股价跳空。JOR因子是指盈余公告次日股价相对市场指数的跳空幅度,相比于传统盈余漂移因子EAR,JOR因子在A股市场具有更强的选股效果,行业市值中性化后的JOR因子IC均值3.28%,年化ICIR为2.2,JOR因子与常见风格因子相关性极低,剔除Barra风格后仍然具有显著选股能力。
净利润断层金股组合
我们在超预期的样本中选取JOR因子最大(盈余公告次日跳空幅度最大)的50只股票等权构建定期调仓的组合,组合每年都战胜中证500指数,2010年以来实现了相对中证500指数32.37%的年化超额收益,信息比率3.01。如果以股票型和偏股型基金为比较对象,85%仓位的组合自2010年以来每年的业绩均能排进市场的前25%。
净利润断层作为一类经典的成长股量化策略,所选股票更偏向于医药、消费和电子等成长性较好的板块。持股风格来看,组合整体持仓市值中等偏大,估值处于市场中位数略高的位置,动量维度来看,组合持仓偏向于前期股价表现价强势的股票。
1
“净利润断层”的由来
诸多经典的大师选股策略(例如戴维斯双击、欧奈尔杯柄等)都在A股市场具有极强的生命力,能够为投资者带来持续丰厚的超额回报。“净利润断层”本质上是一种基本面与技术面共振的选股策略,在网络和部分投资书籍中较为流传。量化领域对其的关注却相对稀缺,本篇报告尝试将这种偏主动的选股思路模型化并进行实证分析,实证结果表明,净利润断层选股策略非常适用于A股市场,在各种市场环境下均能大幅战胜市场指数。
“净利润断层”属于经典的成长股投资策略,全美投资冠军Mark Minervini所著的《股票魔法师》一书中关于“盈余余波”(PED)的阐述如下:公司披露出业绩惊喜后再买入股票为时未晚,往往还会有第二波大幅上涨,投资者积极介入存在很大可能获取超额收益,很多研究都显示这种余波现象可以持续几个月。
净利润断层策略的核心有两点:“净利润”,指净利润惊喜,也是通常意义上的业绩超预期;“断层”,指盈余公告后的首个交易日股价出现一个明显的向上跳空行为,该跳空通常代表市场对盈余报告的认可程度以及市场情绪。
净利润断层的投资思想近几年在A股市场上逐步流行,历史上铸就了诸多经典投资案例。我们以2019年的大牛股沪电股份(002463.SZ)为例,具体阐述“净利润断层”的操作思路:该公司于2019年6月27日发布半年度业绩预告,预告业绩大超市场预期,股价表现是满足“断层”情形中的最理想状态——跳空一字涨停,投资者在涨停打开后介入该股票并不晚,股价后续一个月跑赢中证500指数30%以上。
本质上,该策略是基本面与技术面共振双击下的选股模式,具有较强的选股逻辑和较高的可实操性。我们使用定量模型重构“净利润惊喜”与“断层”这两大要素,试图构建一个能够持续战胜市场的组合。
2
量化模型思路简述
如何定义“超预期”?考虑到大多数分析师在报告中只预测年度净利润,在最终年报或者年报预告、快报揭晓业绩前,我们并不能准确衡量公司业绩是否超预期。在我们先前的专题报告《基于预期业绩季度化分解的超预期30组合》(20180907)中,我们提出了一种将分析师预测的年度业绩进行季度化拆解的方法,该方法一定程度上解决了单季度业绩超预期程度难以定量化描述的问题,但对于部分样本的刻画也可能存在瑕疵:例如部分公司在预告的业绩中大量计入了非经常性损益,这种情形下计算出的超预期幅度并不能很好的反映真实情况。
本文另辟蹊径,在刻画股票业绩超预期时,我们没有通过传统定量的方式来比较实际业绩相对预期业绩的差值,而是通过一种偏定性的方式来刻画业绩超预期:通过分词和语义分析来识别分析师撰写的研究报告标题中是否带有类超预期含义的表达。A股分析师会对重点公司的盈余公告进行及时的点评,报告标题即是对点评全文最精炼的概括,如果分析师认为业绩超预期,大多会在标题中直接体现。分析师通常足够灵活,在确认是否超预期时能够有效规避非经常性损益的干扰,所以直接基于分析师文本筛选出超预期的公司更加简洁、有效。
此外,结合“净利润断层现象”的启发以及海外针对盈余漂移现象的研究,我们认为A股市场在盈余公告后首日的跳空行为最具信息含量(即学术文献中刻画的价格跳跃现象)。基于此,我们设计了JOR因子衡量盈余公告首日的“断层程度”,发现该因子比传统的盈余漂移因子EAR在A股市场上具有更显著的选股效果,且因子独立性较强,剔除常见风格因子后仍然能够带来增量信息。
基于对“超预期”和“断层”的刻画,我们将所有上市公司的盈余公告(业绩预告、快报、定期财报)作为研究样本,对2010年至今所发生的“净利润断层”进行事件性研究,发现预告、定期财报触发的“净利润断层”事件具有显著、持续的alpha,且alpha衰减较慢。
3
盈余公告跳空因子(JOR)
首先我们将“断层”进行定量化刻画,我们构建“盈余公告跳空因子”(Jumpof ReportDate Factor,下文简称JOR因子)来描述股价的“断层行为”,发现该因子在全市场范围内具有显著的选股能力,与常见的风格类因子均保持较好的独立性。
3.1 传统EAR因子
净利润断层现象在学术文献亦有对照,被称作为“盈余漂移”异象(PEAD)。研究(Ball,Brown,1968)发现:盈余公告发布之后,股价长期的累积超额收益朝着盈利意外方向漂移。基于上述研究,Brandt等(2008)设计了最为经典的EAR因子(EarningsAnnouncement Return)。该因子定义方式如下:若公司在T日发布盈余公告,则将T-2至T+1日期间的累计超额收益记为因子值,该因子在美股市场上具有较强的选股能力。图2展示了美股市场在不同持有期下基于EAR因子分5组后的多空对冲收益表现。
我们在A股市场构建EAR因子并测算其因子表现。通过图3和图4可以看出,EAR因子在A股市场的选股效果并不出色,总体上具有一定的选股能力,但其波动性较大。
进一步地,行业市值中性后的EAR因子IC均值为1.98%,ICIR为1.32,月度胜率为65.83%。Barra风格中性后的因子IC均值为1.55%,整体表现较为一般。
3.2 JOR因子的构建
实际上,部分学术文献认为盈余公告日之后的价格跳跃行为比盈余公告日前后的超额收益更有信息含量(Haigang Zhou,John Qi Zhu,2012)。本文考虑到A股独特交易模式以及受“净利润断层”现象启发,我们猜想A股市场上盈余公告隔日的跳空是最具信息含量的股价跳跃行为。据此,我们构建JOR因子:
整体上,JOR因子的表现相对EAR因子有明显提升,IC均值提升显著,IC的波动率也有明显降低。
JOR因子行业市值中性后IC均值为3.28%,ICIR提升至2.20,月度胜率提升至77.50%。对常见风格中性后,IC均值仍有2.40%,ICIR高到2.56。
分组收益方面,以行业市值中性后的JOR因子为例,其分组单调性明显,且超额收益明显向多头收益集中。剔除Barra风格后,其因子多空收益仍然稳健。此外我们考察JOR因子与Barra十大风格因子的秩相关性。我们发现,JOR因子与Barra十大常用风格因子之间秩相关较弱,因子独立性较强;作为同源因子,与EAR因子相关性相对较强,但JOR因子的因子表现明显强于EAR。
基于上述研究,我们发现JOR因子具有优异的全市场选股能力,且独立性较强,后续我们将使用JOR因子对净利润断层策略中的断层现象进行刻画。
4
超预期的文本刻画
4.1 有效样本筛选方式
首先,我们将定义有效的分析师报告样本,分析师报告数据采集于朝阳永续数据库。本文主要采集分析师对盈余公告(业绩预告、业绩快报和正式财报)的文本点评信息,考虑到分析师报告的撰写时间和入库时间之间可能具有一定的时滞,我们设定如下的有效样本筛选规则:
2)分析师所在券商过去12个月内发布研究报告数量排名全市场前40名,剔除研究报告数量过少的券商报告样本;
3)所有报告的撰写时间始于2010年1月1日,截止于2020年3月31日。
经过筛选后的有效报告样本共计242240份,多数集中于正式财报点评中,占比高达86.7%。若从有效样本的撰写和入库时滞角度分析,接近90%的样本时滞在3天之内,99%的样本时滞在4天之内。
4.2 超预期的文本定义方式
我们直接从有效样本的报告标题中识别超预期的关键信息,并筛选出相关股票池。在文本分析中,我们借助Python的jieba库进行分词,以及gensim库作为工具分析词向量关联度。具体筛选中我们设置的一些参数与规则如下:
1) 断句符号:句号、逗号、问号
2) 必须词组1:预期
3) 必选词组2:超、高于、好于
4) 屏蔽词组:料,或,将,预计,望,可能,待(以上表示对未来的一种预判,而非当期业绩超预期),略,小幅(表示程度轻微);
上述词组的设定主要依赖于gensim库中Word2Vec算法下词组相似性结论进行判断。
基于该方式筛选出的具备“超预期”涵义的分析师报告样本一共12756个,占所有有效样本的6.06%;其中预告类的“超预期”占比率最高,达到12.88%,这或许与业绩预告发布时间早于业绩快报和正式财报有关。
我们对不同类型的超预期样本按照入库所在月份进行统计。整体上,基于财报的超预期样本密集集中在4,8,10月份,预告超预期样本基本集中1,4,7,10月份,另外3,6,9月份数量也较可观;快报超预期样本基本集中在1,2,3,7月份。分年度角度观察,业绩快报类超预期报告相对稀缺,而预告、定期财报类超预期样本数量相对充足。
5
超预期事件效应
5.1 各类型事件累积超额表现
图15展示了超预期事件触发后相对于中证500指数的超额收益。我们发现:
1)业绩预告、年报的超额收益相当稳定、且衰退较慢,长达80个交易日内仍然贡献持续为正的超额收益。而快报的超额收益虽然为正,但稳定性不足。
2)预告类型超预期事件的超额能力、持续性最强,财报居中,快报最差;
3)无论是业绩预告还是正式财报,多份超预期报告样本验证下的超预期事件(n=2)超额能力显著强于单份超预期报告样本验证下的超预期事件。
5.2 断层因子对超预期事件的分组效果
净利润断层策略中,“断层”的刻画对策略的表现同样至关重要。我们进一步分析JOR因子对超预期事件的分组效果。我们分别在预告超预期样本和正式财报超预期样本中按照JOR对股票进行三等分,计算不同分组下的超额收益水平。
整体而言,无论是预告还是财报超预期样本中,我们发现断层因子均具有显著的区分能力,这侧面证实了净利润断层策略思想的可靠。
6
净利润断层组合构建
通过上面的分析我们知道,超预期事件的触发事件有一定的随机性,在任何时点,我们无法预知未来一段时间会有多少样本触发超预期,如果按照触发一个调整一个的方式来调仓,对资金分配和交易操作的要求比较高。通过上文的分析我们看到超预期策略触发后,在未来3个月的周期内都存在超额收益,因此我们尝试将调仓频率降低,在固定的时点调仓,这样构建的组合更适用于实盘的操作。首先,我们将验证上文设计的JOR因子在超预期样本空间中的选股能力,接着我们利用验证得到的结论构建净利润断层金股组合。
6.1 超预期样本空间下的JOR因子选股效果
上文已经论述了JOR因子在全市场样本空间具备选股能力,但净利润断层策略需要断层因子在超预期的样本中同样具有分组能力,接下来我们将考察JOR因子在超预期样本中的分组效果。这里我们定义超预期的样本空间如下:在每个月末回溯过去6个月的样本,若某股票在回溯期内触发超预期事件(即在盈余公告发布后的5天内有分析师的点评报告标题中包含“超预期”含义的词组),则该股票在该月末入选超预期样本空间。
整体上,我们定义的超预期样本空间每期数量在110-420之间,平均数位于240只左右。2016年以来的超预期样本空间数量明显放大,基本能稳定在200只以上。
图17展示了2010年以来超预期样本空间相对于中证500指数的表现,很明显看出“预期样本空间的组合表现稳定,能持续显著地战胜中证500指数。
2010年以来,超预期样本空间年化超中证500指数12.31%,除了2014年略微跑输指数外,其余年份均具有正收益。
我们发现JOR因子在超预期样本空间中仍然具有显著分组能力。每个月底在超预期样本空间内按照JOR因子的取值排序五等分,相对应地构建五个组合。走势如图18,可以观察到JOR因子具有较为显著的分组能力,尤其是跳空幅度最大组的股票超额收益非常显著。
6.2 净利润断层金股组合
基于JOR因子在超预期样本空间中的优秀表现,下面我们尝试结合正式财报和业绩预告的信息,构建净利润断层金股组合。具体构建方式如下:
调仓时点:基于正式财报、业绩预告信息的分布月份,我们在1,4,7,8,10这5个月月末进行调仓。
回测时间:2010年1月—2020年3月;交易成本:双边千三
图19显示,净利润断层金股组合业绩表现非常稳健,年化相对中证500指数的超额收益率高达32.37%,相对最大回撤8.66%,除去2014年跑赢幅度较小外,其他年份均能较大幅度跑赢基准。今年以来,组合已经跑赢中证500指数14.18%。
我们把组合相对中证500指数的超额收益进行分月汇总,总体上月度胜率达到79.67%。
从月度表现来看,组合在4、6、12月业绩表现相对更优,而在2、7、11月业绩表现相对较弱。
上述的业绩分析中,我们主要把净利润断层金股组合与中证500指数做比较。但我们的组合构成是简单的等权加权方式,并没有在行业或风格上去做限制约束,这里我们换一个更具有参考意义的比较基准—主动股票和偏股型基金的业绩中位数,如果我们的组合每年都能战胜该基准,则说明该策略在历史不同市场环境下都是适用的。
如表7所示,2010年以来净利润断层金股每年都能战胜主动偏股型基金的中位数,基本上每一年都能战胜基准10%以上,以年度业绩排名来看,每年的业绩都能排进主动偏股型基金的前25%,对不同的市场环境有很好的适应能力。
6.3 持仓特征分析
我们主要对净利润断层金股组合进行持仓分析。首先是持仓数量,图21显示,随着持仓数量的增加,组合的年化收益呈现下降趋势,但不同持仓数量下的组合表现都非常出色,持仓30只和持仓60只得年化收益差距在4%左右。前文的绩效展示中,出于尽可能扩大组合资金容量的考虑,选取了持仓数量上限为50只。
图22展示了在持仓数量上限为50只的约束下,各换仓时点的可买股票数量。总体而言,全样本75%的时点都能买满50只,90%的时点能买足30只,2010年初最少一次买入了16只;2016年开始,82%的时点都能买满50只,所有时点都能买足30只。
图23展示了历史入选股票的行业分布。成长股频出的医药、电子、机械和计算机等行业入选次数最多;而钢铁、煤炭、军工、有色等周期性行业入选次数很少。
图24展示了策略在各个换仓时点上所持股票的市值分位数水平(分位数越大,代表市值暴露越高)。整体来看市值排序的平均分位数为74%,持仓偏向于中大型市值的股票。
图25展示了策略在各个换仓时点上所持股票的估值分位数水平(分位数越大,代表估值越低)。整体来看BP因子的平均分位数为42%,持仓股票估值略高于市场中位数水平。
图26展示了策略在各个换仓时点上持仓在长期动量因子上的暴露情况(过去1个月至过去12个月的累计收益,分位数越大,代表动量越强)。整体来看长期因子的暴露水平分位数为64%,策略持仓偏向于选择前期表现较为强势的股票。
总体而言,净利润断层作为一类经典的成长股量化策略,所选股票更偏向于医药、消费和电子等成长性较好的板块,持仓股票市值中等偏大,估值处于市场中位数略高的位置、前期股价表现价强势,非常符合典型成长股投资策略的画像。
7
总结
净利润断层选股策略本质上是一种基本面与技术面共振的选股策略,在网络和部分投资书籍中较为流传。量化领域对其的关注却相对稀缺,本篇报告尝试将这种偏主动的选股思路模型化并进行实证分析,实证结果表明,净利润断层选股策略非常适用于A股市场,在各种市场环境下均能大幅战胜市场指数。
如何定量刻画“业绩惊喜”和“股价跳空”是模型构建成功的关键。
我们用业绩超预期来刻画业绩惊喜,在刻画股票业绩超预期时,我们没有通过传统定量的方式来比较实际业绩相对预期业绩的差值,而是另辟蹊径通过一种偏定性的方式来刻画业绩超预期:通过分词和语义分析来识别分析师撰写的研究报告标题中是否带有类超预期含义的表达。通过该方法筛选出的超预期样本相对市场能产生三个月以上的持续超额收益,以此触发的股票池相对中证500指数实现12.31%的超额收益。
我们用盈余公告跳空因子JOR来刻画股价跳空。JOR因子是指盈余公告次日股价相对市场指数的跳空幅度,相比于传统盈余漂移因子EAR,JOR因子在A股市场具有更强的选股效果,行业市值中性化后的JOR因子IC均值3.28%,年化ICIR为2.2,JOR因子与常见风格因子相关性极低,剔除Barra风格后仍然具有显著选股能力。
我们在超预期的样本中选取JOR因子最大(盈余公告次日跳空幅度最大)的50只股票等权构建定期调仓的组合,组合每年都战胜中证500指数,2010年以来实现了相对中证500指数32.37%的年化超额收益,信息比率3.01。如果以股票型和偏股型基金为比较对象,85%仓位的组合自2010年以来每年的业绩均能排进市场的前25%。
净利润断层作为一类经典的成长股量化策略,所选股票更偏向于医药、消费和电子等成长性较好的板块。持股风格来看,组合整体持仓市值中等偏大,估值处于市场中位数略高的位置,动量维度来看,组合持仓偏向于前期股价表现价强势的股票。
风险提示
市场系统性风险,有效因子变动风险。
多因子选股系列报告