新浪财经

Deep Timing:日内信息与相似度学习驱动择时 | 民生金工

市场投研资讯

关注

(来源:尔乐量化)

➤ 根据民生金工历史研究框架搭建深度学习股票收益预测模型进行个股择时建模,效果显著。

民生金工已经发布过多篇深度学习相关报告,从之前的报告中我们已经总结出一套适合如今市场环境的深度学习股票收益预测框架。基于此框架,我们建立股票混合收益预测模型,模型包含日频输入与分钟频输入,利用预测值取历史滚动阈值输出交易信号。近5年多的时间中,对于等权持有每一支股票,策略获得77%的累积超额收益,集中在市场下跌的2022-2023年;且在市场上涨的2020-2021年并没有跑输市场。

➤ SimStock根据自监督学习预测股票相似度,同时考虑股票静态与动态相关性。

所谓自监督学习,即预测目标并不从外部而来,而是通过数据本身的结构生成,利用数据增强技术自动构建正样本和负样本,即对于每只股票而言,较为相关的股票与不相关的股票。整个模型采用了对比学习的思想,将股票的时序信息加入相似度衡量,使得行业与风格不再是股票分类的唯一标准。结果表明,与一支股票相似度最高的股票大都是相同一级行业的股票,但是在市值上并没有明显的相似规律,且在二级行业上也没有明显规律,属性信息日频输出,更加鲁棒。

➤ 利用SimStock输出的属性信息初始化基模型隐状态,预测效果进一步提升

改进后模型在近5年多的时间中,对于等权持有每一支股票获得109%的累积超额收益,平均每只股票年化收益30%,跑赢个股14.8%(费前);若基准为50%仓位,则年化超额收益29%,在所有股票的所有样本外回测期内,日度判断胜率为57.4%,持仓几率为45.7%,平均每支股票年化换手率(双边)为26.2倍。在成分股内,沪深300好于中证500好于中证1000,可能是小盘股上换手率不够导致的。

➤ 将预测值合成至指数依然有效,高波行业中效果明显

在个股择时有了一定成效后,我们尝试利用个股信号合成指数信号。首先我们根据流通市值计算指数内合格成分股的权重,随后将每支股票的收益预测根据权重加权合成至指数收益预测。沪深300年化收益5.1%,超额收益5.6%;中证500年化收益12.4%,超额收益12.2%;中证1000年化收益15.1%,超额收益14.9%。同样方法论在不同行业中效果差别较为明显,在红利低波行业中较差,而在高波板块中较好,表现最好的电力设备及新能源行业年化收益36%,平均每年跑赢行业31.1%。价值/成长轮动策略年化收益3.3%,超额收益4.2%。

➤ 信号应用范围广泛,可对多种产品进行增强

择时策略可以直接用于个股波段策略以博取高收益:对于某些TMT,科技类主动型基金,可以根据择时信号对关注标的择时交易,避免回撤,从而博取更加稳定的组合表现;合成至指数后的择时信号可以用于指数增强等产品的仓位控制:比如中证500指数每年通过择时跑赢基准12%,若假设现金仓位可在90%~100%间波动,则适当的择时策略可提升组合年化收益1%左右;择时信号在IC期货中会也有一定效果,但由于多空收益最大回撤较大,建议控制仓位。

01

基于中高频信息的股票收益率预测模型搭建

本篇报告我们基于民生金工深度学习框架进行个股择时策略研究。信号可用于个股波段择时,或并合成至指数后进行指数择时。

1.1民生金工深度学习框架:输入、训练与输出

从之前发布的系列报告中我们已经总结出一套适合如今市场环境的深度学习股票收益率预测框架。该框架由3部分构成:输入端,我们利用强化学习输出风格因子以计算近期市场的风格偏好;训练端,我们采用元学习纳入最新市场数据且对样本外预测的输入与输出进行微调,动态适应市场环境;输出端,我们利用带约束的优化网络对于输出y进行约束,以达到特定目的,如控制输出的风格,行业暴露等。

输入端:《深度学习如何自适应市场状态以提升模型稳健性?》20250127

《深度风险模型与强化风险模型的构建及组合优化》20250506

训练端:《从增量学习到元学习:深度学习训练新框架》20240202

输出端:《深度风险模型与强化风险模型的构建及组合优化》20250506

具体的,强化学习风格因子部分来自《深度风险模型与强化风险模型的构建及组合优化》。为了更加准确地刻画市场风格,我们利用PPO强化学习模型预测更加具有解释度,且相比深度学习更加稳健的风险因子。将传统风格因子与近期个股量价数据输入PPO模型,奖励函数为稳定性惩罚后的市场收益拟合优度,预测得到强化风格因子后,取最近市场上涨幅度最高的前10%股票,并计算这些股票最近的强化风格均值作为AI市场偏好。

训练端的元增量学习来自《从增量学习到元学习—深度学习训练新框架》。元增量学习首先建立在增量学习的背景之上,利用过去一段时间的增量数据来更新基模型,不断让模型纳入新的市场规律,对未来的预测产生影响。在此之上进一步用数据适应器适应增量数据并用MAML适应基模型,以避免增量数据与历史数据的联合分布差异过大导致的模型局部优化问题。

最后,在对模型输出的优化上,我们可以利用带约束的LinSAT深度神经网络在输出层中进行优化。LinSAT层设计了一个可微且无参数的轻量级层,用于将正线性约束编码到神经网络的输出中,通过将正线性约束视为边际分布,实现了端到端的可微训练,确保了约束的严格满足。进一步地,我们可以将对于行业,风格,个股的约束条件输入到LinSAT网络中,对预测进行约束,从而针对约束训练出在特定条件下预测能力更加准确的模型。

1.2基于中高频信息的收益预测与择时应用

基于上述框架,我们可以建立股票混合收益率预测模型,用于权益择时。模型包含日频输入与分钟频输入,日频输入端我们选择了民生金工因子库中51个技术面/情绪面日频特征+7个日频基础量价指标+10个强化风格因子,分钟频输入端我们采用民生金工因子库中的52个分钟频特征(合成至日频),基分类器我们采用2个GRU分别对日频与分钟频特征进行解码;市场信息的嵌入上,我们利用指数量价+1.1节中提到的市场强化风格偏好生成权重进行嵌入;为了稳定预测信号以进行择时,我们将多期股票收益作为预测目标,并将多期MSE的均值作为损失函数,故收益预测仍然为(n,1)。

模型数据处理与其他参数细节如下表所示。训练数据从2013年开始,每次训练+验证集长度为6年,验证集为后15%,样本外收益预测自2019年开始,每20个交易日基于元学习框架利用最新市场信息对历史基模型进行微调,历史基模型每年滚动训练一次。

模型信号分布集中于0轴附近。模型得到收益预测后,利用预测构建择时策略,注意这里的预测仍然是对未来一段时期内的综合收益预测(n, 1);我们观察全历史(2019年以来)所有股票的收益预测分布:信号呈单峰分布,略微右偏,两侧密度迅速下降,尾部极窄。此分布均值为0.55%,最小值-36.8%,25%分位数-0.32%,中位数0.5%,75%分位数1.37%,最大值30.1%。

根据市场情况,我们需要对于历史预测取滚动阈值,输出买入信号。在A股总体市场条件下,若以0为阈值输出买入信号,有可能无法避免回撤的风险。除此之外,对于一个旨在做波段的择时策略,我们不希望频繁交易。故一旦输出买入信号,我们规定需要至少持有10个交易日,除非遇到强烈卖出信号。基于以上思路,我们以过去一年预测值的70%分位数作为阈值,超过此阈值则输出买入信号,而卖出信号规定为低于过去一年预测值的30%分位数。

以平安银行为例,策略准确识别了2020-2021年的上涨与2022年的回撤,5年跑赢个股81%,表现优秀。而这5.5年间共交易111次,平均每年换手率不到双边20倍,已经显著优于同类策略的选股换手率(将近翻倍)。

回测时暂不计交易费用,然而由于我们在构建模型时用到了多目标优化,故原始预测的变化不会很快,从而一定程度上降低策略换手率,按照双边千分之3的交易成本估算,费后可以在平安银行上取得年化7.4%的收益,平均每年跑赢8.8%。

我们在全A中进行回测,对每一支股票采取相同策略后取表现平均。近5年多的时间中,对于等权持有每一支股票,策略获得77%的累积超额收益,平均每年取得27%的年化收益,跑赢个股达11.3%(费前)。超额收益集中在市场下跌的2022-2023年;且在市场上涨的2020-2021年并没有跑输市场;故可以初步认为策略有效。

值得注意的是,策略超额收益高低与市场表现高度相关,理论上我们的基准应该对每支股票持中性观点,也就是半仓。若将基准换为持续持有每支股票的50%仓位,则累计超额收益可以提升至108%,平均每年跑赢基准20.2%。

择时信号本身在选股上相比以IC为目标函数的深度学习表现较弱。若将择时信号作为选股因子,2019年以来因子周度平均RankIC4.5%,双周频调仓多头组合按照双边千分之二扣费后年化收益23.2%,相对中证800年化超额收益18.3%,远不如我们之前报告中的Meta_Master等因子。

策略在不同市值规模的宽基成分股中表现有所区别。对于沪深300成分股,近五年平均胜率74%,平均年化收益17.2%,夏普比率1.24 ,平均每年超额收益11.4%,绝对收益净值最大回撤8%。

中证500中平均胜率75%,平均年化收益18.8%,夏普比率1.58,平均每年超额收益9.3%, 绝对收益净值最大回撤10.3%

中证1000成分股中年平均胜率74%,平均年化收益18.1%,夏普比率1.24,平均每年超额收益6.9%,绝对收益净值最大回撤21.3%

与选股不同,择时信号的有效性不与市值有太多关系(回撤角度大盘好于小盘),而较为有效的股票也多为高流动性与高波动的股票,这与传统学习在选股上的偏好截然相反,这也从侧面说明了选股与择时两个问题的区别。

02

SimStock股票相似度刻画与模型提升

CHAPTER

从提升模型效果而言,相似股票的择时信号可能共享某些规律,我们可以考虑加入相似度信息或者加权训练提升模型的泛化能力。我们参考Yoontae Hwang等人在2023年底发表的论文《SimStock : Representation Model for Stock Similarities》,利用自监督学习与时间域泛化技术,预测股票相似程度,我们将此信息加入至上一节模型中,旨在提升模型在不同种类股票之间预测的稳定性。

2.1SimStock模型刻画股票相似度

在深度学习中,股票属性信息往往是提升模型表现的重要因素,而刻画股票相似度有很多种方式。在我们之前的报告《深度学习如何利用公募持仓网络优化选股效果?》中,我们通过公募基金年报/半年报信息提取股票内在属性,加入到LSTM(长短期记忆网络,Long Short-Term Memory)中取得了效果提升。在本次研究中,我们希望通过一种更加动态的方式,以预测相似度为目标,得到股票的内在属性,从而提升模型准确率。

论文提出了利用自监督学习预测股票相似度。衡量两只股票是否相似,首先需要提取股票特征,传统方法利用风格和行业表征股票属性,但缺乏对于近期量价规律的刻画。而自监督学习可以在考虑股票行业风格等属性的同时,提取过去一段时间的量价规律,从而输出一个更加全面的当期个股信息表示向量,更加动态地刻画相似度信息。

所谓自监督学习,即预测目标并不从外部而来,而是通过数据本身的结构生成,作者利用数据增强技术自动构建正样本和负样本,即对于每只股票而言,较为相关的股票与不相关的股票。LSTM生成动态注意力参数后对于正负样本分别加权,并通过CLS令牌吸收整个序列的信息,输出最终的个股向量表示。整个模型采用了对比学习的思想,将股票的时序信息加入相似度衡量,使得行业与风格不再是股票分类的唯一标准。

首先,模型纳入股票原始输入,即个股过去40日时序量价,barra风格因子以及资金流指标,数据形状为(N, 40, 20),其中N为股票数量。基于原始数据与行业信息嵌入(行业哑变量经过全链接层处理)构建数据锚点X,随后基于锚点构建正样本与负样本,即“与每只股票较为相似的模拟样本”与“与每只股票较为不相似的模拟样本“,正样本X_pos=λX+(1-λ)X_perm,其中λ=0.75,X_perm为X的一个随机特征(抽样),即很片面代表X的随机样本,形状为(N, 40, 1),每一个batch随机抽取一个特征作为X_perm。构建完样本后,利用行业信息嵌入初始化LSTM后输入股票原始信息,输出注意力权重,并利用Transformer中的CLS令牌聚合技术(将注意力得分聚合至股票维度)得到个股属性向量表示Hs,我们的学习目标是让Hs与正样本聚合得到的股票属性向量CLSpos尽可能相似,同时让Hs与负样本聚合得到的股票属性向量CLSneg相似度尽可能低,从而得到更能代表当期股票属性的股票向量Hs,股票相似度可以用当期个股属性向量的余弦相似度表示。

我们训练SimStock模型,训练集从2013年开始为期5年,验证集1年,测试集从2019年开始。由于SimStock是自监督学习模型,模型在训练时并不运用未来数据,故即使我们将全样本的预测输出作为结果,也不会用到未来信息。对于后续模型中使用2013-2018年训练集时,我们也用到了SimStock在同时期样本内的输出,这一点在理论上是可行的。

从模型输出结果上看,SimStock依旧偏好同行业的股票作为相关性最高的股票。我们取模型输出后的随机一天截面来观察模型的预测规律,具体地,取当天股票的属性向量后对每只股票与其他所有股票进行余弦相似度计算,我们取了2025年5月30日的代表性4只股票(表中第一行),并列出与其最相关的前20只股票。

从结果可以看出,与每支股票相似度最高的股票都是相同行业的股票,但是在市值上并没有明显的相似规律,且在二级行业上也没有明显规律。

2.2基于股票属性嵌入的收益预测模型

上文中得到的股票属性信息可以加入到GRU股票收益预测模型中,旨在提升模型在不同股票中预测的稳定性。我们可以将第一节中用到的日频特征输入SimStock,将SimStock刻画的股票属性向量Hs加入股票收益预测模型中,用Hs初始化GRU的隐藏状态,即用Hs代替GRU模型的第0个隐状态,用一个已知而非随机的隐状态向量引导模型从股票属性认知开始学习,旨在提升模型在不同种类股票中表现的稳定性。改进后模型结构图如下所示,模型中其他要素与训练设定均不变。

改进后模型表现有所提升。根据上一节中的相同方式在全A中进行回测,对每一支股票施行相同策略后取表现平均,近5年多的时间中,对于等权持有每一支股票,策略获得109%的累积超额收益,平均每只股票年化收益30%,跑赢个股14.8%(费前);若基准为50%仓位,则年化超额收益29%,在所有股票的所有样本外回测期内,日度判断胜率为57.4%,持仓几率为45.7%,平均每支股票年化换手率(双边)为26.2倍。

继续以平安银行为例,改进后策略5年累计跑赢股票本身115%,平均每年跑赢21%,相比改进前进一步提升12%。5年半中共交易147次,平均每年双边换手率27.5倍,相比基准模型有所提升。按照双边千分之3的费率估算,平均每年收益率16%,跑赢个股17%,相比基准模型提升7%。

策略在不同宽基中表现有所改善,且差距有所减小。对于沪深300成分股,近五年平均胜率76.1%,平均年化收益20.7%,夏普比率1.88 ,平均每年超额收益14.4%,策略绝对收益最大回撤均值为8.5%。且2020-2021的超额稳定性有所提升。

中证500中平均胜率75.6%,平均年化收益23.4%,夏普比率1.97,平均每年超额收益13.1%, 策略绝对收益最大回撤均值为10.8%。

中证1000成分股中年平均胜率75.6%,平均年化收益22.5%,夏普比率1.56,平均每年超额收益10.7%策略,绝对收益最大回撤均值为20.5%。

改进后模型在选股效果上没有提升,这可能是由于训练标签不适用导致的。改进后模型因子2019年以来周度平均RankIC4.2%,双周频调仓多头组合按照双边千分之二扣费后年化收益21.7%,相对中证800年化超额收益17.2%。

03

微观至中观的宽基与行业指数择时效果

CHAPTER

3.1宽基指数择时

在个股择时有了一定成效后,我们尝试利用个股信号合成指数信号。对于指数择时信号的自下而上合成有2种方法:第一种是根据个股的买入卖出信号加总至指数信号;第二种是根据个股的原始收益预测合成至指数收益预测,再根据指数收益预测输出指数的买入卖出信号。我们选择第二种方法,因为个股收益预测至个股交易信号的计算中包含了一定误差,而进一步合成至指数后信号的误差更大,所以我们选择自下而上合成收益预测后再计算交易信号,这样只有一步误差放大。

首先我们根据流通市值计算指数内合格成分股的权重,随后将每支股票的收益预测根据权重加权合成至指数收益预测。因个股合成的预测更加平滑且接近于0,故我们取更激进的过去一年预测的60%分位数作为信号阈值;且因为个股合成的缘故,信号变动较快,故我们规定买卖后至少保持5个交易日以避免频繁换手。合成后策略在沪深300,中证500,中证1000的效果如图所示。

沪深300择时策略年化收益5.1%,相对沪深300年化超额收益5.6%,策略最大回撤7.7%,若将过去一年预测值40%分位数作为空头信号,同一仓位至少保持5个交易日,策略年化多空收益10.7%,最大回撤8.4%。

中证500择时多头策略年化收益12.4%,相对中证500超额收益12.2%,策略最大回撤7.1%,若将过去一年预测值40%分位数作为空头信号,同一仓位至少保持5个交易日,策略年化多空收益24.6%,最大回撤12.6%。

中证1000择时多头策略年化收益15.1%,相对中证1000超额收益14.9%,策略最大回撤11.3%,若将过去一年预测值40%分位数作为空头信号,同一仓位至少保持5个交易日,策略年化多空收益30.2%,最大回撤14.5%。

考虑到不定期择时信号操作难度较大,但若我们将策略改为固定周频,效果下降较为明显。策略每周五收盘后给出信号,按照指数周度收益回测策略有效性:

沪深300周度择时策略年化收益1.7%,相对沪深300年化超额收益2.3%,策略最大回撤13.4%,年化多空收益3.7%,最大回撤19.6%。

中证500择时多头策略年化收益8.3%,相对中证500超额收益8%,策略最大回撤7.8%,年化多空收益16%,最大回撤14.9%。

中证1000择时多头策略年化收益10.5%,相对中证1000超额收益10.3%,策略最大回撤16.2%,年化多空收益19.8%,最大回撤24.2%。

3.2行业及风格指数择时

相同的方法也可以同样对行业指数与风格指数进行择时。个股信号同样可以合成至行业信号,利用完全一致的方法论对所有行业的择时策略可以更加灵活地应用。对每一个中信行业择时效果如下:

尽管加入了股票属性信息,择时策略仍然在不同行业中表现区别较大,在波动率高的行业中表现普遍较好。第一张图中绝对收益最高的5个行业分别为机械,医药,计算机,汽车与通信,相对收益最高的5个行业分别为医药,机械,农林牧渔,通信和建材。表现较好的行业通常都有赔率较高,且震荡规律较为明显的特点,模型大多数情况下可以识别行业下跌,持有时间大部分在上涨,故在赔率较高的行业中可以获得更高的收益。

策略在红利低波的防守型行业中效果有限。在所有行业中,银行,煤炭与纺织服装没能显著跑赢基准(一直满仓)。在波动率与弹性较低的行业中,机器学习模型较难长期稳定给出择时信号,尽管这些行业本身绝对收益表现并不差。对于大金融板块,行业出现明显上涨机会主要由政策等因素牵制,较难预测,模型在右侧买入后很难获得超额收益。

策略在电力设备及新能源中择时效果最明显。策略在行业中年化收益36%,平均每年跑赢行业31.1%,对于典型的高波成长行业,模型表现十分优异。

模型对于风格指数的择时效果稍微逊色一些。在中证800成长/价值中,择时信号也有一定效果,我们对于价值/成长的择时策略为:若价值收益预测>0且价值收益预测大于成长收益预测,则满仓价值,反之则满仓成长,若二者都预测下跌,则保持空仓。考虑到操作的便捷性,我们继续在每周五输出信号,进行固定周频调仓。择时策略年化收益3.3%,超额收益4.2%(相对价值成长等权)。

04

本篇研究中,我们对于深度学习在股票以及指数上的择时策略进行了探索,并取得了一定成果。首先我们根据历史框架搭建基于日频与分钟频输入的股票收益预测模型,取得一定效果;随后加入自监督训练得到的股票属性,模型效果显著提升;最后我们将个股信号合成至指数,在宽基指数,行业与风格上跑赢绝大多数基准,为个股波段以及短期风格行业择时提出了新解法。

根据民生金工历史研究框架搭建深度学习股票收益预测模型进行个股择时建模,效果显著。基于历史框架建立股票混合收益预测模型,模型包含日频输入与分钟频输入,利用预测值取历史滚动阈值输出交易信号,策略近5年在每支股票上平均获得77%的累积超额收益。 

SimStock根据自监督学习预测股票相似度,同时考虑股票静态与动态相关性。利用SimStock输出的属性信息初始化基模型隐状态,预测效果进一步提升。改进后模型策略获得109%的累积超额收益,平均每只股票年化收益30%,跑赢个股14.8%(费前);日度判断胜率为57.4%,持仓几率为45.7%。

将预测值合成至指数依然有效,高波行业中效果明显。沪深300择时策略年化收益5.1%,超额收益5.6%;中证500年化收益12.4%,超额收益12.2%;中证1000年化收益15.1%,超额收益14.9%。同样方法论在在高波板块中较好,表现最好的电力设备及新能源行业年化收益36%,平均每年跑赢行业31.1%,在红利低波等行业中较差;在价值和成长等风格中策略效果减弱,但仍然有效。

本篇研究中提出的方法论可以从以下几个角度出发应用至产品构建中:

1.择时策略对于高波成长行业尤其有效,在某些个股中效果尤其出色,可以直接用于个股波段策略以博取高收益。对于某些TMT,科技类主动型基金,可以根据择时信号对关注标的择时交易,避免回撤,从而博取更加稳定的组合表现。

2.合成至指数后的择时信号可以用于指数增强等产品的仓位控制。比如中证500指数每年通过择时跑赢基准12%,若假设现金仓位可在90%~100%间波动,则适当的择时策略可提升组合年化收益1%左右,且与因子策略本身无关,是值得尝试的收益增厚方式。

3.信号可以被用于股指期货中进行交易。择时策略信号在IC期货中会也有一定效果,但由于多空收益最大回撤较大,建议控制仓位;此外,若能在盘中计算信号并立即建仓,准确率与收益都将进一步提升。

4.其他ETF与行业,风格配置上的潜在应用。择时信号合成至行业与风格上大多可以跑赢基准,在资产配置或ETF交易中可以参考行业信号,进一步用类似风格轮动的方法论将行业择时改为行业轮动策略进行应用。

1量化模型基于历史数据,市场未来可能发生变化,策略模型有失效可能。

报告信息:

韵天雨 S0100524120004  yuntianyu@mszq.com

本文来自民生证券研究院于2025年7月31日发布的报告《Deep Timing:日内信息与相似度学习驱动择时》,详细内容请阅读报告原文。

《证券期货投资者适当性管理办法》于2017年7月1日起正式实施,通过本微信订阅号/本账号发布的观点和信息仅供民生证券的专业投资者参考,完整的投资观点应以民生证券研究院发布的完整报告为准。若您并非民生证券客户中的专业投资者,为控制投资风险,请取消订阅、接收或使用本订阅号/本账号中的任何信息。本订阅号/本账号难以设置访问权限,若给您造成不便,敬请谅解。我司不会因为关注、收到或阅读本订阅号/本账号推送内容而视相关人员为客户;市场有风险,投资需谨慎。

免责声明

民生证券股份有限公司(以下简称“本公司”)具有中国证监会许可的证券投资咨询业务资格。本报告仅供本公司境内客户使用。本公司不会因接收人收到本报告而视其为客户。本报告仅为参考之用,并不构成对客户的投资建议,不应被视为买卖任何证券、金融工具的要约或要约邀请。本报告所包含的观点及建议并未考虑个别客户的特殊状况、目标或需要,客户应当充分考虑自身特定状况,不应单纯依靠本报告所载的内容而取代个人的独立判断。在任何情况下,本公司不对任何人因使用本报告中的任何内容而导致的任何可能的损失负任何责任。

在法律允许的情况下,本公司及其附属机构可能持有报告中提及的公司所发行证券的头寸并进行交易,也可能为这些公司提供或正在争取提供投资银行、财务顾问、咨询服务等相关服务,本公司的员工可能担任本报告所提及的公司的董事。客户应充分考虑可能存在的利益冲突,勿将本报告作为投资决策的唯一参考依据。

加载中...