衍复豹豹说:走进因子投资(下)
格上基金官方微博
作者:衍复投资
量价/基本面/另类因子
根据数据类型,业界通常将因子分为三类:
量价/基本面/另类因子。
其中量价因子是在当前A股市场量化策略中超额贡献占比最高的策略类型。
量价因子就是用股票量价数据表述的特征。
所谓的“量价”数据中,
“量”就是成交量、订单量相关数据,
“价"就是股价相关数据。
动量因子和反转因子是最广为人知的两个量价因子。
其中动量因子通常反映股票在过去12个月扣掉最近1个月时间内的收益率情况,因子值越大说明股票的动量越大。
有些投资者相信强者恒强,
也就是动量因子值越大的股票,
未来一个月的期望收益率越高。
所以这些投资者会做多这些股票。
这就叫作做多动量因子,
或者说叫做趋势策略。
反转因子通常反映股票在过去1个月时间内的收益率情况,
因子值越大说明股票的反转势能越大。
有些投资者相信均值回复的力量,
也就是反转因子值越小的股票,
未来一个月的期望收益率反而越高。
所以这些投资者会做多这些股票,
这就叫做反转策略。
不难发现,反转和趋势的逻辑是相反的。
事实上,股票价格有时候会体现动量效应,
有时候则体现反转效应。
基本面数据是反映上市公司、行业、宏观经济运行状况的数据。
例如上市公司财务报表的数据能反映上市公司运营状况,
因此就属于基本面数据。
价值因子和成长因子是广为人知的两类基本面因子。
成长因子关注公司过去营业收入和净利润的增长率。
价值因子,也叫估值因子。
关注上市公司的Book-to-price(简称BP),
BP是账面价值/市场价值。
BP越高,说明上市公司的股价越被低估。
随着时代的不断发展,
投资者的平均水平在不断提升。
现在已经很难单纯利用成长和价值因子来寻找到稳赚不赔的股票,
但是它们依旧是最受关注的基本面因子。
另类因子对应的数据自然是另类数据。
顾名思义,另类数据通常指的是传统量化投研过程中不会被使用的数据。
大多数另类数据是非结构化数据,
例如文本、音频、视频等。
与之相对应的是结构化数据,例如数值。
量价和基本面数据属于典型的结构化数据。
新闻舆情属于典型的另类数据,
它们以文本的形式存在并且传递信息。
通常来说,
人脑比机器更加擅长处理和分析这类数据。
但是随着AI技术的发展,
计算机也能够较为准确地处理类似的数据,
因此另类数据也可以帮助量化投资。
高/中/低频因子
我们通常用因子对应的数据更新频率来区分高、中、低频因子。
因子对应的数据更新频率和单因子策略的交易频率通常是高度正相关的。
交易频率既可以用单位时间内的换手率来衡量,
即每单位规模对应的成交量,
也可以用单位时间内每单位规模对应的订单数量来衡量。
总结
这是三种不同维度的特征,
所以各位同学们,