每周学点——因子分析: 了解影响市场的关键因素(第二期)
富善投资
来源:富善投资
3.了解影响市场的关键因素(二)
本期内容接着上回继续来分享了解市场的关键因素。除去上面的检验,还有一个是数据本身的检测。数据科学中有句话:“Garbagein, Garbage out”,就是在强调数据质量的重要性。我们认为这句话在因子分析中可以有三层理解。首先,就是我们研究因子所用到的数据应该能够大致反映总体的特点。由于行情一直在产生,总体是无法获取的,但是我们可以尽量使用足够长、足够“正常”的采样数据,这有助于体现因子的真实效果。比如,在研究股指期货因子时,我们一般会用到上市以来所有的历史数据,并适当弱化因子在极端行情下的表现(如2015 年)。如果有的因子在2019 年后突然有效,我们会深入分析该因子的逻辑,在能够解释清楚的前提下,方可认为该因子有效。第二个层面是采样数据本身应该是相对均衡的。在一段特殊行情中,比如单边上涨中挖掘因子,显然是无法得到客观结果的。采样数据最好能完整覆盖单边上行/下行、强/弱震荡等多种行情。第三个层面则是因子值最好是平稳的。平稳的因子更容易产生多空均衡的信号,而且也更符合预测算法的要求。
经过因子分析,我们就可以得到有效因子的集合。在对这些因子进行去极值、归一化、标准化、降维等处理后,便可以组合起来,通过打分法给出信号,或者投入模型对未来收益进行预测,从而给出信号。这些流程相对固定,本章不再展开说明。
从因子分析的内容来看,我们不难发现因子研究具有很多优点。首先,研究效率相对较高。因子分析的结构化和流程化使得我们能够批量分析几十甚至数百个因子,迅速筛选出有效的因子集合,并便捷地比较不同因子。在技术指标的研究还在纠结于使用唐奇安通道、布林带通道还是肯特纳通道时,因子分析表明它们实际上是高度相关的,都是描述动量的因子,从本质上来看并无区别。因子分析的模块化还意味着我们可以通过增加低相关但有效的因子,不断提升策略表现。除此之外,因子分析的结果较为全面,有助于我们了解行情的特点。例如,唐奇安因子的正相关性表明存在动量效应,而高低开因子的负相关性则意味着隔夜行情倾向于反转。当然因子分析也存在一些限制,比如因变量通常为固定周期的未来收益,较缺乏灵活性,需要大量数据,且所使用的方法主要适用于线性关系的检测等。
总的来说,因子分析是瑕不掩瑜的。因子研究正在蓬勃发展,因子分析作为了解市场的重要方法具有不可忽视的价值。