新浪财经

基本面逻辑下的商品期货因子改进与策略组合(横截面篇)

新浪财经

关注

来源:量化先行者

报告提要

基本面因子构建需考虑季节效应

大部分商品的基本面情况都存在一种或多种季节性规律,忽略季节效应的影响很可能对基本面信息产生误解。如春节前后累库、传统高温淡季、采暖季限产和冬储等因素均导致螺纹钢库存呈现季节性。这一规律在按农历日排列的库存走势中表现更为直观。

不同维度库存因子横截面策略表现

在考虑适用性后,我们剔除仓单数据和贵金属品种,基于库存同比增速、环比增速和二阶增速分别构建横截面策略,结果显示:农历同比因子与公历同比因子表现差异不大,在同比增速上,公历同比表现相对较好,但在库存的二阶增速维度,农历同比更胜一筹;环比增速对参数的敏感性相对更强,且基本面逻辑较弱;2016年以来,二阶增速因子表现强势,在大部分参数组下能实现10%以上的年化收益。

不同组合方式下库存二维增速策略

我们利用综合农历日及公历日的库存同比增速和二阶增速因子,在信号叠加、因子值叠加和因子排序叠加三种组合方式下构建库存二维增速策略。结果显示,在因子值叠加方式下策略收益较高但参数敏感性相对较强,信号叠加方式下策略表现最稳健。

库存-展期收益三因子策略

逻辑上当前期限结构呈现Backwardation的品种若伴随库存走低,则期货价格上涨概率更高。因此我们将反映商品期限结构的展期收益因子加入组合中,构建库存-展期收益三因子策略。回测发现无论基于因子值叠加还是信号叠加,三因子策略表现均十分出色,100个参数组下,平均年化收益达11.3%,夏普比率为2.1,Calmar为 2.1。近四年每年可实现10%以上的年化收益,且各年收益波动相对较小,整体稳定性更强。策略对参数、因子组合方式及权重配置的敏感性均较低。

目录

1

研究背景

在前期系列报告中,我们从基本面、技术面和情绪面等维度构建了商品期货横截面因子,主要分析了商品库存、期限结构、动量以及持仓多空情绪对商品期货价格的影响。这些因子策略尝试通过刻画不同品种的某一共同特征,来区分品种的相对强弱,对强势品种做多、弱势品种做空,构建对冲策略以获取相对稳健的收益。但这些因子大多为风险因子,在时间序列上的表现波动较大,且期货有效因子数据源较少,有效因子被挖掘出来后很容易由于市场拥挤导致历史表现不错的策略出现大幅回撤或失效,如今年三季度的展期收益因子。另一方面,满足流动性的活跃品种2009年前较少,导致用于回测及检验跟踪的数据有限,因此,在构建横截面因子时,我们需要尽可能从基本面逻辑出发,通过不同维度对比来充分挖掘因子的有效性,并试图构建组合策略以增强其稳定性。

本文将从基本面数据可能存在的季节效应出发,对传统库存因子进行不同维度的改进与对比,尝试构建更具逻辑性的因子,并对比不同组合方式下基本面多因子策略的表现。

2

基本面数据可能存在的季节性

商品价格主要由供需关系决定。大部分品种的基本面情况都存在一种或多种季节性规律,忽略季节效应的影响很可能导致对基本面信息产生误解。将供需基本面数据中普遍存在的季节效应纳入考量,将有助于构建更具逻辑性的因子。

2.1 棕榈油供需

我国棕榈油基本依赖进口,主要进口国为印度尼西亚和马来西亚。马来西亚作为世界最大的棕榈油供应国之一,其产量特点对棕榈油的供给、价格等具有重要影响。从图1来看,马来西亚棕榈油产量季节性特征明显,1-10月为年度增产周期,11月开始季节性减产周期,产量逐渐回落并持续至次年1季度末。

需求方面,我国棕榈油目前以不超过24度的精炼棕榈油为主。从时间来看,10月份之后是我国油脂消费的旺季,棕榈油消费增加,港口库存季节性减少。

2.2 螺纹钢库存

由下图可明显观察到螺纹钢库存的季节性规律。通常情况下,由于春节假期影响,螺纹钢库存积累始于上年末1-6周,止于年初2月底3月初,传统高温淡季、采暖季限产和冬储等因素均导致库存呈现季节性。这一规律在按农历周排列的库存走势中表现更为直观。

每年春节前后,螺纹钢都会经历预期内的累库过程,但累库的速度和幅度可能具有较大差异,这部分超越一般规律的差异往往决定了来年春季行情。如2016年春节前螺纹钢库存处于历史低位,供需关系较好,节后价格强势上扬。2017年累库周期较长,库存水平同比较高,但需求恢复后的去库速度也快于同期,因此价格并未大幅调整。而2018年春节累库速度和幅度均快于往年,库存水平创近四年新高,叠加当时受环保限产预期影响的高价位,螺纹钢价格出现大幅回撤。2019年春节前后无论从库存绝对量水平还是累库速度幅度来看均位于近两年中间,因此对价格的影响相对较小,反映出来的节后走势也相对平稳。

根据前文分析,我们知道,在构建基本面因子时,需要将其可能存在的季节效应或周期性规律纳入考量。下面本文以库存为例,在基本面逻辑下探究不同维度的因子构建方式,并对比不同因子在横截面策略中的表现。

3

基本面逻辑下的库存因子构建

3.1 品种适用性

我们首先对商品库存指标进行筛选并确定样本品种。基于目前市场上关于库存指标的构建方法,我们进一步分析数据合理性及品种适用性,并最终确定本文库存策略的样本品种。

从库存指标合理性来看,仓单一定程度上反映库存,但大商所和郑商所的仓单数据受其对于注册和注销规则更改的影响较大,导致其时间序列可比性较差。

从品种适用性来看,并不是所有商品都能用供需基本面来分析价格,贵金属就是一个典型例子。对于黄金白银这类兼具商品属性和金融属性的贵金属而言,供给需求的估计十分棘手。如黄金需求包括投机用途(价值贮藏)和工业用途,基本取决于市场对其所认定的价值,这种心理评估依赖于复杂的变量,包括:相对通货膨胀、全球利率、汇率变动、贸易数据、国际关系等。而供给方面,黄金总存量是一个不可知的数据。另外,除不可储存的商品外,供给并非固定量,会随价格而波动,而我们不知道各价格水平下黄金市场的供给量,即无法掌握其供给曲线的性质。更糟糕的是供给曲线本身不固定,举例来说,当通胀严重时,每个价位下的黄金供给量都会减少。因此,由生产消费维度着手分析贵金属价格并不可行。

基于以上分析,结合流动性要求(见前期系列报告),本文定义表1的19个品种作为库存因子策略的样本品种。

3.2 库存因子构建方式

在分析基本面量价数据时,普遍使用的处理方式是转换成同比或环比,两者各有优劣。同比可以剔除季节性影响,但体现的信息相对滞后,可能无法捕捉短期波动;环比反映近期变化,但忽略季节效应和周期性等整体规律,如螺纹钢的春节后复工、传统高温淡季、采暖季限产和冬储等导致库存的季节性规律。

在作同比处理时还应当考虑比较的基准日是按农历日还是公历日,对比的年份数量,尤其是对于频率为周度及以下的数据而言,基准日及基准年数的选择显得尤为重要。如国内普遍存在以农历日为基准的春节等节假日,对应的是节后复工现象,而天气等因素对商品的影响也会体现在农历日上。这一现象在图3和图4的对比中十分明显。关于基准年数,主要是考虑仅比较一年历史数据的可靠性和稳定性可能存在不足,无法避免由于突发事件等因素导致的前一年基准数据的异常对次年增速的影响,而这一影响若已被预期,那对价格的作用可能会大打折扣。

此外,除了观察商品库存相比往年同期的增速,还可关注这一增速的趋势,如库存同比加速上升相对于库存同比上升可能蕴藏更多的信息。因此我们引入同比增速的环比变化来刻画库存的二阶增速。

在早期关于库存因子策略的报告中,我们构建的库存偏离度因子本质上是库存的环比增速,并未考虑季节效应。在本文中,我们将对比同比增速、环比增速以及二阶增速三种维度下库存因子横截面策略的表现。

4

不同维度库存因子策略表现

下面我们基于库存同比增速、环比增速和二阶增速分别构建横截面策略。多空比例均为当日可投资品种的20%,即做多库存增速或二阶增速最高的20%品种,做空增速最低的20%品种。回测区间为2010年1月4日-2019年12月10日。考虑到库存指标多为周度数据,我们在每周开盘前计算最新库存因子,开盘调仓。各品种等权配置,每次调仓进行组合各品种的权重再分配。假设操作不带杠杆,且不考虑现金部分收益。手续费单边万分之三。

4.1 库存同比增速因子

4.1.1 农历同比

我们定义库存农历同比增速为

其中,y和t分别表示库存数据所在的农历年份和农历日,n为同比的历史年数,考虑到过于早期数据的可比性较弱,本文设定n不超过3。如n=2,则表示比较的基准库存为农历日期下过去两年同期的平均值。增速大于0表示相比于历史同期库存上升。

从多参数组回测结果来看,策略在1-2年基准年数下表现差异不大,年化收益10%左右,平均calmar为1,且对因子平滑期敏感度较低。

4.1.2 公历同比

类似地,我们定义库存公历同比增速为

从多参数组回测结果来看,与农历同比因子结果相似,公历同比因子在1-2年基准年数下表现差异不大,年化收益10%左右,平均calmar大于1,且对因子平滑期敏感度较低。

4.2 库存环比增速因子

从同比增速因子回测结果来看,农历和公历同比差异不大,下面我们对比环比增速因子的表现。库存环比增速定义为

其中,m表示库存的环比天数。同样地,我们也在1-5日因子平滑期下进行回测。从不同参数组策略表现来看,库存环比因子在环比天数为80天以上,可以获得5%左右的收益,但夏普比率均小于1,策略受因子平滑期敏感性较低。

4.3 库存二阶增速因子

我们定义库存同比增速的环比变化为库存二阶增速,逻辑上,库存上升大概率对价格有抑制作用,但若这一上升速度在下降,代表的是库存的加速去化,可能并非利空,2017年春节后的螺纹钢价格就是一个很好的例子。下面我们根据基准日历的不同,定义基于库存农历同比的环比变化

和库存公历同比的环比变化

其中m表示库存同比增速的环比天数。同样地,我们也在1-5日因子平滑期、1-3年历史基准年数下进行回测。

回测结果显示,平均来看,1-2日平滑期、2年基准、环比天数为40-100日时策略表现相对更好。大部分参数组下,基于农历日的二阶增速因子表现更佳。总体而言,二阶增速因子对参数的敏感性不强。

从以上不同维度库存因子的回测结果来看:

(1)农历同比因子与公历同比因子表现差异不大,在同比增速上,公历同比表现相对较好,但在库存的二阶增速维度,农历同比在大部分参数组下更胜一筹;

(2)环比增速对参数的敏感性相对更强,且基本面逻辑相对较弱;

(3)2016年以来,二阶增速因子表现强势,在大部分参数组下能实现10%以上的年化收益。

5

不同组合方式下的多因子策略表现

5.1 库存二维增速策略

在本节中,我们将尝试对库存同比增速、库存二阶增速构建库存二维增速策略,从两个维度出发以更全面、更及时地刻画库存变化,筛选库存同比上升或加速上升(减速下降)的品种做空,库存同比下降或加速下降(减速上升)的品种做多。下面我们对比不同组合方式下库存二维增速策略的表现。

从单因子回测结果来看,农历同比和公历同比因子整体表现差异不大,为了避免单一基准可能导致的局部差异,比如春节等农历节假日前后可能使用农历同比更合理,而其余大部分时段市场可能更关注公历同比数据,我们将两种日历基准下的因子加总后构建同比增速和二阶增速因子,即定义库存同比增速和库存二阶增速分别为

下面我们取基准年数n为2,二阶增速的环比天数m为10-120日,因子平滑期R为1-2,在两因子信号叠加、因子值叠加和因子排序叠加三种组合方式下进行策略回测。

5.1.1 因子排序叠加

在因子排序叠加法下,我们在每个调仓日对所有品种的库存同比增速Stock_YOY和二阶增速Stock_YOY_Dev分别进行从低到高排序,对每个品种在两个因子上的排序值加总后即可得到该品种的最终排序值。选出排序值最低的前20%作为多头,最高的20%作为空头。从回测结果来看,在大部分参数组下均可实现10%以上的年化收益,夏普比均大于1。

5.1.2 因子值叠加

在因子值叠加法下,我们在每个调仓日对所有品种的库存同比增速Stock_YOY和二阶增速Stock_YOY_Dev分别进行最大最小标准化处理,对每个品种标准化后的两个因子值加总后即可得到该品种的最终因子值。选出因子值最低的前20%作为多头,最高的20%作为空头。从回测结果来看,相比于因子排序值加总,按因子值叠加的方式在大部分参数组下表现更好。

5.1.3 信号叠加

在信号叠加法下,我们在每个调仓日对所有品种的库存同比增速Stock_YOY和二阶增速Stock_YOY_Dev分别进行从低到高排序,分别选出两个因子的多头和空头,对多头、空头和不操作品种分别赋予1、-1和0的信号,每个品种两个信号叠加后正负方向即为多空方向,信号绝对值即为信号强度,单品种信号强度的占比即为该品种的权重。

从回测结果来看,信号叠加法的平均夏普比率和Calmar是三种方法下最优的,能更好地平滑风险控制回撤,稳健性相对更好。

对比三种组合方式在多参数组下的表现,我们发现因子值叠加方式下策略收益较高但参数敏感性较强,信号叠加方式下策略表现最稳健。

5.2 库存-展期收益三因子策略

根据5.1的回测结果,我们发现综合了库存同比增速和加速度的二维增速因子比单一维度因子表现提升明显。下面我们进一步思考商品的期限结构,逻辑上当前期限结构呈现Backwardation的品种若伴随库存走低,则期货价格上涨概率更高。因此,我们尝试将反映商品期限结构的展期收益因子加入组合中,构建库存-展期收益三因子策略,在因子值叠加和信号叠加方式下对比三因子策略的表现。关于展期收益的具体计算及操作的样本品种请参见系列报告八《基于期限结构稳定性判断的展期收益策略详解》。

下表展示了40-120日展期收益平滑期(RY)、10-100日库存二阶增速环比天数下库存-展期收益三因子策略的表现。结果显示,无论采用因子值叠加还是信号叠加,三因子策略表现均十分出色,100个参数组下,平均年化收益达11.3%,夏普比率为2.1,Calmar为 2.1。策略稳健性强,对参数敏感性较弱。

对比库存二维增速策略与库存-展期收益三因子策略在不同环比天数下的表现,我们发现:1. 二因子策略与三因子策略收益差异不大,部分参数组下二因子策略具有更高的收益,但三因子策略稳健性更强;2. 因子值叠加与信号叠加的组合方式对策略影响不大。

下面我们在库存二阶增速环比天数为30,展期收益平滑期为100日参数组下对比库存二维增速策略和库存-展期收益三因子策略表现。分年度收益结果显示,三因子策略各年均可获取正收益,近四年每年可实现10%以上的年化收益,且各年收益波动相对较小,整体稳定性更强。

进一步地,我们按板块和品种统计了多因子策略收益来源,发现:1. 分板块来看,黑色系在两个策略中贡献的总收益均最多,但从单位信号来看各板块差异不大;2. 分品种来看,焦炭、橡胶、锌、焦煤、棕榈油贡献的收益最多。

6

多参数配置策略

为了避免参数敏感性,我们采用多参数综合的方式测试多因子策略表现。多参数配置法下,每个因子的最终取值为不同参数因子值的加总而非单一参数的因子值。

已知库存二维增速策略的主要参数为二阶增速环比天数n,展期收益策略的主要参数为因子平滑期RY。我们依然取n为10-100日,RY为40-120日,在每个调仓日同时计算10-100日环比天数下的库存二阶增速因子和40-120日平滑期下的展期收益因子,并与库存同比增速因子组合分别构建库存二维增速策略和库存-展期收益三因子策略。

回测结果显示,库存二维增速策略与库存-展期收益三因子策略年化收益差异不大,均为11%左右,但三因子策略波动和回撤较低,信号叠加方式下夏普比率和Calmar均达到2以上。

7

权重配置敏感性检验

最后,我们对库存-展期收益三因子策略中各品种权重配置作敏感性检验。对比等权和不同窗口期ATR倒数加权方式下策略的表现。从回测结果来看,不同加权方式对年化收益有一定影响,ATR倒数加权配置方式下策略表现较弱。但从夏普比率来看,不同权重配置下策略差异不大。整体而言,策略对权重配置的敏感性较低。

8

总结与展望

本文从供需基本面数据中普遍存在的季节效应出发,对传统库存因子进行不同维度的改进与对比,分农历和公历日分别构建了库存同比增速因子和库存二阶增速因子,并对比不同组合方式下基本面多因子横截面策略的表现。主要结论有:

春节前后累库、传统高温淡季、采暖季限产和冬储等因素均导致螺纹钢库存呈现季节性。这一规律在按农历周排列的库存走势中表现更为直观。

大商所和郑商所的仓单数据受注册和注销规则更改影响较大,作为库存代理变量可能存在较大偏误,库存基本面分析对黄金白银这类兼具商品属性和金融属性的贵金属而言可能是无效的。

基于库存同比增速、环比增速和二阶增速分别构建的横截面策略回测结果显示:农历同比因子与公历同比因子表现差异不大,在同比增速上,公历同比表现相对较好,但在库存的二阶增速维度,农历同比在大部分参数组下更胜一筹;环比增速对参数的敏感性相对更强,且基本面逻辑较弱;2016年以来,二阶增速因子表现强势,在大部分参数组下能实现10%以上的年化收益。

我们利用综合农历日及公历日的库存同比增速和二阶增速因子,在信号叠加、因子值叠加和因子排序叠加三种组合方式下构建库存二维增速策略。结果显示,在因子值叠加方式下策略收益较高但参数敏感性相对较强,信号叠加方式下策略表现最稳健。

进一步,我们将反映商品期限结构的展期收益因子加入组合中,构建库存-展期收益三因子策略。回测发现无论采用因子值叠加还是信号叠加,三因子策略均表现出色,100个参数组下,平均年化收益达11.3%,夏普比率为2.1,Calmar为 2.1,策略稳健性强。

对比库存二维增速策略与库存-展期收益三因子策略在多参数下的表现,我们发现:两者收益差异不大,均为11%左右,部分参数组下二因子策略具有更高的收益,但三因子策略稳健性更强;因子值叠加与信号叠加的组合方式对策略影响不大。这一结论在多参数配置法下依然成立。

不同加权方式对年化收益存在一定影响,ATR倒数加权配置方式相比等权收益有所下降。但从夏普比率来看,不同权重配置下策略差异不大。整体而言,策略对权重配置的敏感性较低。

相关报告

《商品期货CTA专题报告(九)持仓龙虎榜蕴藏的投资机会 2019-08-22》

《商品期货CTA专题报告(八)基于期限结构稳定性判断的展期收益策略详解2019-05-17》

《商品期货CTA专题报告(七)预期外宏观因子对商品期货价格的冲击影响研究2019-01-27》

《商品期货CTA专题报告(六)基本面分析框架下的黑色系商品库存预测2018-02-09》

《商品期货CTA专题报告(五)我国商品期货分类及异质性基本面分析概述2018-01-31》

多因子选股系列报告

加载中...