《西部金融}2013年第1期望翩翩翩酣跚跚酣帧移基于参数调整的协整配对交易策略:理论模型及应用张河生闻岳春(同济大学经济管理学院,上海200070) 摘要:股指期货与融资融券的启动,开启了中国做空和对冲时代的大门,协整画己对的套利交易将会扮演重要角色。在构建交易策略过程中,目前大多数交易者都在交易区间和止损区间的设置上采取经验佳,典型的做法是分别取一倍和两倍的标准差。事实上,这种做法不能保证获得最大的套利利润,甚至会出现亏损。本文认为区间的参数选择是一个慎重抉择的过程,应该通过不断地调试以选择最优参数,以使该交易策略体系更好地发挥作用。关键词:参数调整;协整;自己对交易策略中图分类号:文献标识码:8文章编号:1674-0017-2013(1)-0011-06 一、喜|言20世纪八十年代,MorganStanley的团队利用一系列基于统计学与数学构建的量化投资策略获得了巨额利润,其中就包括配对交易策略。此后配对交易作为一种市场中性投资策略,受到了机构投资者和对冲基金的广泛认可。基于统计套利的配对交易策略是指从市场上找出历史价格走势相近的资产进行配对,当配对的资产价格差偏离历史均值时,则做空价格较高的资产,同时买进价格较低的资产,等待它们回归到长期均衡关系,由此赚取两个资产价格收敛的报酬,其属于一种市场中性策略。配对交易策略要求配对资产的价格序列具有长期稳定的关系,捕捉的是长期均衡中两个资产的短暂价格偏离所带来的套利机会。在实证研究中,很多学者证明协整配对交易可在我国获得盈利,并提出了改进,如构建GARCH模型来刻画价差序列的时变方差性,并表明考虑异方差的配对交易效果更加稳健,亏损的风险大大减少。但是前人的研究对于交易区间、止损区间的设定都是采用历史经验值,事实证明,这种做法可能导致亏损。交易策略需要进行参数调试以获得最优的参数,使其收益最大化。对于配对交易,其交易区间、止损区间的最优参数也需要不断反复地测试才能得到。近几年来,国内的学者和机构研究人员也开始对协整配对交易进行了专门研究,大多数实证结果表明协整配对套利在我国是可以盈利的。仇中群(2009)、于琦婷(2011)分别对沪深300股指期货的高频仿真交易数据及融资融券标的股票价格数据运用协整的统计套利实证分析,表明基于协整的统计套利策略模型是有效的。刘富兵、蒋瑛琅、何苗(2010)与李世伟(2011)考虑了异方差性及ARCH效应,建立基于GARCH模型的协整套利策略,实证分析表明该模型能取得更好的套利效果。由此可见,运用协整理论可以在我国股票市场和股指期贷市场进行统计套利,并在考虑异方差问题之后能够获得更加稳健的盈利。但是仅仅考虑异方差仍然不能达到最令人满意的结果,这就涉及到区间参数的选择问题,本文将就此问题进行深入研究。二、理论分析(一)协整关系将两个非平稳的时间序列做线性回归:Y,=λX,+,抖,在统计学上可能得到显著性差异,即回归是有效的,而事实上,这个时间序列之间却不存在任何关系,这种现象称为谬误回归,也称为"伪回归"。可见,两个非平稳时间序列经常可能出现谬误回归现象,这会影响到我们的研究。但是如果可以证明回归式中的残差项μ也是平稳的,则可以保证Y,与X,存在一种长期稳定的关系,我们称X,与Y,存在协整关系。由此可以看出,检验两个时间序列是否存在协整关系的常用方法就是Engle一Granger检验法。其思路是收稿日期:2012-9作者简介:张河生(-),男,湖北阳新人,硕士研究生,现就读于同济大学经济与管理学院。闻岳春(-),男,浙江余姚人,教授,博士生导师,现供职于同济大学经济与管理学院。注:本文是国家自然基金项目(项目批准号:71273190)、教育部人文社科研究规划项目(编号:10YJA790196)的部分成果。n
《西部金融}2013年第1期E理-撞撞:曾锣、段糟恕织将移秘锦绣篇篇醺瓣稽费我首先将两个时间序列做回归,然后针对残差项做平稳性检验,如果是平稳的就认为两者具有协整关系,否则就不存在协整关系。(二)配对交易策略如果能够得到两个资产的价格具有协整关系,我们就可以利用这个协整关系做统计套利。首先要构建交易区间和止损区间。其原理是价差序列{也即回归式中的残差序列是平稳的:均值不变、方差为常数),具有均值回复的趋势。将其去中心化后(也即将残差减去其均值后所得到的残差序列),均值就是0,价差就有回复到O的趋势。圈1交易决策..,."μ6 叫叫崎偏偏汹幽静W崎怜!繁时-ω份苦在2喇喇阴阳峭抖8由图1,我们可以构建(】岭,+λ8)的交易区间以及(一闹,+μ8)的止损区间(8为残差抖的标准差,人μ为选取的系数)。交易区间就是价差突破区间上下边界时即开始建仓的波动区间,止损区间就是价差突破上下边界时平仓止损的波动区间,以防止更大的亏损。因为价差有均值回复的趋势,如果偏离过大,就属于不正常的范围,会带来潜在的亏损。例如,当价差序列在第6个时刻点突破上边界性8时,开始构建一个组合,做多一种资产同时做空另一种资产。我们预期这个价差在未来某一点会恢复到O值附近,即价差将会收敛,当价差在13时刻时恢复到O就平仓,完成一个交易回合;如果价差没有收敛而是继续上扬,在第16时刻突破了我们设立的止损区间(-岗,+同)的上边界,也要进行平仓止损。如果价差序列开始突破到下边界-À.8,就建立一个反方向的头寸,同样是收敛到O值时平仓;如果未收敛而继续下行突破-州时进行平仓止损。(三)考虑异方差性由于在做线性回归时都是在五大经典假设的前提下,其中之一就是假设残差的方差不变性。但事实证明,金融资产价格的时间序列并不满足这一假设,会存在所谓的异方差性,这就意味着我们设立的交易区间与止损区间并不是两条平行的直线,而是由实时的价格数据决定的一个波动的区间。GARCH模型是一个专门针对金融数据所量体订做的回归模型,在普通回归模型基础上,GARCH模型对误差的方差进行了进一步的建模。一般的GARCH模型可以用公式(1)和(2)表示,其中X,为t时刻价差的值,声。为滞后项的系数,e,为价差序列自回归的残差项,σ:为价差序列t时刻的方差,ε为服从标准正态分布的随机项,K,C值为常数项。条件均值方程:X,气喘iI.;:1 e’_i + I.: :1 X’-j +k (1) j 条件方差方程:σ74zz:1σ:1+β~:1ε,_j+C(2) (四)参数选择的重要性即使考虑了异方差,交易区间与止损区间变成了波动的通道,固定参数下,通道的宽度也不会有特别明显的变化。比如说正负1倍的标准差作为交易区间上下界,考虑异方差后的交易通道的宽度一般不会超过6倍的标准差。但价差序列在保持平稳的前提下仍然可能会有很大的波动,并在O均值线一边徘徊一段时间,这样就会造成频繁交易,考虑成本后就可能大幅降低盈利,甚至出现亏损。而且如果是在止损区间边界徘徊的话,考虑成本后会造成巨大的亏损。因此有必要调整区间的参数使通道宽度合适,让价差序列尽量少接触止损通道的边界,接触交易区间边界次数要在频繁交易带来的高额成本以及多次交易获得盈利之间获得平衡。参数的选择是交易策略有效的一个重要因素,不能轻率地凭经验值确定,而应该通过对历史数据不断地试验以获得最优的参数值。12
《西部金融)2013年第1期撬疲寓楼播噩-盟三、实证分析本文基于Matlab软件运用协整理论对股指期货配对交易做实证分析,选取的是IF1209与IF1212(分别表示2012年9月到期和2012年12月到期)两个品种2012年5月4日10:06到2012年5月24日15:15的分钟数据,各有4000个数据。将IF1209的数据放在series变量的第一列,IF1212的数据放在series变量的第二列,创建一个40∞吃的矩阵变量series(当然也可以选取IF1206和IF1207,合约对的选择可以随意)。两个合约的历史收盘价格数据如图2所示,初步发现两者的走势有一些类似之处,可能存在协整关系。图2历史价格对比28∞ 事哥4吨26502600 2550~ o 500 1000 1500 2000 25∞3000 3500∞。耐18]资料来源:国元领航(一)协整关系检验分别对两个合约产品的时间序列做ADF检验,在Matlab里需要用到adftesst函数,返回的h值为0,证明两个产品的历史价格数据都是非平稳的。然后对两个时间序列数据做一阶差分后再做平稳性检验,证明两个序列是一阶单整的,可能存在协整关系。Matlab里用egcitest函数对两个序列的协整关系进行检验。其步骤是:首先将senes的第一列数据对第二列做回归,即让IF1209的数据对IF1212的数据做回归,得到公式(3),然后检验回归式中残差值是否具有平稳性,返回的h值为1,证明两者具有协整关系。IFI209=*IF1212++ε(3) (二)考虑异方差将公式(3)中得到的残差序列中心化后(图3)做engletest检验,我们用archtest函数,返回的h值为1,表示残差具有异方差性。图3去中心化后的残差序列500 1000 1500 2000 2500 3000 3500 400{l S"::':雹考虑到异方差后,我们需要对残差序列建模用来刻画残差的异方差性,这意味着我们后面所构建的交易区间和止损区间不再是两条平行的直线,而是波动的平行通道。首先对indicate这个变量用ARMA模型的AIC定阶法则定阶,得到R=l、M=l时,AIC值最小,因此可以判断indicate序列属于ARMA(l,l)模型;其次用GARCH(l,l)模型来刻画indicate序列的时变方差,这是基于通常的做法(一般认为GARCH(1 ,1)模型能够很好地刻画时变方差)。于是本次案例中运用ARMA(I,l)-GARCH(1,l)来刻画残差序列,并且运用于后面的交易区间和止损区间的构建,见公式(4)、公式(5)。(4) X,=e,*e’_1 +* X'_l一σ兰飞1+0归04句:1+00055(5) (三)交易策略1、滚动取样交易交易是基于前面M个时间段的数据,每隔N个时间段来进行的。如果前面M个时间段内两个时间序列13
《西部金融>2013年第1期E理-睡眼德秘锁梅翩翩锦辙锦梅毒翻翻存在协整关系,就可以按照上文阐述的策略进行交易。假设M=420,N=60,也就是,从现在开始进行协整配对交易,我们参考的是前面420分钟(也即前7个小时)的历史数据来判断有无协整关系,60分钟(也即1个小时)以后,我们重新换一批数据,用1个小时以后的之前7个小时数据进行协整配对交易,也就是用现在的前6个小时和未来1个小时的数据进行协整来判断交易机会。之所以用滚动方式不断调整用于判断协整关系的历史数据,是因为协整关系本身的不稳定性。两个时间序列的协整关系可能随着时间的推移突然消失,一般是由于某个变量发生了巨大冲击事件,使得时间序列数据彻底改变了以往的路径;同时,协整关系也可以在之前没有协整关系的两个时间序列间突然存在这是因为随着历史数据的增加两个具有某种联系的变量的协整关系才逐渐显示出来。2、交易区间、止损区间Ganapathy Vidyamurthy( 2005)在PairsTrading: Quantitative Methods and Analysis一书中通过随机模拟得到如下规律:假设去均值后的价差被动是一个白噪声序列,那么最大收益的交易边界条件是正负倍的标准差,即λ=实证研究在设止损区间时,设为倍标准差,源于风险价值的思想,假设去中心化的对数价差服从正态分布,我们有959毛的把握保证其波动幅度不超过倍标准差,即μ=但这只是经验数据,没有任何证据表明这些是可靠的,人μ的确定是本文的重点,我们将在后文着重分析如何调试参数以获得最大收益O考虑异方差之后的交易区间、止损区间如图4所示。根据我们的交易策略,是每隔60分钟观察前420分钟的数据进行协整配对交易,所以交易的初始数据是样本数据的第421个。前420个数据的区间通道是由程序自动画出,但没有用处,即使价差不断触碰区间上下限也不会有任何交易指令发出。同理,在3960个数据之后的区间也是没有用处的,即使图4显示此时的价差不断触碰区间的上下限。图4交易区闰与止损区间士要3.>~老二隶主ξλ司75、μ=1部)3、交易函数在构建交易策略时。为了便于以后调试参数,需要创建一个交易函数。函数palrs具有五个输入变量,senes是去中心化的价差序列,参数M、N如前所述,参数openposition,stopposition就是人μ,这几个参数需要通过样本内数据不断运行调试,以便在程序化交易中获得最大利润。函数返回一个交易信号,并做出损益图。function varargout =pairs(series, M, N, openposition, stopposition) 4、成本与损益的计算期货公司进行程序化交易时需要考虑的成本有两种:滑点与手续费。滑点是指下单的点位与最后成交的点位之间的差距。滑点的产生有可能是由于网络延迟或当时行情波动剧烈也有可能是因为不正规的交易商故意做手脚。任何一个平台都会存在这个问题,这取决于平台软件的质量以及服务器的稳定性等。期货公司的滑点一般为个点。手续费也是机构投资者必不可少的一项成本,沪深300股指期货合约对交易所来说,交割手续费标准为交割金额的万分之一;期货公司一般会高于交易所的标准,为万分之一点五。由于做的是套利交易,每一个交易回合涉及到两种合约:IF1209和IF1212(下文中用1代表IF1209,2代表IF1212),而每一回合中有两次交易,比如开仓时是做多1与做空2,平仓时就是做空1与做多20同时,每次交易反方向合约数量的固定比例为日,即交易一于1就会按相反方向交易白手2(此例中日值为,即公式(3)的贝塔系数)。考虑滑点与手续费作为成本,成本就是交易的四种合约点数之和加上滑点后乘以手续费率,即[(空1+伊空2+多1+伊多2)+*4]*∞15;收益的计算是用交易的空单点数减去两次交易多单点数,即(空1+伊空14
《西部金融>2013年第1期噩噩-圄2)-(多1+白*多2)。由于期货交易是保证金交易,收益率的计算是用所得的损益除以所交的保证金,计算公式为:(空1+伊空2+多1+伊多2)*。(四)初步结果初步结果如图5所示。根据上述交易策略,本次实证模拟中,去中,心化的价差接触O线平仓次数为101次,累计盈利%,但是考虑交易成本后仅盈利毛;价差触碰止损通道平仓的次数为246次,累计亏损%,考虑交易成本后亏损毛。综合来看,4∞0个样本数据共亏损%,但是考虑交易成本后,亏损43%。圄5实证结果iJl主斗-f1137iflit|;二:二二仨丰=当;~交易次数(五)参数的调试及结果由上所述,选择λ=、μ=作为区间的参数,导致了亏损。从图5分析得到,因为交易次数太频繁导致成本高于盈利的点数:即使价差触O线的交易有一定盈利,但止损平仓导致的亏损因为交易次数的频繁而非常巨大,最终导致了整体的亏损。从图4可以看出,是由于价差不断地触碰交易区间和止损区间导致交易次数增加,于是考虑把人μ参数设的大些,从而使交易次数减少,特别是止损的次数要减少。但是如果把参数设得太大,区间过于宽广,价差无法触及区间边界,交易次数也就少,无法实现盈利。由上述分析得出需着重调试的参数为人件,于是假定M、N为默认值420和60,假设调试参数λ的范围为到4,步长为,μ的范围为2到10,步长为1,共有15*9=135组值,依次代人pairs函数,将能够使考虑成本后的收益最大的那组值作为最优参数。如图6和图7所示,得到最优的人μ值分别为和10,去中心化的价差接触O线平仓次数为60次,累计盈利%,考虑交易成本后仍盈利%;价差触碰止损通道平仓的次数为27次,累计亏损毛,考虑交易成本后亏损%。综合来看,4000个样本数据共盈利%,即使考虑交易成本后仍然盈利毛。图6调试后的交易区间与止损区间L -401号002000号∞300035∞4000 时i';:固7调试后的实证结果1S
《西部金融}2013年第1期E理.圄蘸提编辑豁然能辙由此可以看出人μ参数调试的效果非常明显,其实这种变化也是很好理解的。交易区间与止损区间的变化使得交易触发的条件发生了极大的改变,调试后价差触O线平仓的次数由101次变为60次,盈利由毛上升为%;考虑交易成本后,这种上升更为明显,调试前盈利为毛,调试后盈利上升为毛。在止损平仓这一块,调试前后交易次数由246次变为27次,大大减少了这一部分的亏损,由%降到岛;考虑交易成本后,这一部分的效果更为明显,前后亏损由47刀%降到%。四、结论实证表明通过参数调试,改变交易区间与止损区间的大小,可以极大改善交易策略的运行结果,并最终实现盈利。在此次实证中选取的IF1209和IF1212做配对交易在二十个交易日里扣除成本后实现盈利万元人民币,效果比较理想。经过实证研究,可以得出以下结论:λ参数应该是能让价差序列经常触及交易区间边界的值,μ参数应尽量大一些,从而尽量避免价差触及止损区间的上下边界;在股指期货合约这种协整关系明显且稳定的配对中,止损区间可能非常大甚至不需要,但是两支股票之间的止损区间参数会小很多;协整配对交易一定要考虑异方差的情况,因为价差的波动幅度可能会很大,而且呈现聚集性和短暂的趋势'性,固定的区间会导致巨大的亏损或者丧失很多交易机会;选取不同的合约,最优的人μ参数会不一样,所以并不存在一组这样的λ、μ值,它对于任何品种的配对交易都是最优的,之前的实证研究往往主观选取某个经验值,这是不合理的;在相同的产品对中进行协助套利,最优的人μ值也是不断变化着的,基于不同的历史数据得出的最优λ、μ值也是稍微有些差异的,这说明需要根据实时数据动态调整人μ值。参考文献[1 ]仇中群.基于协整的股指期货套利研究[D].安徽:中国科技大学,硕士学位论文,20090[2]李世伟.基于协整理论的沪深300股指期货跨期套利研究[J].中国计量学院学报,2011,(2):198-2020[3]刘富兵,蒋瑛珉,何苗.股指期货跨期套利研究一股指期货系列报告之二十一[町.国泰君安证券研究所,2010。[4]魏奋运用Matlab开发协整和配对交易策略.-1O-9。[5]于琼婷.基于协整方法的统计套利策略的实证分析[J]科学决策,2011,(3):70-850The Co-integration Pairing Trading Strategy Based on the Parameter A司justment:the Theory Model and Application ZHANG Hesheng Wen Yuechun (School of Economics & Mangeme时,Tongji University, Shanghai 200070 ) Abstract: The sta此-upof stock index futures and financing securities 1ead China to the timωof short and hedge, and co-integra›tion pairing trading wi11 p1ay an impo阳ntro1e. In the process of constructing the trading strategy, at present, most traders use experi›ence va1ue when se忧ingthe trading range and stop 10ss range, and the typica1 way is to take one and two times of the standard deviation respective1y. In fact, this kind ofpractice cannot guarantee the biggest arbitrage profits and even cause 10sses. The paper thinks that the range parameter se1ection is a discreet process of the choice and也eoptima1 parameters shou1d be se1ected constantly by debugging to make the trading strategy system work be忧:parameter adjustment; co-integration; pairing仕adingstrategy 责任编辑、校对:焦少飞16