第32卷第1期经济数学Vol. 32, 2 0 1 5年3月JOURNAL OF QUANTIT A TIVE ECONOMICS Mar. 2 0 1 5 协整模型的配对交易策略优化养邢恩泉,尹涛(北京大学软件与微电子学院,北京100871) 摘要对基于协整理论的配对交易策略进行了改进.改进后的模型利用计算机能够快速循环运算的特点,循环查找最优自己对组合与建仓阅值,使模型能够快速运用到各类资产及多种数据频率的自己对交易中,具有根据数据变化进行自我动态修正的功能.关键词协整模型;配对交易;遍利性中图分类号F832. 51 文献标识码A The Improvements in Pairs Trading Strategy of the Cointegration Model: Ergodic Research on the Basis of Computer Technology XING En-quan, YIN Tao (School of SoftUJare and Microelectronics, Peking University, Beijing 100871,China) Abstract This paper is aimed at improving pairs trading strategy based on the cointegration theory. The improved model loops and searches for the optimized pairs and transaction threshold by taking advantage of the rapid loop calculation of computer, which accelerates its application in pairs trading of assets and data frequency of various kinds. The model has the function of dynamic self-correction in accordance with the data changes. Key words cointegration model; pairs trading; ergodic research 的一支数量分析团队提出以来,其套利策略被广泛应用,目前在欧美、日本等成熟市场已成为主流,被1 51 对冲基金、共同基金、投资公司及资深的独立投资者从本质上讲,统计套利就是一种投资组合策略.使用.统计套利的有效使用和广泛传播,一直被看作其基本过程可以大致归纳为:首先,运用统计分析工是资本市场成熟的重要标志之一.其不仅丰富了投具对投资组合中资产价格的历史数据进行分析与研资者的投资策略,而且有利于最大限度地发挥资本究;然后,建立能够刻画出资产价格之间关系的数量市场的"自我纠错"机制,从而优化与提高了资本市模型;最后,在资产价格之间的关系偏离模型预测的场的资源配置效率.统计套利的常见方法包括:配对交易、卢中性策均衡值时,利用"均值回归"理论,进行相应的套利操略与多因素模型等.其中,配对交易策略(Pairs 作,从而实现稳定的投资收益.统计套利自从20世纪80年代,由NunzioTartaglia带领的摩根士丹利Trading)在国内资本市场有着较为广泛的应用,在保收稿日期:2015-01-13作者简介:邢恩泉(1979-),天津人,讲师,博士E-mail: :zxqyjhz@
66一经济数学第32卷统计套利中的具有尤为突出的地位.基于统计套利的[研究多国股票市场指数的长期协整的配对交易策略是一种市场中性策略,具体的说,是关系,研究表明市场指数的表现会影响这种长期关指从市场上找出历史股价走势相近的股票进行配系,当一个市场趋势显著改变时,技资者应该重新构建套利组合[5J 对,当配对的股票价格差CSpreads)偏离历史均值时,则做空股价较高的股票同时买进股价较低的股国内也有学者对配对交易的方法进行了研究.票,等待他们回归到长期均衡关系,由此赚取两股票吴栩等运用价差服从o-u过程的随机价差模型与价格收敛的报酬.基于Elliott的随机价差模型对沪深300股指期货配对交易一般采用"最小化偏差平方和"、"随机和上证180ETF的配对交易机会进行了研究与预价差模型"与"协整模型"等方法来进行资产组合的测,研究结果表明价差服从o-u过程的随机价差模选择与交易.其中,协整模型的应用频率相对较高.型的预测效果更好[6J也有很多学者对基于协整模在通常情况下,采用协整模型实现配对交易时:型的配对交易进行了实证研究.雷井生和林莎基于首先,通过构建协整模型确定资产价格之间存在的股票价格的日数据和5种日内高频数据,采用协整长期均衡关系;然后,根据价差波动的特性,确定交策略对上证超级大盘指数的20只成分股进行统计易频率、交易触发条件与平仓规则等交易规则;最套利,通过对套利结果的比较与分析,得出在各频率后,对价差走势进行动态追踪,从而完成套利交易.数据下,统计套利策略均能有效地应用于我国股票在关于统计套利的研究中,存在着两个"经验性"选市场[7J期货品种之间的统计套利研究也是国内学择:依靠经验选择构建配对交易的基本品种;依靠经界关注的焦点,如丁秀玲和华仁海以协整理论为基验选择偏离均值的标准差倍数.本文将利用计算机础,对大豆与豆柏期货之间的历史价格关系进行了技术,对上述两个"经验性"选择进行遍历性研究,从深入研究,发现其价格会相互影响且存在长期的均而实现对配对交易协整模型的改进与优化.衡关系,并在此基础上对样本数据进行模拟套利交易,发现套利的平均利润并不显著[8J启文秀等选2 文献回顾取商品指数期货与上证大宗商品股票ETF作为套利对象,运用协整统计模型设计套利方案,其中交易国外学者主要对配对交易的模型与方法进行了信号设置为价差偏离序列标准差的倍.研究表大量的研究.其中,除了可以运用普通最小二乘法对明该统计套利方案能够获得稳定收益,证明统计套传统的协整模型进行估计之外.Giovan町等利用弹利在商品指数期货双跨套利是可行的[9J贾尚辉、性最小二乘法对配对交易中的回归模型进行了估江令对股指期货与其相对应的股票指数关联性进行计,并以标准普尔500期货指数为对象验证了该方了讨论,并以沪深300股指期货与沪深300指数为法是有效的[等在研究了配对交易策略的对象进行了协整关系的实证研究[10 J 分析框架之后,为价差建立均值回归马尔科夫链模协整模型作为目前国内配对交易研究中主要使型,并用模型给出的价差预测值与价差的观测值进用的研究方法,已经有不少国内学者对其提出了改J行比较,从而决定合适的交易时机[2•C. L. Dunis 进.比如何树红等在协整理论的基础上,引入等以WTI原油期货和BRENT原油期货为配对交GARCH模型,建立了股指期货跨期套利模型.在建易对象,分别使用协整模型、移动平均法、神经网络立套利交易策略时,利用标准正态分布的置信水平分析法、自回归移动平均法建立套利模型,并比较了确定建仓阔值.实证研究表明该模型能够有效的发模型之间的套利绩效,发现利用移动平均法和自回现股指期贷市场存在的日内跨期套利机会,并且通归移动平均法进行模拟交易的年收益较高,而传统过建立合理的套利交易机制可以获得较为可观的收协整模型,神经网络分析法并未获得理想效果.国外益[11 J贺正楚等立足于期贷市场的基本功能,发现学者对套利品种的研究也较为多样[以原油期铮市场及其现货市场对来自各自身的冲击反应迅及原油提炼品期货为研究对象,发现其价格之间存速,且具有强持续性.期贷市场对现货市场冲击是积在的长期均衡关系.因而根据协整理论,对裂解价差极、有效的,但现货市场对期货的冲击是消极、微弱的套利机会进行了研究,并设计出相应的套利策略.的,研究结果为套期保值时点的选择提供了重要的历史数据表明原油及原油提炼品期货价格之间存在理论参考依据[12 J在配对交易策略的改进方面.T可盈利的风险套利机会,且在统计学上是显著涛提出了基于协整模型的延后开仓配对交易策略并
67一第1期邢恩泉等:协整模型的配对交易策略优化证明了该策略在我国的可行性[13 J 用。LS法估计回归模型得到上述文献对本文的研究具有重要的启发与借鉴Y, =卢。十卢lX,十U,.(2) 意义.但同时也存在一些不足:首先,虽然统计套利最后,对残差序列{风}进行单位根检验,如果检验研究中的配对交易品种较为多样化,但是配对交易结果证明残差序列不存在单位根,即时间序列{U, }是品种的选择主要依靠实际经验或者依据配对交易对平稳的,那么{Y,}与解释变量序列{X,}之间存在协整关象之间存在的某些经济学联系.其次,建仓阔值的选系,即{Y,}与{X,}之间存在长期均衡关系.择具有主观性,特别是在使用协整方法进行套利的 交易组合的建立研究中,多数以是σ(σ为价差序列的标准差)作为建如果{X,}与{Y,}之间存在长期协整关系,利用仓阔值,而h值的确定依颇于经验判断,如果选取的回归模型中的A作为对冲比例,即如果有1单位的h值过大,交易机会就会减少,不会尽可能多的获得资产Y则需要占1单位的资产X进行反向对冲. 确定交易信号交易利润,而如果选取的h值太小,又会导致交易太频繁,产生巨大的交易成本,导致利润减少.本文以通过对估计方程(2)变形可以得到残差:协整模型为基础,利用计算机能够快速循环运算的U, = Y, -˛30 -˛31 X,. (3) 特点对传统模型进行改进,给出配对交易中具有一并计算残差的标准差σ,用spread表示资产X与资般性的统计套利模型,循环查找最优配对组合与建产Y之间的价差序列,即(4) 仓阔值,利用计算机技术进行循环计算与数据挖掘,spread = Y,→卢lX,.并以mspread代表价差的均值.从而得到遍历解.当spread>mspread时,说明资产Y相对于资产X被高估了,而当spread大到一定程度,可以覆3 模型构建盖套利交易成本时,以此作为开仓信号,卖出资产y,同时买进资产X,当spread回归到mspread时将3. 1 传统套利模型两个资产进行平仓,这样就可以获得套利利润.3. 1. 1 套利对象的选择当spread<mspread时,说明资产Y相对于资传统套利模型在选取配对交易的对象时通常以产X被低估了,而当spread偏离mspread到一定程两个具有高度相关性的资产作为配对组合,并且假度,可以覆盖所有套利交易费用时,以此作为开仓信设它们之间相关性是长期可持续的.一般来讲,这种号,买进资产Y,同时卖出资产X,当spread回归到相关性主要来源于不同种类的资产之间存在某种经mspread时将两个资产进行平仓.济学联系,例如,上下游产业链的商品期货价格往往传统套利模型需要确定建仓与平仓阔值,一般相互影响,从而使期货之间的价格走势存在某种稳研究中开仓阔值为价差等于价差的均值加上h倍的定的关系.以此为基础,在套利模型建立之初,投资标准差σ,即spread二mspread:::l::如.平仓阔值为价者就会凭借经验选择一组套利对象,然后检验其是差等于价差的均值,即spread= mspread. 否具有协整关系,若不具备协整关系,则投资者就会传统套利模型中走的取值多依赖经验而定,没按照上述原则继续寻找其他配对组合,若所选对象有主动寻找是否存在最优解使得套利的预期收益最具有协整关系,则根据协整回归模型来确定资产间的配置比例,最后通过价差的统计性质来确定套利大化. 套利模型的改进机制.这样的选择方法存在的问题就是效率低,且所第一,在选取配对交易对象时,先将所有考虑范选取的配对组合未必能够实现预期利润.围内的资产价格时间序列作为输入变量,其次,输入 协整关系检验已经设计好的计算机程序,然后通过计算机的循环检验资产之间的协整关系主要采用Engle运算,筛选出两两之间具有协整关系的配对交易品Granger两步法.其具体步骤是:首先,假设{X,}与种.假设共有N种资产,首先利用ADF检验筛选出{Y, }代表资产X与资产Y的价格序列,对时间序列M个均是一阶单整的资产价格时间序列;再次,将{X,}与{Y,}进行ADF检验确定两者的平稳性,确这M个资产价格时间序列进行两两组合,则共有M定其均为非平稳序列且是一阶单整.其次,构造回归关(M-1)/2个组合结果,记为集合G;最后,对所模型z(1) 有组合结果做协整检验,筛选出具有协整关系的资Y, = o + 1X, +Ø,.
-68一第32卷经济数学7R产组合作为配对交易对象.代表配对交易组合](]εG')能够在样本内及样J第二,在选取h时,根据历史数据,利用计算机本外总数据区间上取得的收益水平,根据第二步求得循环运算功能,对每一对资产组合查找最优交易信的建仓|萌值,可以求得配对交易组合J的样本外收益号,即确定h值使得该交易对的样本内收益率达到率OR,则其总收益率可以表示为最大.其具体过程为:首先,对某一特定配对交易组TRJ = IR十OR,其中JεG,IR二三O,OR二三o合H(HEG),根据样本内数据计算出其价差的标最优配对交易对象的筛选准则可以表示为:准差阳,其公式为对V],]εG,若丑1E G,TR)二三TR,则组J合I即为最优配对交易对象.σH = I 1τ> : (spreadi -mspreadin)2. (5) 气In-l-;-;;;j 4 实证分析其中,n为样本内数据个数,mspreadin为样本内价差的均值.本文选取在大连商品交易所交易的8个商品期其次,令k=k(u=1,2,…,抖,可以得到建u货品种,即大豆、豆油、豆柏、PVC、玉米、塑料、棕榈仓阔值ku(JH .假如在t时刻,价差落在区间油和焦炭.数据来洒、于Wind资讯金融终端.由于每(mspreadin -k u(J H ,mspreadin十丸σH)以外,立刻进个期货合约都有到期时间,因此期货价格具有不连行建仓,记此时的价差为spread,;当价差回落至均续的特点,而且,在同一交易日,同一期货品种有若值msρreadin时进行平仓,记此时为T时刻,价差干个不同交割月的合约在交易,为了研究方便,我们为吕pread;则单次套利收益为T选用行情报价系统提供的连续合约价格,即豆一连Pspread-spread, ,i = 1,2, ,m; (6) i T 续、豆油连续、豆柏连续、PVC连续、焦炭连续、塑料其中m为样本内套利次数.假设每次建仓时交易成连续、玉米连续、棕榈油连续.时间段选取2012年1本为C,则样本内收益率为月4日到2014年4月18日,在数据频率上,选取日战工2E(7) 内收盘数据,每个序列有样本552个,并将其中每个最后,对Vi ,iξQ,Q= {1,2,...m} ,若3qεQ,序列的最后100个数据作为样本外数据.R向二三R缸,则令k=q,即对于配对交易组合H,其其次,将8个品种的期货价格时间序列作为输最优套利交易建仓阑值为qðH.入变量,导人用matlab编写好的程序中(参见附第三,为增强模型的稳健性,选取最优配对交易组录),其中,将K值的取值范围设置为[0,3J,以合时,应以总收益率最大为准则.首先,对集合G进行为步长.运行后得到如表l结果.调整,从中剔除那些样本内收益率或样本外收益率小于等于零的配对交易组合,记调整后的集合为G'.令表1计算机程序运行结果阳一-玉一王一玉米玉米玉米玉米塑米塑米塑料焦料焦料焦炭一炭旦炭豆油一一除一兢知机期货2配对系数最优K值样本内收益率(%)样本外收益率(%)总收益率(%)焦炭 18. 13 豆油 14. 85 6. 72 21. 57 旦一 PVC 棕榈汹 1. 31 18. 91 豆柏 豆10η'7μ20Ln931061A013i974241H4V-巧 626144653R4Uo-L-47io8o1o8η1LJnJ1u0l79hA72U7QUE0E1 00000·口521Ji1Joo8J7J71-ι0-FELJ0AJ375--一J'iAdAPVC2V2巧io叭队队队队队哇豆柏豆油℃司柏一圣A。哇队月啥qυoonJqunu-13AVOO--nunL-41itt-LQd9μ队刷刷国豆油?一油一时一何002l-本哇少L工UEHE一险-,却会一没一有中交一易一费-用一样-A一成一本-以一平一均一每-易-L-用-的一保一证一金一算一样一本-LM/ 一成一表--rm一 在一样一本-AN/ 注何本交ιl为试阶段付/忧臼咄伊不存7f在丰半实际运行结果说明,8个期货品种的配对组合易组合在样本外测试阶段不存在任何交易机会.另中有14个组合存在协整关系,其中,有7对配对交外,由于没有考虑交易费用以及止损水平,因此所有
第1期邢恩泉等:协整模型的配对交易策略优化69 的收益率都表现为正值.会.因此,在实际使用模型进行配对交易时,还需要在剔除这7对交易组合后,系统根据总收益率对模型进行进一步的调整,如优化数据区间的选择,最大原则输出最终选择结果,即最优配对交易组合计算交易费用对收益的影响,建立完善的风险控制为豆油和棕榈油,其配对交易的样本内收益率为机制,设置合理的止损水平等.% ,样本收益率为%,总收益率为94.参考文献93%.配对系数为,即交易组合的比例为[lJ G MONTANA, K TRIANTAFYLLOPOULOS, T TSAGAR 250 : 233,即卖出250手豆油合约的同时需要买入IS. Flexible least squares for temporal data mining and statisti›233手棕榈油合约,或者买出250手豆油合约的同cal arbitrage [J]. Expert Systems with Applications. 2009, 时卖出233于棕榈油合约.此外,豆油与棕榈油配对36:2819-2830. 交易的最优k值为,代表当开仓信号设置为价[2J R ] ELLIOTT, JOHN, V D HOEK, et al. Pairs trading[JJ 差均值基础上士<1时,其总收益率达到最大‘Quantitative Finance. 2005,3: 271-276. [3J C L DUNIS, J LAWS, B EVANS. Trading futures spreads: An application of correlation and threshold filters[J]. Applied 5 总结与展望Financial Economics. 2006. 16: 903-914. [4J P B GIRMA, A S PAULSON. Risk arbitrage opportunities in 本次研究以协整模型为基础,利用计算机能够petroleum futures spreads [J]. The Journal of Futures Mar›快速循环运算的特点对传统模型进行改进,给出配kets, 1999 , 8 : 931 -955. [5J CHRISTOS, ALEXAKIS. Long-run relations among equity 对交易中具有一般性的统计套利模型.该模型具有indices under different market conditions: Implications on the 很强的普适性:implementation of statistical arbitrage strategies[J]. ] ournal of 第一,在任何数据频率下,能够对任意种类的资Interrlational Financial Markets, Institutions & Money. 2010, 产进行模型检验,并迅速地找到能够进行配对交易20: 389 -403. 的品种.[6J 吴栩,宋光辉,董艳.沪深股市夏普比率的多重分形相关性分析[J].经济数学,2014,31(2):13-18. 第二,克服依靠经验选择建仓阔值的缺点,利用[7J 雷井生,林莎.基于高频数据的统计套利策略及实证研究[JJ.计算机循环运算的功能,快速找出使样本内收益最科研管理,2013,34(6):138-145. 大的交易阔值.[8J 丁秀玲,华仁海.大连商品交易所大豆与与豆柏期货价格之间第三,以样本内与样本外总数据区间内的收益的套利研究[J].统计研究2007,24(2):55一59.率最大为标准,选取最优配对交易组合,并且自动剔[9J 启文秀,牛静,李芳,等.基于统计套利模型的商品指数期货双跨套利方案研究[J]管理评论,2013,25(9):100-107. 除掉样本内收益率或样本外收益率小于等于零的配[10J贾尚晖,江令.股指期货和股票指数的关联性分析口].数学的对交易组合,以此增强模型的稳健性.实践与认识.2013,43(2):90-94 为简单介绍模型功能,本文以在大连商品交易[11]何树红,张月秋,张文.基于GARCH模型的股指期货协整跨所上市的8个期货品种为例,将8个期货品种的价期套利实证研究[J].数学的实践与认识,2013,43(20):274一格时间序列作为输入变量,经过计算机运算,首先发279. [12J贺正楚,周贤军,文先明.基于SVAR模型的期绊市场及其现现14个组合长期上存在协整关系,然后比较出其中货市场的价格发现功能实证研究[J].湖南大学学报2自然科学最优配对交易组合为豆油和棕榈油,其最优K值为版,2011,38(7): 92 97. ;最后,通过计算机指令将所有结果进行输出.[13J丁涛.配对交易策略在A股市场的应用与改进口].中国商贸.在研究中,由于样本外数据区间较短,且样本外数据2013,(2) :24-27. 的波动性与样本内数据不同,最终结果中有7个配对交易组合在样本外测试期间不存在任何交易机