识别风险,发现价值 请务必阅读末页的免责声明
1 / 25
金融工程|专题报告
2017 年 7 月 6 日
证券研究报告
Table_Title
虚拟遗憾最小化应用于量化择时与交易
交易性择时策略研究之十二
Tab le_Summary
报告摘要:
人工智能与量化投资
人工智能发展如火如荼,正在以一种前所未有的力量改变着我们生活
的方方面面。本篇报告首先从投资规模、细分行业等角度回顾了近年来
Fintech 的发展情况。将人工智能算法应用于投资策略当中,往往能够提供
新颖、有效的思路,比如广为人知的深度学习算法。然而,深度学习仅是
人工智能耀眼明星中的一颗,随后我们重点介绍了另外一种虚拟遗憾最小
化算法,并将之用于量化择时投资策略。
虚拟遗憾最小化策略简介
2017 年 1 月,人工智能机器人 Libratus 在两人无限注的德州扑克中战
胜了四位顶级人类职业德扑选手,又于 2017 年 4 月战胜李开复组建的“龙
之队”,Libratus 背后的一个核心算法就是虚拟遗憾最小化(CFR)。
虚拟遗憾最小化能够给出决策点上每个可执行动作的概率——即博弈
的策略,采用该策略可以使我们的收益最大、遗憾值最小。遗憾值是指对
未采取的动作后悔程度的量化,所谓“虚拟”的意思是将结局的遗憾值分解到
之前的决策点中,通过反复迭代,使每个决策点的遗憾值最小,来达到最
终收益最大化的目的。
虚拟遗憾最小化在量化择时中的应用
我们假设把全市场当做对手进行博弈,根据指数的历史数据(对手的
历史动作序列),以日为时间尺度,用虚拟遗憾最小化预测下一个交易日指
数上涨、下跌的概率,即执行做多、做空动作的概率,进而给出量化择时
的多空信号。在实证中,本篇报告将虚拟遗憾最小化算法用于沪深 300 指
数、上证指数、中证 500 指数、创业板指和中小板指,进行多空择时和纯
做多择时,总体风险收益情况良好。在细节上需要注意的是,应根据不同
指数波动率的差异,选择相应产生信号的阈值。
虚拟遗憾最小化在股指期货交易中的应用
将虚拟遗憾最小化用于日线的股指期货交易当中。沪深 300 指数作为
沪深 300 股指期货的跟踪标的,它的变化会立即在股指期货当中得到反应。
我们将沪深 300 股指的多空信号用于股指期货的日频交易中,结果表明零
交易费用、双边万二交易费用和双边千一交易费用下,策略的年化收益率
为 %、%和 %。
风险提示
本篇报告仅作为对将虚拟遗憾最小化算法用于量化择时的讨论,不提
供任何投资建议。
图 1、HS300 指数多空、纯多头择时
图 2、IF 主力合约日频交易
Table_Author 分析师: 张 超 S0260514070002
020-87578291
zhangchao@
Tabl e_Report 相关研究:
深度学习之股指期货日内交
易策略
2014-06-18
深度学习算法掘金 ALPHA 因
子
2014-06-19
Fintech 改变金融-海外市场 2016-07-18
Fintech 改变金融-中国市场 2016-08-07
识别风险,发现价值 请务必阅读末页的免责声明
2 / 25
金融工程|专题报告
目录索引
一、人工智能与投资 ......................................................... 4
(一)FINTECH的发展 ..................................................... 4
(二)人工智能与投资策略——深度学习在投资策略中的应用 ................. 7
(三)棋牌博弈的 AI .................................................... 10
二、传统德州扑克 AI算法:虚拟遗憾最小化 ................................... 11
(一)虚拟遗憾最小化的思想和基本概念 .................................. 11
(二)德州扑克 AI算法:虚拟遗憾最小化 ................................. 12
三、虚拟遗憾最小化算法在量化择时中的应用 .................................. 14
(一)算法在量化择时中的应用 .......................................... 14
(二)不同股指的实证 .................................................. 16
四、虚拟遗憾最小化在股指期货低频交易中的应用 .............................. 23
五、总结 .................................................................. 24
识别风险,发现价值 请务必阅读末页的免责声明
3 / 25
金融工程|专题报告
图表索引
图 1:全球 Fintech行业风投驱动的融资额和成交量 ........................ 4
图 2:Fintech在三大洲风投驱动下的融资额(单位:十亿美元) ............. 4
图 3:中国 2012年-2016年金融科技领域投资总额和交易数量 ................ 5
图 4:国际银行巨头 2011-2016年投资金融科技领域情况(投资笔数) ........ 5
图 5:2016年金融科技 TOP100企业所在领域占比 ........................... 6
图 6:深度学习的层级结构 .............................................. 8
图 7:深度学习之股指期货日内交易策略 .................................. 9
图 8:基于深度学习的 Alpha因子策略示意图。 ............................ 9
图 9:两人无限注德州扑克的博弈树 ..................................... 13
图 10:虚拟遗憾最小化的算法框架 ...................................... 14
图 11:根据策略产生择时信号的过程 .................................... 16
图 12:𝛔(𝒍𝒐𝒏𝒈)的频数分布直方图 ...................................... 17
图 13:样本内,虚拟遗憾最小化策略在沪深 300指数多空、纯多择时收益 .... 17
图 14:样本外,虚拟遗憾最小化策略在沪深 300指数多空、纯多择时收益 .... 18
图 15:样本外,虚拟遗憾最小化策略在上证指数多空、纯多择时收益 ........ 19
图 16:样本外,虚拟遗憾最小化策略在中证 500指数多空、纯多择时收益 .... 20
图 17:样本外,虚拟遗憾最小化策略在创业板指数多空、纯多择时收益 ...... 21
图 18:样本外,虚拟遗憾最小化策略在中小板指数多空、纯多择时收益 ...... 22
图 19: 虚拟遗憾最小化策略用于 IF低频交易的累积收益率 ................ 23
表 1:金融科技公司 Top50里中国公司情况 ................................ 6
表 2:深度学习在科技领域的重大突破 .................................... 7
表 3: 样本外,虚拟遗憾最小化策略在沪深 300指数多空、纯做多择时结果 .. 18
表 4: 样本外,虚拟遗憾最小化策略在上证指数多空、纯做多择时结果 ...... 19
表 5: 样本外,虚拟遗憾最小化策略在中证 500指数多空、纯做多择时结果 .. 20
表 6: 样本外,虚拟遗憾最小化策略在创业板指数多空、纯做多择时结果 .... 21
表 7: 样本外,虚拟遗憾最小化策略在中小板指数多空、纯做多择时结果 .... 22
表 8: 虚拟遗憾最小化策略在 IF 日频交易上的测算结果 ................... 23
识别风险,发现价值 请务必阅读末页的免责声明
4 / 25
金融工程|专题报告
一、人工智能与投资
(一)Fintech 的发展
Fintech——Financial Technology是将科技运用在金融领域。使得金融服务更
加高效的企业所构成的一个经济产业。2008年金融危机之后,银行信贷体系的高风
险与不透明性暴露无遗,传统金融行业面临更多的监管和资本金要求,相比而言
Fintech企业无此顾虑,因此可以提供低成本、低风险、较透明、更便捷的金融服务。
另外,随着社交网络的发展和大数据分析的广泛应用,金融科技产品受到千禧一代
用户群体的热烈欢迎,Fintech便是在这样的环境下发展壮大。2016年,全球Fintech
行业中风投驱动的融资总额为127亿美元,涉及836笔交易,较2015年的高峰时期的
146亿美元的风投融资总额和848笔交易有所下降。花旗集团的一项研究报告表明,
2016年至2020年,金融科技初创公司的收益将上升10倍,总收益将超过1000亿美元。
图1:全球Fintech行业风投驱动的融资额和成交量
数据来源:CB Insights、广发证券发展研究中心
图2:Fintech在三大洲风投驱动下的融资额(单位:十亿美元)
数据来源:CB Insights、广发证券发展研究中心
25 31
77
146 127
451
572
725
848 836
0
30
60
90
120
150
180
0
200
400
600
800
1000
2012 2013 2014 2015 2016
风投驱动融资额(亿美元)
风投驱动成交量
0
2
4
6
8
10
12
14
16
2012 2013 2014 2015 2016
北美 欧洲 亚洲
识别风险,发现价值 请务必阅读末页的免责声明
5 / 25
金融工程|专题报告
从上图可以看出,2014年之前,Fintech发展比较缓慢,主要由北美为主导;之
后开始飞速发展,并且亚洲的份额占比逐年提升,2016年已经接近北美。2015年间,
北美、欧洲、亚洲地区风投驱动下的融资额分别为77亿美元、亿美元、45亿美
元;2016年份额分别是61亿美元、12亿美元、54亿美元。作为亚洲地区的第一经济
体,中国成为亚洲金融科技飞速发展的助推剂,近两年来金融科技在国内大热,涌
现了大批初创公司进入这个领域。2015年和2016年中国金融科技领域的投资额为28
亿美元和46亿美元,同比增长250%和64%,保持快速增长,这也表明国内各大投资者
纷纷看好Fintech的发展前景。
图3:中国2012年-2016年金融科技领域投资总额和交易数量
数据来源:CB Insights、广发证券发展研究中
图4:国际银行巨头2011-2016年投资金融科技领域情况(投资笔数)
数据来源:CB Insights、广发证券发展研究中心
在Fintech的全球融资热潮中,可以看到传统银行也开始转型,从以前与Fintech
竞争到如今开始寻求与Fintech公司合作。国际银行巨头们近几年来对Fintech公司
2 2 8
28
46
10
18
44
42
46
0
10
20
30
40
50
0
10
20
30
40
50
2012 2013 2014 2015 2016
投资额(亿美元)
交易数量
0
5
10
15
20
25
识别风险,发现价值 请务必阅读末页的免责声明
6 / 25
金融工程|专题报告
的投资不断增加,试图将金融科技与自身传统业务完成融合。花旗集团和高盛集团
是当中最活跃的国际金融巨头,截止2016年分别在金融科技领域进行了21笔和18笔
风险投资。花旗集团的投资活动包括2016年1月向从事区块链的数字资产控股有限公
司投资6000万美元,2015年5月向开源金融数据服务公司Visible Alpha投资3000万
美元;高盛集团的投资活动包括2016年6月向网络借贷公司Better Mortgage投资3000
万美元,2014年11月向人工智能金融科技公司Kensho投资1500万美元等。
从Fintech的热门业务方向来看,在国外主要发展于区块链、借贷、支付、智能
投顾、众筹融资、个人理财等领域,而在国内主要发展于移动支付、P2P、众筹融资、
互联网理财与互联网保险等领域。根据H2 Ventures公司与毕马威(KPMG)公司发布
的《2016金融科技100强》报告中的统计数据,这Top100的金融科技公司在过去一年
中吸引了146亿美元的资金,其中从事借贷、支付、保险业务的公司分别有32家、18
家和12家,占据半壁江山。中国科技金融公司表现尤为亮眼,蚂蚁金服、趣店、陆
金所、众安保险横扫Top5中的四个席位,京东金融、我来贷、融360、品钛也强势挤
入50强,这8家企业中有6家的主要业务是借贷、1家支付、1家保险。
图5:2016年金融科技TOP100企业所在领域占比
资料来源:H2 VENTURES、KPMG、广发证券发展研究中心
表 1:金融科技公司 Top50里中国公司情况
排名 公司 简介
1 蚂蚁金服
第三方支付平台,致力于创建开放生态系统;为小微企业
和个人消费者提供金融服务。
2 趣店
学生小额贷款、分期付款和投资管理平台,为中国目前不
使用信用卡的消费者提供金融服务。
4 陆金所
平安集团下互联网借贷和财富管理平台,目标是提供全球
最全面的财富管理。
5 众安保险
互联网保险公司,应用移动互联网、云计算、大数据进行
产品设计、自动理赔、市场定位分析和风险控制。
10 京东金融
主要业务:供应链金融,消费金融,众筹,财富管理,支
付服务,保险和证券。
32%
18%12%
9%
7%
6%
5%
5% 3%
借贷
支付
保险
监管科技
数据分析
财富管理
数字货币
区块链
资本市场
众筹
会计
识别风险,发现价值 请务必阅读末页的免责声明
7 / 25
金融工程|专题报告
33 我来贷
致力于为消费者提供便宜、快捷、低风险的借钱方式,公
司的风险管理技术结合机器学习、大数据技术和非结构化
数据技术。
34 融 360 为用户提供便捷,有价格竞争力和可靠的金融信息服务。
39 品钛
利用大数据技术和其创新技术为消费者和小企业提供智能
金融服务。
资料来源:H2 VENTURES、KPMG、广发证券发展研究中心
在Fintech的业务领域中,区块链和资本市场的高科技近几年也得到了高速的发
展。区块链是一种分布式数据库,能应用于分布式结算,将对传统的清算部门造成
重大的冲击;而资本市场的高科技包括了智能投资顾问与高科技数据分析平台,主
要是将人工智能算法和大数据分析技术应用于金融市场,为个人或机构投资者提供
投资建议、咨询服务或者资产管理,例如国外的Betterment公司、Weathfont公司、
Kensho公司和Dataminr公司等。2017年3月,全球最大资产管理公司之一的BlackRock
(贝莱德)宣布300亿美元资产重组计划,其中60亿美元并入基于计算机和数学模型
的量化投资基金。国际知名咨询公司AT Kearney预测2020年机器人投顾行业的资产
管理规模将突破万亿美元。
(二)人工智能与投资策略——深度学习在投资策略中的应用
2016年3月,AlphaGo和李世石之间的围棋人机大战震惊了世界。人工智能轻而
易举地在人类智慧的高地战胜了人类顶级棋手。这只是人工智能时代的一个缩影,
近年来,拥有大数据支持的深度学习迅速发展,掀起了一股方兴未艾的研究和应用
热潮。谷歌、微软、IBM、百度等IT巨头们纷纷厉兵秣马,在深度学习领域投入人力
物力。不负众望深度学习以一种前所未有的力量改变着我们的生活,创造一个个新
的记录。
表 2:深度学习在科技领域的重大突破
语音识别 识别错误率相对降低 30%,是近 20年来最大突破
图像识别 ImageNet评测上的错误率从以前方法的 26%提升到 15%
智能推荐系统 Netflix 视频推荐比赛最佳成绩
药物活性预测 比赛最佳成绩
自然语言处理 准确率提高到 85%,目前最好结果
网络广告点击率预测 目前最好结果
围棋 AlphaGo 打败人类顶级选手
翻译 Google 神经网络机器翻译系统水平接近人类翻译
德州扑克 DeepStack、Libratus(冷扑大师)战胜人类职业选手
资料来源:互联网、广发证券发展研究中心
人工智能在金融领域也同样大展身手,据统计2015年创建的对冲基金中40%依赖
于计算机模型做投资决策。可以看到,在金融市场每天会产生大量交易数据——单
单A股市场考虑以秒为单位的高频数据,每个交易日就会产生两千多万个新的数据样
识别风险,发现价值 请务必阅读末页的免责声明
8 / 25
金融工程|专题报告
本,如何从“数据海洋”中提取有用的信息,来帮助投资者获得超额收益或绝对收
益?随着计算机科学与技术的发展,存储成本的降低和计算速度的提高,深度学习
或许是一柄利刃。
深度学习模拟视觉系统中大脑皮层的Hubel-Wiesel模型,采用一层层“抽象化”
的方式来对数据或信号进行表达,类似于大脑皮层对图像的分辨。根据Hubel-Wiesel
模型,大脑皮层是分层次处理图像信息的:第一层是原始信号的摄入,即像素的摄
入;第二层是初步处理,即确定物体图像的边缘和方向;第三层是抽象,即判定眼
前物体的形状;第四层是进一步抽象,即大脑判定该图像是什么物体。深度学习模
型也是先从原始信号中分离出低层的特征,再从低层的特征中获取高一层的特征,
然后获得更高一层的表达,最后在高层特征上建立起分类器,获得模型的预测输出。
图6:深度学习的层级结构
资料来源:广发证券发展研究中心
西蒙斯的壁虎式投资理论告诉我们,投资时在短线内是可以进行方向性预测,
捕捉到短期套利机会的,基于此我们曾经利用深度学习对大量的历史交易数据进行
学习,开发了深度学习之股指期货日内交易策略以及深度学习算法掘金Alhpa因子策
略。这里我们简单介绍这两种策略,抛砖引玉,以窥人工智能中深度学习算法在投
资策略中的应用。
在深度学习之股指期货日内交易策略中,我们首先使用深度学习模型对短期内
股指期货的涨跌进行预测,然后根据预测结果确定股指期货买卖的信号。使用股指
期货1秒级高频数据,在模型中输入短期内股指期货的价格,以及价格的变化范围,
买卖盘价和委卖委买量等,深度学习网络的第一个隐层有200个节点,第二个隐层有
100个节点,输出层有2个节点(输出Score1和Score2)。无监督学习的隐层训练迭
代次数为50次,有监督学习的迭代次数为400次。当模型输出层的Score1大于我们设
定阈值时,意味对股指期货的预测是上涨,触发买进的信号;当输出层的Score2小
于我们设定的另一个阈值时,意味对股指期货的预测是下跌,触发卖空的信号。在
实证训练样本完成后,模型高频预测的准确率超过73%;根据此模型产生的多空信号,
进行日内股指期货交易,取得很好的年化收益率和最大回撤。
识别风险,发现价值 请务必阅读末页的免责声明
9 / 25
金融工程|专题报告
图7:深度学习之股指期货日内交易策略
资料来源:广发证券发展研究中心
在深度学习算法掘金Alpha因子的策略中,我们基于交易量价信息,建立深度学
习预测模型,对股票未来的涨跌情况进行预测,并将预测结果作为因子,期望通过
此因子获得Alpha收益。
深度学习的Alpha因子挖掘的策略示意图如下,深度学习模型建立起当前时刻(t
时刻)与此前时刻市场数据𝑋𝑡、一段时间后股票价格变化𝑌𝑡之间的关系,即使用t时
刻信息𝑋𝑡通过深度学习模型对此后的𝑌𝑡进行预测,根据预测的𝑌𝑡给出得分,得分可以
作为Alpha策略的因子。我们选择股票池为中证800成分股,以周为预测周期和换仓
周期,即在每天收盘的时刻进行预测,每次预测的对象都是该交易日之后第5个交易
日收盘时刻相对于当前收盘价的涨跌情况。根据一周后预测的得分,可以很方便快
捷的建立起类似多因子选股模型的交易策略,基于此我们给出了单项做多策略、多
空配对策略和资金等权重对冲策略。
图8:基于深度学习的Alpha因子策略示意图。
资料来源:广发证券发展研究中心
识别风险,发现价值 请务必阅读末页的免责声明
10 / 25
金融工程|专题报告
通过以上两个策略,我们验证了深度学习这一大数据时代的利器在价格预测上
的有效性,关于这两个策略的详细介绍可参考之前发布的研究报告《深度学习之股
指期货日内交易策略——大数据深度学习系列之一》和《深度学习算法掘金ALPHA因
子——大数据深度学习系列之二》。
事实上,深度学习只是人工智能众多耀眼明星中的一颗,随着人工智能技术的
进步和发展,会有越来越多“智能”的算法可以用于投资策略的开发,例如本篇报
告中将要展示的使用虚拟遗憾最小化的算法进行量化择时。如BlackRock(贝莱德)创
始人及首席执行官近期所言:“信息的民主化使得主动性投资变得越来越难做。我
们必须改变生态系统,更多地依赖大数据、人工智能、量化等手段”。
(三)棋牌博弈的 AI
围棋中的AI
计算机与人类在棋类项目上的博弈可以直观地反映部分人工智能发展水平,早
在1996年和1997年IBM公司的“深蓝”计算机就曾两次对战国际象棋世界冠军卡斯帕
罗夫,并都获得胜利。棋类项目中只有围棋还坚守在人类智慧的高地,所谓千古不
同局,棋盘上361个格点可以演化出的棋局甚至比宇宙中的粒子数还多,复杂程度远
超其他棋类,依靠“穷举法”攻占国际象棋的手段难以有效地作用在围棋上,因此
许多人推断数十年内不会有人工智能机器人能够战胜人类顶级围棋选手。然而就在
2015年12月,谷歌DeepMind公司研发的AI围棋AlphaGo首次亮相,便以5:0的比分战
胜人类职业选手欧洲围棋冠军樊麾。接着,2016年3月AlphaGo迎战韩国九段、世界
冠军李世石,在全世界的瞩目下,4:1战胜李世石。AlphaGo因其中一场失利获得世
界第四的排名。
事实上,AlphaGo的大脑主要是由两部分组成。第一部分是选择在什么位臵落子:
AlphaGo首先通过“学习”3000万级数量的人类棋谱,试图找出人类高手在面对某一
棋局时要走的下一步是什么,此时还只是模仿单一落子;之后通过百万级额外的模
拟局,将每一个模拟棋局下到底,利用“增强学习”,教会自己最可能下赢的一手。
第二部分是价值网络,用来辅助决定落子的位臵选择:由于棋局之后的走法有很多
种,计算机要模拟每一种情况需要大量的时间,为提高速度,价值网路会选择“最
值得”走的情况进行模拟,这样会极大地提高下棋速度。AlphaGo每天都这样自我学
习,废寝忘食地虐待自己,2016年7月,世界职业围棋排名网站GoRatings公布AlphaGo
以3612分超越3608分的柯洁成为新的世界第一。半年之后,进步神速的AlphaGo化名
“Master”出现在中韩围棋对弈网络,连续战胜包括中国围棋名将柯洁、聂卫平、
古力、韩国围棋冠军朴廷桓在内的顶级高手,获胜60场无一败绩。同时版本的
AlphaGo也随之问世,不同于之前版本“深度学习”已有棋谱得出围棋手数的估值,
新版本的AlphaGo利用之前优化过的估值函数,抛弃人类棋谱,从零开始,自我对局
并深度学习,以期能够更上一层楼。
德州扑克中的AI
德州扑克是一项标志情商、智慧和勇气的牌类游戏,自20世纪初诞生便风靡全
识别风险,发现价值 请务必阅读末页的免责声明
11 / 25
金融工程|专题报告
球,深受各个不同职业群体玩家的青睐。德州扑克和围棋的一个主要不同在于:围
棋是一种“完美信息”博弈,即对于玩家而言,游戏中所有的信息都已经在棋局中
体现出来;而德州扑克是一种“不完美信息”博弈,游戏玩家并不知道游戏中所有
的信息,比如对手的手牌和桌上未翻开的公共牌,存在隐藏的信息,同时还有诈唬
等心理战术。这些特点使得德州扑克更贴近生活中真实的拍卖、谈判等金融政治博
弈场景,所以德州扑克也许是测试人工智能是否能够应付这些情景的一个平台。事
实上,人工智能已经与人类德扑高手在无限注双人德扑的多次交锋中获得胜利。2016
年11月,阿尔伯塔大学人工智能机器人DeepStack与33位人类高手进行了为期4周,
共万手的较量,结果DeepStack的平均赢率为492mbb/g(50mbb/g被认为拥有较大
优势,750mbb/g是每局对手都弃牌的赢率)。2017年1月,卡内基梅隆大学人工智能
机器人Libratus与四位更强的人类职业德扑玩家进行为期20天,共12万手的比赛,
共计领先人类团队176万美元的虚拟筹码。2017年4月,创新工场李开复邀请Libratus
(冷扑大师)与2016世界德扑大赛WSOP金手链冠军率领的“龙之队”比赛,又一次
完胜人类选手。而Libratus的开发正是基于虚拟遗憾最小化算法(Counterfactual
Regret Minimization)。
Libratus所用的虚拟遗憾最小化算法,不必像AlphaGo需要提前学习3000万份人
类棋谱,也没有令人知其然而不知其所以然、充满随机因素的“黑匣子”,开发者
只是告诉它游戏的规则,通过大量地自我对局,不断试错,反复迭代,优化决策行
为,甚至自己“教会”自己诈唬。另外,由于它是从零开始,自己和自己对局,没
有学习人类之前的策略,所以套路和人类选手完全不一样。
其实在零和博弈中,博弈双方存在纳什均衡,当双方的策略是纳什均衡,若有
一方背离自己的策略,背离策略的一方不会获得更高的收益,而没有背离策略的一
方不会获得更低的收益。虚拟遗憾最小化算法就是通过反复迭代,计算零和博弈中
近似纳什均衡的有效方法,使得Libratus立于“不败之地”。在投资决策时,我们
也可以利用虚拟遗憾最小化的思想,从博弈的过程中吸取以往决策的经验教训,多
次迭代调整出高效的策略,使得未来所做动作的遗憾最小。下面我们就通过德州扑
克介绍虚拟遗憾最小化算法,并将虚拟遗憾最小化算法的思想用于A股量化择时。
二、传统德州扑克 AI 算法:虚拟遗憾最小化
(一)虚拟遗憾最小化的思想和基本概念
为了更好地理解虚拟遗憾最小化,我们首先介绍遗憾值和遗憾匹配的概念。所
谓的遗憾值就是对没有采取一个行为的后悔或遗憾程度的量化度量。就拿我们熟悉
的石头剪刀布的游戏来说明,甲乙两人在玩剪刀石头布,胜的人得1分,输的人得-1
分,平手的话两人都是0分。一局游戏中,甲出石头,乙出布,所以甲出石头的效用
值是:𝜇甲(石头)=-1,乙出布的效用值是𝜇乙(布)=1。定义采取动作A而未采取动作B
的遗憾值是:
r B = μ B −μ A (1)
游戏结束时,甲就会后悔自己为什么没有出布,若是出布,两人平手,效用值
是𝜇甲(布)=0;更后悔自己为什么没有出剪刀,若是出剪刀,甲胜,效用值是𝜇甲(剪
识别风险,发现价值 请务必阅读末页的免责声明
12 / 25
金融工程|专题报告
刀)=1。此时,根据定义甲对自己出了石头而没出剪刀的遗憾值是:𝑟甲(剪刀)=𝜇甲(剪
刀)-𝜇甲(石头)=1-(-1)=2;对自己没出布的遗憾值是:𝑟甲(布)=𝜇甲(布)-𝜇甲(石
头)=0-(-1)=1;同理对没出石头的遗憾值是: 𝑟甲 (石头)=𝜇甲 (石头)-𝜇甲 (石
头)=-1-(-1)=0(其实甲出的就是石头,这么做是为了方便之后的说明)。从举例可
以看出对于采取A动作而未采取B动作的遗憾值就是B动作的效用值减去A动作的效用
值。
在本算法中,我们说的策略是指某一情形下,可采取的动作的概率分布。在上
面的例子中,甲乙两人玩了很多局剪刀石头布后,甲会根据之前游戏中自己和对手
情况,形成在下一局的策略σ,即自己下一局中出剪刀、石头、布的概率:σ(剪刀)、
σ 石头 、σ(布)。
最小化遗憾值的方法是遗憾匹配,它是一种迭代过程。假设进行了T次游戏,每
次有戏中,都会存在三个动作的遗憾值。将所有T次游戏中,三个动作对应的遗憾值
分别相加,可以得到每种动作的累计遗憾值,例如T次游戏中,剪刀的累计遗憾值是:
𝑅𝑇 剪刀 = 𝑟𝑡(剪刀)
𝑇
𝑡=1
(2)
根据遗憾匹配,第T+1次对局中,甲的策略𝜎𝑇+1中出剪刀的概率为:
𝜎𝑇+1 剪刀 =
𝑅𝑇 剪刀
𝑅𝑇 剪刀 + 𝑅𝑇 石头 + 𝑅𝑇 布
(3)
可以看出用遗憾匹配计算策略的一个基本思想就是在之前的对局中,自己越后
悔没去做的动作,在下一次就有越大的概率执行该动作。这种基于博弈论和心理学
的思想,使得算法更加“人性化”。
通过这个简单的例子我们介绍了遗憾值最小化的基础概念和思想,然而生活中
的情况往往更加复杂,一件事件需要进行多次决策,每次决策之间又息息相关,即
所谓的扩展式博弈。在扩展式博弈中,可以使用虚拟遗憾最小化算法,所谓“虚拟”
二字,意思是将整个事件结果的遗憾值分解到之前每个决策中,通过多次迭代,使
每个决策的局部遗憾值最小,从而让局中人的平均遗憾值最小化。虚拟遗憾最小化
算法每迭代一次之后,每个决策点上所得到的局部遗憾值都会被用来计算下一次迭
代时的博弈策略。新的博弈策略通过遗憾匹配来得到,在这样反复迭代和更新的过
程中,使得局中人的平均策略向纳什均衡收敛。德州扑克是一个典型的不完美信息、
扩展式博弈,下面我们用以德州扑克为例,介绍虚拟遗憾最小化算法。
(二)德州扑克 AI 算法:虚拟遗憾最小化
德州扑克游戏整副牌52张,分四种花色和十三个牌值,玩家数通常是2-10人左
右,由两个玩家担任大小盲注先下注。游戏开始时随机为每个玩家分配两张手牌,
桌面上有五张未翻开的公共牌。游戏一共进行4次押注,分别是在翻牌前(Pre-Flop)、
翻牌(Flop)、转牌(Turn)和河牌(River)阶段。每次押注时,玩家有弃牌(Fold)、
跟注(Call)和加注(Raise)三种选择。翻牌阶段翻三张公共牌,转牌和河牌阶段
分别再翻一张公共牌。4轮押注结束后进入摊牌阶段,比较未弃牌玩家的手牌和五张
识别风险,发现价值 请务必阅读末页的免责声明
13 / 25
金融工程|专题报告
公共牌可以组成的最好牌型。
因为局中人不知道对手的手牌、也不知道未翻开的公共牌,所以德扑是不完美
信息对称,另外,局中人最多有4次下注机会,所以同时也是扩展式博弈。下图给出
了两人(玩家1、玩家2)无限注德州扑克的博弈树,理论上,完整的博弈树包含了
游戏的所有情况。图中蓝色和红色的节点表示玩家1和玩家2的决策点H,该决策点到
博弈树最上端的点之间的路径称为决策点H对应的动作序列h。绿色的点表示翻开桌
上的公共牌;黑色的点表示该玩家的游戏收益或者说是效用值,我们将黑色的点叫
做叶子节点Z,就像博弈树末端的叶子,叶子节点Z到博弈树最上端的点之间的路径
叫做终止序列z。
图9:两人无限注德州扑克的博弈树
资料来源:《DeepStack: Expert-Level artificial intelligence in heads-up
no-limit poker》
将叶子节点的效用值分配到各个决策点,可以得到各个决策点的虚拟价值,决
策点H或动作序列h上的虚拟价值算法如下:
v h = 𝜋−𝑖 h ∙ 𝜋 h, 𝑧 ∙ 𝑢𝑖 𝑧
𝑧
(4)
上式中,i表示某个局中人,-i表示其他所有局中人的集合;
𝑢𝑖 𝑧 是i在叶子节点的效用值;
𝜋(h, 𝑧)是转移概率,表示从动作序列h到终止序列z发生的概率,𝜋 h, 𝑧 =
𝜎(𝑚)𝑚 ,其中m是h与z之间的动作,𝜎 𝑚 是该动作在策略𝜎下发生的概率;
𝜋−𝑖(h)表示动作h发生的概率中,其他所有局中人的贡献。
这个公式可以将整个比赛的效用值分解到各个决策点上,得到决策点上的虚拟
价值v h 。此时在决策点H上,局中人可以有许多选择,比如可以选择动作
识别风险,发现价值 请务必阅读末页的免责声明
14 / 25
金融工程|专题报告
𝑎𝑘(k=1,2,…,K),那么他不执行𝑎𝑘动作的虚拟遗憾值就是r h,𝑎𝑘 :
r h,𝑎𝑘 = v h𝑎𝑘 − v h (5)
h𝑎𝑘的意思是在h之后执行𝑎𝑘的动作序列。这样我们就得到了每个决策点上不执
行某个动作的虚拟遗憾值;在T次对局中,累计虚拟遗憾值𝑅𝑇 h,𝑎𝑘 就是每局比赛的
r h,𝑎𝑘 之和。同样地,为了使得虚拟遗憾值最小化,要用遗憾匹配来求第T+1局各个
决策点H上的策略(即决策点H上每个动作执行的概率):
𝜎𝑇+1 h,𝑎𝑘 = 𝑅
𝑇 h,𝑎𝑘 / 𝑅
𝑇 h,𝑎𝑙
𝐾
𝑙=1
(6)
在第T+1局比赛中,便可以使用更新后的策略𝜎𝑇+1进行博弈。之后,再继续将第
T+1局的效用值分解到各个决策点上,计算各个决策点的虚拟价值,以及决策点上不
执行动作的虚拟遗憾值,用遗憾匹配再更新第T+2局的策略𝜎𝑇+2(第T+2局中,决策
点上每个动作实行的概率)。如此通过大量的反复迭代,不断更新各个决策点上的
策略,就可以使得策略逼近纳什均衡策略,平均虚拟遗憾值达到最小。更新好策略
集后,当比赛时再次遇到某一动作序列h时,计算机就会提取该决策点H上的策略,
给出执行各个动作的概率。下图给出了虚拟遗憾最小化的算法框架。
图10:虚拟遗憾最小化的算法框架
资料来源:广发证券发展研究中心
三、虚拟遗憾最小化算法在量化择时中的应用
(一)算法在量化择时中的应用
识别风险,发现价值 请务必阅读末页的免责声明
15 / 25
金融工程|专题报告
虚拟遗憾最小化在处理非完美信息、扩展式博弈问题时,能够站在全局的高度
上,为每一步决策提供有效的策略,使得最终局中人的收益最大,遗憾最小。其实
不难发现,投资者在市场中时时刻刻都面临着非完美信息、扩展式博弈:我们不可
能知道市场中所有的信息,需要利用有限已知的信息做出一系列投资决策。如果将
博弈的局中人看成是市场上所有的投资者,将所有投资者的集体行为抽象成市场指
数的走势,那么如何在博弈中战胜市场,获得满意的收益呢?虚拟遗憾最小化恰好
能够为我们挖掘策略提供有效的思路。
资本市场瞬息万变,资产价格上涨时,有人会后悔没有提早入市,而资产价格
下跌时,又有人遗憾未能及时平仓。将虚拟遗憾最小化应用在量化择时中,给出预
测的多空信号,将“遗憾”最小化,或者说将收益最大化,就是我们要做的事情。
当投资者和市场指数进行“博弈”时,市场的动作序列h可以通过指数的历史数
据反应。以日为时间单位,我们站在当前的时点,需要根据市场的动作序列h做出决
策:做多、做空或者平仓,当前的时点就是决策点。我们通过虚拟遗憾最小化算法,
给出对当前时点之后一天的预测——股价上涨概率和下跌概率,这两个值对应我们
在之后一天执行做多动作和做空动作的概率。
虚拟遗憾最小化是一种迭代更新策略的方法,在交易日T,我们需要预测交易日
T+1股价上涨和下跌的概率,或者说预测策略做多动作执行的概率𝜎𝑇+1(long)及做
空动作执行的概率𝜎𝑇+1(short)。据(4)式,在交易日T收盘后,决策点𝐻𝑇的虚
拟价值为:
v(h𝑇)=𝜎
𝑇(long) ∙ (𝑃𝑇-𝑃𝑇−1) − 𝜎
𝑇(short) ∙ (𝑃𝑇 − 𝑃𝑇−1) (7)
上式中𝑃𝑇-𝑃𝑇−1,是交易日T,T-1的收盘价之差;虚拟价值v(h𝑇)其实就是交易日
T执行策略𝜎𝑇的平均效用值。交易日T收盘后,投资者对没有执行做多行动的虚拟遗
憾值是:
𝑟𝑇(𝑙𝑜𝑛𝑔) = v h𝑇long − v h𝑇 (8)
而动作序列h𝑇long的虚拟价值v h𝑇long ,可以看做是执行做多动作的收益
𝑃𝑇-𝑃𝑇−1。将T之前所有交易日做多动作的虚拟遗憾值求和,得到T时刻的做多的累计
虚拟遗憾值𝑅𝑇(long):
𝑅𝑇 𝑙𝑜𝑛𝑔 = 𝑟𝑇 𝑙𝑜𝑛𝑔
𝑇
𝑡=1
(9)
累计虚拟遗憾值是对某一动作序列下某个决策“后悔”的总体反应,但是就像
人类会对很久之前的事情发生遗忘,越久远的虚拟遗憾值的时效性就越差。为此,
可以引入“遗忘系数”k(0<k<1),使距离当前时刻越远的虚拟遗憾值的权重越小。
累计虚拟遗憾值变为:
𝑅𝑇 𝑙𝑜𝑛𝑔 = 𝑘 ∙ 𝑅𝑇−1 𝑙𝑜𝑛𝑔 + 𝑟𝑇(𝑙𝑜𝑛𝑔) (10)
据(6)式遗憾匹配算法,可以给出预测的第T+1个交易日执行做多和做空动作
的概率:
𝜎𝑇+1 𝑙𝑜𝑛𝑔 =
𝑅𝑇 𝑙𝑜𝑛𝑔
𝑅𝑇 𝑙𝑜𝑛𝑔 + 𝑅𝑇 𝑠h𝑜𝑟𝑡
(11)
识别风险,发现价值 请务必阅读末页的免责声明
16 / 25
金融工程|专题报告
𝜎𝑇+1 𝑠h𝑜𝑟𝑡 =
𝑅𝑇 𝑠h𝑜𝑟𝑡
𝑅𝑇 𝑙𝑜𝑛𝑔 + 𝑅𝑇 𝑠h𝑜𝑟𝑡
(12)
可以看到,策略𝜎𝑇+1是在策略𝜎𝑇的基础上迭代计算出来的。一般地,初始化策
略𝜎1:𝜎1 𝑙𝑜𝑛𝑔 = ;𝜎1(𝑠h𝑜𝑟𝑡) = 。这样反复迭代,在每天收盘时更新出下一
天的策略,便可以得到执行做多和做空动作的概率。
考虑到量化择时需要给出多空信号,我们设定了两个在附近的阈值Gate1和
Gate2(Gate1>,Gate2<)。当σ 𝑙𝑜𝑛𝑔 上突破Gate1时,给出做多信号1,直
到有一天σ 𝑙𝑜𝑛𝑔 小于,给出平仓信号0;当σ 𝑙𝑜𝑛𝑔 下突破Gate2时,给出做空
信号-1,直到有一天σ 𝑙𝑜𝑛𝑔 大于,给出平仓信号0。阈值的设定可以减少噪声
的影响,提高信号的稳定性。
图11:根据策略产生择时信号的过程
资料来源:广发证券发展研究中心
(二)不同股指的实证
沪深300指数的实证
要将预测的上涨(即执行买入动作)概率σ 𝑙𝑜𝑛𝑔 转换为多空信号,首先需要确
定 阈 值 Gate1 和 Gate2 。 用 虚 拟 遗 憾 最 小 化 算 法 求 出 沪 深 300 指 数 在
之间每个交易日的σ 𝑙𝑜𝑛𝑔 ,通过对σ 𝑙𝑜𝑛𝑔 频数分布直方图
的直观观察,选择Gate1=,Gate2=。
识别风险,发现价值 请务必阅读末页的免责声明
17 / 25
金融工程|专题报告
图12:𝛔 𝒍𝒐𝒏𝒈 的频数分布直方图
数据来源:广发证券发展研究中心、wind资讯
算法的一个参数是“遗忘系数”k(0<k<1),将之间的累积
收益率作为样本内目标函数,求出样本内累积收益率最大时的k,最终选择k=
用于样本外预测。选取作为样本外,下面给出样本内和样本外
多空策略和纯做多策略的收益情况。
图13:样本内,虚拟遗憾最小化策略在沪深300指数多空、纯多择时收益
数据来源:广发证券发展研究中心、wind资讯
0
1000
2000
3000
4000
5000
6000
7000
-100%
0%
100%
200%
300%
400%
500%
累计收益率(多空) 累计收益率(纯多) 沪深300-收盘价
识别风险,发现价值 请务必阅读末页的免责声明
18 / 25
金融工程|专题报告
图14:样本外,虚拟遗憾最小化策略在沪深300指数多空、纯多择时收益
数据来源:广发证券发展研究中心、wind资讯
表 3: 样本外,虚拟遗憾最小化策略在沪深 300指数多空、纯做多择时结果
多空择时 纯做多择时
择时周期 2011-3-14至 2017-2-23 2011-3-14至 2017-2-23
择时次数 19 9
平均预测周期 38个交易日 34个交易日
累积收益率(复利) % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 10 4
错误次数 9 5
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 % %
数据来源:广发证券发展研究中心、wind资讯
从择时结果来看,风险收益情况良好。可以看到该策略的择时次数较少,平均
预测周期较长,适合中线择时。分析其中原因,与阈值Gate1和Gate2的取值有关:
阈值的差越大,上涨和下跌概率越难突破阈值,看多信号1和看空信号-1就产生的越
少。其实,预测的上涨概率σ 𝑙𝑜𝑛𝑔 和下跌概率σ 𝑠h𝑜𝑟𝑡 是虚拟遗憾在时间上累积
的反映,当虚拟遗憾在时间上累积的动量突破阈值时,就会触发多空信号,及时提
醒我们采取不同的策略以获得收益。
我们之前只是优化了遗忘系数k,而没有特意优化阈值的选择。之后策略的应用
中,仍保持阈值Gate1=,Gate2=不变。
0
1000
2000
3000
4000
5000
6000
-20%
0%
20%
40%
60%
80%
100%
120%
140%
累计收益率(多空) 累计收益率(纯多) hs300收盘价
识别风险,发现价值 请务必阅读末页的免责声明
19 / 25
金融工程|专题报告
上证指数的实证
使用上证指数2005-1-4至2011-1-31内的数据做虚拟遗憾最小化策略的样本内
优化,得到遗忘系数k=,将k用于样本外(2011-2-1至2017-3-16)的预测,结
果如下。
图15:样本外,虚拟遗憾最小化策略在上证指数多空、纯多择时收益
数据来源:广发证券发展研究中心、wind资讯
表 4: 样本外,虚拟遗憾最小化策略在上证指数多空、纯做多择时结果
多空择时 纯做多择时
择时周期 2011-2-1至 2017-3-16 2011-2-1至 2017-3-16
择时次数 95 49
平均预测周期 12个交易日 13个交易日
累积收益率(复利) % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 35 19
错误次数 60 30
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 % %
数据来源:广发证券发展研究中心、wind资讯
中证500指数的实证
使用中证500指数2005-1-4至2011-1-31内的数据做虚拟遗憾最小化策略的样本
0
1000
2000
3000
4000
5000
6000
-20%
0%
20%
40%
60%
80%
100%
120%
累计收益率(多空) 累计收益率(纯多) 收盘价(元)
识别风险,发现价值 请务必阅读末页的免责声明
20 / 25
金融工程|专题报告
内优化,得到遗忘系数k=,将k用于样本外(2011-2-1至2017-3-16)的预测,
结果如下。
图16:样本外,虚拟遗憾最小化策略在中证500指数多空、纯多择时收益
数据来源:广发证券发展研究中心、wind资讯
表 5: 样本外,虚拟遗憾最小化策略在中证 500指数多空、纯做多择时结果
多空择时 纯做多择时
择时周期 2011-2-1至 2017-3-16 2011-2-1至 2017-3-16
择时次数 99 50
平均预测周期 12个交易日 13个交易日
累积收益率(复利) % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 37 20
错误次数 62 30
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 % %
数据来源:广发证券发展研究中心、wind资讯
创业板指数的实证
使用创业板指数2010-6-1至2013-12-19内的数据做虚拟遗憾最小化策略的样本
内优化,得到遗忘系数k=,将k用于样本外(2013-12-20至2017-3-16)的预测,
结果如下。
0
2000
4000
6000
8000
10000
12000
14000
0%
50%
100%
150%
200%
250%
累计收益率(多空) 累计收益率(纯多) 收盘价(元)
识别风险,发现价值 请务必阅读末页的免责声明
21 / 25
金融工程|专题报告
图17:样本外,虚拟遗憾最小化策略在创业板指数多空、纯多择时收益
数据来源:广发证券发展研究中心、wind资讯
表 6: 样本外,虚拟遗憾最小化策略在创业板指数多空、纯做多择时结果
多空择时 纯做多择时
择时周期 2013-12-20至 2017-3-16 2013-12-20至 2017-3-16
择时次数 27 12
平均预测周期 21个交易日 23个交易日
累积收益率(复利) % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 9 4
错误次数 18 8
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 % %
数据来源:广发证券发展研究中心、wind资讯
中小板指数的实证
使用中小板指数2005-6-7至2011-3-24内的数据做虚拟遗憾最小化策略的样本
内优化,得到遗忘系数k=,将k用于样本外(2011-3-25至2017-3-16)的预测,
结果如下。
0
500
1000
1500
2000
2500
3000
3500
4000
4500
-50%
0%
50%
100%
150%
200%
250%
2013-12-20 2014-12-20 2015-12-20 2016-12-20
累计收益率(多空) 累计收益率(纯多) 收盘价(元)
识别风险,发现价值 请务必阅读末页的免责声明
22 / 25
金融工程|专题报告
图18:样本外,虚拟遗憾最小化策略在中小板指数多空、纯多择时收益
数据来源:广发证券发展研究中心、wind资讯
表 7: 样本外,虚拟遗憾最小化策略在中小板指数多空、纯做多择时结果
多空择时 纯做多择时
择时周期 2011-3-25至 2017-3-16 2011-3-25至 2017-3-16
择时次数 93 46
平均预测周期 12个交易日 12个交易日
累积收益率(复利) % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 27 13
错误次数 66 33
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 * %
数据来源:广发证券发展研究中心、wind资讯
可以看到,虚拟遗憾最小化策略在中小板指的择时应用上,收益率相比减少。
这是因为在以上所有指数的实证中,我们选取产生信号的阈值Gate1和Gate2是相同
的,分别是和。由于不同指数的波动率不同,致使σ 𝑙𝑜𝑛𝑔 的频数分布直
方图不同,在同相的阈值Gate1和Gate2下,择时信号变号的频率必然不同。具体而
言,波动率相对较高的指数,σ 𝑙𝑜𝑛𝑔 容易突破阈值而使择时信号改变。考虑到这
个因素,应该针对不同的指数设臵不同的阈值,以提高收益率。对波动率较大的指
数,应该扩大阈值之差,而对波动率较小的指数,应该缩小阈值之差。
0
2000
4000
6000
8000
10000
12000
14000
-20%
0%
20%
40%
60%
80%
100%
120%
累计收益(多空) 累计收益(纯多) 收盘价(元)
识别风险,发现价值 请务必阅读末页的免责声明
23 / 25
金融工程|专题报告
四、虚拟遗憾最小化在股指期货低频交易中的应用
众所周知,股指期货交易频率越高,策略对于交易成本的敏感性越强。自2015
年9月7日股指期货交易制度改革以来,沪深300股指期货流动性大幅度下降,买卖盘
挂单量减小,使得单笔交易成本成倍增加。由于中长线的交易策略单笔平均收益较
大,覆盖高交易成本后,仍有可观的收益。所以接下来我们给出虚拟遗憾最小化算
法在股指期货日频交易中的一个应用。
沪深300指数作为沪深300股指期货的标的,它的变化会立即在沪深300股指期货
当中得到反应,二者有很强的相关性。我们将之前沪深300股指的多空信号应用在
hs300股指期货的交易中,给出零交易费用、万二交易费用和千一交易费用下的收益
情况,结果如下。
图19: 虚拟遗憾最小化策略用于IF低频交易的累积收益率
数据来源:广发证券发展研究中心、wind资讯
表 8: 虚拟遗憾最小化策略在 IF 日频交易上的测算结果
零交易成本 双边万二 双边千一
交易周期 2010-12-1至 2017-2-23
交易次数 20次
平均持仓周期 39个交易日
累积收益率(复利) % % %
年化收益率 % % %
单次平均收益率 % %
判断正确率 55%
平均盈利率 % % %
平均亏损率 % % %
0
1000
2000
3000
4000
5000
6000
-20%
0%
20%
40%
60%
80%
100%
120%
零交易成本 双边万二 双边千一 if00cfe-收盘价
识别风险,发现价值 请务必阅读末页的免责声明
24 / 25
金融工程|专题报告
盈亏比
正确次数 11
错误次数 9
单次最大盈利 % % %
单次最大亏损 % % %
最大回撤率 % % %
数据来源:广发证券发展研究中心、wind资讯
五、总结
虚拟遗憾最小化是处理非完美信息、扩展式博弈的一种有效算法,本篇报告中,
我们假设把市场指数当做对手进行博弈,根据指数的历史数据(对手的历史动作序
列),以日为时间尺度,用虚拟遗憾最小化预测下一个交易日指数上涨、下跌的概
率,即执行做多、做空动作的概率,进而给出量化择时的多空信号。在实证中,本
篇报告将虚拟遗憾最小化算法用于沪深300指数、上证指数、中证500指数、创业板
指和中小板指,进行多空择时和纯做多择时,总体风险收益情况良好。随后,我们
将沪深300股指的多空信号应用在股指期货交易中,给出零交易费用、万二交易费用
和千一交易费用下的收益情况。在细节上需要注意的是,应根据不同指数波动率的
差异,选择相应产生信号的阈值。
风险提示
本篇报告仅作为将虚拟遗憾最小化应用于量化择时的讨论,不提供任何投资建
议。
识别风险,发现价值 请务必阅读末页的免责声明
25 / 25
金融工程|专题报告
Table_RatingIndus try 广发证券—行业投资评级说明
买入: 预期未来 12 个月内,股价表现强于大盘 10%以上。
持有: 预期未来 12 个月内,股价相对大盘的变动幅度介于-10%~+10%。
卖出: 预期未来 12 个月内,股价表现弱于大盘 10%以上。
Table_RatingCompany 广发证券—公司投资评级说明
买入: 预期未来 12 个月内,股价表现强于大盘 15%以上。
谨慎增持: 预期未来 12 个月内,股价表现强于大盘 5%-15%。
持有: 预期未来 12 个月内,股价相对大盘的变动幅度介于-5%~+5%。
卖出: 预期未来 12 个月内,股价表现弱于大盘 5%以上。
Table_Address 联系我们
广州市 深圳市 北京市 上海市
地址 广州市天河区林和西路 9
号耀中广场 A 座 1401
深圳福田区益田路 6001 号
太平金融大厦 31 层
北京市西城区月坛北街 2 号
月坛大厦 18 层
上海浦东新区世纪大道 8 号
国金中心一期 16 层
邮政编码 510620 518000 100045 200120
客服邮箱 gfyf@
服务热线
Table_Disclaimer 免责声明
广发证券股份有限公司(以下简称“广发证券”)具备证券投资咨询业务资格。本报告只发送给广发证券重点客户,不对外公开发布,
只有接收客户才可以使用,且对于接收客户而言具有相关保密义务。广发证券并不因相关人员通过其他途径收到或阅读本报告而视其为
广发证券的客户。本报告的内容、观点或建议并未考虑个别客户的特定状况,不应被视为对特定客户关于特定证券或金融工具的投资建
议。本报告发送给某客户是基于该客户被认为有能力独立评估投资风险、独立行使投资决策并独立承担相应风险。
本报告所载资料的来源及观点的出处皆被广发证券股份有限公司认为可靠,但广发证券不对其准确性或完整性做出任何保证。报告内容
仅供参考,报告中的信息或所表达观点不构成所涉证券买卖的出价或询价。广发证券不对因使用本报告的内容而引致的损失承担任何责
任,除非法律法规有明确规定。客户不应以本报告取代其独立判断或仅根据本报告做出决策。
广发证券可发出其它与本报告所载信息不一致及有不同结论的报告。本报告反映研究人员的不同观点、见解及分析方法,并不代表广发
证券或其附属机构的立场。报告所载资料、意见及推测仅反映研究人员于发出本报告当日的判断,可随时更改且不予通告。
本报告旨在发送给广发证券的特定客户及其它专业人士。未经广发证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊
登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。