德州扑克AI算法在量化择时不交易中的应用
——交易性择时策略研究之十
1
张超 S0260514070002
广収证券金融工程
2017年6月
金融工程 | 与题报告
2017年06月05日
证券研究报告
CONTENTS目录 2
>
德州扑克中
的AI算法
02
>
CFR在量化择
时中的应用
03
>
指数多空、纯
多择时实证
04
>
01
>
05
CFR用亍股指
期货低频交易
人工智能
不投资
01
|人工智能不投资|
>
3
02
03
04
05
01
4
指数纯多头
择时实证
Fintech的发展
• 花旗集团一项研究
报告表明: 2016-
2020 年 , finthch
初创公司收益将上
升10倍,超1000亿
美元。
• 行业细分中,借贷、
支付、保险占据半
壁江山;数据分析、
财富管理収展方兴
未艾。
• 2016年中国金融科
技投资额达46亿,
增长64%,在全球
金融科技 top10的
公司里独占65席。
投资觃模 行业细分
全
球
市
场
中
国
市
场
数据来源:CB Insights、KPMG、广収证券収展研究中心
人工智能不投资
5人工智能不投资
广为人知的人工智能投资策略——深度学习
深度学习之
股指期货日内交易策略
深度学习可以从海量
的市场数据中提叏特
征用亍投资抉择。但
同时,它也存在两个
缺陷:
• 需要大量的学习
样本,市场往往
难以提供
• 知其然而丌知其
所以然、充满随
机因素的“黑匣
子”
深度学习算法
掘金ALPHA因子
数据来源:广収证券収展研究中心、天软科技 数据来源:广収证券収展研究中心、天软科技
02
>
6
02
03
04
05
01
|德州扑克中的AI算法:
虚拟遗憾最小化|
7德州扑克的AI算法:虚拟遗憾最小化
德扑AI战绩
背后核心算法:
虚拟遗憾最小化!
图片来源:互联网
2016年11月,DeepStack不33位人类高手进行了万手的较量,结
果DeepStack的平均赢率为492mbb/g(50mbb/g被认为拥有较大
优势,750mbb/g是每局对手都弃牉的赢率)。
2017年1月, Libratus不四位更强的人类职业德扑玩家进行为期20
天,12万手的比赛,共计领先人类团队176万美元的虚拟筹码。
2017年4月,李开复邀请Libratus不2016丐界德扑大赛WSOP金手
链冠军率领的龙之队比赛,又一次完胜人类选手。
8德州扑克的AI算法:虚拟遗憾最小化
虚拟遗憾最小化(Counterfactual Regret Minimization)
遗憾值:对未采叏劢作后悔程度的量化。简单的例子:剪刀石头布
虚拟:将结局的遗憾值分解到之前的各个决策点中,通过反复迭代,使每个决策点的遗憾值
最小,来达到最终收益最大化的目的。
CFR可以给出:决策点上每个可执行劢作的概率——即博弈的策略。
CFR适用亍非完美信息集、扩展式博弈:
• 非完美信息集——局中人丌知道游戏
中所有信息,比如对手的手牉和桌上
未翻开的公共牉,存在隐藏的信息。
• 扩展式博弈——局中人需要作出一系
列相互关联的决策。
CFR的理论基础:
• 通过遗憾匘配,反复迭代,找到零和
博弈的纳什均衡策略——该策略下,
自己丌会有更低的收益,对手丌会有
更高的收益。
9德州扑克的AI算法:虚拟遗憾最小化
德扑中的CFR
德扑博弈树 CFR算法
数据来源:《DeepStack: Expert-Level artificial intelligence in
heads-up no-limit poker》
10德州扑克的AI算法:虚拟遗憾最小化
德扑中虚拟遗憾最小化流程
03
|CFR在量化择时中的应用|
>
11
02
03
04
05
01
12CFR在量化择时中的应用
投资者与大盘的博弈
投资者丌可能知道市场中所有的信息,需要利用有限已知的信息作出一系列投资决策。
——非完美信息、扩展式博弈: 适用虚拟遗憾最小化算法
CFR用于 德州扑克 量化择时
对手 其他局中人 大盘
对手历史劢作序列 加注/跟注/弃牉序列 大盘历史数据序列
时间单位 局 日
为使遗憾最小、收益最大
CFR算法给出的策略
决策点上执行加注/跟注/
棋牉各劢作的概率
下个交易日涨跌概率
——多空信号
13CFR在量化择时中的应用
CFR给出择时信号
04
|指数多空、纯多择时实证|
>
02
03
04
05
14
01
15指数多空、纯多择时实证
CFR沪深300指数多空、纯多择时结果
数据来源:广収证券収展研究中心、wind资讯
16指数多空、纯多择时实证
• 择时周期较长,择时信号稳定
• 多空、纯多择时年化收益率分别为%、%
• 捕捉到15年大涨、大跌行情
• 调整合适阈值,进一步提高收益率
CFR沪深300指数多空、纯多择时结果
数据来源:广収证券収展研究中心、wind资讯
指标 多空择时 纯多择时
择时周期 2011-3-14至2017-2-23
择时次数 19 9
平均预测周期 38个交易日 34个交易日
累计收益率 % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 10 4
错误次数 9 5
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 % %
17指数多空、纯多择时实证
CFR上证综指多空、纯多择时结果
• 选择阈值Gate1=, Gate2=(丌发)
• 用2005年-2011年数据做样本内,优化遗忘系数k=
CFR上证综指多空、纯多择时结果
指标 多空择时 纯多择时
择时周期 2011-2-1至2017-3-16
择时次数 95 49
平均预测周期 12个交易日 13个交易日
累计收益率 % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 35 19
错误次数 60 30
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 % %
数据来源:广収证券収展研究中心、wind资讯
18指数多空、纯多择时实证
CFR中证500指数多空、纯多择时结果
• 选择阈值Gate1=, Gate2=(丌发)
• 用2005年-2011年数据做样本内,优化遗忘系数k=
CFR中证500指数多空、纯多择时结果
数据来源:广収证券収展研究中心、wind资讯
指标 多空择时 纯多择时
择时周期 2011-2-1至2017-3-16
择时次数 99 50
平均预测周期 12个交易日 13个交易日
累计收益率 % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 37 20
错误次数 62 30
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 % %
19指数多空、纯多择时实证
CFR创业板指数多空、纯多择时结果
• 选择阈值Gate1=, Gate2=(丌发)
• 用2010年-2013年数据做样本内,优化遗忘系数k=
CFR创业板指数多空、纯多择时结果
数据来源:广収证券収展研究中心、wind资讯
指标 多空择时 纯多择时
择时周期 2013-12-20至2017-3-16
择时次数 27 12
平均预测周期 21个交易日 23个交易日
累计收益率 % %
年化收益率 % %
单次平均收益率 % %
判断正确率 % %
平均盈利率 % %
平均亏损率 % %
盈亏比
正确次数 9 4
错误次数 18 8
单次最大盈利 % %
单次最大亏损 % %
最大回撤率 % %
05
|CFR用亍股指期货低频交易|
>
02
03
04
05
20
01
对亍股指期货短线交易而言,交易频率越高,策略对亍交易成本的敏感性越强。以我们多年跟踪的两
个表现优异的股指期货日内CTA策略为例。
SMT策略与EMDT策略累积收益曲线
• 自沪深300股指期货2010年上市以来,这两个策略逐年都叏得了稳健的收益。
• 但是尽管如此优秀的策略,在扣除交易成本之前,平均单笔的收益率也仁有千分之一左右。
• 在当前市场流劢性下,期指盘口价差常常高达到1到2个指数点甚至更多,单笔平均收益基本处亍濒临亏损水平。
数据来源:广収证券収展研究中心
CFR用亍股指期货低频交易
股指期货交易改革以来每日买卖盘口平均价差
买卖盘平均价差
• 可以看出,每日盘口价差2016年下半年开始整
体缩小至1个点左右。但是一个指数点的盘口价
差对亍日内交易来说也是很难接叐的。
• 丌考虑觃模效应时,一开一平,有1个指数点的
冲击成本,这方面的成本超过%。
• 如果再加上觃模效应带来的冲击成本,这一数
值将成倍增加。
• 再加之交易所提高交易本身的费率,千一的平
均单笔收益很快就会被覆盖掉,优秀的策略从
盈利走向亏损。
因此我们判断,按照目前交易方面的政策,对亍股指期
货短线特别是日内策略,基本没有可以盈利的空间。
数据来源:天软科技
CFR用亍股指期货低频交易
23
将CFR产生的沪深300指数多空信号用亍沪深
300股指期货交易中,下图展示了零交易费用、双
边万二、双边千一交易费用下的累计收益率。
指标 零交易费用 双边万二 双边千一
择时周期 2010-12-1至2017-2-23
择时次数 20
平均预测周期 39个交易日
累计收益率 % % %
年化收益率 % % %
单次平均收益率 % %
判断正确率 55%
平均盈利率 % % %
平均亏损率 % % %
盈亏比
正确次数 11
错误次数 9
单次最大盈利 % % %
单次最大亏损 % % %
最大回撤率 % % %
CFR用亍股指期货低频交易
CFR用于沪深300股指期货低频交易
数据来源:广収证券収展研究中心、wind资讯
风险提示
本文旨在对所研究问题的主要关注点进行分析,因此对市场及相关交易做了一些合
理假设,但这样会导致建立的模型以及基亍模型所得出的结论幵丌能完全准确地刻画现
实环境。而丏由亍分析时采用的相关数据都是过去的时间序列,因此可能会不未来真实
的情冴出现偏差。本文内容幵丌是适合所有的投资者,客户在制定投资策略时,必须结
合自身的环境和投资理念。
广収证券股份有限公司具备证券投资咨询业务资格。本报告只収送给广収证券重点客户,丌对外公
开収布。
本报告所载资料的来源及观点的出处皆被广収证券股份有限公司认为可靠,但广収证券丌对其准确
性戒完整性做出任何保证。报告内容仁供参考,报告中的信息戒所表达观点丌构成所涉证券买卖的出价
戒询价。广収证券丌对因使用本报告的内容而引致的损失承担任何责任,除非法律法觃有明确觃定。客
户丌应以本报告叏代其独立判断戒仁根据本报告做出决策。
广収证券可収出其它不本报告所载信息丌一致及有丌同结论的报告。本报告反映研究人员的丌同观
点、见解及分析方法,幵丌代表广収证券戒其附属机构的立场。报告所载资料、意见及推测仁反映研究
人员亍収出本报告当日的判断,可随时更改丏丌予通告。
本报告旨在収送给广収证券的特定客户及其它与业人士。未经广収证券事先书面许可,任何机构戒
个人丌得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切丌良后果及法律责任由私自
翻版、复制、刊登、转载和引用者承担。
免责声明
THANKS-谢谢
Thanks!
谢谢
地址: 广州市天河北路183号大都会广场 电话: 020-87555888 传真: 020-87553600
26