目录索引
一、引言 .........................................................................................................................................5
(一)传统多因子研究 ........................................................................................................5
(二)羊群效应 ....................................................................................................................8
二、因子构建 .................................................................................................................................9
三、实证分析 ...............................................................................................................................10
(一)数据说明 ..................................................................................................................10
(二)策略构建 ..................................................................................................................10
(三)实证分析—全市场选股 ..........................................................................................10
(四)实证分析—中证800 内选股 ...................................................................................14
(五)实证分析—中证500 内选股 ...................................................................................17
(六)实证分析—沪深300 选股 .......................................................................................20
四、因子进一步处理和分析 .......................................................................................................23
(一)因子处理 ..................................................................................................................23
(二)处理后因子分板块表现 ..........................................................................................24
(三)行业中性后分板块表现 ..........................................................................................35
五、总结 .......................................................................................................................................41
六、风险提示 ...............................................................................................................................41
图表索引
图 1:广发金融工程多因子选股框架一览 .....................................................................5
图 2:广发金融工程多因子选股平台一览 .....................................................................5
图 3:广发金融工程多因子选股平台框架一览 .............................................................6
图 4:全市场三个月股价反转因子历史多空收益率表现一览 ......................................6
图 5:全市场三个月股价反转因子IC 表现一览 .............................................................7
图 6:全市场流通市值因子历史多空收益率表现一览 .................................................7
图 7:全市场流通市值因子IC 表现一览 ........................................................................7
图 8: 全市场选股IC 值走势一览 ...................................................................................11
图 9:全市场分组回测结果 ...........................................................................................12
图 10:全市场选股-对冲中证 500 指数策略净值走势表现一览 .................................13
图 11:中证800 内选股IC 值走势一览 ..........................................................................14
图 12:中证800 内分组回测结果 ..................................................................................15
图 13:中证800 内选股-对冲中证800 指数策略净值走势表现一览 ..........................16
图 14:中证500 内选股IC 值走势一览 .........................................................................17
图 15:中证500 内分组回测结果 ..................................................................................18
图 16:中证500 内选股-对冲中证 500 指数策略净值走势表现一览 ..........................19
图 17:沪深300 内选股IC 值走势一览 .........................................................................20
图 18:沪深300 内分组回测结果 ..................................................................................21
图 19:沪深300 内选股-对冲沪深 300 指数策略净值走势表现一览 ..........................22
图 20:处理后因子-全市场内选股 IC 值走势一览 .......................................................24
图 21:处理后因子-全市场选股-对冲中证500 指数策略净值走势表现一览 ............26
图 22:处理后因子-中证800 内选股-IC 值走势一览 ...................................................27
图 23:处理后因子-中证800 内选股-对冲中证800 指数策略净值走势 .....................28
图 24:处理后因子-中证500 内选股IC 值走势一览 ....................................................29
图 25:处理后因子-中证500 内选股-对冲中证500 指数策略净值走势 .....................31
图 26:处理后因子-沪深300 内选股IC 值走势一览 ....................................................32
图 27:处理后因子-沪深300 内选股-对冲沪深300 指数策略净值走势 .....................33
图 28:行业中性-全市场选股-对冲中证500 指数策略净值走势 ................................35
图 29:行业中性-中证800 内选股-对冲中证800 指数策略净值走势 .........................37
图 30:行业中性-中证500 内选股-对冲中证500 指数策略净值走势 .........................38
图 31:行业中性-沪深300 内选股-对冲沪深300 指数策略净值走势 .........................40
表 1:广发金融工程大数据研究报告一览 ....................................................................8
表 2: 全市场选股 IC-表现 ............................................................................................11
表 3:全市场选股-IC 分年度表现一览 .......................................................................11
表 4:全市场选股-分年度换手率统计 ........................................................................12
表 5:全市场多头-对冲分年度表现一览 ....................................................................13
表 6:中证 800 内选股 IC-表现 ....................................................................................14
表 7:中证 800 内选股-IC 分年度表现一览 ................................................................14
表 8:中证 800 内选股-分年度换手率统计 .................................................................15
表 9:中证 800 多头-对冲分年度表现一览 .................................................................16
表 10:中证 500 内选股 IC-表现 ..................................................................................17
表 11:中证 500 内选股-IC 分年度表现一览 ..............................................................17
表 12:中证 500 内选股-分年度换手率统计 ...............................................................18
表 13:中证 500 内多头-对冲分年度表现一览 ...........................................................19
表 14: 沪深 300 内选股 IC-表现 ...................................................................................20
表 15:沪深 300 内选股-IC 分年度表现一览 ..............................................................20
表 16:沪深 300 内选股-分年度换手率统计 ...............................................................21
表 17:沪深 300 内多头-对冲分年度表现一览 ...........................................................22
表 18:处理后因子选股 IC-表现 ..................................................................................23
表 19:各板块对冲策略结果表现一览 ........................................................................24
表 20: 处理后因子—全市场选股 IC-表现 ..................................................................24
表 21:处理后因子-全市场选股-IC 分年度表现一览 ................................................25
表 22:处理后因子-全市场选股-分年度换手率统计 ..................................................25
表 23:处理后因子-全市场多头-对冲分年度表现一览 ..............................................26
表 24:处理后因子-中证 800 内选股 IC-表现 ............................................................27
表 25:处理后因子-中证 800 内选股-IC 分年度表现一览 .........................................27
表 26:处理后因子-中证 800 内选股-分年度换手率统计 ..........................................28
表 27:处理后因子-中证 800 多头-对冲分年度表现一览 ..........................................29
表 28:处理后因子-中证 500 内选股 IC-表现 ............................................................29
表 29:处理后因子-中证 500 内选股-IC 分年度表现一览 .........................................30
表 30:处理后因子-中证 500 内选股-分年度换手率统计 ..........................................30
表 31:处理后因子-中证 500 内多头-对冲分年度表现一览 ......................................31
表 32: 处理后因子-沪深 300 内选股 IC-表现 .............................................................32
表 33:处理后因子-沪深 300 内选股-IC 分年度表现一览 .........................................32
表 34:处理后因子-沪深 300 内选股-分年度换手率统计 ..........................................33
表 35:处理后因子-沪深 300 内多头-对冲分年度表现一览 ......................................34
表 36:处理后因子选股且行业中性-换手率统计 .......................................................34
表 37:行业中性后各板块对冲策略结果表现一览 ....................................................34
表 38:行业中性-全市场选股-分年度换手率统计 ......................................................35
表 39:行业中性-全市场多头-对冲分年度表现一览 ..................................................36
表 40:行业中性-中证 800 内选股-分年度换手率统计 ..............................................36
表 41:行业中性-中证 800 多头-对冲分年度表现一览 ..............................................37
表 42:行业中性-中证 500 内选股-分年度换手率统计 ..............................................38
表 43:行业中性-中证 500 内多头-对冲分年度表现一览 ..........................................39
表 44:行业中性-沪深 300 内选股-分年度换手率统计 ..............................................39
表 45:行业中性-沪深 300 内多头-对冲分年度表现一览 ..........................................40
一、引言
(一)传统多因子研究
传统的多因子选股策略在国内市场上广泛应用,在过去几年中传统的多因子选
股策略在实际运作中取得了较为稳定的超额收益率。在国内市场中,传统的多因子
选股框架中,从2007年至今较为有效的因子主要是反转类以及市值类的因子。在传
统的多因子研究框架中,对因子的挖掘主要集中于上市公司财务报表、分析师预期
相关数据以及相对频率较低的价量数据(如开盘价、收盘价、成交额等日频、周频
相关的数据维度),调仓的频率也往往集中于月度频率等相对低频的调仓频率。
图 1:广发金融工程多因子选股框架一览
数据来源:
图 2:广发金融工程多因子选股平台一览
数据来源:
图 3:广发金融工程多因子选股平台框架一览
数据来源:
随着国内市场中对传统多因子选股的应用越来越广泛,以往有效的因子逐渐失效,
而且对中低频率价量相关的数据以及财务报表等数据的因子挖掘已经逐渐饱和,已有
的数据维度上增量价值信息有限,很难再在当前维度的数据中挖掘出持续有效的新维
度的因子,对新的因子的挖掘提出了迫切的需求。同时,在国内市场中,由于小市值
效应的长期较为显著的影响,传统的多因子选股策略往往受其影响,如在 2017年,
市场的风格较以往几年发生了急剧的变化,风格上主要集中于价值蓝筹类个股,传统
的反转类、市值类等因子指标失效,市场上的传统多因子选股策略产品经历了较大的
回撤。
图 4:全市场三个月股价反转因子历史多空收益率表现一览
数据来源:
图 5:全市场三个月股价反转因子IC表现一览
数据来源:
图 6:全市场流通市值因子历史多空收益率表现一览
数据来源:
图 7:全市场流通市值因子IC表现一览
数据来源:
传统的多因子选股框架在因子指标维度上需要进一步丰富和扩展,挖掘出新的
有效的因子指标,从当前可切入的数据维度上看,新的因子指标的挖掘主要集中在
两大方向,一块为对另类数据的因子指标挖掘,如对股吧、社交媒体、搜索引擎、
新闻等另类数据的挖掘,关于另类数据在市场的应用,可以参考广发证券金融工程
相关的系列研究成果;第二块为对高频价量相关的数据的因子指标挖掘,如对个股
日内盘口数据、日内分钟、秒钟等级别的价量数据的因子挖掘。本篇专题报告将从
第二个方向的角度出发,利用个股日内高频的相关数据进行因子指标的挖掘研究。
本篇专题报告是关于高频数据因子研究的第三篇,之前两篇请见《基于日内高频数
据的短周期选股因子研究-高频数据因子研究系列一》、《基于日内高频数据的短周
期选股因子研究-高频数据因子研究系列二》
表 1:广发金融工程大数据研究报告一览
基于网络新闻热度的择时策略—互联网大数据挖掘系列之一
公告披露背后隐藏的投资机会—互联网大数据挖掘系列之二
倾听股吧之声,洞察大盘趋势—互联网大数据挖掘系列之三
那些年一起追过的财经小编选股策略—互联网财经频道文本挖掘策略
基于互联网挖掘的热点选股策略—互联网大数据挖掘系列之五
基于大数据挖掘的关联个股投资机会—互联网大数据挖掘系列之六
基于大数据挖掘的Smart Beta策略—互联网大数据挖掘系列之七 多
维数据下的大数据择时策略研究—互联网大数据挖掘系列之八 基
于大数据挖掘的概念轮动策略—互联网大数据挖掘系列之九
基于大数据挖掘的行业轮动策略—互联网大数据挖掘系列之十
基于舆情的资产配置模型—互联网大数据挖掘系列之十一
基于网络舆情的指数轮动策略研究—互联网大数据挖掘系列之十二
基于网络舆情再探指数轮动策略—互联网大数据挖掘系列之十三 数
据来源:
(二)羊群效应
无论是国外还是国内,投资者的投资行为一直是学术界及实业界热门研究的领
域之一。而投资者的羊群行为,在行为金融学领域,一直是其中研究的一个热点。
羊群行为通常被定义为投资者对他人行为的模仿。Devenow and Welch (1996)提出造
成这一现象的原因有三点。第一个原因来源于报酬的外部性,指一个行为带来的回
报随着实施这一行为的人数增加而增加。例如,投资者倾向于同时交易,这样能为
他们带来更好的流动性。第二个原因来自于声誉问题和与委托代理理论。当一个基
金经理人的业绩是相对于一个基准来评估时,例如,通过使用其他经理人的平均业
绩或市场/行业指数的业绩评价该经理人的绩效,那么该经理人更加倾向于模仿这个
基准的做法。虽然这样做会使得经理人丧失比平均水平表现的更好的潜力,但却能
够防止由于相对表现较差而带来的损失。第三个原因是信息的外部性,指投资者通
过观察其他投资人的行为来获取信息。这种外部性可能非常强,以至于投资者甚至
会忽略自己的信息而依赖这种噪音信息。
对于羊群行为的的研究一直是行为金融界的热点,Lakonishok、Shleifer和
Vishny(1992)提供了一种测量投资者群体间相关联交易行为的模型。这个模型(LSV
模型)的基本思想是量化投资者对特定资产的买卖压力。就整个市场而言,买单和
卖单是保持平衡的。然而,对于一个特定的投资者群体以及一个特定的资产,可能
有一个超额的买单或卖单,这也就是羊群行为。
羊群行为的存在对市场有效假说提出了挑战,市场有效假说认为所有投资者都
是理性的,并且有着相同的信息集,因此可以形成一致的股价预期,市场上的股票
价格能够真实的反映股票的内在价值。但是羊群行为的投资不一定是理性的。投资
者不是通过对于公司的理性分析,而是通过观察和跟踪其他投资者的行为来进行投
资,即不是所有的市场参与者都完全知情,因此羊群行为可能会使得股票价格偏离
其基本面,从而影响股票的实际价值。
Tan, Chiang, Mason (2008)等人的研究表明羊群行为会增加市场波动性和套利机
会。羊群行为可能还会影响股票的价格变动过程,根据Grinblatt (1995)和Wermers
(1999)等人的研究结果,羊群行为有利于信息的快速传递,从而使得股价能够随着
信息快速变化,有助于价格发现过程。通常认为,短期羊群效应会伴随着价格的反
转,即当出现买入(卖出)羊群行为时,未来股价可能会下跌(上涨)。同时,买
入(卖出)效应越强烈,未来价格下跌(上涨)的幅度越大,即未来价格变动和羊
群行为的剧烈程度相关。国内学者朱菲菲、李惠璇(2019)等人将“交易单规模”引
入LSV模型中,实证分析了国内股票市场买入和卖出羊群行为发生的频率及相关的
特征行为。本专题报告基于个股在日内交易明细数据构建基于羊群效应下的因子并
研究该因子在不同市场板块上的有效性及策略表现结果。
二、因子构建
根据Lakonishok和Christoffersen等人的研究,羊群行为度量为
�(�, �)
�(�, �) = |
�(�, �) + �(�, �)
− �� | − ��(�, �)
其中B(i,T)代表在特定时间时间段(小时,天,周)内对于某只股票的买方驱动
单的数量,S(i,T)代表特定时间段卖方驱动单的数量。��为在该特定时间段内,所有
股票的买单占其交易单比例的在横截面上平均值,即绝对值中的项代表了特定股票
买单比例的相对水平。其中AF(i,T)是调整项,其表达式为
��,�
��(�, �) = ∑ (
��,� ) �� (1
− �
)��,�− |
��
− � |
� � �
�=0
��,�
�
它假设投资者独立交易的情况下,个股买单比例相对平均水平的期望值。在该
假设下,买方驱动单服从二项分布,B(i,T) ~B(��,� , �),其中��,� = �(�, �) + �(�,
�)。根据个股买单比例的相对平均水平的值为正或者负,将羊群行为划分成买入羊
群行为HB(i,T)和卖出羊群行为HS(i,T),其表达式如下所示
�(�, �)
��(�, �) = −�(�, �) ��
�(�, �) + �(�, �)
> ��
�(�, �)
��(�, �) = �(�, �) ��
�(�, �) + �(�, �)
< ��
为了计算在特定时间内的买单量和卖单量,本文使用天软数据库的划分标准。
其高频数据库提供的是每5秒合成的交易数据(上海交易所)和每3秒合成的交易数
据(深圳交易所)。本篇专题报告通过如下算法识别个股每笔买卖方向,具体如下:
(1) 、如果当前时刻股票成交价大于之前一笔(5s或3s前)的买一价,则被定义为
买方驱动单;
(2) 、如果当前时刻股票成交价小于之前一笔的卖一价则被定义为卖方驱动单;
(3) 、如果当前时刻股票成交价等于之前一笔的成交价,则被分为第三类驱动单。
当统计在一段时间内的买方和卖方驱动单时,买方B(i,T)=买方驱动单+第三类驱动单
/2,卖方S(i,T)=卖方驱动单+第三类驱动单/2。
三、实证分析
(一)数据说明
样本区间:2007年1月1日至今
样本范围:全市场、中证800指数成分股、中证500指数成分股及沪深300指数
成分股
数据频率:个股每个交易日买卖单数量以及行情数据
(二)策略构建
实证区间:2007年1月1日至今
选股范围:全市场,剔除上市不满一年的股票,剔除ST股票,剔除交易日停牌
和当日涨跌停的股票
分档方式:根据当期个股计算的HB(i,T)和HS(i,T)作为因子值,从小到大分成10
档
调仓周期:周频换仓,Q1档为因子值最大的,Q10档为因子值最小的。
股票权重:在非行业中性的情况下,策略中股票的权重按照等权处理
(三)实证分析—全市场选股
12期滚动均值IC值
%
%
%
%
%
%
%
%
%
表 2: 全市场选股IC-表现
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
全市场 %
数据来源: 、天软、
图 8: 全市场选股IC值走势一览
数据来源: 、天软、
表 3:全市场选股-IC分年度表现一览
分年度统计 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
2007 %
2008 %
2009 %
2010 %
2011 %
2012 %
2013 %
2014 %
2015 %
2016 %
2017 %
2018 %
2019 %
2020 至今 %
数据来源: 、天软、
从表2、表3以及图8的结果可以看出,因子指标从2007年开始至今因子的IC均值
为,标准差为,在周频调仓的情况下,正IC占比为%。滚动12期 IC
的均值也基本上处以零以上的位置,分年度统计中,多数年份的IC均值为正,且多
数年份正IC占比在60%以上, 2009年正IC占比较高,为% 。
表 4:全市场选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
All
数据来源: 、天软、
图 9:全市场分组回测结果
数据来源: 、天软、
全市场所有股票在横截面上根据因子值分成10组,分别构建投资组合,股票权
重按照等权重分配,从图9结果可以看出,策略分档收益在回测期内单调性明显,即
因子值对个股收益率区分度明显。
90
80
70
60
50
40
30
20
10
0
q10q9q8q7q6q5q4q3q2q1
90
80
70
60
50
40
30
20
10
0
超额净值策略净值中证500
图 10:全市场选股-对冲中证500指数策略净值走势表现一览
数据来源: 、天软、
表 5:全市场多头-对冲分年度表现一览
多头 多头对冲中证 500 指数
年度
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
从表5的结果中可以看出,多头组合策略整体的年化收益率%,多头组合
相对中证500指数在回测中取得了年化%的收益率,信息比率为,策略的
最大回撤为%。
(四)实证分析—中证 800 内选股
表 6:中证800内选股IC-表现
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
中证 800 %
数据来源: 、天软、
图 11:中证800内选股IC值走势一览
数据来源: 、天软、
表 7:中证800内选股-IC分年度表现一览
分年度统计 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
2007 %
2008 %
2009 %
2010 %
2011 %
2012 %
2013 %
2014 %
2015 %
2016 %
2017 %
2018 %
2019 %
2020 至今 %
数据来源: 、天软、
从表6、表7以及图11的结果可以看出,因子指标从2007年至今的IC均值为,标
准差为,在周频调仓的情况下,正IC占比为%。滚动12期IC的均值也 基本
上处以零以上的位置,分年度统计中,多数年份的IC均值为正,且多数年份正 IC占比
在60%以上, 2009年正IC占比较高,为%
12期滚动均值IC值
%
%
%
%
%
%
%
%
%
%
%
30
25
20
15
10
5
0
q10q9q8q7q6q5q4q3q2q1
表 8:中证800内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
All
数据来源: 、天软、
图 12:中证800内分组回测结果
数据来源:Wnd、天软、
30
25
20
15
10
5
0
超额净值策略净值中证800
图 13:中证800内选股-对冲中证800指数策略净值走势表现一览
数据来源: 、天软、
表 9:中证800多头-对冲分年度表现一览
多头 多头对冲中证 800 指数
年度
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
从图12的结果可以看出,在中证800股票池中,因子收益随着因子值的下降单
调递减。从表9的结果中可以看出,多头组合策略整体的年化收益率%,多头
组合相对中证800指数在回测中取得了年化%的收益率,信息比率为,策
略的最大回撤%。
(五)实证分析—中证 500 内选股
表 10:中证500内选股IC-表现
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
中证 500 %
数据来源: 、天软、
图 14:中证500内选股IC值走势一览
数据来源: 、天软,
表 11:中证500内选股-IC分年度表现一览
分年度统计 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
2007 %
2008 %
2009 %
2010 %
2011 %
2012 %
2013 %
2014 %
2015 %
2016 %
2017 %
2018 %
2019 %
2020 至今 %
数据来源: 、天软、
从表10、表11以及图14的结果可以看出,因子指标从2007年至今的IC均值为
,高于在全市场和中证800内选股的结果。标准差为,在周频调仓的情况
下,正IC占比为%。滚动12期IC的均值在近些年位于0轴附近波动。分年度统
计中,多数年份的IC均值为正,且多数年份正IC占比在60%以上, 2009年正IC占比
12期滚动均值IC值
%
%
%
%
%
%
%
45
40
35
30
25
20
15
10
5
0
q10q9q8q7q6q5q4q3q2q1
较高,为% 。
表 12:中证500内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计值(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
All
数据来源: 、天软、
图 15:中证500内分组回测结果
数据来源: 、天软、
45
40
35
30
25
20
15
10
5
0
超额净值策略净值中证500
图 16:中证500内选股-对冲中证500指数策略净值走势表现一览
数据来源: 、天软、
表 13:中证500内多头-对冲分年度表现一览
年化收益
年度
累计收益
多头
年化 最大回撤 信息比率 年化收益
多头对冲中证 500 指数 累
计收益 年化 最大回撤 信息比率
(%) (%) 波动率(%) (%) (%) (%) 波动率(%) (%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今 29
ALL
数据来源: 、天软、
从图15的结果可以看出,在中证500股票池中,因子收益随着因子值的下降单 调
递减。从表13的结果中可以看出,多头组合策略整体的年化收益率%,多头组合
相对中证500指数在回测中取得了年化%的收益率,信息比率为,策略的最
大回撤%。整体上看,在中证500内的选股结果比中证800内略微提升。
12期滚动均值IC值
%
%
%
%
%
%
%
(六)实证分析—沪深 300 选股
表 14: 沪深300内选股IC-表现
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
沪深 300 %
数据来源: 、天软、
图 17:沪深300内选股IC值走势一览
数据来源: 、天软、
表 15:沪深300内选股-IC分年度表现一览
分年度统计 IC 均值 I
C
标准差 I
C
最大值 IC 最小值 负 IC 占比
2007 %
2008 %
2009 %
2010 %
2011 %
2012 %
2013 %
2014 %
2015 %
2016 %
2017 %
2018 %
2019 %
2020 至今 %
数据来源: 、天软、
从表14、表15以及图17的结果可以看出,因子指标从2007至今的IC均值为,标
准差为,在周频调仓的情况下,正IC占比为%。滚动12期IC的均值大 部分
时间都在零轴附近波动。分年度统计中,半数以上的年份IC值为正。半数左右 年份的
正IC占比在50%以上, 2007年正IC占最高,为% 。
表 16:沪深300内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计值(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
All
数据来源: 、天软、
图 18:沪深300内分组回测结果
数据来源: 、天软、
14
12
10
8
6
4
2
0
q10q9q8q7q6q5q4q3q2q1
14
12
10
8
6
4
2
0
超额净值策略净值沪深300
图 19:沪深300内选股-对冲沪深300指数策略净值走势表现一览
数据来源: 、天软、
表 17:沪深300内多头-对冲分年度表现一览
多头 多头对冲沪深 300 指数
年化收益 累计收益 年化 最大回撤 年化收益 累计收益 年化 最大回撤
年度
(%) (%) 波动率(%) (%)
信息比率
(%) (%) 波动率(%% (%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
从图18中的结果可以看出,在沪深300股票池中,将股票按照因子值分成10组 分
别构建投资组合,各组收益没有较为明显的区分,部分组合存在收益大致相近的情况,
说明在该股票池中,因子区分度不高。从表17的结果中可以看出,多头组合策略整体
的年化收益率%,多头组合相对沪深300指数的年化收益率为%,
信息比率为,策略的最大回撤%。
四、因子进一步处理和分析
(一)因子处理
去极值
采用MAD法对异常的数据进行剔除。MAD法是针对均值标准差方法的改进,样
本均值用样本中位数代替,样本标准差用样本MAD(Median Absolute Deviation)代
替。
�� = ������{�� , � = 1,2,3 … , �}
��� = ������(|�� − ��|), � = 1,2,3, … , �
���� = × ���
采用与3σ法等价的方法,将数据中偏离中位数超过3倍����的值,替换为对应
的值,这样去除了极值的同时也将极值的股票之间保序。
中性化
将原始因子值和股票的市值以及行业进行回归,取残差项作为新因子
�(�, �) = �0 + �1����(�, �) + �2��������(�, �) + �(�, �)
其中市值自变量使用对数市值,行业自变量为0或者1的哑变量
标准化
使用因子的Z-Score值作为新的因子值
�(�, �) − ����(�(�, �))
���� (�, �) = ���(�(�, �))
将原始因子值经过上述处理之后的结果如下所示。
表 18:处理后因子选股IC-表现
中证 800 %
中证 500 %
沪深 300 %
数据来源: 、天软、
从表18结果可以看出,经过处理后因子的IC均值比原始因子的IC均值高,且正
IC值占比较高。
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
全市场 %
表 19:各板块对冲策略结果表现一览
原始因子-对冲 处理后因子-对冲
板块
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
全市场
中证 800
中证 500
沪深 300
数据来源: 、天软、
根据表19可以看出,与IC的结果类似,处理后的因子在不同板块上的收益率相
较于未经过处理的因子有较为明显的提高,策略的波动率和最大回撤都有所下降。
其中在沪深300板块收益提升的较为明显,年化收益率提升了约5%。
(二)处理后因子分板块表现
处理后因子—全市场选股
表 20: 处理后因子—全市场选股IC-表现
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
全市场 %
数据来源: 、天软、
图 20:处理后因子-全市场内选股IC值走势一览
数据来源: 、天软、
12期滚动均值IC值
%
%
%
%
%
%
%
%
表 21:处理后因子-全市场选股-IC分年度表现一览
分年度统计 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
2007 %
2008 %
2009 %
2010 %
2011 %
2012 %
2013 %
2014 %
2015 %
2016 %
2017 %
2018 %
2019 %
2020 至今 %
数据来源: 、天软、
表 22:处理后因子-全市场选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
All
数据来源: 、天软、
90
80
70
60
50
40
30
20
10
0
超额净值策略净值中证500
图 21:处理后因子-全市场选股-对冲中证500指数策略净值走势表现一览
数据来源: 、天软、
表 23:处理后因子-全市场多头-对冲分年度表现一览
多头 多头对冲中证 500 指数
年化
年化 累计 年化 最大回撤 累计 年化 最大回撤
年度 信息比率 收益 信息比率
收益(%) 收益(%) 波动率(%) (%)
(%)
收益(%) 波动率(%) (%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
12期滚动均值IC值
%
%
%
%
%
%
%
%
%
处理后因子——中证800内选股
表 24:处理后因子-中证800内选股IC-表现
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
中证 800 %
数据来源:wind、天软,
图 22:处理后因子-中证800内选股-IC值走势一览
数据来源: 、天软、
表 25:处理后因子-中证800内选股-IC分年度表现一览
分年度统计 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
2007 %
2008 %
2009 %
2010 %
2011 %
2012 %
2013 %
2014 %
2015 %
2016 %
2017 %
2018 %
2019 %
2020 至今 %
数据来源: 、天软、
35
30
25
20
15
10
5
0
超额净值策略净值中证800
表 26:处理后因子-中证800内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
图 23:处理后因子-中证800内选股-对冲中证800指数策略净值走势
数据来源: 、天软、
12期滚动均值IC值
%
%
%
%
%
%
%
%
%
表 27:处理后因子-中证800多头-对冲分年度表现一览
多头 多头对冲中证 800 指数
年度
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
处理后因子—中证500内选股
表 28:处理后因子-中证500内选股IC-表现
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
中证 500 %
数据来源: 、天软、
图 24:处理后因子-中证500内选股IC值走势一览
数据来源: 、天软、
表 29:处理后因子-中证500内选股-IC分年度表现一览
分年度统计 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
2007 %
2008 %
2009 %
2010 %
2011 %
2012 %
2013 %
2014 %
2015 %
2016 %
2017 %
2018 %
2019 %
2020 至今 %
数据来源: 、天软、
表 30:处理后因子-中证500内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
50
40
30
20
10
0
超额净值策略净值中证500
60
图 25:处理后因子-中证500内选股-对冲中证500指数策略净值走势
数据来源: 、天软、
表 31:处理后因子-中证500内多头-对冲分年度表现一览
多头 多头对冲指数
年度
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
处理后因子—沪深300选股
表 32: 处理后因子-沪深300内选股IC-表现
范围 IC 均值 IC 标准差 IC 最大值 IC 最小值 正 IC 占比
沪深 300 %
数据来源: 、天软、
图 26:处理后因子-沪深300内选股IC值走势一览
数据来源: 、天软、
表 33:处理后因子-沪深300内选股-IC分年度表现一览
分年度统计 IC 均值 IC 标准差 IC 最大值 IC 最小值 负 IC 占比
2007 %
2008 %
2009 %
2010 %
2011 %
2012 %
2013 %
2014 %
2015 %
2016 %
2017 %
2018 %
2019 %
2020 至今 %
数据来源: 、天软、
12期滚动均值IC值
%
%
%
%
%
%
%
%
%
%
18
16
14
12
10
8
6
4
2
0
超额净值策略净值沪深300
表 34:处理后因子-沪深300内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
图 27:处理后因子-沪深300内选股-对冲沪深300指数策略净值走势
数据来源: 、天软、
表 35:处理后因子-沪深300内多头-对冲分年度表现一览
多头 多头对冲指数
年度
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
行业中性
为了控制行业风险,在构建多头对冲策略时,可以根据对冲指数的行业权重为
策略选出的股票配权,利用上述方式重新构建股票组合后得到的结果如下。
表 36:处理后因子选股且行业中性-换手率统计
分板块统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
全市场
中证 800
中证 500
沪深 300
数据来源: 、天软、
从表35中可以看出,行业中性处理后策略整体换手率有所降低。
表 37:行业中性后各板块对冲策略结果表现一览
数据来源:wind、天软、
处理后因子-对冲 处理后因子-行业中性-对冲
板块
年化
收益(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
全市场
中证 800
中证 500
沪深 300
从表37中可以看出,在全市场和中证500中,对处理后的因子选股做行业中性
不会明显的影响其收益率,并且能够降低波动率和最大回撤,降低策略风险,从而
提高策略的信息比率。
(三)行业中性后分板块表现
行业中性—全市场选股
表 38:行业中性-全市场选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
图 28:行业中性-全市场选股-对冲中证500指数策略净值走势
数据来源: 、天软、
80
70
60
50
40
30
20
10
0
超额净值策略净值中证500
表 39:行业中性-全市场多头-对冲分年度表现一览
多头 多头对冲指数
年度
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率 年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
行业中性——中证800内选股
表 40:行业中性-中证800内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
18
16
14
12
10
8
6
4
2
0
超额净值策略净值中证800
图 29:行业中性-中证800内选股-对冲中证800指数策略净值走势
数据来源: 、天软、
表 41:行业中性-中证800多头-对冲分年度表现一览
多头 多头对冲指数
年化收益 累计收益 年化 最大回撤 年化收益 累计收益 年化 最大回撤
年度
(%) (%) 波动率(%) (%)
信息比率
(%) (%) 波动率(%) (%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
行业中性—中证500内选股
表 42:行业中性-中证500内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
图 30:行业中性-中证500内选股-对冲中证500指数策略净值走势
中证500 策略净值 超额净值
60
50
40
30
20
10
0
数据来源: 、天软、
表 43:行业中性-中证500内多头-对冲分年度表现一览
多头 多头对冲指数
年度
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率 年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
行业中性—沪深300选股
表 44:行业中性-沪深300内选股-分年度换手率统计
分年度统计 均值(%) 最大值(%) 最小值(%) 标准差(%) 累计(%)
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
10
9
8
7
6
5
4
3
2
1
0
超额净值策略净值沪深300
图 31:行业中性-沪深300内选股-对冲沪深300指数策略净值走势
数据来源: 、天软、
表 45:行业中性-沪深300内多头-对冲分年度表现一览
多头 多头对冲指数
年度
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
年化收益
(%)
累计收益
(%)
年化
波动率(%)
最大回撤
(%)
信息比率
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020 至今
ALL
数据来源: 、天软、
五、总结
传统的多因子选股策略在国内市场上广泛应用,但最近几年随着市场风格的变换,
历史上长期有效的因子逐渐失效,在传统数据维度中对因子的挖掘已逐渐饱和,因此
对新因子的挖掘提出了迫切的需求。本篇专题报告从个股日内高频的数据出发,尝试
从个股高频数据中挖掘新的因子指标,得到结论:
1. 结合个股微观市场结构,利用个股日内交易明细,结合LSV模型,构建个股短期
内的羊群效应指标,并基于构造的指标在全市场、中证800、中证500及沪深300
板块内进行了详细地测算。实证结果表明,因子指标在全市场、中证 800指数
成分股、中证500 指数对个股收益率区分度较为明显,且分档收益单调性也较
为明显;
2. 未经处理过的因子指标在全市场中选股,从2007年至今,IC均值为,正IC占
比为%,多头组合在回测期内年化收益率为%,信息比率为;多头
组合相对中证500指数年化超额收益率为%,信息比率为;
3. 经过处理后的因子指标全市场中选股,从2007年至今,IC均值为,正IC占
比为%,多头组合在回测期内年化收益率为%,信息比率为;多头
组合相对中证500指数年化超额收益率为%,信息比率为。
六、风险提示
本报告旨在对所研究问题的主要关注点进行分析,因此对市场及相关交易做了
一些合理假设,但这样可能会导致基于模型所得出的结论并不能完全准确地刻画现
实环境,在此可能会与未来真实的情况出现偏差。本报告内容并不是适合所有的投
资者,客户在制定投资策略时,必须结合自身的环境和投资理念。