国际清算银行工作论
文
No 1250
利用机器学习预测金融市场压
力
利用机器学习预测金融市场压力 ϕ
摘要
利用新构建的市场状况指标(MCIs)针对三个关键的美国市场(国债、外汇和货 币
市场),我们证明了基于树的机器学习(ML)模型在预测未来市场压力的完整 分
布方面显著优于传统的时序方法。通过分位数回归,我们发现随机森林比自回归
基准实现了高达27%的分位数损失降低,尤其是在较长的预测周期(3-12个月
)上。Shapley值分析揭示,资金流动性、投资者过度扩张和全球金融周期是未来
市场状况尾部实现的 重要预测因子。MCIs自身也发挥了突出的作用,不仅在同一
市场(自我强化的动态)中,而且在其他市场中也发挥着重要作用。 在...之内 市
场和市场间(溢出效应)
在...之间/跨... 市场在这些结果中凸显了机器学习在预测尾部风险和实时识别系统
性脆弱性方面的价值,从而弥合了高频数据与宏观经济稳定性框架之间的差距。
JEL CodesG01, C53, G17, G12, G28.
关键词 机器学习、财务压力、分位数回归、预测、Shapley
价值。
ϕ 所有作者均来自国际清算银行(BIS),货币与经济部门,瑞士巴塞尔中央火车站广场2号,CH-4002
。 相应作者 : 珠珊·朱(@)。我们感谢乔恩·弗罗斯特、马可·隆巴迪、费尔南多·佩雷斯-
克鲁斯以及BIS研讨会参与者提供的有益评论和建议。本文所表达的观点仅代表作者,并不一定代表B IS。
利益声明:无。
mailto:@
1 简介
金融市场压力是宏观经济稳定的一个持续威胁,会对信贷供应、资产价格和经济增长
产生连锁效应。《大金融危机》(GFC)、新冠“抢现金”以及市场流动性不足的反复出
现都凸显了不稳定和失灵的金融市场带来的系统性风险。此类事件通常起源于看似 孤
立的领域——如货币市场或外汇掉期——然后在全球范围内传播,因为相互关联的 中间
机构和杠杆投资者放大了冲击。 1
政策制定者和学者们长期以来一直在寻找工具来实时测量和预测这些压力动态。传统
的做法,包括金融压力指数(FSIs)和金融状况指数(FCIs),提供了市场健康状况
的总体快照,但往往将广泛的情绪变化(例如,通过VIX的股票波动性)与结构性脆弱
性(如流动性短缺或套利崩溃)混淆。这种混淆限制了它们在识别市场特定压力方面
的实用性,而市场特定压力对于有针对性的干预至关重要。解决这些差距需要一个优
先考虑实时数据并适应非线性动态的框架——这是一个非常适合机器学习(ML)的任
务。
本文提出了两项相互关联的贡献。首先,我们为美国三个关键市场构建了新颖的市场 条
件指标(MCIs):国债、外汇(FX)和货币市场。与传统的指数不同,MCIs强调 市场
微观结构扭曲,这体现在流动性危机和偏离无套利条件的事件中,这些事件反映 了中介
机构的资产负债表约束以及套利能力的损害。其次,我们采用基于树的人工智 能(AI)
模型(随机森林(RF))通过分位数回归(Koenker和Bassett,1978;Adri an等人,2019)
预测未来市场条件分布的全样本。我们的结果显示,机器学习(ML
)模型在经典时间序列方法(例如自回归和多元分位数回归)上持续表现出色,特别
是在较长的时间范围(3-12个月)内。人工智能/机器学习模型的一个公认缺点是缺乏 可
解释性,即理解复杂模型如何得出其输出的挑战,以及哪些输入变量在产生该输出中
起重要作用。我们依赖Shapley值来解决这一问题(Shapley,1953)。从政策角度 来看,
这是至关重要的,因为它可以提供哪些变量有助于解释MCIs预测分布变化的线 索。我
们发现证据表明,投资者过度扩张(例如,基金流入、全球金融周期)和
1 参见Brunnermeier和Pedersen(2009)、Brunnermeier和Oehmke(2009)、Adrian和Shin(2010)
、Duffie(2020)、Duffie(2021)以及Ranaldo和Rossi(2017)等众多文献。
中介流动性约束(例如,一级交易商证券持有量)是这种分布变化的重要驱动因素。 2 同
样,其他市场以及同一市场过去MCI的实现也发挥着相关作用,这表明了在这些集成
市场中的溢出效应的重要性,以及市场压力的自我强化性质。
我们的MCI是通过两步过程构建的。 3 首先,我们编纂市场特定的变量,这些变量代
表波动性(例如,外汇市场的隐含波动性、国债的MOVE指数),流动性(例如,买 卖
价差、新旧券差价、回购-OIS价差),以及套利崩溃(例如,覆盖利率平价(CIP
)偏离、货币三元组的三角无套利差异)。 4 这些变量通过滚动窗口主成分分析(P
CA)进行标准化和汇总,生成每日实时指数,这些指数均值为零,方差为1——即正 值
(负值)表示比平均市场条件更紧(更松)。MCIs很好地捕捉了市场中的已知压力 事
件,例如,2011-2012年欧洲债务危机和2016年英国脱欧公投期间外汇MCI的飙升
,而国债MCI反映了2013年后紧缩恐慌和2020年大流行期间的流动性恶化。关键的是
,MCIs为VIX提供了补充信息,如2015-2016年所见,当时外汇压力激增,而没有相 应
的股票波动率飙升。这种粒度解决了FSIs/FCIs的关键局限性,这些指标往往过度依 赖
来自股票的信号(Carlson等,2014;Kliesen等,2012)。
武装了MCIs,我们接下来着手评估如何最佳地预测其从3个月到12个月期限的实现情 况。
我们将其与两种经典方法进行基准比较:一个自回归(AR)模型和一个包含44个 可能预
示脆弱性的预测因子的多元分位数回归。我们将预测因子分为两大类,一类反映投资
者的风险感知和过度扩张,另一类则捕捉市场更结构性的特征,如中介的市场创造能
力以及资金流动性状况(Brunnermeier和Pedersen,2009;Duffie等人,2023
;Gorton和Metrick,2012)。尽管多元模型在样本内优于AR模型,但其在样本外的 准确
性在较长的预期下恶化,表明过度拟合。例如,在12个月期限下,多元模型对美 国国
库券MCI的量位损失比AR模型高出18%。这强调了其局限性。
2 参见Ben-Rephael等人(2012年),Ben-Rephael等人(2021年),Rey(2013年),Miranda-Agrip pino和Rey
(2020年),Du等人(2023年)。
3 我们随此论文一同将MCI系列提供给研究者。
4 参见,例如,Amihud 和 Mendelson(1986)对买卖价差作为流动性指标早期分析的研究,Du 等人( 2018)
关于CIP偏差的研究,Huang 等人(2025)关于货币三重奏中一价定律的违反,以及Krishnamurt hy(2002)
关于在岸/离岸价差的探讨。
线性模型在捕捉复杂相互作用,例如经销商资产负债表与资金流动性之间的反馈,这
些可能引发市场压力的方面存在局限。
基于树的模型在此环境下表现出色,因为它们在处理市场条件快速变化和非线性关系 方
面具有更好的能力。特别是随机森林,由于其由去相关决策树组成的集成,能够在 允许
预测因子之间存在非线性交互的同时,对过拟合具有鲁棒性(Breiman,2001; Grinsztajn
等人,2022)。例如,对于外汇市场压力的90百分位数(3个月期限),随 机森林相对于
AR模型实现了27%的较低百分位数损失。在未报告的稳健性检验中,我 们发现极端梯
度提升(XGBoost)表现出相当的性能,尽管它的计算成本更高。
已经确立了机器学习模型在预测MCIs分布上界方面的优越性,我们接下来评估哪些变 量
可能驱动这种性能。机器学习模型的可解释性常常受到批评,但Shapley值(Lundb erg等人,
2018年)通过量化每个预测器的边际贡献来缓解这一点——这是使我们所开 发的方法对
脆弱性监控和政策制定有用的一个重要标准。对于外汇市场,欧元和英镑衍生品的隐
含波动率、通过基金流动捕捉到的市场情绪,以及外汇和国债MCIs的过去 实现值特别突
出。同样,家族基金流向风险较高的部分(Ben-Rephael等人,2021年
)以及全球金融周期的一个衡量指标(Rey,2013年)成为未来货币市场压力尾部实
现的重要预测因素。因此,在看似平静和低波动性的时期,投资者过度扩张往往为随
后的市场压力播下了种子。这些见解可以帮助政策制定者关注非银行中介和杠杆周期
监控中的关键领域,正如最近的金融稳定报告所指出(例如,联邦储备委员会(2022
年))。先前MCI实现的相关性以及其他市场的MCIs突出了流动性螺旋的自我加强性 质
(Brunnermeier和Pedersen,2009年;Plantin和Shin,2018年;Aymanns等人,2 017年)以
及这些市场之间的相互关联性,尽管它们各不相同,但在现代基于市场的金 融体系中却
紧密相连。
我们的框架有三个政策应用。首先,市场条件指数(MCIs)充当央行实时诊断工具, 标
记出综合指数未能捕捉到的特定市场压力。其次,机器学习(ML)架构为压力测试 框
架提供了一个模板,其中预测结果分布(例如,左侧尾部流动性冲击)至关重要。 相关
地,该方法还为政策制定者提供了一个工具,以实时预测市场压力的早期迹象。 第三,
Shapley值识别系统性脆弱性——例如,经纪商资产负债表约束或拥挤交易(D uffie等人,
2023年;Brown等人,2022年)——这些脆弱性需要宏观审慎监管。对于学者而言,这
些结果……
idate ML在金融经济学中的作用,特别是在信号稀疏和非线性动态的环境下。
相关文献。 我们的论文为文献的多个分支做出了贡献。首先,我们为机器学习在银行
和金融领域应用方面的文献做出了贡献(参见Fouliard等人,2021年的研究)。越来 越
多的文献研究机器学习在资产定价和回报可预测性方面的应用(例如,参见Jensen 等人,
2024年和Kelly等人,2024年的研究及其参考文献)。Gu等人(2020年)通过 使用机器
学习预测相对于领先的回归策略,证明了美国股票投资者可以获得巨大的经济收益。
与他们的论文和Grinsztajn等人(2022年)的研究发现一致,我们证明了基 于树的模型
在预测金融变量方面的优越性。我们关注市场功能障碍及其对金融稳定性的影响,这
也将我们的工作与Aquilina等人(2025年)的研究联系起来,他们表明循 环神经网络可
以帮助预测欧元-日元-美元三重汇率市场的60天预测期内违反三角形套 利关系的情况。
5 我们的Shapley值应用,建立在Lundberg等人(2018)的基础上,
有助于弥合机器学习与可解释性之间的差距。 6 近期的研究也探讨了机器学习及相关
方法在预测银行和金融危机方面的能力(Ward, 2017;Beutel等,2019;Bluwstein等
,2020)。 7 我们通过专注于金融市场压力预测,聚焦于比银行危机积累过程中的缓
慢移动不平衡更高的频率维度,从而作出贡献。
其次,我们为金融压力测量的文献做出了贡献。 8 虽然FSIs(Monin,2017)和FCIs
(Hatzius等,2010;Adrian等,2022)汇总了广泛信号,但我们的方法强调对市场流 动性、
定价失误以及标准套利关系崩溃的破坏,这些都是市场功能受损的明显迹象。此外,
我们还通过聚焦由做市和抵押品支持的投资策略相互关联的关键市场作出贡献
。这种对识别市场运行不良时期的关注——在过去的二十年里有几次需要央行进行昂 贵
的“最后贷款人”干预(Al-dasoro等,2025)——正是我们研究工作与衡量更广泛范 围的其
他人工作的不同之处。
5 我们使用这个货币三元组,以及包括英镑和瑞士法郎在内的其他货币对,作为构建我们的外汇MCI(货
币综合指数)的输入变量集的一部分。
6 塔拉舍夫等人(2016)提供了一个应用Shapley值来识别系统性银行的案例。
7 早期对银行业危机预测的研究(不含机器学习技术)包括Borio和Lowe(2002)以及Borio和Drehman n
(2009)。更多最近的研究,可参考Schularick和Taylor(2012)和Greenwood等人(2022),以及其 他文献。
8 这篇文献在金融危机之后显著增长,相关但不同的关于银行危机早期预警指标(参见前一条脚注)和系
统性风险的研究也呈现出同样的趋势(Bisias等,2012;Acharya等,2016;Adrian和Brunnermeier, 2016;
Hollo等,2012)。
资金市场条件。
最后,我们的工作交汇于金融经济学两大基础领域:市场微观结构与流动性提供中的
角色,以及基于中介机构的资产定价,其焦点在于中介机构约束作为系统性风险的驱
动因素。 9 我们通过引入高频、市场特定的指标并利用机器学习来建模它们之间的相
互作用来弥补这些差距。市场微观结构文献强调了交易摩擦、信息不对称和制度设计
如何塑造流动性和价格形成。Kyle(1985年)和Glosten与Milgrom(1985年)的开创性工
作将买卖价差确立为逆向选择和库存成本的代理指标,而最近的研究(例如,Bru
nnermeier和Pedersen(2009年))将流动性与融资条件联系起来——这是我们市场 微观
结构指标的核心主题。最近的实证研究强调了套利失败作为市场压力信号的作用
(Du等人,2018年;Rime等人,2022年;Huang等人,2025年)。我们的市场微观 结构
指标通过将微观结构变量(例如,买卖价差、跨货币基差偏差)综合为每日压力指标
来具体化这一文献中的经验教训。这与Bai等人(2018年)的强调相一致,他们认 为市场
特定的流动性指标对于诊断系统性风险至关重要。
路线图 本文的其余部分结构如下。第二节介绍了MCI的构建,回顾了它们的特性,并
讨论了它们与金融压力或金融状况的替代指标之间的关系。第三节提出了基准分位数
预测模型,我们的随机森林模型随后将对其进行评估。第四节使用Shapley值来识别哪 些
预测变量携带最多的信息,用于预测市场MCI分布的尾部。最后,第五节得出结论
。
2 测量市场条件
金融市场状况监测的重要性不容忽视。市场压力事件可能会严重损害资本的合理分配
和价格形成,导致更广泛的经济动荡。因此,为政策制定者和市场参与者制定衡量市
场状况的稳健措施至关重要。本节介绍了针对三个关键市场领域新开发的指标:美国
国债市场、美国货币市场和以外汇市场为中心的市场。
9 金融中介机构(银行、交易员、对冲基金和货币市场基金)在流动性提供中发挥着至关重要的角色,
但他们这样做的能力具有顺周期性(Adrian和Shin,2010)并受制于资产负债表成本(He和Krishnamurt hy,
2013;Du等,2023)以及监管(Scheicher和Schrimpf,2022)。
围绕美元。MCIs旨在捕捉市场波动性、流动性和偏离标准无套利条件的情况。它们提
供了对市场健康状况和潜在压力的全面视角,覆盖市场功能障碍时期以及市场保持功
能但历史上流动性极低的时期。
MCIs的建设涉及一个两步过程,每次专注于一个市场。 10 在第一步中,我们收集了
反映波动性、市场及资金(非)流动性以及更广泛的受损做市商的变量,针对三个市
场中的每一个。我们旨在在市场状况的不同方面覆盖范围和较长时段的每日时间序列
的可用性之间达到平衡。在考虑这一权衡的基础上,我们开始分析的时间点是2003年
。
在第二步,我们构建市场特定的综合指标。我们表达所有变量,使得更高的值表示更
差的市场状况。然后,我们通过z分数转换对其进行标准化,以确保它们具有零均值和
单位标准差。之后,我们通过滚动窗口主成分分析(PCA)构建样本外MCIs。我们这 样
做是为了仅考虑过去的信息,以避免在预测练习中的前瞻性偏差。我们从一个三年期
的初始估计窗口开始,其中每个市场在前三年的MCI被定义为第一个主成分,即输入
序列的线性组合,它捕捉了它们的大部分变异性。之后,我们以每月的频率扩展窗口,
并在每月使用扩展的窗口重新进行PCA。为了便于解释,我们将MCIs标准化,使 其具有
零均值和单位标准差。因此,MCIs的正值表示比平均水平更紧张的市场状况, 发出潜
在压力的信号。
表1列出了在第一步中使用的输入变量。对于外汇市场,我们包括了交叉货币基点、货 币
三元组的单一定价法则(VLOOP)违规、各种货币对的买卖价差以及摩根大通的外 汇
波动率指数。 11 对于美国国债市场,我们包括了各种指标。市场流动性通过报价时间
(衡量债券交易商在TradeWeb系统中对报价请求做出响应所需时间的指标)来评 估,各
种到期日的证券报价利差或观察到的债券收益率与拟合平滑收益率曲线的偏差
(Hu等人,2013),以及其他指标。反过来,利率互换利差则反映了价格错位。
10 该程序基于并扩展了相关政策文章(Aldasoro et al., 2022)。
11 货币间基差是指通过将一种货币与另一种货币进行掉期,换取该货币所需支付的利息与在现金市场上
直接借入该货币的成本之间的差额。非零值表明了覆盖利率平价(CIP)的违反,这表明市场出现错位
( Du等,2018;Rime等,2022)。类似地,VLOOP指标表示套利受损(Huang等,2025)。报价利差是 衡
量市场流动性的标准指标,而外汇波动率指数则反过来捕捉市场不确定性。
(以隔夜指数互换(OIS)与不同到期期限的国库券之间的利差计算,并以绝对值表
示),国库期货基差(Barth和Kahn,2021年)或滚动流动性溢价(Krishnamurthy, 2002
年;Duffie等人,2023年),以及其他指标。波动性通过MOVE指数来捕捉。最 后,对
于美国货币市场,我们包括回购利率与OIS利率之间的利差、各种高质量金融商业票
据与OIS利率之间的利差(Rime等人,2022年)、TED利差和LIBOR-OIS利差
。
总体而言,我们使用的输入变量捕捉了过去二十年中已知的不良市场条件事件。例如
,外汇市场波动和错位指标在2011-12年发出了欧洲主权债务危机的信号,2015年瑞 士
法郎脱钩,2016年的英国脱欧和美国的货币市场基金(MMF)改革。在国债市场中
,衡量市场流动性和波动性的指标在大宗商品危机、紧缩恐慌、新冠病毒大流行和乌
克兰战争开始时均有所上升。类似的指标在货币市场中也发挥了作用:在金融危机、
美国MMF改革、2018年初VIX指数飙升、2019年9月回购市场动荡和大流行期间,回 购-
期权性反向抵押贷款(repo-OIS)利差以及商业票据-期权性反向抵押贷款(CP-OI S)利
差均出现了激增。
这些模式也在我们的MCI指标中得到了充分反映,这些指标既捕捉了广泛的阶段,也 捕
捉了市场特定的阶段。图1展示了基于主成分分析的三种市场的MCI估计,同时显示 了
全样本估计和滚动窗口估计。 12 三个市场的MCIs在GFC和Covid-19大流行期间( 程
度不同)急剧上升。但它们也表明在其他不太极端的时期市场条件恶化。例如,在 欧洲
主权债务危机期间以及2015/2016年(瑞士法郎脱钩、英国脱欧和美国MMF改革
)时,外汇MCI缓慢上升。反过来,在2013年缩减恐慌之后,以及2014年和2021年的 独
特闪事件期间,国库券MCI略微进入正领域。最近,它在上升,与市场对恶化国库券
市场流动性的评论一致(Scheicher和Schrimpf,2022;联邦储备委员会,2022)
。最后,货币市场MCI在MMF改革和2018年VIX飙升期间表现出适度的增加,尽管必
须承认,在GFC和Covid-19危机之外,它仍然在很大程度上保持低调。
重要地,MCIs 为 VIX 提供补充信息,从而为市场条件提供独特的见解(Aldasoro 等人,
2022)。虽然 MCIs 与 VIX 正相关,但它们通常能捕捉到 VIX 单独无法捕捉到的细微差
别(Aldasoro et al., 2022)。
12 全样本主成分分析使用了整个数据集来计算主成分,这可能会引入未来的信息并潜在地影响估计的准
确性。我们的滚动估计通过仅使用历史信息来解决这一问题。
例如,在2015-16期间,外汇市场条件指数(FX MCI)显著上升,而VIX(恐慌指数) 没
有相应增加,突显出市场特有的压力,这在VIX中并不明显。相比之下,大多数金融 市
场指数(FSIs)和金融条件指数(FCIs)与VIX紧密相连,因为VIX是它们构建的关键
输入因素。这些指数与VIX之间强烈的关联意味着它们通常反映相似的信息。例如, 美
国金融研究办公室的FSI和高盛的美国FCI都显示出与VIX非常高的相关性(尽管VIX
只是众多输入因素之一)。这表明它们同样捕捉到了广泛的市场情绪和波动性。然而
,这种紧密的关联可能会限制它们识别市场特定压力事件的能力。这是市场条件指数
(MCIs)通过专注于市场特定的变量和条件有效填补的差距,除了它们对价格错位、
流动性和套利损害的关注之外。
3 预测市场状况指数的分位数
金融市场压力本质上是非对称和重尾的。政策制定者不仅关注市场状况的平均预测,
还关注尾部风险——可能引发传染的上百分位压力情景。与经典方法如线性回归估计
条件均值、平缓这些关键极端值不同,分位数回归则通过对整个分布进行建模。 13 使
我们能够回答诸如:哪些因素驱动了货币市场中最差的10%的结果?
高维数据(在我们的案例中为44个预测因子)的分位数预测提出了两个挑战。首先是
非线性:预测因子之间的关系可能是乘法或阈值依赖的。其次是稀疏信号:许多特征
或预测因子在平均情况下可能没有信息,但在特定分位数中却至关重要。
基于树的多智能体模型,如随机森林和XGBoost,特别适合这项任务。通过递归地将 数
据分成具有相似应力级别的区域,它们捕捉局部交互和变量重要性,而不施加线性 假
设。
在本节中,我们评估了两种广泛使用的时间序列模型在预测MCIs分位数方面的样本外
准确性,并将其与基于树的机器学习模型进行了对比。我们分三个步骤进行。首先, 我
们定义了预测问题。其次,我们介绍了我们考虑的两个基准经典模型:自回归和多 变量
(这需要讨论所使用的预测因子)。然后,我们介绍了基于树的模型,并评估了 它们
的性能与基准模型的对比。
13 关于分位数回归的开拓性工作,参见Koenker和Bassett(1978)。关于最近的多变量应用,用于预测和压
力测试,参见Chavleishvili和Manganelli(2024)。
t =1
t
定义问题。
对于所考虑的两种基线模型,我们使用分位数损失来评估市场状况预测分位数与样本
外观察到的分位数之间的距离。
在一个经典的线性模型中,目标函数为: 希腊字母τ - 第 k 分位数回归是为了找到向
量 β 那个最小化的
T
1 X
ρ ( y − βx T ) ,
Τ t
(1)
在ρ(·)为所谓的检查函数的情况下,N该函t 数定义为τ
τu 如果 u > 0对于任何 u ρ
( u ) = 属于实数域
希腊字母τ
τ − 1) u 如 果 u ≤ 0
(2)
p
, , x , , x 是一个维度为1的向量 p p
在方程(1)中, x T = x 1 ··· k ··· × , 哪里是
t
t 管我们的MCI数据按日频次提供,我们仍使用其月度平均值,以便在之后将低频解
t 变量引入模型。我们估计了各种模型,并使用84个月的估计-测试窗口对模型的样本
外表现进行检验。换句话说,对于一个特定的月份 t 我们使用每月观测数据来运行我
们T 的估算。 t − 83至 t 我们随后预测了: h - 未来一段时间内,根据观察到的解释
变量,MC数Is量的。经验β 分= 布β 分1 位,数··· , β k ,··· , β p 这是一个 p× 1 向量捕捉边际变
t 对希于腊每字个母预τ测由范于围边h际变= 1化,导2致,-.第.. 量12级,我x 们k 计. 解算决预方测案分位数中的分位数损失,并在
不t 同的测试窗口上计算平均损失。对于一个月的预测时间范围,我们有153个估计和测
该试算窗法口最,小而化对目于标12函个数月,的从预而测得时到间最范优围值,。我们β 有. 142个估计和测试窗口。
基准模型
自回归模型。我们从最简单的时序模型开始,其中我们只考虑市场状况指数的过去值
。具体来说,我们使用一个时期滞后,并运行以下回归来预测: 希腊字母τ 依赖变量
的分位数
th
变 量 y :
t
y 希 腊 字 母 τ ϕ β y + ε
t− 1 t t
(3)
方程(3)类似于AR(1)回归的分位数版本。为了提高模型性能,我们还允许我们研
究的三个关键金融市场中的市场条件相互关联。因此,我们将方程(3)修改如下:
y 希 腊 字 母 τ ~β y + β y + β y + ε
1 t,r,t− 1 2 mm,t− 1 3
fx,t− t
哪里 y 并且 i属于{tr,1mm, fx}集合 指代财政部、货币或外汇市场条件
(4)
i,t
在时间 t .
i,t
多元时间序列模型。另一种方法是考虑各种附加预测因子来对市场条件进行预测:
K
X
y 希 腊 字 母 τ ~β y + β y + β y +
(5)
哪 里 x with γ x + ε 是K个可能有用的额外预测因子。
k1 =t,r,t− ,··1· ,2Kmm,t− 1 3
k fx,t− t
预测未来市场条1 件。
为此,我们考虑k k了,t−广1泛的金融和经济指标,提供了对市场动态和宏观经济状态的全面视
角,这些指标i,t可k=能1 是市场状况的潜在预测因素。在选择有助于解释未来压力上升风险的
指标时,我们关注上述两类变量:(i)指向投资者过度扩张或信号市场风险感知 增加的变
量;(ii)关于流动性状况和市场做市能力的变量。我们的数据集包括多达44 个解释变量。
表2展示了它们的汇总统计。
第一组变量捕捉了美国政府及中央银行对市场流动性的直接影响。预测因素包括美联
储的国债购买总量及其6个月移动平均数,这有助于捕捉中央银行流动性供应的影响。
此外,我们收集了美国国库一般账户的水平和变化,以及主要交易商未完成的国债交
割量,从而提供了关于市场流动性和稳定性的见解。
第二组预测因子涉及资金流动数据。我们考虑了上个月的数据以及6个月的移动平均值
,以便让更长时间的资金流动趋势对市场状况产生影响。具体来说,我们使用了EPFR
的发达市场和新兴市场的资金流动数据,涵盖债券、股票、高收益和投资级证券。
除了跨国基金流动外,我们还利用由投资公司协会根据Ben-Rephael等人(2012年) 和
Ben-Rephael等人(2021年)编制的家庭内部基金流动数据,包括货币市场基金、 高收益
基金和股票基金。基金流动数据揭示了投资者对不同资产类别和地区的情绪和 风险偏
好。
我们同时也考虑了各种宏观经济和宏观金融指标。这些指标包括美国和全球经济的花
旗经济意外指数,该指数衡量实际经济数据与预期之间的比较,以及息票持有、超额
债券溢价(Gilchrist和Zakrajˇsek(2012))、全球金融周期指数(Rey(2013))以 及10
年国债期货合约的保证金要求(以捕捉资产负债表成本和中介机构在市场交易中 的利
差)。在这一类别下,我们还包括短期利率所反映的借款成本,以及中长跑期的利差。
最后,我们考虑代表金融市场风险的指标。这一组包括广泛的美元指数、欧元、英镑
和日元的隐含波动性、表示利率风险的默瑞尔林奇期权波动性估计(MOVE)指数、
美国股市近端风险的VIX指数以及捕捉S&P 500收益分布感知尾部风险的SKEW指数。
基线模型的性能
图2和图3报告了不同预测范围从一个月到十二个月的样本内和样本外分位数损失。行 表
示市场(外汇、货币市场和国债),而列表示中位数、第75百分位数和第90百分位 数。
蓝色线条反映了自回归模型(AR)的性能,而橙色线条捕捉了具有完整(Full) 列表
的44个输入变量的多元模型性能。
在样本内,多变量模型在各个预测周期内均表现出持续优异的性能。通过包括更多解
释变量,多变量模型利用了更多信息,如图2所示,其损失分位数低于自回归模型。无
论模型拟合的损失分位数或考虑的预测周期如何,多变量模型在样本内的表现都是明
确优于(损失更低)。
然而,在样本外,顺序发生了逆转。如图3所示,在各个预测范围、市场和分位数上,
多变量模型相比自回归模型(AR模型)产生了更高的平均分位数损失。鉴于我们对样 本
外预测MCI(市场条件指数)的兴趣,以下我们将重点关注表现更佳的自回归模型
(AR模型)作为评估其他模型性能的基准。
基于树的模型。
基于树的模型
在机器学习模型中,基于树的变体在表格数据中仍然是最先进的技术(Grinsz-tajn等 人,
2022年)。当损失函数不连续且数据集中包含许多无信息特征时,基于树的模型 在广泛
的超参数选择中打败了神经网络模型,适用于表格数据集。确实,分位数损失 函数是
非连续的,我们考虑的预测变量也可能包含无信息特征。因此,基于树的模型 非常适
合我们的需求。由于我们不在优化机器学习模型性能上感兴趣,我们专注于随 机森林,
因为它的时间效率较高。此外,与神经网络模型相比,像随机森林这样的基 于树的模
型具有允许结果可解释性的优势,正如上文所述,这对于我们的应用至关重 要。
随机森林方法,由Breiman于2001年正式提出,是一种创建独立决策树集成用于分类 或
回归任务的程序。它们通过在训练期间构建多个决策树并生成单个树的平均预测来 进
行操作。随机森林的预测误差由不同树的预测误差之间的相关性及其平均值确定的 函
数上界。通过平均多个树,随机森林方法减少了过拟合的风险,这是单个决策树中 常
见的问题。
Meinshausen (2006) 认为,随机森林不仅能够提供关于条件均值的信 息,还能提供关于感
兴趣变量的完整条件分布的信息。他提出了一种随机森林的推广(“分位数回归森 林”),
作为一种推断条件分位数的方 法,并展示了即使在具有高维预测变量的环境中
,它也能提供准确的估计。我们在估计和预测我们的蒙特卡洛积分的量位数时,依靠
这种方法。
RF的绩效。如上所述,在两个基线模型中,自回归模型比全特征模型在样本外表现更
佳。在图4中,我们因此比较了随机森林模型与自回归模型的样本外分位数损失。列代 表
市场(国债、货币市场、外汇市场),而行表示分位数(中位数、第90百分位和第9 5百
分位)。具体来说,我们展示了RF相对于自回归模型的分位数损失差异,以及90
%的置信区间。负值表示RF的表现更优。
射频模型。
我们的研究结果表明,随机森林方法可以显著优于基准模型。特别是,在货币市场和
外汇市场中,随机森林的量分损失显著低于基线模型。这种情况既发生在不同预测时
段,也发生在不同分位数上。对于货币市场,随机森林模型在一个月的预测时段内与
自回归模型的表现相当。然而,从两个月预测时段开始,随机森林模型显著优于自回
归模型。这表明,随机森林模型有效地捕捉了预测两个月后货币市场状况的最具信息
量的变量。
在外汇市场中,RF模型捕捉相关变量的能力在更长的预测周期内表现良好。其相对于
自回归模型的表现持续改善,直至11个月预测周期。这表明RF模型成功捕捉到提供对
未来外汇市场条件具有稳健和持续预测能力的变量。
对于美国国债市场而言,然而,随机森林模型在预测市场状况方面并未显著优于自回 归
模型。虽然在预测中位数方面,RF模型略有不足,但考虑到分布的上尾部分,尤其 是
在短期(3-5个月)和中期内,其性能有所改善。
哪些变量有助于预测市场状况?
在机器学习(ML)模型日益受到“黑箱”批评的时代,其预测的可解释性至关重要—— 尤
其是在经济学领域,政策制定者和学者们不仅需要准确的预测,还需要对潜在驱动因
素的可行见解。Shapley值,这一概念源于合作博弈论(Shapley,1953年),提供 了一个
严格的框架,用于将模型预测归因于个体特征,确保公平(通过考虑所有可能的特征
交互)和透明度。这种方法特别适合于解开支撑金融市场压力的复杂、非线性关系,
例如经销商资产负债表与投资者杠杆周期之间的相互作用。
传统的可解释性方法,如线性回归中的系数幅度或排列重要性分数,在两个方面表现
不足。首先,它们无法捕捉到依赖于情境的效果:像超额债券溢价这样的变量可能只
有在中间阶层危机时期才有关系,而线性模型无法编码这种细微差别。其次,它们忽
视了特征之间的相互作用——例如,复合效应
美联储资产负债表扩张和资金流向对国债市场流动性的影响。Shapley值通过量化每个 预
测因子对特定预测的边际贡献,在所有可能的变量组合条件下,来填补这些差距。在
机器学习模型中,Shapley值被用来解释每个特征对模型做出的预测的贡献。
给定一个特征集 x 并且一个模型 f Shapley值对于一个特征 i 代表该特征对预测的平均
贡献,涵盖所有可能的特征子集。具体而言,Shapley值 ϕ 关于功能 i is given by: 由此
给出:
i
位置:
X |S| !( |N| − |S| − 1)!
ϕ =
[ f ( Sϕ{i} ) 负 号 负 号 ( S )]
i |N| !
S是N\\{i}的子集
• N是所有特征的集合。
• S 是不包含 i 的特征子集。
• f(S)是使用子集S中的特征进行的模型预测。
• |S| 是子集 S 中特征的数目。
• |N|是特征总数。
对于基于树的模型,如决策树、随机森林和梯度提升机,可以使用树的结构优化Shapl ey
值的计算。Lundberg等人(2018年)为SHAP(SHapley Additive exPlanation)值开发了快
速精确的树解,这些值是树模型的唯一一致且局部准确的属性值。在附录中
,我们通过一个两特征示例说明了计算SHAP值的关键步骤。
图5显示了预测未来三个月货币市场条件90%分位数时Shapley值的汇总图。行展示了 按
各自的平均绝对Shapley值排序的输入变量。x轴表示在样本外预测实例中指定输入 变量
的Shapley值(点)。点颜色从蓝色(特定输入变量的低值)到红色(高值)不等
。
一些变量脱颖而出,成为预测未来货币市场状况尾部实现的指标,反映了资金流动性
和投资者过度扩张。或许并不令人惊讶,当前货币市场状况是最重要的特征。货币市
场MCI(蓝色圆点)的当前值较低时,往往预示着三个月内货币市场状况的90分位数 较
低。相反,当MCI的当前值较高时,情况则相反。
货币市场MCI(红色点)的值。这表明了压力下货币市场条件的强烈自我强化性质。
反过来,美联储对国债的购买(较低或较高),以及全球金融周期(Miranda-Agrippin o和
Rey,2020)指标的低(高)值,往往预示着货币市场条件更加紧缩(宽松)。反 过来,
3个月期国债发行量的降低以及联邦储备银行(即国库总账户)的美国国库存款 的降低与
未来货币市场MCI尾部实现的降低有关。最后,收益率曲线斜率(通过10年 和2年期利
率之差来捕捉)的降低有助于预测未来货币市场条件的紧缩。
图6提供了外汇市场条件相同分析。排名第一的变量是三个月欧元/美元汇率的隐含波
动性,反映了期权市场对汇率变动附加的不确定性程度。 14 较高的(较低的)值预示
着未来更高的(较低的)外汇MCI。与货币市场MCI类似,外汇MCI的较高值也蕴含 着对
未来外汇MCI尾部实现的重要信息。此外,国库MCI的高值也倾向于提高未来外汇MCI分
布的90%分位数。此外,当市场情绪低落,如净家族内流向股票基金的流动量低
(Ben-Rephael等,2012年),预计的外汇MCI的90%分位数上升。大多数解释预 计外汇
MCI尾部预测的前置变量反映的是投资者的过度扩展和风险感知,而非资金流动性或
中介机构的做市能力(Du等,2023年)。当然,一些后续变量也相当重要,但 它们的排
名通常较低。
最后,图7展示了国债市场的结果。与其他两个MCI指数相似,MCI当前的高值预示着 未
来指标尾部实现值的增加。股票市场情绪也排名较高,较低的当前值预示着未来国 债
市场压力的增加。广义美元指数的高值指向未来国债市场MCI的第90百分位数将发 生变
化,这与Bruno和Shin(2015)的金融渠道一致。然而,对于国债MCI的结果应 谨慎解
读,因为(正如之前所示)外样本性能并不比自回归模型显著更好。
5 结论
本文证明,结合新构建的市场状况指标,基于树的机器学习模型提供了一套强大的预
测金融的工具箱。
14 同样,GBP-USD的隐含波动率很重要,排名第5。
市场压力监测。通过关注三个关键的美国市场——国债、外汇和货币市场,我们发现
MCIs能够捕捉到传统金融状况和压力指数经常忽视的流动性错配、波动性和套利条件
。我们的分位数回归框架揭示,在预测范围内,机器学习模型,尤其是随机森林,比
经典的时间序列方法表现更优。Shapley值分析突出了资金流动性、投资者过度扩张和 全
球金融周期动态在解释市场条件预测尾部实现值方面的重要作用。此外,市场状况指
数本身也会影响同一市场中的MCI的未来实现(自我强化动态)。 在...之内 市场和市
场间(溢出效应) 在...之间/跨... 市场。
这些发现具有重要的意义。对于政策制定者来说,MCIs提供了一个实时诊断工具,用
于识别市场失灵,补充现有的金融服务指数(FSIs)和金融市场指数(FCIs)。家庭
内部资金流动和全球金融周期的突出地位强调了监测非银行中介和投资者杠杆周期的 必
要性。对于学者来说,我们的结果验证了基于树形结构的机器学习(ML)在金融预 测
中的有效性,尤其是在充斥着非线性关系和稀疏信号的环境中——这一结论与Grins ztajn
等人(2022年)的研究结论相呼应。
我们的研究指出未来探索的四个途径。首先,将多维度综合指数(MCIs)扩展到企业 债
券和衍生品市场可以增强系统性风险监控。其次,结合机器学习与结构框架的混合模
型(例如,包含金融摩擦的动态随机一般均衡模型)可能提高可解释性。第三,纳入
替代数据——例如交易商库存、基于文本的情绪或区块链衍生的流动性指标——可 以改
进预测。最后,实时实施需要解决计算瓶颈,例如高维模型中Shapley值计算的延 迟问题。
参考文献
Acharya, Viral V.,Lasse H. Pedersen,Thomas Philippon,和 Matthew Richardson. 2
016. “衡量系统性风险。” 《金融研究评论》 30 (1): 2–47.
Adrian, Tobias, Nina Boyarchenko, 和 Domenico Giannone. 2019年。“脆弱的增长。” 美国经
济评论 109 (4): 1263–1289.
阿德里安、托比亚斯和马库斯·克·布伦纳梅尔。 2016. “CoVaR.” 美国经济评论 106 (
7): 1705–41.
Adrian, Tobias, Federico Grinberg, Nellie Liang, Manmohan Sheheryar, and Jason Y
u. 2022. “风险增长的结构。” 美国经济杂志:宏观经济学 14 (283-323): .
Adrian, Tobias, and Hyun Song Shin. 2010. “经销商杠杆和流动性。” 《金融中介期刊 》 19
(3): 418–437.
Aldasoro, Iñaki, Peter Hørdahl, and Sonya Zhu. 2022年。“在压力之下:市场状况与压力。”
国际清算银行季刊 (19): 31–45.
Aldasoro, Iñaki, Wenqian Huang, and Nikola Tarashev. 2025年。“央行流动性支持、银行监管
及资产管理者的风险承担。” 管理科学 待发布。
Amihud, Yakov, and Haim Mendelson. 1986年。“资产定价与买卖价差。” 《金融经济学杂志》
17 (2): 223–249.
阿基莉娜,马泰奥,道格拉斯·阿拉乌若,加斯顿·格洛斯,泰京·帕克,以及费尔南多· 佩
雷斯-克鲁兹。 2025年。“利用人工智能监控金融市场。” BIS工作论文 待发布。
Aymanns, Christoph, Co-Pierre Georg, and Benjamin Golub. 2017年。“耦合场外交易市场中的
流动性螺旋。”圣加仑大学金融学院工作论文1810号,
rg/p/usg/sfwpfi/.
白,珍妮,阿温德·克里什纳穆尔蒂,以及查尔斯-亨利·韦穆勒。 2018年。“在银行业的
流动性错配测量。” 《金融杂志》 73 (1): 51–93.
巴特,丹尼尔,和R. 杰伊·卡恩。 2021年。“对冲基金和国库现金-期货脱节。”OFRC 工作
组文件 21-01, 财金研究办公室, 可在SSRN查找: 544。
本-雷法尔,阿齐,赵建文,和伊塔·戈德斯坦。 2021年。“共同基金流动与信贷及商业周
期波动。” 《金融经济学杂志》 139 84–108.
本-雷法尔,阿齐,舒姆埃尔·卡德尔,和亚维·沃尔。 2012. “使用共同基金流动量衡量
投资者情绪。” 《金融经济学杂志》 104 363–382.
贝特uhl, 约翰内斯, 索菲亚·利斯特, 和 格雷戈尔·冯·斯温尼茨 2019年。“机器学习是否有助
于我们预测银行危机?” 《金融稳定杂志》 45 100693.
比西亚斯,德米特里奥斯,马克·弗洛德,安德鲁·洛,以及斯塔沃罗斯·瓦拉瓦尼斯。 2
012年。“系统性风险分析的调查。” 年度金融经济学评述 4 255–296.
Bluwstein, Kristina, Marcus Buckmann, Andreas Joseph, Miao Kang, Sujit Kapadia, and Ozgur
Simsek. 2020. “信贷增长、收益率曲线与金融危机预测:来自机器学习方法的证据。”工
作论文848,英格兰银行。
鲍里奥,克劳迪奥,和马蒂亚斯·德雷曼 2009. “重新评估银行危机风险。” 国际清算银行季
刊 29–46.
鲍里奥,克劳迪奥,和菲利普·洛。 2002. “评估银行业危机的风险。” 国际清算银行工作
论文114号,国际清算银行。
布瑞曼,利奥. 2001. “随机森林.” 机器学习 45 (1): 5–32.
布朗,格雷戈里·W,菲利普·霍华德,以及克里斯蒂安·T·伦布莱德。 2022年。“拥挤的
交易和尾部风险。” 《金融研究评论》 35 (7): 3231–3271.
布勒纳梅尔,马克斯·K,和马丁·奥姆克 2009. 泡沫、流动性与宏观经济 国家经济研
究局
布unnermeier, Markus K, 和 Lasse Heje Pedersen. 2009. “市场流动性与资金流动性
。” 《财务研究评论》 22 (6): 2201–2238.
Bruno, Valentina, and Hyun Song Shin. 2015年。“跨境银行业务与全球流动性。” 《经济研究
评论》 82 (2): 535–564.
卡尔森,马克;路易斯,库尔特;尼尔森,威廉。 2014年。“利用政策干预识别金融压
力。” 《国际金融与经济杂志》 19 59–72.
查维什维利,苏尔汗,和西莫内·曼格内利。 2024年。“基于分位数向量自回归的预测与
压力测试。” 应用经济学杂志 39 (1): 66–85.
杜文新、本杰明·赫伯特和李文豪 2023年。“中介平衡表与国债收益率曲线。” 《金融经济
学杂志》 150 (3): 103722.
杜文新、亚历山大·特佩尔和艾德里安·维德尔汉 2018年。“偏离了覆盖利率平价。” 《金融
杂志》 73 (3): 915–957.
杜菲,达雷尔。 2020. “仍为世界的避风港?COVID-19危机后重新设计美国国债市场
。” 哈钦斯中心工作论文 62 号。
杜菲,达雷尔。 2021. “美国国债市场的韧性重焕生机。” 布鲁金斯学会 .
Duffie, Darrell, Michael Fleming, Frank Keane, Claire Nelson, Or Shachar, and Peter Van
Tassel. 2023. “经销商产能与美国国债市场功能。” 工作报告 1070,纽约联邦储备银行。
联邦储备委员会. 2022. “金融稳定报告.” 五月.
Fouliard, Jeremy, Michael Howell, Hélène Rey, and Vania Stavrakeva. 2021年。“回答女王:
机器学习与金融危机。”NBER工作论文28302,美国国家经济研究局。
吉尔克里斯,西蒙,和埃贡·扎卡耶斯克。 2012年。“信用利差与经济周期波动。” 美国经
济评论 102 (4): 1692–1720.
格洛斯顿,劳伦斯·R,和保罗·R·米尔格罗姆。 1985. “在异质信息交易员的专业市场
中,投标价、要价和交易价。” 《金融经济学杂志》 14 (1): 71–100.
高顿,加里,和安德鲁·梅特里克。 2012年。“证券化银行业和回购基金的挤兑事件。” 《金融
经济学杂志》 104 (3): 425–451.
格林伍德,罗宾,塞缪尔·汉森,安德烈·谢列弗,以及雅各布·索伦森。
2022年。“可预测的金融危机。” 《金融杂志》 77 863–921.
Grinsztajn, Leo, Edouard Oyallon, and Gael Varoquaux. 2022. “为什么基于树模型的典型表格
数据中仍然优于深度学习?” In 神经网络信息处理系统进展 第35卷,第507- 520页,Curran
Associates, Inc.
顾世豪,布莱恩·凯利,徐大城。 2020年。“通过机器学习的经验性资产定价。” 《金融研
究评论》 33 (5): 2223–2273.
Hatzius, Jan, Peter Hooper, Frederic Mishkin, Kermit Schoenholtz, and Mark Watson
. 2010年。“金融危机后的金融条件指数:新的视角。” NBER工作论文 16150.
何志国和阿尔温德·克里希那穆尔蒂。 2013. “中间资产定价。”
美国经济评论 103 (2): 732–770.
您好,丹尼尔,曼弗雷德·克雷默,以及马可·洛杜卡。 2012年。“CISS——金融系统中系
统性压力的复合指标。”欧洲中央银行工作论文1426,欧洲中央银行。
胡,邢欣 Grace,潘军,王江 Jiang 2013. “流动性不足的信息噪声。” 《金融杂志》 6 8 (6):
2341–2382.
黄文倩,安吉洛·兰达尔,安德烈亚斯·施里姆普,及法比基乌斯·索莫-吉。 2025. “货币市场
中的流动性供给受限。” 《金融经济学杂志》 即将发布。
Jensen, Theis Ingerslev, Bryan T. Kelly, Semyon Malamud, and Lasse Heje Pederse
n. 2024年。“机器学习与可执行有效前沿。”研究报告22-63,瑞士金融学院,可在SS RN查
阅: 或 17。
凯利,布莱恩,谢蒙·马拉穆德,和康英·周。 2024. “在回报预测中复杂性的美德。” 《金融
杂志》 79 (1): 459–503.
克利森,凯文,迈克尔·欧扬,以及艾·韦尔曼。 2012. “区分多样的措施:金融压力调
查。” 联邦储备银行圣路易斯审查 94 (5): 369–397.
科恩克,罗杰,和吉尔伯特·贝塞特。 1978. “回归分位数。” 《计量经济学》
46 (1): 33–50.
克里希纳穆尔蒂,阿文德。 2002. “债券/旧债券利差。” 《金融经济学杂志》 66 (2):
463–506, 投机套利的限制。
凯尔,艾伯特·S. 1985. “连续拍卖与内部交易。” 《计量经济学》 53 (6): 1315–1335
.
伦德伯格,斯科特·M,加布里埃尔·G·埃里翁,苏-英·李。 2018. “对于树集成的一致性个
性化特征归因。” arXiv 预印本 arXiv: .
Meinshausen, Nicolai. 2006年。“分位数回归森林。” 《机器学习研究杂志》 7 (983-
999): .
Miranda-Agrippino, Silvia, 和 H´el`ene Rey. 2020年。“美国货币政策与全球金融周期
。” 《经济研究评论》 87 (6): 2754–2776.
Monin, Philip. 2017年。“《OFR金融压力指数》。” 办公室金融研究工作论文 (17-04
): .
Plantin, Guillaume, 和 Hyun Song Shin. 2018年。“汇率与货币溢出。” 理论经济学 1 3 (2):
637–666.
拉纳尔多、安杰洛和恩佐·罗西。 2017年。“外汇市场流动性:测量、普遍性和风险溢价。”
《金融杂志》 72 (3): 1119– 1151.
雷,埃莱娜。 2013年。“难题非三难:全球周期与货币政策的独立性。” 会议记录 - 经
济政策研讨会 - 杰克逊霍尔 .
Rime, Dagfinn, Andreas Schrimpf, 和 Olav Syrstad. 2022年。“覆盖利率平价套利。” 《金融研究
评论》 即将发布。
Scheicher, Martin, 和 Andreas Schrimpf. 2022年。“债券市场流动性——在动荡水域中航行。”
苏尔夫政策简报 (395): .
Schularick, Moritz, and Alan M. Taylor. 2012. “金融危机爆发:货币政策、杠杆周期与金融危
机,1870-2008。” 美国经济评论 102 (2): 1029–1061.
Shapley, Lloyd S. 1953. “n人博弈的价值。” 对博弈论理论的贡献 2 307–317.
塔拉斯谢夫,尼古拉,科斯塔斯·察察罗尼斯,和克劳迪奥·博里奥。 2016年。“基于S
hapley值的收益分配:方法与政策应用。” 金融评论 20 (3): 1189–1213.
沃德,费利克斯。 2017年。“识别危险区域:利用分类树集成和多个预测因子预测金融
危机。” 应用经济学杂志 32 359–378.
图1: 市场状况指数。 此图显示了五日移动平均线。
美国国债、货币和外汇(FX)市场状况指数
市场(分别对应上、中、下三个面板)。蓝色线条为原始系列。
在Aldasoro等人(2022年)的研究中使用全样本主成分分析(PCA)。红色 线
条是使用PCA构建的系列,其滚动估计从一条线开始
三年窗口期,每次扩展一个月。样本期从
2003年1月1日至2024年5月31日。
AR(增强现实)
完整
AR(增强现实)
完整
图 2: 样本量分位数损失。 此图显示了50分位数(左侧面板)、75分位数(中央面板
)和90分位数(右侧面板)回归的平均样本内预测损失。蓝色线条(标记为) AR
( 增强现实) 显示平均 样本内 损失在包含市场条件当前值(如方程(4)中所示)的
分位数回归模型中对于不同预测范围,红色线条(标记为 完整 ) 表示当量化回归模型
包含44个解释变量列表(如方程(5)所示)时的值。横轴为预测时间范围,从一个 月
到十二个月不等。样本期间为2003年1月至2024年5月。
FX, q50 FX, q75 FX, q90
1 2 3 4 5 6 7 8 9 10 11 12
MM, q50
1 2 3 4 5 6 7 8 9 10 11 12
MM,q75
1 2 3 4 5 6 7 8 9 10 11 12
MM, q90
AR(增强现实)
完整
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
TR, q50 TR, q75 TR, q90
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
AR(增强现实)
完整 AR(增强现实)
完整
AR(增强现实)
完整
AR(增强现实)
完整 AR(增强现实)
完整
AR(增强现实)
完整
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
AR(增强现实)
完整
AR(增强现实)
完整
AR(增强现实)
完整
AR(增强现实)
完整
AR(增强现实)
完整
分
位
数
损
失
分
位
数
损
失
图3: 样本外分位数损失。 此图显示了第50分位数(左侧面板)、第75分位数(中
央面板)和第90分位数(右侧面板)回归的平均样本内预测损失。蓝色线条(标记为
) AR(增强现实) 显示平均 样本外 损失在不同预测区间内,当分位数回归模型仅
包括市场状况的当前值(如方程(4)所示),红色线条(标记为 完整 显示在包含4
4个解释变量列表(如方程式(5)所示)的分位数回归模型中的平均损失。横轴为预 测
期限,范围从一个月到十二个月。样本期为2003年1月至2024年5月。
FX, q50 FX, q75 FX, q90
AR(增强现实)
完整
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
MM, q50 MM,q75 MM, q90
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
TR, q50 TR, q75 TR, q90
AR(增强现实)
完整
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
AR(增强现实)
完整
AR(增强现实)
完整
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
分
位
数
损
失
图4: 随机森林在样本外的表现 此图显示了随机森林模型与自回归模型在分位数损失
上的差异。分位数损失是根据我们对不同预测时长的样本外预测计算的。负值表示随
机森林模型的表现优于自回归模型。阴影区域是90%置信区间。样本期间为2003年1 月
至2024年5月。
图5: 重要特征用于预测货币市场危机(MCI)。 此图显示了从随机森林的样本外预
测中得出的Shapley值,用于预测货币市场MCI的90%分位数,三个月前的情况。每一 行
显示了在样本外预测中指定解释变量的Shapley值(由x轴指示)。行按指定解释变 量的
绝对Shapley值降序排列。
高度
MCI (MM)
TRP (6ma)
法案3m
GFC Index
TRA
差值(10年/2年)
CP发行
HYNEIO (6ma)
10年期利差
情绪
MCI (FX)
TRP
第四季度,3个月欧元(EUR)
PDCoupon
MMF (6ma)
IV JPY 3m
交换 3m2y
IV GBP 3m
过 量 BP
FFlow_dmHY (6ma)
FFlow_emE (6ma)
FFlow_dmIG (6ma) 经
济意外(美国)
交易失败。
FFlow_dmB (6ma)
SKEW
MCI (TR)
DXY
经济意外(全球)
FFlow_dmE (6ma)
情绪(6个月)
差值(2年/3个月)
VIX
HYNEIO
FFlow_dmB
FFlow_emB (6ma)
移动
FFlow_emE
货币市场基金
FFlow_dmE
FFlow_dmHY
FFlow_dmIG
chTRA
FFlow_emB
低
SHAP值(对模型输出的影响)
特
性
特
征
值
图6: 重要特征用于预测外汇市场条件指数(FX MCI)。 此图显示了从随机森林的
样本外预测中得出的Shapley值,用于预测外汇MCI的90%分位数,三个月前的情况。 每
一行显示了在样本外预测中特定解释变量的Shapley值(由x轴指示)。行根据特定 解释
变量的平均绝对Shapley值按降序排列。
高度
第四季度,3个月欧元(EUR)
MCI (FX)
MCI (TR)
情绪(6个月)
IV GBP 3m
法 案 3m
交 换 3m2y
GFC Index
PDCoupon
情绪
IV JPY 3m
VIX
10年期利差
经济意外(全球)
过 量 BP
MCI (MM)
差值(2年/3个月)
差值(10年/2年)
经济意外(美国)
FFlow_dmE (6ma)
CP发行
FFlow_dmIG (6ma)
移动
FFlow_dmHY
FFlow_emE (6ma)
HYNEIO
TRP
DXY
FFlow_emB (6ma)
FFlow_emE
SKEW
货币市场基金
FFlow_emB
FFlow_dmE
TRP (6ma)
FFlow_dmHY (6ma)
TRA
交易失败。
HYNEIO (6ma)
FFlow_dmIG
FFlow_dmB (6ma)
FFlow_dmB
MMF (6ma)
chTRA
低
SHAP值(对模型输出的影响)
特
性
特
征
值
图7: 重要特征用于预测国库市场MCI。 此图显示了从随机森林的样本外预测中得到
的Shapley值,针对三个月前国债MCI的第90百分位数。每一行显示了指定解释变量在 样
本外预测中的Shapley值(由x轴指示)。行按指定解释变量的平均绝对Shapley值 降序
排列。
高度
MCI (TR)
情绪(6个月)
情绪
交换 3m2y
CP发行
DXY
法 案 3m
交易失败。
移动
FFlow_emB (6ma)
差值(10年/2年)
MCI (FX)
PDCoupon
SKEW
差值(2年/3个月)
第四季度,3个月欧元(EUR)
FFlow_dmE (6ma)
IV GBP 3m
过 量 BP
经济意外(美国)
IV JPY 3m
HYNEIO (6ma)
MCI (MM)
FFlow_dmIG (6ma)
TRP
FFlow_emE (6ma)
MMF (6ma)
FFlow_dmB (6ma)
经济意外(全球)
TRP (6ma)
TRA
HYNEIO
10年期利差
货币市场基金
FFlow_dmHY (6ma)
GFC Index
VIX
FFlow_emE
FFlow_dmIG
FFlow_emB
FFlow_dmE
FFlow_dmB
FFlow_dmHY
chTRA
低
SHAP值(对模型输出的影响)
特
性
特
征
值
表 1: 输入变量按市场划分的MCI构建。 面板A至C列出了估计外汇、国债和货币市场
MCIs的输入变量。我们的估计涵盖了从2003年1月1日到2024年5月31日的期间。
面板A:外汇市场
变量
摩根大通外汇波动
指数
定义
3个月期权隐含波动率(G10和新兴市场)
市场货币(ing)
来源
彭博社
引用价差 报价的即期汇率买卖价差(欧元,)
日元(JPY)、英镑(GBP)、瑞士法郎(CHF)兑美
数据域
元(USD)。
跨货币基差 欧元-日元-英镑-瑞士法郎/美元交叉货币基点。 彭博社
三角形VLOOP 五日移动平均的三角形无套利
USD-EUR-FX,USD-GBP-FX之间的偏差
在FX = EUR/GBP, CHF, JPY,正如黄等所提及。
al (2021).
数据域
面板B:国债市场定义
变量
迈弗迪克斯指数 美国国债收益率波动由1个月期权隐含
关于2年、5年、10年和30年期国债的定价。
来源
彭博社
引用价差(2008年之前) 1st to 4th off-the-run US Treasury yield spreads的平
suries (2, 5, 10 years).
均彭值博社
引用的利差(2008年后) 平均期限外美国国库券的利差;(到期-
权益:年,年,年,-10年)。
Tradeweb
报价时间 交易员返回首次报价所需的时间
询盘最终促成交易,交易金额为至10-
一年期离岸美国国债。
Tradeweb
流动性指数(GVLQ-
美元(USD)
对于美国政府证券。平均收益率偏差
与拟合的美国国债收益率曲线相比
1年期以上的债券。
彭博社,
美联储
在位溢价 差额在成熟10-的票面收益率之间
1年期美国国债及新发行10年期国债收益率国
债,如Christensen等人(2017年)所述。
彭博社
绝对隔夜指数掉期(OIS) 利绝差对值 OIS-美债利差(到期日
绑定:6个月、2年、5年)。
彭博社
绝对国债期货
基础
隐含值与实际值5年绝对差额
贸易回购利率(2周移动平均)。
彭博社
面板C:货币市场定义
变量
商业票据(CP)-
零息债券(OIS)利差
3个月(A1/P1,财务(Fin)AA)或1个月
(非金融AA级,或非金融A2/P2级)信用证利率减去
OIS.
来源
彭博社
回购-隔夜指数掉期(OIS) 利绝差对值(1个月或1周)的美国GCF(全球清算组织)
回购利率减去隔夜指数互换(OIS)。
彭博社
TED利差 三个月期LIBOR减去国库券利率。 彭博社
伦敦银行间同业拆借利率
(L
I三BO个R月)期与L隔IB夜OR指减数去掉三期个(月O期IS)I利S。差 彭博社
表 2: 预测因素的描述性统计摘要。
面板A 美国联邦储备银行净每月购买美国政府债券(以万亿美元计,TRP(tln)),以及其六个月移动
平均(TRP(tln,6ma)),美国国债在联邦储备银行存款的月平均和变化(TRA(bln)或chTRA(bln
)),美国国债结算中的主要交易商违约(DealFails(bln)),以及主要交易商净息票国债持有量(P
DCoupon),如Du等(2023)所述。 面板B 每月从EPFR流向发达/新兴债券(后缀为dmB或emB)和股票
(dmE或emE)市场、高收益债券(dmHY)、投资级(dmIG)、家族内部资金流入货币市场基金
(MMF)、高收益债券基金(HYNEIO)或股票基金(Sentiment),如Ben-Rephael等人(2012)和B en-
Rephael等人(2021)所述。 面板C : 过剩债券溢价(ExcessBP)来自Gilchrist和Zakrajˇsek(201 2年),
广义美元指数(DXY),基于Rey(2013年)的全球金融周期指数(GFC Index),美国或全球经济意外
指数(Econ Surprise),由CBOE报告的10年期国债期货维持保证金(以千美元为单位)(10 y Margin),
总商业票据发行额的美元总额(以十亿美元为单位)(CP issuance),3个月美国国库券发行额(Bill
3m),以及10年期和2年期国债收益率的差异(10 y/ 2 y ),并且在2年期和3个月期国债收益率(2 y/ 3 m ).
面板 D 并且 E :MOVE、VIX、SKEW指数,三个月的EUR/GBP/JPY隐含波动率(IV EUR/GBP/JPY
3m),以及市场流动性条件当前值。如果原始数据在更高的频率下可用,则所有变量都将汇总到月度频
率。样本期从2003年1月到2024年5月。
计数 均值 标准差 最小值 25% 分位数 50% 分位数 75% 分位数 最大值面
板A:美联储/政府相关
TRP (tln)
TRP (tln, 6ma)
特拉(10亿)
chTRA (亿)
交易失败(亿)
PDCoupon (tln)
面板B:基金流动
dmB FFlow
dmE FFlow
FFlow dmHY
dmIG FFlow
emB FFlow
FFlow emE
dmB (6ma) FFlow
FFlow dmE (6ma)
dmHY (6ma) FFlow
dmIG (6ma) FFlow
FFlow emB (6ma)
emE (6ma) FFlow
MMF
HYNEIO
情绪指数
MMF(6个月)
HYNEIO (6ma)
情绪(6ma)
面板C:宏观经济条件
ExcessBP
DXY
GFC指数
经济意外指数(美国)
经济意外(全球)
10年期利差(千)
CP发行(亿)
法案 3m
差值(10年/2年)
差值(2年/3个月)
面板D:波动性
MOVE
VIX
SKEW
IV EUR 3m
IV GBP 3m
IV JPY 3m 32
交换3m2y
面板E:MCI指数
MCI (TR)
MCI(MM)
MCI (FX)
附录
A1 示例:具有两个特征的 TreeSHAP
在本节中,我们以具有两个特征的树为例,回顾了计算特征Shapley(或SHAP)值的 关
键步骤。
树遍历。对于每个特征,算法遍历树以确定该特征在每个节点的贡献。这涉及计算在
包含与排除特征时模型预测的变化。
路径贡献。对于树中的每条路径,算法计算该路径上每个特征的贡献。这是通过考虑
特征在树中每个分叉处的边际贡献来完成的。
平均贡献。每个特征的Shapley值是其所有可能路径和所有集成树中贡献的平均值(如 果
使用森林或提升模型)。
考虑到以下结构的决策树:
• 根节点在处分割
• 根节点的左子节点是一个预测值为10的叶节点。
• 根节点的正确子节点在x . 2处分裂
•节点在x处分叉的左侧子节点是一个预测为的叶节点。
• 在x上分裂的节点正确的子节点是一个预测值为的叶子节点。
根 : x1
10 Split: x2
20 30
为了计算Shapley值, x 我们需要考虑的贡献为 x 至
1 1
所有可能特征子集的预测。
第一步:计算 f(S) 和 f(Sϕ {x }) 1
• S = ϕ 没有提供翻译内容。
– 平均预测,无任何特征:
• S = {x 2}:
10 + 20 + 30
3
= 20
– 使用预测 x2:
ϕ 如果x2 位于左子节点:20
ϕ 如果x2 在正确孩子中:30
– 平均预测:
20 + 30
2
= 25
• Sϕ {x} 1} = {x 1}:
– 使用预测 x1:
ϕ 如果x1 在左侧子节点中:10
ϕ 如果x1 位于正确孩子位置:
· 进一步的分歧 x2平均值为20至30:
– 平均预测:
20 + 30
2
10 + 25
= 25
第二步:计算贡献
• 当 S=ϕ 时 x 的贡献:1
=
2
f(Sϕ {x }) −f(S) = −20 = − 1
• x 在 S = {x } 时的贡献:1 2
f(Sϕ {x }) −f(S) = −25 = − 1
步骤 3:平均贡献
• Shapley值是x在所有子集中贡献的平均值:1 1
1 =
ϕ (( − 2 . 5) + ( − 7 . 5)) = ( − 10) = −5
在这个例子中,Shapley值x 对于 x 通过考虑其边际值来计算。
1
1 2 2
对特征的所有可能子集的贡献。这些贡献被平均以提供一个公平的代表性。 x 此方法
对模型预测的影响。
1
确保每个特征的贡献得到公平评估,同时考虑到模型中所有可能的交互和依赖关系。T
reeSHAP算法通过利用树结构高效计算这些值,使其适用于大型且复杂的基于树的模 型
成为可能。