这是两个衰退衍生指标的故事_5G_科技世界_切尔网

　　在经济周期预测中，有两种衰退衍生指标(recession-derivative indicators, RDIs)被广泛用作预测对象，即(1)如果在未来某一特定时间点恰好出现衰退，则目标变量取值1;(2)如果在未来某一特定时间点出现衰退，则目标变量取值1。使用日收益率差作为说明性预测因子，我们使用接收器操作特征分析正式和定量地比较了两种rdi。在1962年至2021年的8次NBER衰退中，我们发现，在其他条件不变的情况下，通常第二个RDI会使预测器表现更好。然而，在某些情况下，根据预测范围、衰退持续时间和信号的时间特征，第一个RDI可以产生更好看和更有用的预测。我们还考虑了Peláez (J Macroecon 45:384-393, 2015)提出的半年一次的年表，并发现其表现处于其他两个的中间。我们的分析表明，特定RDI的选择应该由特定决策环境下预测用户的需求决定。

　　Diebold(2006)强调了对预测“对象”的清晰认识和意识的重要性，这是成功预测任务的六个基本考虑因素之一。在经济衰退预测的背景下，有两种可选的方法，从既定的经济衰退日期重新定义预测对象:(1)在未来的特定时间点出现经济衰退，例如，从现在开始的h期，脚注1;(2)经济衰退将在未来的特定时期开始，例如，下一个h期的任何时间。以下(Harding and Pagan 2016)，我们将这些替代预测对象称为衰退衍生指标(rdi)，分别用RDI1和RDI2表示。在美国，rdi通常来源于国家经济研究局(NBER)建立的商业周期年表。许多研究人员在使用这两种RDI时没有认识到，在其他条件不变的情况下，使用一种RDI可能会使一组预测看起来比使用另一种RDI更好。

　　显然，第二个RDI要求不高，也更容易预测，因为它不要求经济衰退的确切开始日期。Lai和Ng(2020)认为，与RDI1相比，RDI2是一个限制较少的目标，对政策制定者来说更有意义。Stekler和Ye(2017)从天气预报中提供了一个相关的类比来说明这一优势。“一个开车去长途旅行的人想知道在接下来的八小时内是否会下雪。司机对旅途中某个特定时间的天气预报是否会下雪不太感兴趣。(Stekler and Ye, 2017)。

　　请注意，除了这两个之外，还可以使用其他预测对象。例如，Peláez(2015)构建了一个半年一次的衰退指标年表，从包含NBER高峰月份的日历半年到包含下一个低谷月份的日历半年开始的时期等于1，其他时期等于0。Peláez(2015)没有预测每月一次的衰退，而是将目标对准了转折的半年，从而扩大了目标范围，并表明他的“双年模型”与传统的衰退预测对象相比表现得非常好。

　　然而，Harding和Pagan(2010)认为，在RDI1下，样本中经济衰退的无条件概率远低于RDI2下的概率，这主要是因为经济扩张与经济衰退并不对称。因此，更高的经济衰退概率以及RDI2的额外交货时间仅仅是如何定义rdi的人为因素。当然，RDI2将捕捉到更多的未来冲击，但它也可能有额外的假警报风险，这取决于预测范围内的其他中介因素。

　　Lai和Ng(2020)以及Borio等人(2020)考虑了两种替代rdi对经济衰退预测模型成功的比较作用。前一篇论文探讨了使用RDI2以及三个额外模型改进的衰退预测质量，包括一个动态logit模型，一个从大量月度和每周经济变量中提取月度和每周共同因素的动态因素模型，以及一个将共同因素与低频数据结合起来的MIDAS回归。Borio等人(2020)还对16个发达和新兴经济体的面板使用了包含大量金融风险因素的probit模型，以确定金融周期对衰退的作用。这两项研究都使用了许多预测评估标准，包括接受者工作特征曲线下的面积(AUROC)和产量差作为唯一的解释变量，对他们首选的模型进行基准测试。虽然(Lai和Ng 2020)发现证据表明RDI2通常比RDI1产生更高的AUROC，但Borio等人(2020)发现这两种rdi在许多国家的样本中产生了相似的结果。然而，这两篇论文都没有探讨一种RDI如何使同一组预测看起来比另一种RDI更好的途径。此外，这些预估模型的高级特性带来了对模型规格错误的额外敏感性。建模问题包括允许不同的参数，整合未知数量的因素的影响，这些因素的影响会随着时间的推移而变化，使用复古数据，处理锯齿边缘数据集，以及识别NBER在转折点几个月后宣布的衰退日期。正如Hwang(2019)充分证明的那样，最后一个问题在当前背景下尤其有问题，因为原则上它排除了使用NBER公告之前的变量进行预测。此外，样本中衰退时期的稀疏性使得很难辨别一种RDI对另一种RDI的具体贡献。

　　为了避免这些众多的建模问题，我们直接使用每日收益差数据生成接收者工作特征曲线(ROC)，而不估计任何参数模型。在当前情况下，我们的无模型方法还有许多其他优点:(i)实际的市场分析师每天都在实地监测实际收益率差，并实时观察其反转，因此我们的方法正确地模仿了市场观察者，而没有由于时间聚合而产生的扭曲。(ii)由于使用日常数据而增加的样本观测值有助于我们更精确地计算命中率和虚警率。(iii)对于预测评价，很大一部分样本被用作训练样本;因此，较少的实际衰退事件可以研究样本外预测练习。最后，(iv)由于预测是无模型的，直接由价差产生，因此不存在由于NBER回顾性公布拐点而导致的模型参数估计问题。通过避免这些可能混淆RDI在估计概率中的作用的问题，我们可以只关注一个问题，即特定RDI在报告的预测成功中的作用，通过抽象出研究人员在实时进行实际预测评估时面临的所有其他问题。脚注5

　　本文的目的是研究这些替代rdi在预测衰退时的细微差别。我们表明，RDI2虽然具有更高的总体AUROC，但可能并不总是产生更好的预测结果——几个环境因素，包括特定衰退的长度，衰退之前和期间信号的时间概况，以及预测范围，与特定的RDI相互作用，产生正确的撞击和假警报的特定组合，从而产生AUROC。在1962年至2021年的8次NBER衰退中，我们发现RDI2显著提高了AUROC。但更值得注意的是，在经济衰退时期，RDI1用同样的预测器做出了更具歧视性的预测。因为每次衰退都有不同的特征，通过研究RDI的作用，我们能够梳理出一个RDI比另一个更好的特征，以及为什么。这是本文在方法论上的主要贡献。

　　本文的计划如下:在第二节中，我们定义了rdi和预测规则。第3节介绍了我们使用的数据的细节以及使用1962-2021年整个样本的ROC分析。第4节给出了我们样本涵盖的每次衰退的相应结果。第5节将这两个RDI与Peláez(2015)提出的第三个RDI进行了比较。最后，第6节总结了我们的主要结论和对rdi使用的建议。

　　在本节中，我们正式定义了我们想要深入研究的两个主要rdi。我们首先让第t天的二进制NBER衰退指标为，如果它属于由NBER年表确定的衰退时期，则等于1，否则等于0。要预测的第k个RDI为。对于RDI1，等于NBER的衰退指标提前h天，即:

　　(1)

　　在第二个定义中，如果NBER衰退指标在接下来的h天中的任何一天开始为1，则RDI2等于1，否则为0，定义为

　　（2)

　　如果经济衰退在接下来的h天内开始，这个RDI等于1，否则等于0。显然，经济衰退的确切日期和持续时间对RDI2来说似乎并不重要。由于在接下来的h天中的某一天等于0时等于1，并且在它之后的一天等于1，因此RDI2的直接目的是预测经济衰退的转折点，参见Pagan(2019)和Borio等人(2020)。脚注6

　　在开始分析之前，计算RDI1和RDI2之间的一致性，看看它们在我们的样本中有多少重叠，这将是很有趣的。一致性C定义为

　　（3）

　　也就是两个rdi重叠的时间比例。使用1962年1月2日至2021年11月30日数据的两个12个月前rdi的联合分布总结在列联表1中，其中我们发现只有5.5%的病例不重叠。计算出的一致性值为0.95，这是一个非常高的值，因为衰退是一个相对罕见的事件，而且两个rdi在大多数时候都等于0。然而，在另一个RDI也处于衰退的情况下，在一个RDI下处于衰退的条件概率是Pr和Pr。因此，在我们关注的衰退期间，两个RDI的差异很大。

　　表1两个12个月前rdi的联合分布

　　由于我们的主要目的是在相同的环境下比较两个rdi，而不是做出最好的预测，因此我们在分析中使用收益率差作为唯一的指标变量。此外，我们没有使用任何参数模型(例如，Probit, logit等)，因此，收益率差直接用于二元预测[参见Berge和jord

　　(2011)， Lahiri和Wang (2013)， Bauer和Mertens(2018)]。我们的预测规则定义为

　　（4）

　　其中为第t天的价差值，为阈值，为任意一个rdi下的二元预测。给定日差的选定阈值，如果差值低于此值，则进行衰退预测。是一种特殊情况，在这种情况下，如果收益率曲线倒挂，就会做出衰退预测，这是常用的。通过我们深思熟虑的研究设计，我们没有使用复杂的模型，以避免可能扭曲我们比较的模型估计的棘手问题。此外，由于不涉及模型估计，因此样本内和样本外预测之间没有差异。

　　给定值，有四种可能的结果描述二元预测及其结果的联合分布:(a)预测是衰退，结果是衰退;(b)预测不是衰退，结果是衰退;(c)预测是衰退，但结果不是衰退;预测不是衰退，结果也不是衰退。每种情况的比例为，并总结在一个列联表中，即(见表2)。我们将H定义为命中率，即正确预测衰退时期的比例:。H也被称为真阳性率或灵敏度。虚警率(F)定义为非衰退期被错误地认为是衰退期的比例:H和F可以计算所有可能的阈值。因此H和F都是阈值的函数。从现在开始，我们使用和来表示命中率和虚警率是的函数。通过对的所有可能值进行绘图，我们得到了接收者工作特性(ROC)曲线。AUROC，即曲线下的面积，就可以计算出来了。AUROC越大，性能越好。

　　表2预测与结果联合分布

　　美国国家经济研究局的衰退指标被用作使左侧产出变量的基础。评估价差的每日数据为10年期国债不变期限减去3个月国债不变期限，即1962年1月2日至2021年11月30日。不仅3个月利率更能反映市场，Bauer和Mertens(2018)表明，在没有任何期限溢价或量化宽松调整的情况下，10年期和3个月利率之间的差异是预测衰退最有效的期限价差。虽然月度数据在AUROC方面产生了类似的结果(稍后将显示)，但我们使用每日价差数据不仅是因为它具有高频率的及时预测，而且还因为它有更多的观察值可供计算，这在计算相对较少的衰退时有利于我们在数字上进行计算。这对于下一节针对经济衰退的分析很重要，尤其是在涉及到非常短的2020年经济衰退时。日息差与NBER衰退阴影在图1中绘制，显示了收益率息差预示衰退的持久能力。请注意，收益率曲线的斜率通常在衰退前几个季度反转，而利差值在衰退前和衰退期间并不总是保持在低位。此外，1982年以后，价差值在降到广泛监测的零阈值以下时变得很害羞。

　　图1

　　NBER的衰退逐渐减弱并蔓延

　　由于假期和不同月份的天数不等，不同月份的利差观测值可能不相等。为了在定义地平线时简化我们的分析，我们将每个月的观测次数固定为22次，这是最常见的数字。如果观测值少于22个，并且一个月的工作日有假日，则假日被视为缺失值并线性插值。如果仍然少于22个观测值，我们在月初插入人工缺失观测值，并进行线性插值。总之，缺失值被线性插值，因此每个月有22个观测值。如果一个月有超过22个观测值，我们将该月的最后几个观测值替换为它们的平均值，这样每个月就有22个观测值。例如，如果一个月有23个观测值，我们将第22和23个观测值替换为它们的平均值。这些内插和平均的观测值只占样本中可以忽略不计的一部分，最终结果不受影响。分析简化了，具有可行性。关于低频期高频观测次数不恒定问题的讨论，请参见(Ghysels 2013)和Ghysels et al.(2020)。在对数据进行初始处理后，每个月的观测次数相同，我们得到了从1962年1月1日到2021年11月最后一天的观测数据。在图1中，每日息差与NBER的衰退阴影相对应，显示出其预示美国衰退的显著周期性力量。

　　此外，虽然NBER的衰退指标是月度的，但由于没有月份间的变化，它可以转化为每日变量——如果一个月处于衰退状态，那么该月的所有日子都处于衰退状态。通过将NBER指标转化为日常指标，我们可以将混合频率模型转化为单一高频模型，并在考虑特定目标时避免不必要的复杂性。

　　在图2的两个面板中绘制了12个月和6个月的两个rdi的ROC曲线。显然，RDI2的ROC曲线在曲线上的所有阈值上都优于RDI1。但是，在1.0左右的相关阈值处，两个ROC曲线之间的楔形要大得多。我们进一步通过实施DeLong检验(DeLong et al. 1988)来比较两个rdi的ROC曲线，并假设RDI1的AUROC等于RDI2的AUROC。在这两种情况下，检验拒绝原假设，并倾向于RDI2, p值小于0.0001。

　　图2

　　两种rdi的ROC曲线。注意:蓝点表示特定的阈值及其在ROC曲线上的值。(网上彩色图)

　　图3

　　注:绿线代表RDI1，红线代表RDI2。(网上彩色图)

　　与之前的许多研究一致[例如，Ng(2012)和Hwang(2019)]，在解释rdi时，传播在12视界上效果最好，因此，我们特别关注这一视界。此外，我们还对其他视界进行了实验，以探讨预测视界和指标的隐含解释力如何影响rdi的绩效。在图3中，我们绘制了1979-2021年与两个rdi相关的样本外递归估计的衰退概率，该模型基于静态概率模型，spread是唯一的解释变量。从未来12个月的预测中，我们发现(Lai和Ng 2020)， RDI2在大多数情况下比RDI1反映了更多的衰退可能性。然而，在6个月的时间跨度内，令人惊讶的是，我们没有发现同样的结果。除1975-1984年外，RDI1对6个月前预报的预测概率始终高于RDI2。当然，这些较高的概率并不一定转化为ROC方面的优越预测。表3报告了每个水平的AUROC和每个RDI。我们可以看到，RDI2的AUROC保持较高，且随预报水平变化不大，始终高于RDI1。注意，RDI1的AUROC在视界6特别低(仅为0.77)，这不是传播的最佳视界。即使在这个范围内，rdi2的AUROC为0.90，比RDI1增加了近16.9%。这突出了RDI2在视界上的灵活性和健壮性。这一结果值得注意，因为6个月是经济衰退预测中普遍使用的期限，参见Stock和Watson (1993b)。与RDI2一样，NBER最初设计的综合领先指数旨在更灵活地预测近期(6-9个月)的衰退，而无需指定特定的范围(见Lahiri和Moore 1992)。在他的评论中，Zarnowitz(1993)提出了Stock和Watson (1993a)采用的6个月固定视界预测方案的问题，认为这是对NBER传统的基本背离，并建议进一步研究。

　　表3各层AUROC比较

　　图4

　　柯伊伯值的阈值

　　由于AUROC是一个综合了所有可能(但通常不是所有相关)阈值的全局度量，我们还通过查看Kuipers评分(KS)来比较两个rdi。RDI k的KS定义为

　　（5）

　　它随阈值而变化。我们使用整个样本绘制图4中两个rdi的KS。Berge和jord

　　(2011)根据效用函数证明了Kuiper分数，其中命中的收益等于错过的成本的绝对值，并选择了使该函数最大化的阈值。我们发现，除了少数极端阈值外，RDI2的KS几乎总是高于RDI1的KS，正如我们之前发现的那样，这个楔形在6个月前的预测中更为明显。图3中6个月预测的较高RDI1概率转化为较差的KS值。可以注意到，KS在阈值0.9%至1%(也称为约登指数)附近最大。我们将选择0.9%来产生我们稍后将展示的一些结果。传统的阈值为零(即收益率差的反转)将产生相当低的KS分数。为了证实这些结果，图5显示了RDI1和RDI2[和]在不同阈值下的条件密度。两种密度相交的点(约为0.9%)使整个样本的KS达到最大值。有趣的是，图5的顶部面板表明，对于具有两个视界的前四次衰退，ks最大化阈值接近于零(约0.2%)，这是利差的传统反转。参见(Lahiri and Yang 2013)对这一结果的进一步阐述。

　　总而言之，当我们比较1962年至2021年涵盖所有8次衰退的整个样本的两个RDI时，我们发现压倒性的证据表明，使用RDI2作为NBER衰退年表的预测对象，同样的预测器看起来会更成功。从这个意义上说，在预测同样的衰退序列时，RDI2将使预测看起来比RDI1更成功。Lai和Ng(2020)认为，从政策制定者的角度来看，RDI2也更合适。然而，可以想象，RDI1在不同的政策环境中可能更合适，例如，知道股市崩盘的确切时间可能有助于避免在牛市中过早抛售股票。对于不同的从业者，给定相同的衰退信号序列，每个RDI的有用性和可靠性各不相同。对于不太关心政权更迭确切时间的预测用户来说，RDI2可能是更好的选择。

　　图5

　　有条件的密度。注意:红色密度曲线是有条件的。黑色虚线密度曲线是有条件的。密度是基于未来12个月的水平。(网上彩色图)

　　为了进一步了解使RDI2优于RDI1的因素，我们逐一考察了自1969年以来的8次经济衰退的相对表现。这些衰退跨越(1969:12-1970:11)、(1973:11-1975:3)、(1980:1-1980:7)、(1981:7-1982:11)、(1990:7-1991:3)、(2001:3-2001:11)、(2007:12-2009:6)和(2020:2-2020:4)。由于它们在持续时间、可预测性和敏锐性方面高度异质，我们可以梳理出不同预测和背景对它们相对表现的独立贡献。例如，在样本中，衰退的持续时间从2个月到18个月不等。除了1981:7-1982:11和2007:12-2009:3的衰退外，我们样本中的其他衰退之后都是几个月的增长放缓，因此可能更容易预测，见Lahiri(2010)。

　　我们在每次衰退开始前两年开始逐个衰退评估，并在衰退的最后一天结束。对于(1981:7 - 1982:11)次经济衰退，我们从一年前开始，因为1980年经济衰退结束和1981年经济衰退开始之间只有一年。最近四次衰退的阈值是固定的，正如前面所示，这是产生最佳总体KS的阈值。对于我们样本中的前四次衰退，阈值设定为0.2，因为我们的实验表明，在前几十年，0.2左右的值是最佳的。我们考虑了6个月和12个月的时间跨度来寻找它们的独立影响。表4报告了每次衰退的预测评价。最直接的观察是，对于1973:11-1975:3(衰退2)和1990:7-1991:3(衰退5)的衰退，在地平线12预测下，RDI1在更高的命中率、更低的误报率和更高的柯伊伯分数方面表现得比RDI2更好。但对于视界6,RDI1在衰退5(即1990:7-1991:3)时失去了优势，但在衰退2(即1973:11-1975:3)时继续保持优势。在表4中的所有其他情况下，RDI2产生了更好的性能。为了理解衰退长度的作用，以及衰退前和衰退期间利差的行为，我们在图6和图7中分别给出了两次衰退的收益率息差图以及RDI1和RDI2的值。在这些图表中，红线(虚线)和蓝线分别表示和的时间段。没有红虚线的句号和没有蓝虚线的句号。这些线是在ks最大化的差值处绘制的。如果息差低于或高于这两条水平线所标记的水平，则预示着经济衰退。

　　表4经济衰退预测结果

　　衰退1(1969:12-1970:11):两个rdi的KS在12个月范围内相似，RDI2的KS略高。这是因为这次衰退持续了11个月，接近预测范围。因此，两个rdi在大多数时间重叠，并产生相似的结果。这种细微的差异来自于1个月的非重叠期，如图6a所示。在6个月的期限内，RDI2有更好的KS。这一解释得到了图7a的支持，在图7a中，我们看到了衰退开始时的一段时间，这与预测范围短于衰退持续时间的事实有关。在那次衰退开始的早期，利差的价值上升得很高，给出了非衰退信号，而RDI1将其视为假信号，从而降低了命中率。另一方面，RDI2的命中率不受影响，因为在衰退内部进行预测时，没有更多的峰值转折点。

　　图6

　　每次衰退都有两个rdi: 12个月的头。注:黑线表示价差。红色虚线表示RDI1=1的时间段。蓝线表示RDI2等于1的周期。两个rdi的线都是在我们使用的阈值处绘制的(前4次衰退为0.2%，后4次衰退为0.9%)，以帮助我们了解利差是否低于该阈值。(网上彩色图)

　　图7

　　每次衰退都有两个rdi:提前6个月。注:说明见图6

　　衰退2(1973:11-1975:3):在12个月的范围内，RDI1的KS为0.39，高于RDI2的KS 0.16。这种解释与RDI2在长期衰退中额外的假警报有关。在这次经济衰退期间，利差值继续保持在低水平和负值，给出了持续的经济衰退预测，这些预测被RDI2视为错误，被RDI1视为正确。因此，RDI1的虚警率低于RDI2。在这种情况下，RDI1从长期衰退中“受益”，而且预测器在衰退开始后继续发出衰退信号。上述解释可以在图6b中得到证实，其中，和(利差低于阈值)出现在衰退的头几个月。相比之下，6个月的结果非常接近，也有类似的解释(见图7b)。

　　衰退3(1980:1-1980:7):在12个月的范围内，由于误报率较低，RDI2的KS较高，为0.69。1980年经济衰退的持续时间相对较短(6个月)。在图7c中，由于RDI2在时间方面不敏感，因此在衰退开始前6个月的衰退预测被RDI2视为真实。但这些衰退预测被RDI1视为虚惊一场，因为尽管衰退开始得很快，但它结束得如此之早，以至于12个月后就不复存在了。在6个月的范围内，两个rdi的结果是相同的，因为衰退的持续时间与预测范围相同，并且两个rdi重叠。

　　衰退4(1981:7-1982:11):在12个月的范围内，这两个rdi的KS相似，分别为0.64和0.67。这是因为在衰退开始时的非重叠时期，RDI2的额外假警报和额外的真实负面预测相互抵消;见图6d。在6个月的时间尺度上，RDI1的KS由于较低的命中率而变得更低。这次衰退的持续时间为16个月，比预测的时间长了10个月。在经济衰退期间的大部分时间里，利差都很高，在经济衰退的前10个月里，RDI1将非衰退预测计算为假，RDI2将其计算为真(见图7d)。这导致RDI1的命中率很低。这是一个RDI2“受益”于其对衰退持续时间不太敏感的例子:一旦衰退开始，RDI2假设为0值，并且不再担心较低的命中率。

　　衰退5(1990:7-1991:3):在12个月的范围内，RDI1的KS为0.63，高于RDI2的KS 0.52。在图6e中，在衰退之前的一段时间里，和。在此期间，利差的价值显著上升，并给出了非衰退信号，这是RDI2错误的。RDI1认为这些非衰退预测是正确的，因为衰退提前结束了。因此，RDI1的命中率高于RDI2的命中率。在这个例子中，RDI1从经济衰退持续时间短和预测器的早期复苏中“受益”，这对许多关心时机的金融人士来说很重要。在6个月的时间里，由于命中率较低，RDI1不再产生更好看的结果。这种解释类似于衰退4(提前6个月);见图7e。

　　衰退6 (2001:3-2001:11):RDI2的结果在两个层面上都更好。在这次仅持续8个月的短期衰退中，RDI2再次受益于地平线12的不那么严格，就像衰退3一样。此外，由于衰退持续时间超过6个月，RDI1在衰退的前两个月有大约2个月的假阴性(错过衰退)，这降低了它的命中率。

　　第七次经济衰退(2007:12-2009:6):第七次经济衰退是另一个长期的经济衰退。由于RDI2对衰退持续时间的敏感性较低，因此在两个层面上都能得出更好的结果。这种解释与经济衰退(1981:7-1982:11)相似。尽管这次衰退与第二次衰退(1973:11-1975:3)相似，但衰退前和衰退期间的利差表现却大不相同。两个rdi的高虚警率是由于2006年之前利差的早期下降，2006年的衰退信号在经济上是正确的，但太早了，不能被两个rdi视为真实。Borio et al.(2020)对这个问题进行了深刻的讨论。

　　第8次衰退(2020:2 - 2020:4):由于与COVID-19相关的特殊情况，2020年的衰退非常短暂。RDI2由于其不那么严格，在两个视界上都得到了更好的结果。原因与第6次和第3次衰退相似。然而，异常升高的误报率再次由传播的早期下降引起，如图7h所示。

　　从上述分析中可以清楚地看出，衰退信号在衰退前和衰退期间的时间分布必须与衰退的开始和持续时间同步，以最大限度地发挥RDI的歧视性力量。通常，作为唯一的预测指标，价差会在几个周期内反转，并迅速恢复。在这种情况下，如果衰退被证明是长期的，两种rdi都会产生许多错误信号。Lai和Ng(2020)以及Borio等人(2020)最近的工作表明，如果在其他预测范围内补充具有预测值的其他相关衰退预测因子，则复合预测因子可能会在不牺牲误报率的情况下提高准确率。

　　近年来，许多重要的论文探讨了不同类型的收益率差和其他预测因子在预测欧元区和其他地区经济衰退中的作用，通常使用AUROC(见Moneta (2005)， bell

　　和费拉拉(2009)，Fendel等人(2021)和Sabes和Sahuc(2022))。本文所开发的方法也可以适用于其他国家。最后，我们应该指出，我们的结果是规范性的，不能预先用于选择一个或另一个RDI。它应该由对下一次衰退的开始日期和持续时间的预期以及预测者在特定决策背景下的损失函数决定。

　　摘要

　　1 介绍

　　2 衰退衍生指标

　　3.每日价差数据及全样本ROC分析

　　4 个别衰退的两种rdi比较

　　5 第三次RDI

　　6 结论

　　笔记

　　参考文献

　　致谢

　　作者信息

　　道德声明

　　搜索

　　导航

　　#####

　　Peláez(2015)引入了所谓的半年衰退预测模型，它不是预测衰退的月份或开始月份，而是预测转折的半年。因此，他的预测对象被定义为从包含NBER高峰月份的日历半年开始到包含下一个低谷月份的日历半年为1，其他期间为0。因此Peláez将NBER的衰退假数据转换为两年一次的年表。只要半年中至少有一个月是NBER的衰退，那么整个半年就是衰退。例如，在Peláez的重新定义中，2001年3月至2001年11月的衰退(我们的衰退6)跨越了2001年上半年和下半年，持续了12个月。

　　通过半年一次的观察，Peláez表明，他的简单的预测模型与收益率息差和一个复合金融变量成功地预测了自20世纪70年代以来的所有峰值，没有任何误报。它也优于(Wright 2006)的规格。尽管(Peláez 2015)没有提出他的两年一次的模型作为另一个RDI，但我们之前已经指出，它确实可以被解释为另一个RDI。作为我们分析的自然延伸，我们现在考虑他的重新定义，并与RDI1和RDI2进行比较。

　　请注意，为了将他的半年度年表作为另一个RDI进行评估，没有必要将所有数据转换为半年度平均值。因此，为了便于比较，我们将这个定义的频率定为每日，但保持波峰和波谷的日期与Peláez的RDI3相同。根据Peláez的想法，这个定义中的2020年衰退(recession 8)是从2020年1月的第一天到6月的最后一天。其他衰退的日期在Peláez(2015)表1的第四和第五列中定义。我们称之为RDI3，定义为

　　（6）

　　其中是由Peláez提供的半年一次的经济衰退指标年表(在我们的分析中变成了每日一次)。我们计算了RDI3的所有预测评价统计量。在上图8中，RDI3的ROC曲线与其他两个rdi进行对比。RDI3的H、F、KS见表5。可以看出，RDI3的结果在命中率、虚警率和AUROC方面都处于其他rdi的中间。由于RDI3倾向于使预测对象更宽，因此可能更容易命中。例如，Peláez RDI的衰退平均持续时间为16.2个月，而NBER的原始年表为12.2个月。正如我们在这些表中看到的，RDI3给出的结果接近RDI1，但比RDI2的差别要小得多。我们的方法评估Peláez的建议作为一个新的RDI，但没有使用两年一次的观察进行实证实施。言外之意，(Peláez 2015)报告的RDI3非常有利的结果可能是由于将月度数据汇总为两年平均值，并将峰值日期定为六个月事件，而不是每天或每月。

　　最后，由于该领域的大多数最新研究都使用了月度数据[例如，Stekler和Ye (2017)， Lai和Ng(2020)以及Vrontos等人(2021)]，我们使用月度数据重新生成图8a, b中的结果，并在图8c, d中进行了报告。我们发现三个rdi的性能和顺序非常相似，因此我们可以得出结论，本文报告的结果不是使用日常数据的人为产物。然而，由于在图8a、b中使用了更多的观测值，这些曲线比图8c、d中的曲线更平滑。前面我们已经强调了在我们的背景下使用日常数据的其他重要优势。

　　图8

　　ROC曲线比较:3个rdi

　　表5经济衰退预测结果:RDI3

　　使用收益率差作为说明性衰退预测指标，在不估计任何参数模型的情况下，我们正式和定量地比较了在衰退预测中广泛使用的两种可供选择的衰退衍生指标，即:(1)如果NBER在未来正好在预先指定的地平线上出现衰退，则目标变量取1 (RDI1);(2)如果在下一个指定的周期(RDI2)内的任何时间开始出现衰退，则目标变量取值1。无模型方法直接从原始收益率差数据中生成预测，这不会受到由于模型规格错误和NBER延迟宣布转折点而导致的参数估计问题的影响。从业人员能够监控收益率差的实际值，而不是从基础模型估计的概率，当它接近负值时，这是我们方法的一个真正优势。

　　总结我们的发现，我们发现总的来说，RDI2往往比RDI1表现出更好的结果，因为它对经济衰退何时开始的定义不那么严格，对经济衰退的持续时间也不那么敏感。然而，考虑到相同的预测指标和相同的衰退年表，RDI2可能不会在所有情况下都产生更有利的结果。我们确定了以下情况，其中RDI1预计会产生更好的结果:(1)衰退相对于预测范围较短，预测器低于阈值并在衰退开始之前提前增加;(2)衰退相对于预测范围较长，息差不会过早增加，并且在衰退期间保持低水平。通过对8次衰退和两个预测期的样本分析，我们发现有3次RDI1的柯伊伯分数高于RDI2，另外2次RDI1的柯伊伯分数非常接近。因此，与传统思维相反，预测未来特定日期经济衰退发生的目标变量RDI1并不总是比预测未来特定时间内经济衰退发生的目标变量RDI2更具限制性。此外，从银行家、基金经理和股票交易员等从业人员的角度来看，他们每天都在跟踪他们的业务，关心经济衰退的持续时间和精确时间，RDI1可能比RDI2更能做出更好的投资决策。

　　我们还考虑了Peláez(2015)提出的半年一次的RDI，但没有将数据汇总为两年一次的RDI，发现这种RDI可以产生比RDI1更好的结果，但不如RDI2好。注意，我们的结论可以用额外的预测因子和月度数据进行推广。

　　一个全面但要求更高的RDI应该同时预测峰值和低谷的时间。缺乏这一点，我们从比较广泛使用的RDI的分析中得到的直觉是，特定RDI的相对优势取决于预测范围、衰退持续时间以及衰退前和衰退期间衰退信号的时间概况。由于这些因素很少是实时知道的，从业人员对RDI的选择应该取决于他们先前对峰值开始日期的预期和即将到来的衰退在预期范围内的持续时间。

　　下载原文档：https://link.springer.com/content/pdf/10.1007/s00181-023-02361-6.pdf

这是两个衰退衍生指标的故事

相关推荐