平滑和预测混合频率时间系列与矢量指数平滑模型外文翻译资料

 2023-03-15 03:03

平滑和预测混合频率时间系列与矢量指数平滑模型

作者:Byeongchan Seong

国籍:South Korea

出处:Economic Modelling 91 (2020) 463–468

中文译文:

摘要:混频时间序列的分析主要局限于向量自回归移动平均框架,而指数平滑方法是近年来较为成熟的模型。方法为估计低频变量的缺失观测值和构造未来值的预测提供了一个有用的多变量时间序列规范。因此,本研究提出矢量方法作为的一个合适的替代方案来平滑和预测中值时间序列。为了说明方法的优越性,我们利用美国的四个月重合指标和季度实际国内生产总值数据,得到了低频变量的高频平滑估计和矢量时间序列的预测。并通过蒙特卡罗模拟对该方法的预测精度进行了验证。结果表明,该方法适用于中短期预测。

  1. 介绍

多变量经济时间序列和金融时间序列经常以混合或不同的频率出现。一些常见的例子是美国经济分析局、美国劳工统计局和美国人口普查局,它们每月和每季度报告数据。

混频(MF)时间序列通常难以分析。为了方便计算,它们通常被转换成一个共同的频率,或者通过时间聚合数据到一个较低的频率,或者通过插值较低的频率数据到最高的频率。然而,这种聚合涉及到一些高频数据的丢失,从而对估计效率产生不利影响。此外,在插值中,使用与所考虑的模型无关的方法会导致有偏差的结果(Seong等人,2013)。

为了克服聚合和插值的局限性,关于MF时间序列的文献提出了三种主要方法: 状态空间建模、混合数据抽样(MIDAS)和贝叶斯采样(Ghysels,2016)。这些方法主要集中在自回归(VAR)模型上。首先,Zadrozny (1990)和 Mittnik 和 Zadrozny (2005)使用状态空间模型来匹配一个潜在的高频VAR模型。在这种方法中,卡尔曼滤波器对处理或平滑中频时间序列的缺失数据和预测中频时间序列起着至关重要的作用。它也已经发展成修改形式,如在Mariano和Murasawa (2003年)和Seong等人(2013年) : 前者使用因子模型处理 MF 时间序列,后者研究了一个具有协整结构的MF模型。第二,MIDAS方法由Ghysels等人(2002年)和Andreou等人(2010年)推广,现在已经成为MF数据的一种广泛使用的替代方法。这种方法考虑可观测的冲击,但不考虑潜在的冲击,并使用分布式滞后多项式,以确保简明的规范。最近,Ghy-sels (2016)等人将 MIDAS 回归扩展到MF VAR模型。最后,用贝叶斯抽样方法代替状态空间方法对MF VAR模型进行贝叶斯估计。例如,viefer (2011年)和Eraker等人(2015年)使用吉布斯采样器绘制缺失的数据,而不使用卡尔曼滤波器。

对这三种方法进行了比较研究,如Bai等人(2009年),Kuzin等人(2011年) ,Qian(2013年)。有趣的是,Kuzin等人(2011)得出结论,状态空间模型和 MIDAS是更多的补充而不是替代品,因为它们的相对性能取决于考虑的情况。目前的研究属于状态空间模型的文献。然而,本文研究的是基于指数平滑(ETS)模型的MF时间序列,它超出了传统的VAR模型的范围。

中值函数时间序列的建模和分析主要基于向量ARIMA模型模型。ARIMA 模型比其他模型更加系统化,理论上更具有递进性。然而,ETS方法,一个与 ARIMA相竞争的模型,在最近几年有了很大的进步。例如,这种方法可以表示为一个创新的状态空间模型。一项基于统计理论或分布的研究将 ETS 归类为统计模型(Hyndman和Athanasopoulos,2018年)。早期的单变量 ETS 方法已经扩展到多变量(向量)框架,允许利用潜在的序列间相关性来改进拟合和预测(De Silva等,2010)。ETS方法现在被看作是一个独立的领域,而不是ARIMA模型的特例。

在这项研究中,我们提出了向量ETS (VETS)方法作为一个改变自ARIMA 的平滑和预测中值时间序列。它为估计低频变量的脱靶观测值和构造未来值的预测提供了一个有用的多变量时间序列规范。它还简化了参数估计使用类似的函数与一个单一的误差源(SSOE)。此外,该方法不涉及差分,因此被认为是分析非平稳时间序列的有效方法。正如Commandeur和Koopman (2007年)提到的,ARIMA方法从根本上是问题型的,因为“在经济和社会领域,真实的序列从来没有平稳,无论做了多大的差异。”

论文的其余部分结构如下。在第二部分中,我们介绍了物流时间序列的 VETS模型,并构造了它们的状态空间表示。给出了似然函数最大化的初始化过程,讨论了该方法的优缺点。第三部分利用美国四个月同步指标和季度实际国内生产总值(GDP)数据说明了建议的方法。在第四部分,我们进行了蒙特卡罗模拟来研究其预测精度。最后,第五部分结束。

  1. MF时间序列和VETS模型
    1. MF 时间序列

多变量时间序列模型假定以最高频率运行,如Seong等人(2013年)。我们假设所有变量都是以最高频率产生的,但是有些变量并没有以最高频率被观察到。例如,考虑消费者价格指数和的双变量时间序列,它们分别是按月(高频变量)和按季(低频变量)观察的。每月频率标志着基本间隔或最高频率。尽管国内生产总值数据是按月发布的,但只是按季度发布。

为了简化理论的发展,我们假设:

(1)时间序列对于 使得向量对应于高频变量,向量对应于低频变量,其中。

(2)低频变量被观察为它们的高频值的时间聚合。

2.2.支持时间序列的模型

我们利用模型来反映多变量时间序列中的结构。为方便解释,我们考虑以下模式:

其中和是维向量,是独立分布的,和是光滑矩阵。De Silva等人(2010)提出了一个类似的模型,称之为向量创新结构时间序列框架。事实上,方程(1)-(3)中描述的模型将Holt(1957)的线性模型扩展到了多元时间序列。在上述方程中,和分别表示观测矢量的局部水平和局部趋势向量,更多关于局部水平和局部趋势的详细信息见Harvey (1989)第2章。这个模型可以修改成不同的形式。如果没有趋势,则可以省略,用代替抑制为阻尼矩阵的趋势。为了简单起见,我们假设没有季节性。但是,如果存在季节性,就必须将季节性因素增加到或优先考虑季节性调整。

方程(1)-(3)中的框架也称为 SSOE 模型。有多种选择的错误公式,这里没有提出(德席尔瓦等人,2010年)。我们假设是对角线,这意味着同时期的创新是不相关的,相互依赖的关系只能用方程(2)和(3)来建模。

为了解决数据聚合时间序列中观测值缺失的问题,我们将Harvey (1989)提出的累积量定义为:

其中表示观测到的频率, 。例如,如果是一个季度聚合的低频变量,那么,对于 ,累积量被定义为

累加器也可以写成

其中

其中用参数的元素表示对角矩阵。必须指出,如果是高频变量则,,。

2.3.模型的状态空间表示

我们构造了状态空间表示来描述方程(1)-(3)中的模型和方程(5)-(7)中的结构。该表示方法可以方便地估计模型参数,计算低频变量的高频平滑估计,并对中频时间序列进行预测。

定义了3状态向量,然后给出了状态方程

设,其中是观测到的高频累积量矢量。如果在周期中观测到低频累积量矢量则;否则,其中是随机矢量分布的 ,且与无关。然后,正如Seong等人(2013年),我们通过构建测量方程

如果是可观测的,则,否则,

使用(10)和(11)中的状态空间表示,我们可以通过一般的线性递归来计算状态向量:

给出了对数似然函数

其中是初始态矢量,是的第三对角元。方差的最大似然估计为,其中为的第个元素,还有数值。它们被用作低频变量的高频平滑估计,可以通过

2.4.初始化和预测

为了通过平滑递归最大化对数似然函数,我们需要 和的初始值。可以通过以下程序轻松获得:

(1)假设时间序列仅包含一个单变量低频变量(即),应用第2.2及2.3节所说明的方法,并计算分解的低频数列。

(2)对包含的所有低频变量应用步骤(1),然后计算所有低频变量的高频平滑估计(分列序列)。

(3)利用De Silva等人(2010)的矢量创新结构时间序列框架,将步骤(2)中创建的完整数据拟合成方程(1)-(3)中描述的模型。然后,利用得到的参数作平滑矩阵和的初始值。

超前预测分布的矩可用以下公式递推计算:

其中为预测源,和 分别表示预测的均值和方差,和分别表示状态向量的均值和方差。

2.5.模式的优缺点

本文提出的模型虽然采用了状态空间框架,但偏离了文献中经常提到的模型的范围,发展了理论。因此,与模型相比,这些模型提供了方法所具有的相同优势。

模型不依赖于平稳性或差异性,并且比模型使用更少的参数。例如,考虑和的维时间序列,其中高频和低频变量分别在月和季度频率上观测到。利用模型,在维堆积向量的基础上,即使省略截距项,参数个数仍为。然而,模型的参数个数为,其中初始值和的维数为,平滑矩阵和的维数为。虽然我们取和 ,但是参数数目的比率是,也就是说,前者大约是后者的倍。随着或时间聚合顺序的增加,这种差异会进一步扩大。

然而,在框架下,很难考虑一个格兰杰因果关系,一个脉冲响应函数,和协整的概念,如方法,因为这些概念只是在设置下发展,而从来没有在设置下发展。需要进一步研究将这些概念应用到美国教育考试服务中心。

在本文的模型中,由于状态空间模型只需要一个主要的随机源,因此很容易实现求解最大似然估计的算法。见Hyndman等人(2008)的状态空间模型的比较下和多误差来源。我们不需要找到最大方程(15)的极大似然估计,我们还可以考虑最小二乘估计,它使平方误差之和最小。有关下的,请参见Hyndman等人(2008)。

然而,无论采用最大似然估计还是最小均方误差估计,由于参数具有非线性,其估计都必须依赖于数值优化。类似地,方法可以考虑参数估计的或 ,甚至必须根据具体情况使用数值优化(Ghysels等人,2016)。虽然很难与其他方法进行客观的比较,但是本文提出的方法对于参数的高维性具有较强的鲁棒性,并且相对容易实现。

3.应用

3.1.数据

这一部分说明了提出的方法在美国数据中的应用,包括就业、个人收入、工业生产和制造业销售四个月的同步指标,以及季度实际。从1959年12月到2008年12月,的数据包括588个月或196个季度的观察数据。原始数据经过对数转换,然后用表示。这些数据分析使用 模型与协整结构在Seong等人(2013年),我们使用这些数据,以简化绩效评估提出的方法。

3.2.初始化

分析从第2.4节中描述的初始值的估计开始。首先,我们仅使用一个单变量的季度变量来估计按月分列的。为此,我们使用霍尔特的线性模型。在 Croarkin等人(2003)中,在这个步骤中,初始值状态变量可以设置为

(20)

并且水平平滑常数和趋势平滑常数的初始值分别和。在这种情况下,用 线性模型估计了,和。在这些初始值中,水平和趋势值被除以3或9,以便实现将季度变量转换为月变量所需的规模调整。

在第二步中,继De Silva等人(2010)之后,可以使用方程(1)-(3)中描述的多元模型以及在第一步中用分解的估计的填充的五维数据估计中的 和的初始矩阵。虽然这种估计可以用各种方法进行,但为了简单起见,初始矩阵假定为对角线。

表1

2008年样本内季度生产总值的月平滑估计。

注: 列表示和两种平滑估计值之间的差异。

表2

每月的样本外预测误差,包括占用误差、简单误差、等级误差和平均误差。

注意: 所有的值都舍入到小数点后两位。粗体下划线的数字表明,的预测误差的绝对值小于相应的。

3.3.估计、平滑和预测

现在,可以通过最大化(15)中的对数似然函数来获得,,和,其中,与初始化第一步中的单变量情况类似,状态变量的初始值设置为

在本节中,我们计算样本内的月平滑国内生产总值估计数、四个指标的月度抽样预测数和国内生产总值。具体来说,使用,我们计算每月平滑的估计和每月预测。表1显示了2008年1月至2008年12月每月平滑的广东省估计数,作为抽样期间每月平滑的广东省估计数

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[595993],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。