相依数据下非参数回归的变量选择方法注记外文翻译资料

 2022-11-26 08:11

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


相依数据下非参数回归的变量选择方法注记

Wenceslao Gonzamp;alez-Manteigaa, Alejandro Quintela-del-Ramp;.ob; Philippe Vieuc

aDepartamento de Estadstica e Investigacion Operativa, Facultad de Matematicas, Santiago de Compostela, SpainbDepartamento de Matematicas, Facultad de Informatica, Campus de Elvina, Universidad de La Corutilde;na, SpaincLab. de Statistique et Probabilites, Univ. Paul Sabatier, Toulouse, France

摘要:本文基于核光滑方法构造了一个非参数检验,以检验在多维非参数回归中某些协变量是否应当被剔除。同时基于样本的一般性依赖性假设,我们给出了方法当中统计检验量的渐进分布,并应用于一个时间序列数据分析中。

关键词:维数祸根;核回归;变量选择检验;beta;混合

  1. 引言

近年来,核回归、样条等一系列非参数函数估计方法已经被广泛的应用于连续模型的检验当中,这些检验包括参数模型、非参数模型以及非参数模型中回归因子的显著性检验。在这个领域当中,已有大量文献来讨论这个问题:Eubank和Spiegelman[9],Kozek[21],Hardle和Mammen [15], Horowitz和Hardle[18],Gozalo[12], Hong和White , Lavergne和Vuong[22],Fan和Li [10], Stute和Gonzalez-Manteiga[25]以及Hardle等等。在实际应用当中,这些检验都依赖于非参数回归中变量的个数以及估计非参数函数带宽的选择。因此,之后又出现了另外一些可替代的方法,比如基于标记的经验算法(Bierens[3],[4]); Diebolt[7]; Stute[26];Stute等[27];del Barrio等[2]),或者基于局部似然的方法(Staniswalis和Severini[24]),以及将数据驱动平滑参数应用于检验的方法(Kuchibhatla和Hart[20])。

目前,关于相依数据领域的研究较少,只有一些平滑检验渐进正态性的猜想被发表出来(Hjellvik 和Tjostheim[17]); Hall[14], De Jong[6]以及Fan和 Li [10]证明了独立观察在独立集合中是非常重要的工具;Fan和Li[11]建立了退化U统计量的CLT方法与用于检验参数拟合优度的应用算法。在本文中,我们解决了相依数据下非参数回归中的变量选择问题,此外,本文还将由Khashimov[19]给出的一些关于退化U统计量的CLT作为主要工具。在本文第二部分当中,我们证明了非参数模型与变量筛选的检验统计量;在第三部分中,我们将陈述这个检验统计量的渐近分布;注释在第四部分提供,第五部分是相关的理论证明。

  1. 变量选择检验算法

设为一个真实的随机变量,是一个空间的协变量,考虑给定关于的回归函数的问题,定义

其中是随机样本,每个都具有相同的分布。下面我们讨论一些协变量是否对有影响。令,其中,令为关于的回归函数。则原假设为

本文的统计量来源于如下事实:当且仅当原假设成立时为零。因此,本文很自然地从的估计来构造检验统计量。从核函数和实际带宽出发,我们利用Nadaraya-Watson方法建立如下统计量:

其中是某些已知的权重函数,且

其中的是在Parzen-Rosenblatt估计下的边际密度,即

  1. 检验统计量的渐近分布

为了使检验统计量可应用于时间序列的预测,我们在beta;-混合序列中假设,即

其中,且属于,参考Doukhan[8]可知这种绝对规律性的条件允许对大多数时间序列建模。

这个非参数模型的假设有以下几点(其中是的边际密度):

和都是二次连续可微的函数,

存在且连续,

可以与紧支撑连续区分,故,

响应变量有界。

而关于核平滑器的假设有以下几点:

有界、对称且,

是紧支撑的,

最后,对于某些,混合系数的假设有如下几点:

,其中

我们将使用如下符号:

且。

定理1.若假设成立,那么在原假设下我们得到

证明:在原假设下,我们有,其中

引理1.在定理1的条件下,我们有和。

为了引出下面的定理,我们首先有如下定义,对于某些序列,使得

同时定义

引理2.在定理1的条件下,若(8)成立,那么和是。

我们知道,通过导致Nadaraya-Watson平滑(Ango-Nze和Doukhan[1]),所以公式(8)满足。故定理1直接从引理1和引理2得来。

  1. 注释

我们首先讨论假设。通过设定条件矩的存在和有界,假设可以忽略,但是我们仍然需要利用Gyorfi等[13]中的截断技术,尽管这将大大增加证明的长度。同样地,假设可以被改写成,但为简洁起见,这里也不再提出。条件通常的允许带宽为和,其中。同时需注意,条件和包含了的混合系数,其中任意大,这比一般的几何衰减条件更加普遍(见Fan和Li[11])。最后的关键假设是beta;-混合依赖性。现在遇到的问题是将我们的结果扩展到所谓的alpha;混合条件(其略微弱于beta;混合条件),然而实际上我们缺乏关于alpha;混合统计量的理论工具(见Bosq[5]对于混合过程的概率工具的文献)。

本文第二个注释是关于统计量的实际应用。定理1说明在原假设的条件下,可以使用临界区来渐进构造的检验。比如实际生活中,通过使用导频估计和,我们可以使用插入临界区。其中

,。

需要注意的是,重抽样机制可能有利于获得有一些引导复制构建的临界区。但三个关键临界区,和间的比较研究,以及不同概率重采样机制(块引导,固定引导hellip;hellip;)如何选择仍然是待解决的问题。

最后要注意的是,本文写出定理(以及和)证明的方式,比变量选择更适合应用于其他的方法。例如,本文的引理可直接应用于检验参数拟合。而在这种情况下,本文证明中涉及的将变为待检验的参数模型下的估计。

  1. 引理证明

证明在混合过程中广泛使用两种概率工具:Lee[23]中用于处理协方差型表达式的引理,还有Khashimov[19]中关于统计量的定理1。

引理1的证明:引理1可由下面四个公式直接得到公式(9)的证明:我们有

因此公式(9)是通过的替代和泰勒展开的综合。

公式(10)的证明:通过分解:

其中。

(1)当时,通过替换进行积分和利用假设我们可以得到:

且通过公式(9)我们有:

(2)当时,通过替代综合以及应用Lee[23]中的引理,我们获得独立于和的常数使得:

所以,通过组合公式(13)-(15)和假设的第一部分,我们得到公式(10)。

公式(11)的证明:参考Khashimov[19] 的定理1,下面将对统计量应用:

在这个证明中,使用Khashimov符号:

其中和是的密度。令是与具有相同分布的独立变量,

通过替换和使用,以及我们有

同样,根据Khashimov[19]我们可以计算涉及Khashimov定理的其他量并得到:

我们可以应用Khashimov的结果,同时得到

因为,故所要求的结果(11)直接从公示(16)和(17)开始。

公式(12)的证明:通过代替综合和应用Lee[23]文献中的引理B,可得:

因此假设的第二部分可以证明公式(12)。

引理2的证明:

首先证明:条件说明

其中是用核构造的的核估计。根据Ango-Nze和Doukhan[1]可以发现是到的均匀收敛,证明结束。

下面证明:之前与有相同的构造,而因为公式(8),现在更容易处理。利用公式(8)和假设,我们得到

对于方差,我们使用以下分解:

其中

正如我们获得公式(14)和(15)一样,我们将和两种情况分开,用(8)来约束涉及的每一项,我们得到

最终,利用公式(19)和(21)完成这个证明。

接下来证明:通过的调节,利用Lee[23]中的引理B和假设,我们有

下面计算方差

考虑时的情况。通过利用公式(8)我们可以得到:对于某些,

通过与公式(11)完全相同的证明来计算,可得:

下面考虑的情况。首先利用Lee[23]中的引理B,然后计算通过调节计算剩余积分。我们得到:

最后,我们考虑,的情况。我们有

现在,利用公式(8)和替代整合,我们得到

通过公式(23)—(26)和条件和,我们得到。结合公式(22),证明结束。

参考文献

[1] Ango-Nzamp;e, P., Doukhan, P., 1996. Functional estimation for time series I. Quadratic convergence properties. Math. Methods Statist. 5, 404–423.

[2] del Barrio, E., Cuestas-Albertos, J.A., Matran, C., 2000. Contributions of empirical and quantile processes to the asymptotic theory of goodness of lt;t tests (with discussions). TEST 9, 1–96.

[3] Bierens, H., 1982. Consistent model specilt;cation tests. J. Econometrics 20, 105–134.

[4] Bierens, H., 1990. A consistent conditional moment test of functional form. Econometrica 58, 1443–1458.

[5] Bosq, D., 1996. Nonparametric statistics for Stochastic processes, Estimation and Prediction, Lecture Notes in Statistics,Springer, Berlin, p. 110.

[6] De Jong, P., 1987. A central limit theorem for generalized quadratic forms. Probab. Theory Related Fields 75, 261–277.

[7] Diebolt, J., 1995. A nonparametric test for the regression function: asymptotic theory. J. Statist. Plann. Inference 44, 1–17.

[8] Doukhan, P., 1994. Mixing. Properties and exampl

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[26136],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。