集合离散度和集合技巧的关系外文翻译资料

 2022-12-04 15:36:46

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


集合离散度和集合技巧的关系

JEFFREY S. WHITAKER和ANDREW F. LOUNGE

科罗拉多州boulder市NOAA-CIRES气候诊断中心

(1997年9月29日收到的手稿,1998年2月23日)

摘要:统计数据表明1)即使是一个完美的集合(即所有预报误差的来源都被正确的采样)也不会在集合离散度和预报技巧间有很高的相关性2)当日与日之间的离散度变化较大时,离散度和预报技巧之间的相关通常较大;3)当集合离散度与其气候平均值相比很大或者很小的时候,离散度就有可能是最有用的关于预报技巧的预报因子。作者在业务设置条件下研究了集合离散度和预报技巧之间的关系,通过分析NCAR的集合预报系统提供的数据来实现。地形相关的离散度-预报技巧之间的关系与地形有关的离散度的日与日之间的变化有关系。使用线性准地转模型研究了离散度变化的动力学机制。同时还讨论了与样本大小相关的问题。这一大小需要在定义离散度极值的构成时使用。

1.引言

在大部分情况下,集合预报的平均值与构成集合的任意一个单一预报的平均误差相比具有更小的误差(Leith 1974; Murphy 1988)。也许最简单和最广泛使用的集合预报的方法是将集合平均值视为一个单一确定性预报,代表大气未来状态的能够得到的最优估计。正如Leith(1974)指出的那样,在单一确定性预报上使用统计校正技术(之一技术利用了之前预报的评估信息),可以实现集合平均所能达到的好处,但不是全部。然而,集合预报提供了模式变量的预报概率分布的估计,在给定分析误差的概率分布的估计的情况下。假设预报概率分布是单峰的,则从预报到预报的分布的宽度的变化可能与均值相关。预报概率分布的宽度的最简单的度量是集合或集合均值的二阶矩。使用该信息,集合均值作为预报产品的效用可以显著增强。

集合离散度作为集合均值的预报技巧传统上是根据线性相关性来度量的。 一般来说,使用目前的预报模式,在预报周期小于一周时间内,离散度和技巧之间的相关性被认为是正的,(Kalnay和Dalcher 1987; Murphy 1988; Buizza 1997)。 即使在理想化的“完美模型”实验中,预报模式没有系统偏差,离散度和技巧之间的相关性也有些令人失望,通常小于0.5(Barker 1991)左右。 这可以使用由Houtekamer(1993)使用的离散度和技巧关系的简单随机模型来解释,该模型基于由Kruizinga和Kok(1988)提出的预报误差的统计模型。在给定的网格点中,假定离散度是具有对数正态分布的随机变量,即:

Sm是离散度的均值,beta;是ln标准偏差,N(alpha;,Ƴ)表示服从平均值为alpha;和标准偏差为Ƴ的高斯分布的随机数。S的某个特定空间结构并不重要;选择对数正态分布,因为在这种情况下可以导出离散度和均值相关性的简单分析关系。如果集合预报系统是完美的,即,分析的基本分布和模式误差是已知的并且被正确地采样,并且如果集合平均误差E的概率分布是高斯的,则E完全由S确定。假设E =N(0,S),并且离散度和技巧(由| E |测量)之间的相关性可以分析表示[参见Houtekamer 1993的公式(33)]。图1展示了作为b的函数,S和| E |的相关性,其度量在所关注的网格点处的离散度的时间变化。当beta;=0时,离散度是常数,并且误差是从固定分布中随机抽取,因此相关性必须为零。随着离散度的时间变化增加,相关性也增加,对于大的beta;,渐近到约0.75的值。这个简单的例子说明,即使对于完美的集合,离散度和技巧之间的相关性也不需要很大,并且相关性的大小取决于离散度的日间变化。

图1是对于由(1)和E =N(0,S)给出的理想化统计模型beta;的函数S和|E|的相关关系图。

Houtekamer(1993)使用连续表格展示了当离散度达到“极值”时,离散度的值最优预报意义,即当它与其平均值相比非常大或小时。这可以借助于图2中所示的辅助图的概率分布来理解。由阴影区域和阴影区域包围的面积表示预报误差将在所有观测到的所有个例的最大(阴影)或最小(阴影)20%之间的累积概率。图2a表示预报误差(其中标准偏差为SM)的气候分布,因此阴影和阴影区域各表示所有观测到的个例的20%。图2b(2c)展示了集合离散度与其气候平均值相比较小(大)的情况。对于小(大)离散度的情况,预报误差将在观测到的最大20%中的概率为3%(39%)。相反,对于小(大)离散度情况,预报误差将在观测到的最小20%中的概率为32%(13%)。基本上,技巧的可预报性取决于预报误差的概率分布偏离气候分布多少。因此,离散度距离其气候平均值越大,其左右预报绩效的的预报因子的作用就越大。当分布恰好接近气候平均值时,其具有的预报意义越小,因为预报误差基本上只是从气候分布所涵盖的情况中随机抽取的。因此,为了最佳利用离散度和预报技巧之间的关系,在给定集合预报配置的情况下了解集合离散度的其后分布是十分重要的。。

图2 是高斯预测误差概率分布。 由阴影(阴影)区域包围的区域表示预报误差将在所有观察到的最大(最小)值20%之间的累积概率。 这里,(A)表示预测误差的气候分布(标准偏差为SM)。 此外,(B)表示在气候平均值(SM)中,集合扩展(也即是集合中的预测误差分布的宽度)为60%的情况。 (C)是集合离散度与气候平均值的大小比较,其中集合离散度是气候平均值的1.5倍。

在这项研究中,我们考察了国家环境预报中心(NCEP)给出的集合预报的输出,讨论离散度和技巧之间的关系是否与上述简单的统计条件下的预期项一致。了解集合离散度的日间变化与业务系统中技巧可预报性的地理依赖性之间的关系非常感兴趣。第2节描述了所使用的数据集和分析方法。在第3节中,给出了两个冬季预报的结果。在离散度的日间变化和离散度均值相关性的地理依赖性之间发现有很紧密的关系。从离散度和误差的列联表中可以确认,当离散度是极值值或与其平均值非常不同时,离散度只用作技巧的预报器。在研究了两个冬季后,我们发现离散度和技巧关系的地理依赖性有很大的差异,并且这些差异似乎与离散度变化的地理依赖性的年际变化有关。为了克服解释与目前集合预报的短数据记录相关联的问题,在第4节中,基于准地转模型利用离散度变化的理想化模型估计技巧可预报性的气候平均地理依赖性,并了解打破这种地理依赖性的动力学机制。第5节总结了结果及其对业务技巧预报的影响。

2.数据集和分析方法

本文分析了来自NCEP的业务集合预报系统的网格250hPa流函数数据。使用了1995年11月15日至1996年3月15日和1996年11月15日至1997年3月15日期间的预报评估2。 Toth和Kalnay(1993年)提供了有关实施NCEP集合预报的详细信息。简而言之,NCEP系统由12个成员组成,它们在0000 UTC初始化(一个高分辨率试验,一个低分辨率试验和控制试验的10个低分辨率扰动),并且以1200 UTC初始化的五个成员(一个控制试验和控制试验的四个扰动)。为产生17个集合成员,集合包括了从1200 UTC起报的五个试验,这5个成员没有被加权,因为相比其他成员,这几个成员的起报时间要早12小时。除了0000 UTC高分辨率试验(第一个7天使用T126L18积分和其后使用T62L18)和12个UTC控制试验(第一个3天使用T126L18积分和其后使用T62L18)之外,NCEP集合成员的空间分辨率是T62L18和T62L18)。 NCEP数据 的分辨率降到T35分辨率并输出2.5*2.5的网格。NCEP-NCAR的再分析资料(Kalnay等,1996)用于验证分析。

图3表示高斯光谱滤波器用于平滑S和E的网格滤波器权重,对于北美的选定点, 曲线间隔为1.8times;10-3

集合平均误差定义为分析和预报场之间的均方根(rms)距离,

其中

是N个成员的集合平均值,psi;a是验证分析。离散度定义为集合成员和集合平均之间的平均rms距离,也就是说,

一些研究者使用异常相关作为离散度和技巧的量度(Wobus和Kalnay 1995; Buizza 1997)。选择一个rms定义的离散度和技巧,有两个原因。首先,后面会认识到根据大气不稳定(小扰动的增长率的日间变化)的日间变化来解释离散度的日间变化是十分有用的。第二,如Arpe et al.,(1985),Branstator(1986),Wobus和Kalnay(1995)等,异常相关与异常振幅呈正相关。因此,如Palmer和Tibaldi(1988)所指出的,使用异常相关性的离散度和技巧之间的相关性可能会出现增加,部分原因是因为离散度和技巧与预报异常的大小相互相关。

通常根据空间平均来定义误差和离散度之间的关系。这一空间平均既可以是整个半球(Buizza 1997),也可以是半球上指定的某个地理区域(Wobus and Kalnay 1995)。与定义某个指定区域不同,我们使用exp[-(n/12)2]形式的高斯谱滤波(Sardeshukh和Hoskins 1984)平滑误差和离散度,其中n是半球空间内的总波数。这种做法等效于在一个半径约为1000km的圆形区域内清平均E和S。

图4是预报前期对于20°N极点的所有网格的离散度/误差相关(实线)和beta;(虚线)半球平均值图

3. NCEP业务集合中的离散度/技巧关系

图4显示了两个季节(包括203个预报)的离散度和误差之间的关系的一些半球观测值。为简洁起见,仅给出了北半球的结果。由于NCEP集合只尝试采样分析误差,在夏季半球和热带地区,离散度和误差之间的关系预计较弱,因为模式误差预计相对更重要。离散度/误差相关性被计算为每个网格点处的时间相关性的空间平均。参数beta;是离散度的日间变化的观测值,简单的表示为北半球每个网格点处的lnS的标准偏差的平均值。

在第5天,NCEP集合峰值中的离散度和技巧之间的相关性为约0.3,并且在第10天降低至约0.16。参数beta;也在约第5天达到峰值,随后降低。在长期预报范围内,beta;和离散度/误差相关必然减小到零,因为集合分布接近模式的气候分布,其不会每天改变。当预报分布不是每天都变化(图1所示的beta;= 0情况)时,预报误差只是从固定分布的随机抽取。

对于提前预报时间较短的情况,在NCEP集合中离散度的日间变化非常显著,但是离散度和技巧之间的相关性低。在完美的集合系统中,离散度变化以及因此的离散度/误差相关性可以源自两个方面之一:1)分析误差幅度的日间变化,以及2)初始扰动增长率的日间变化与大气不稳定性相关。对于短期预报而言,前者可能占主导地位,而后者在长期预报起主导作用。图4显示,尽管用于产生NCEP集合的初始扰动的“繁殖方法”(Toth和Kalnay 1993)确实产生振幅每天都变化的扰动,但是这些变化与短期预报误差的日间变化相关性很差。因此,繁殖扰动可能不是精确地对分析误差中的日间变化的抽样,并且NCEP集合中的离散度/误差相关性主要与大气不稳定性的日间变化相关。由于这种机制不能针对短预报时间产生离散度变化,并且对于长预报时间,离散度技巧相关性必须接近零,离散度和技巧之间的相关性必须在长期和短期预报之间的某个范围内达到峰值。

表1是离散度和误差5天内的预报列联表。 表中的条目是在指定的五分位数中误差离散度的联合概率。 列是离散度五分位数,行是误差五分位数。

表1是5天预报的E和S的列联表,5天预报E和S之间的关系最强的预报范围。表中的条目是指定的五分位数中得到的误差和离散度的联合概率。如果E和S之间没有关系,也就是说,如果相关性为零,则表中的所有条目将为0.2。如果存在完美的线性关系,即,如果相关性是1,则所有对角线条目将是1并且非对角线将是零。表中的大多数条目与0.2没有很大不同,除了在角落。例如,如果离散度在最低的五分位数,则误差出现在最低百分位的概率高出其出现在最高五分位概率的3.5倍。因此,如简单的统计学考虑所预期的,当去极值时,离散度作为技巧的预报器更有用。从这个表中,乐观者可以得出结论,当它是极值的时候,与图4所示的低线性相关性相比,离散度是更好的技巧预报器。然而,悲观者也可以得出结论,用离散度来预报技巧,在超过一半的时间是没有什么实际作用的。显然,为了使离散度作为技巧预报器的实际效用最大化,必须知道给定集合预报系统的离散度的基本气候分布,使得可以识别在给定位置处构成离散度的极值的什么。使用引言中描述的简单随机模型,可以为beta;参数的不同值创建如表1所示的概率表。表2(类似于Houtekamer 1993的表4)示出了预报误差在顶部五分位数中的概率,其中离散度在顶部五分之一,作为随机模型的beta;的函数。概率与0.2的偏差是离散度识别不良预报的能力的度量。随着离散度变率(由beta;测量)增加,如果离散度大,则预报将变差的概率也增加。这表明使用整体离散度的业务技巧预报将在离散度变化性大的那些地理区域中最有用。

表2由(1)和E =N(0,S)给出的随机模型的离度和误差在最高五分位数(即,所有值的前20%)中的联合概率为beta;的函数 )。

图5 离散度/误差相关的散点图。beta;是利用20°N的所有网格点做的5天预报。

根据简单的随机模型,NCEP集合中的离散度/误差相关性越高,其中离散度的日间变化越大。这由图5所示,5天预报使用所有北半球网格点的离散度/误差相关性的散点图和beta;。相关性为0.63,因此离散度/误差相关性的空间变化的约36%可以由beta;的空间变化来解释。图6中示出了离散度/误差相关性的地图和用于5天预报的beta;。两个地区在阿拉斯加附近最大,在欧洲以上的次要最大值。离散度/误差相关性有一般趋势,并且beta;随纬度增加。然而,如图

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[25301],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版