

英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料
讨论估计极端风速的统计方法[1]
Perrin, O., H. Rootzeacute;n and R. Taesler
KTH Royal Institute of Technology, Stockholm, Swedish Meteorological and Hydrological Institute, Norrkouml;ping
摘要:据我们所知,热带地区的风速一般是被认为符合威布尔分布的。因此,用数据拟合所产生的威布尔分布通常可以被用来预测极端强风。然而,最极值对估计的威布尔分布几乎没有影响,因此通过这种方式得到的极值预测的准确性可能会受到质疑。本文将这种“威布尔方法”与一种基于统计极值理论的方法“周期最大值法”进行了比较。这比较基于瑞士机场12个气象站30年的每小时10分钟平均风速来进行的。结果显示威布尔方法对风速尾部分布和年最大风速的分布产生了不正确的估计,必须考虑个别测量数据的序列相关性。另外威布尔方法的固有特性是它不提供任何预测值的置信区间。周期最大值法避免了这些问题。这些测量数据是四舍五入的,首先是整数之后就是m/s。此外“从技术上来说”的结果是,如果在估计的过程中忽略了这一四舍五入的过程,那么参数估计的计算标准误差会减少。因此,如果数据进行四舍五入,那么上述事实在估计过程中也应该被考虑到。我们还认为数据四舍五入会降低估计精度这个事实是一个明确的迹象。
介绍
众所周知,热带地区的风速已经被很好的证实符合威布尔分布。因此,我们通常采用基于对所有可用数据进行拟合的威布尔分布来预测未来极端风的大小。这些可以通过直接使用威布尔分布的尾部来实现——在这里我们称之为“威布尔方法”。但是,由于大多数极值对母威布尔分布的参数影响较少,因此我们有理由怀疑这种方法得到的极值预测结果的准确性。
有时候我们使用另一种假设极端风服从耿贝尔分布,其参数来自于原威布尔分布的方法(Davenport, 1967;Alexandersson, 1979; , 1992)。由于耿贝尔分布是威布尔变量极大值分布的极限,这将会给出类似于“威布尔方法”的结果。然而,这个“威布尔-耿贝尔方法”包括一个额外的或许是没有必要的近似,因此我们不会再本文中进一步的去研究它。不过,在附录中我们对它做了个简短的讨论。
本文将“Weibull方法”与基于统计极值理论方法的“年度极大值法”进行了比较。本节将简要介绍这些方法,并在下文第3节中更详细地讨论这些方法。比较的目的是为了建立瑞典风标准的描述方法。
威布尔方法在Petersen等(1981)的文章中被简要的提及,并且Conradsen等(1984)对威布尔估计进行了研究。有很多关于年极大值法的说明,见Embrechts等(1997,第6章第3节)。Teugels(2000)的文章中包含了大量关于风速和统计数据之间关系的参考资料,以及Palutikof等(1999)提供了用于计算极值风速方法的非常有用的概述。
在讨论极值统计方法时,使用极值指数的概念是比较实用的。在Leadbetter等(1983)的研究中,他们认为这个理论是统计极值理论的标准,并如下所示。连续测量之间的依赖性可能导致极值被聚集在小的“聚类”中。例如,一次风暴潮通常会导致几个高度测量的每小时风速维持较高的水平。大体上,我们定义极值指数为一组大值中其中一个数除以总体的平均值。由于一个集群中必须至少存在一个成员,因此极值指数最大只能为1,这种极限情况对应一种(近似的)独立性,其中“集群”实际上只能包含有一个大的值。在一般条件下,n个相关观测值的最大值与n个不相关观测值的最大值分布大致相似。具体来说,如果每小时的风观测值的分布函数为,并且相互独立(那么极值指数为1)则年最大值的分布函数为。但是,如果极值指数不为1,而是介于0与1之间,那么年最大值的分布函数则为。威布尔分布使用这两个工事中的第一个来计算年最大风速的分布,因此假定。关于极端指数概念更详细的讨论以及证据详见Embrechts等(1997 8.1)和Leadbetter等(1983 3.7)。
本文主要的目的是为了故意50年一遇或者100年一遇的风,或者用不同的术语来估计50年或者100年的回归水平。根据定义,这些每年最大风速值平均每50年或者100年吵过一次。相应的50年和100年的风是年最大风速分布的或者分位数。(50年或者100年的风也可以被认为接近“特征值”,即50年或者100年期间最大风速分布的分位数。)
在威布尔方法中,假设所有记录的风速是连续独立的,对所有可用的风速记录进行两参数威布尔分布的拟合。然后根据拟合的威布尔分布计算50年一遇和100年一遇的风。
威布尔分布常常被观察到,对大量风速数据提供了很好的拟合。然而,威布尔方法依赖于下面两个进一步的假设:
被记录的风速是恰当的,并且是独立的。以及
威布尔分布的拟合性在风速分布极大值区域的尾部也是较为良好的。
对于假设(1)需要被注意的是,对于正确估计威布尔分布的参数可以不需要独立。而是随着时间的增加,依赖性适当地快速降低是有效的,(这方面的确切条件似乎是不确定的,但众所周知,他们具有非常普遍的适用性)。
但是,独立性也适用于通过威布尔分布计算50年一遇或100年一遇风的步骤。同样计算是否有效不需要完全独立,这是因为极端部分的数据是近似独立的。从技术上来讲,极端指数等于1就足够了,因此不存在极值的聚类。
因此,威布尔方法中的假设(1)并不想第一次出现那样具有限制性。然而,如果依赖性扩展到了风速记录的极大值区域,那么威布尔方法可能会提供错误的结果。
至于假设(2),没有任何物理或者理论上的理由显示他应该满足于风速记录。如果不是那样的话,使用威布尔方法同样会提供错误的结果。
在年极大值法中,假设不同年份的极值(EV)分布(或耿贝尔分布)是序列无关的,则极值分布(或耿贝尔分布)拟合于年最大风速。这些分布理论的论据来源于统计极值理论。(详见,Coles,2001;Embrechts等,1997;Rootzeacute;n和 Tajvidi(1997)的讨论)
由于不同年份的极大值可能比每小时的测量值更独立,因此,年度极大值方法通过将可能依赖于本地的记录汇集到一个单独的值中从而满足假设(1)。因为我们只使用极值来拟合威布尔分布,这是能够满足假设(2)的。
当然,这是使用年度极大值方法相关的后果。这是在该统计分析中所使用的观测数的大幅度的减少。因此,从年度极大法得到的估计值比威布尔方法所提供的估计值的变化要大得多。然而,一旦威布尔方法估计了错误的数量,即使这样做的精度很高,但显然是没有帮助的。
我们对威布尔方法和年度极大值方法的比较是基于瑞典气象和水文研究所(SMHI)提供的数据。该数据包含瑞典12个气象站30年来每小时风速记录(10分钟平均值)。利用威布尔方法和年极大值法估计得到的年最大风速的分布函数,并与观测到的最大风速分布函数进行了比较。我们还比较了这两种方法获得的五年一遇、五十年一遇和百年一遇的风的大小。
在第二节中将介绍数据库。在第三节中我们讨论了威布尔方法和年度最大值方法以及统计方法。在第四节中我们总结了分析的结果,在第五节中我们给出了最后的讨论和结论。
风数据库
本文使用的风数据库是由SMHI提供的。它包括瑞典12个气象站在1961至1990年期间每小时开始记录的10分钟平均风速,但有一些例外例子(详见表1),因此每个站约有个记录。这些气象站都设在机场。
表1 记录站点
|
站点 |
丢失数据 |
删除数据 |
已修正数据 |
|
Arlanda |
145 |
3 |
0 |
|
Barkakra |
1999 |
0 |
4 |
|
Bredakra |
1996 |
6 |
8 |
|
Bromma |
20339 |
1 |
3 |
|
Karlstad |
44916 |
5 |
1 |
|
Ljungbyhed |
2014 |
2 |
1 |
|
Norrkoping-Sorby |
2153 |
1 |
7 |
|
Save |
3400 |
4 |
2 |
|
Soderhamn |
2093 |
6 |
4 |
|
Uppsala |
2166 |
7 |
5 |
|
asteras-Hasslo |
12782 |
3 |
6 |
|
Visby |
8090 |
4 |
0 |
世界气象组织(WHO)关于不同类型气象站选址的条例和观测程序来自于气象组织(1983年)。在实际情况中,并不总是能够完全遵守这些条例。因此,风速始终被认为在一定程度上受局部效应的影响。机场通常会在气象站周围的区域进行开放托运。因此即使在机场周围更远的距离(例如大于1公里)也可能存在相当大的不均匀性。
所有的台站存在缺失观测的数据,从Arlanda存在的缺失数据到Karlstad存在的缺失数据不等。此外,整个第一年的观测数据都没有列到Arlanda的数据库内。
这些缺失观测数据的主要原因是因为有些机场,尤其是那些小型的民用航空机场只在运营的几小时内进行观测。另外一些,特别是军用机场,在运营的几小时内每小时进行一次观测,但在一天内余下的时间里近每3个小时进行一次观测。
此外,一些数据是可疑的或存在明显错误的,其原因是没有在现有的时间点记录下来,忘记了从结到m/s的转换,以及与相邻测量值相比是不寻常的测量值,例如当周围所有测量值都很低时记录的非常高的风速。我们手动删除或更正了这些数据点。其中只有风速超过14米的记录才被修正,因此低风速的误差被认为对结果的影响微乎其微。
所有的天气观测均以结表示,然后由SMHI将数据转换为m/s,并进行四舍五入到整数,然后将数据存档在其历史数据库内。
表1内的所有台站(也许不包括Bredakra)都位于地形较为平缓的平原中,它们的海拔高度也相当近似。
很可能在30年的时间里,记录仪器周围的环境已经发生可很大的变化,足以影响测量结果。一个特殊变化出现在城市站点周边时会导致观测条件的变化,Arlanda机场就是这样一个例子,这个民航机场在过去几十年内发展迅速。在今年呈现出了一个更加现代化的景象,其表面的粗糙度比1960年时要高得多,这可能导致风速普遍下降。这种影响在某个风向上比另一些风向上更为明显。特别是,一些地形变化可能导致虚假的时间趋势或者相关性。我们还没有机会纠正这种可能性。
威布尔方法和年度极大值法
对每个记录站点分别以相同的方法进行分析,为了描述它,我们用来表示每个站点上的每小时风速,并且用来表示记录的年最大风速值。进而我们设为年最大风速的分布。从而得到T年风的表达公式
(1)
(关于略有不同版本的讨论,详见Rasmussen and Rosbjerg,1991)
具有密度函数的的威布尔累计分布为,其中密度函数:
(2)
在计算公式(1)中回归水平所需要的分布函数时,假设观测是独立,即,那么
(3)
最后参数必须根据数据来估计。这是通过对分组样本应用所为的最大相似度方法所实现的,这方法使用最大化的和的值。
(4)
对于=风速为的记录数。(在标准威布尔方法,四舍五入通常不会被考虑在内,然而,这只会较小地改变估计值。)如果假设每小时的观测值是独立的,则我们的估计值与一般最大似然估计所得到的估计值相同(关于四舍五入数据的研究,见Kulldorf, 1961;Sen和 Singer, 1993)。威布尔方法不提供估计返回值的置信区间。
在年最大值法中,首先假设年最大值是独立的,并且是具有极值(EV)分布函数 其中为位置参数,为刻度参数,为形状参数以及 表示分布函数的“正部分”。也就是说,对于是内括号中的表达式为负值的x-值,表达式应替换为零。则EV分布的密度为
(5)
当
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[20096],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
