

英语原文共 35 页,剩余内容已隐藏,支付完成后下载完整资料
第五章 对集合预报偏差校正方法的评估.
该研究将以分布为导向(DO)的方法扩展到降水的概率分布预测(或集合预测)的验证上来。利用由离散事件导出的检验资料,可以在可能的结果范围内评估概率分布预测的预测质量。本章演示了DO方法的有用性,本章将用三种类型的偏差校正方法来校正基于得梅因河流域上游流域的实验预报系统而得到集合预报的预报偏差,将用DO方法来评估由不同偏差校正方法校正后的概率预报效果,并且讨论了DO方法的结果和预报结果的分布。
5.1 引言
所有动态模型都包含一些偏差,模拟流量的水文模型也不例外。由于输入数据或模型假设时存在一定的误差,水文模型也就具有了偏差,这样的事实就引出了这些问题:偏差会对水文模型潜在用途造成什么样的影响?如何去除这些误差?近年来,基于在同一个初始条件下产生的多种预报结果来预报的集合预报系统(EPS)在水文和气象预报中越来越受欢迎。而这一系列的预报结果被称为一个集合。在这样的情况下,来自某一个水文模型的条件偏差可以传播到整个集合当中,然后再传播到由这个集合的频率分布得到的概率预报结果。然而,由于无法获得集合的真实分布情况(例如,这些集合都由没有偏差的模式产生),因此不能对改进的集合和真正的集合进行直接比较来评估偏差校正方法的优劣。一种间接的方法是检测检验基于去偏差集合的概率预报。因此,面向分布的(DO)方法可以成为评估偏差校正方法的有力工具。
为了说明这一点,我们研究了在得梅因河上斯特拉特福德观察到的每月流量的概率预测。获得的历史资料由49年的观测资料构成。在每个预报日期,水文模拟程序-Fortran(HSPF)用t时刻的初始水文气候条件和i年的气象信息(i=1,hellip;,N,除了包括t时刻的年份)产生流量的不同预报结果(或集合)。因此,我么可以获得从当前时间或预测时间开始并且持续一年的N -1 = 48条流量的迹线。将每条迹线按月份分开,每条迹线可以分成准备期分别为0-11个月的12条迹线。然后,对由每个月的准备期中总体积量得到的集合进行频率分析,进而产生概率分布预测(参见第2章)。
(图5.1: 应用于集合轨迹的偏差校正方法示例)
对集合(由每月流量构成)应用了三种偏差校正方法。改变整体体积会导致不同的概率分布预测(图5.1)。 作为实现偏差校正的另一种方式,Wilks(2000)提出了通过线性变换最小化条件偏差(可靠性)的事后重新校准。 侯等人(1998)还建议使用秩集合与集合进行事后重新校准以实现概率预测的校准。
每月体积小于或等于阈值的事件的概率预测是从概率分布预测中获得的。 相应的连续观察被转换为离散数:1表示事件发生,或0表示事件未发生。因此,事件的验证数据集包括概率预测和离散观察对。使用由离散事件导出的验证数据集,可以在可能的结果范围内评估概率分布预测的预测质量。发布预测阈值的是九个观测值,或观测概率(p=0.05,0.10,0.25,0.33,0.50,0.66,0.75,0.90和0.95)。由偏差校正方法产生的验证数据集通过第3.2节中描述的DO测量进行评估。 在计算DO测量时,实施Logistic回归方法(LRM)(第3.3.3小节)。研究了各种提前期,以研究水文模型偏差与预测质量测量之间的关系。
5.2历史模拟中的偏差
设Yi是i年中一个月观察到的体积,而Yi是月体积的相应历史模拟(i = 1,...,49)。对集合体积进行 “校正”的主要思想是利用Yi与 之间的关系,揭示每月流量的特征,观测值的平均值,标准差(SD)和变异系数(CV),平均误差(ME),均方根误差(RMSE)和计算观察和历史模拟之间的和相关系数(CC)。表5.1中观察到的每月体积的平均值表明该盆地的雨季为3月至7月,旱季为8月至2月。根据表5.2,1月,2月,8月,9月,10月和11月的平均误差为正值,表明月降水量往往被水文模型高估。相比之下,其他月份低估了月降水量。由于该盆地在3月至7月期间有高流量事件,而在其他月份有低流量事件,因此该模型倾向于低估高流量事件并过高估计低流量事件。从观察到的月流量和历史模拟的时间序列中也可以看出这一点(图5.2)。
还计算每月的MSE(均方误差)技能分数(SSMSE),其是准确度的相对度量。 它将历史模拟的MSE(绝对精度测量)与气候学(或观测平均值)的MSE(SSMSE = 1-(RMSE / SD)2进行比较。 SSMSE表明1月的模拟是12个月中最低的。
表5.1:斯特拉特福德的得梅因河的每月观测量(cfsd)的平均值、标准差(SD)和变异系数(CV)。
表5.2:观察到的每月体积和历史模拟之间的平均误差(ME),均方根误差(RMSE),相关系数(CC)和均方误差(MSE)技能分数(SSMSE)。
5.3 偏差修正方法
让代表每月集合体积,集合体积取决于最初的水文条件和一年的气象条件。 一般认为,整体体积中的偏差取决于发布整体体积的月份及误差大小。 因此,偏差校正的集合体积是通过某个函数fj()获得的某个月j:
图5.2:1988年1月至1997年12月的每月观测量及历史模拟比较。
然后,根据在月份j中观察到的体积集合以及相应的历史模拟,即Yi和(i = 1,...,49)来估计函数fj()。 该研究调查乘法校正,回归和分位数映射作为函数。
5.3.1事件偏差校正方法
第一种方法是事件偏差校正方法(EBC)。该方法假设对于相同的历史气象输入存在相同的偏差。史密斯等人(1992)定义了一个乘法校正器:
该方法完美地修正了历史模拟 ,即使 =。该方法的独特之处在于,无论整体体积的大小如何,它都认为历史气象事件具有相同的乘法偏差。图5.3的左侧可以作为EBC的一个例子。
5.3.2回归类型方法
第二种方法基于观察到的体积和相应的历史模拟之间的回归,使用给定模拟体积的观察值的预期值。首先,考虑最简单的情况,即偏差校正模拟由历史模拟和观察值(以下称RLI)之间的线性插值给出。用历史模拟的顺序统计表示:
并且观测值对应于由Y,(i)表示的(i),校正的集合模拟由下式定义:
图5.3: 1949年1月初始状况的1个月提前期预测的偏差修正示例; 左边是 EBC事件偏差校正方法,右边是RLI(线性插值)
图5.3的右侧显示了RLI在1949年1月的结果.RLI给出了EBC所做的历史模拟的真实模拟,并考虑了模拟的大小。
其次,考虑一个幂函数(RPF),这是最常见的回归函数之一。 偏差校正的集合模拟由下式给出:
优化参数b和c,以最小化每个月的平方误差之和,用观测值的预测值来表示:
图5.4显示了针对每组观测结果的功率函数以及5月和9月月度体积的相应历史模拟。显示没有偏差的虚线表明每个月都包含条件偏差。
第三种回归型方法,称为LOWESS(LOcally加权散点图平滑),又称为RLW。 本质上,通过考虑移动窗口内的样本之间的垂直和水平距离来获得期望值。 LOWESS的程序在这里大致说明(详见克利夫兰,1979年)。考虑i=1,...,n的点(Xi,Yi)的散点图。对于每个Xi,权重函数W用于对所有Xk(k = 1,...,n)进行权重omega;k(Xi)。在这个过程中,将W定于Xi处,并将其缩放,以便W首次变为0时点在Xi的附近。通过引入参数f,0f1,r被定义为与fn最接近的整数。通过使用具有权重omega;k(xi)的加权最小二乘对数据进行线性回归来获得每个xi处的初始平滑值yi。 然后,使用权函数W,基于残差yi- 的大小为每个(xi,yi)构造另一组权重delta;i。由于xk –xi距离大,导致小权重omega;k,大残差导致重量delta;i小,反之亦然。使用具有权重delta;iomega;k(xi)的加权最小二乘法通过线性回归计算新的平滑值。
图5.4:5月和9月幂函数下的观测值和预测值
克利夫兰(1979)建议使用压缩法(PRedictionErrorSumofSquares)预测平滑参数f 。PRESS统计量是对误差的验证类型估计量,PRESS的应用确定f使得回归在进行新预测时产生的误差最小(Helsel和Hirsch,1992)。其使用的权重函数W是bisquare函数:
另外,在任何一对相邻估计点使斜率为负的情况下,平滑参数f增加0.01增量,直到获得正斜率。 这导致一对一的功能。 最后,通过使用具有LOWESS的估计点的线性插值来获得偏差校正的条件模型估计器。图5.5显示了LOWESS估算的点数和5月份和9月份月份插值的点数之间的分段。
图5.5:使用5月和9月的LOWESS回归观察月度体积与模拟月度量。
5.3.3 分位数映射方法
第三种方法,分位数映射方法(QM)的想法是观察到的体积和历史模拟应该具有相同的累积相对频率。与线性插值方法(公式5.3)中的历史模拟一样,采用观测的顺序统计:
利用这组顺序统计量(,Yi),通过插值获得校正的模拟;方程只是用公式5.5中的Y(i)代替Y0(i)。 该方法是基于历史模拟和观察之间的经验累积分布函数的一对一变换。因此,假设条件模型估计量服从历史模拟的经验累积分布函数(CDF)。 QM的一个例子如图5.6所示。
5.4 结果和讨论
5.4.1 绩效考量
首先,考虑每个月的MSE(均方误差)技能分数(SSMSE)。将月量的概率预测的MSE与观测的方差进行比较,观测的方差是气候预测的MSE(观测的平均值)。如第5.1节所述,预测系统发布的概率分布预测以9个分位数进行评估。因此,从每个预测月份和提前期的一个概率分布预测中获得九个MSE。用MSE和9个分位数上的平均方差计算SSMSE。图5.7的左侧表示提前期分别为1-3月的SSMSE。对没有偏差校正(NBC)的预测进行SSMSE检查表明了每月变化情况。值得注意的是,2个月和3个月的准备期没有进行偏差校正显示出类似的模式,尽管1个月的准备期没有进行偏差校正得到的模式有些不同。另一个重要的一点是,这些概率预测的相对准确性表明了一种历史模拟的不同月度特征(见5.2)。因此,推测历史模拟中具有较高相对准确度的月份对于集合预测具有较高的相对准确度是不正确的。偏差校正方法的SSMSE与0(无技能线)的比较说明所有偏差校正方法都能表征每个月的能力。
图5.6:用于1个月提前期预测的分位数映射方法(QM)示例,初始条件为1949年1月。
为了将五种偏差校正方法的SSMSE与NBC进行比较,将偏差校正技能得分(SSBC)引入为:
其中MSENBC是没有偏差校正的模拟的MSE。图5.7的右侧显示了预测时间分别为1-3个月的预测得SSBC。这些值也是通过在9个分位数上对方程5.9中的MSE和MSENBC求平均得到的。很明显,8月或9月的某些月份可以从偏差修正方法中受益,但其他月份,如5月或7月则没有。值得注意的是,RPF未能在冬季改善NBC:11月,12月,1月和2月。在图5.7顶部描述的SSBC的1个月前置时间的检查表明RLI在准确性方面提供了最大的改进。SSBC的2个月提前时间表明除3月,7月和11月外,QM是最好的。
根据SSBC的结果,选择5月和9月作为小型和大型改进的例子进行详细研究。 图5.8显示了预报时间内5月和9月SSBC。 即使预测时间是一个月也没有一种偏差修正方法能够在5月份大大提高预测技能。对于这两个月,QM在预测时间超过1个月时获得最佳分数。在1个月的预测时间内,EBC稍微准确一些。 据推测,历史模拟与相应观测之间的乘法偏差在短时间内用于年度气象输入的集合模拟得到了很好的保留。
通常,历史模拟与相应观察之间的差异源于模型缺陷和输入数据缺陷。实际上,不可能实现完美的模拟。然而,为了通过完美的模拟模型来提高预测的质量,考虑用相应的历史模拟替换观测的预测情况。在通常的预测过程中,基于月体积阈值或通过观察计算的分位数将观测值离散化为0或1。但在这种情况下,历史模拟基于历史模拟的分位数进行离散化。然后,针对离散的历史模拟和概率预测的对计算DO测量。此预测称为伪完全流量模拟(PSS)。PSS的效果应该能接近任何偏差校正方法所能够实现的最大改进。然而,PSS的观测结果与实际的观测结果不同,因此其他方法在某些情况下确实有更好的结果。当然,PSS的结果也在以下图中作为参考描述。
从这里开始,首先调查9月份的流量。图5.9显示了1到3个月预测时间的偏差(左)和MSE(右)。在没有偏差校正的情况下,预测系统具有负值并且在偏差中具有“U”形状。也就是说,在绝对意义上,没有偏差校正的预测系统往往会低估事件的发生,特别是对于中等流量事件。所有偏差校正方法都改善了无条件偏差(平均误差),尽管RPF在中间发出了相对较大偏差的预测。平均误差似乎保持与预测时间增加相同的幅度和形状。这意味着平均误差不依赖于预测时间,而是取决于发布预测的月份。图5.9右侧所示的MSE比较表明,所有偏差校正方法都成功地降低了MSE,特别是对于中等流量事件。
图5.7:MSE技能分数(左)和偏差校正的技能分数(右)与预测月份的1,2和3个月预测时
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[20086],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
