源于多重数据的统计降尺度不稳定性分析外文翻译资料

 2022-11-25 15:21:42

源于多重数据的统计降尺度不稳定性分析

S. Kannan11,Subimal Ghosh11,2,Vimal Mishra3,and Kaustubh Salvi11

1土木工程系,印度理工学院孟买校区,孟买,印度,2跨学科气候研究项目,印度理工学院孟买校区,孟买,印度, 3土木工程系,印度理工学院甘地那加校区,维什瓦卡玛政府工程学院,艾哈迈达巴德,印度

摘要:统计降尺度(SD)将低分辨率的大气环流模型(GCM)输出数据用于区域气候项目,其特征是多模型引起的不确定性。这里我们发现不确定性的另一种来源:模型校准中多重观测和再分析数据产品的使用。在对印度夏季风降水的统计降尺度训练中,我们使用了不同来源的两种再分析资料作为预测因子,还有三种印度夏季风降水的格点数据产品。我们观察到来自于这6种可能训练选项中的不确定性与多个GCM产生的不确定性相当。尽管原始GCM模拟项目使日益变化的印度夏季降水空间分布均匀,但在21世纪末,用统计降尺度方法无法得到同样的结果。这是由于降水、GCM模拟和观测/再分析数据的统计关系不同,统计降尺度方法则考虑后者。

  1. 引言

大气环流模式(GCM)被用于模拟降水。由于其空间分辨率低,其精度也较低。因为影响降水的次网格尺度参数未合适地考虑在模型内,GCM所运行的低空间分辨率直接阻碍了区域尺度的降水项目精确度。低空间分辨率的降水项目可能不适合于高分辨率(区域尺度)地区。统计降尺度方法被用于将GCM的低分辨率数据降尺度成高分辨率数据。

统计降尺度是高效运行的降尺度技术,它基于以下假设:区域气候受两个因素制约,即大尺度气候情形和区域地形因素。在此基本原则下,统计降尺度根据观测数据得出大尺度气候因子(预测因子)和区域目标变量(预报量)的统计关系。这种关系为该区域特有,且隐含地考虑了区域因素,这一步骤也被认为是完美的编程方法。此处分析使用统计降尺度方法,它基于转换函数,使用线性回归以获得预测测因子和预报量之间的关系。

使用降尺度的气候变化项目与不确定性相联系,包括模式间不确定性[Huth,2004; Ghosh and Mujumdar,2007;Mujumdar and Ghosh,2008],模式内部误差(GCM多次运行)[Stainforth et al.,2007],情景不确定性[Wilby and Harris,2006],降尺度不确定性[Ghosh and Katkar,2012]。一个可靠且稳健的气候变化项目必须考虑所有来源的不确定性。优化统计降尺度方法中的统计关系需要观测数据。对于天气尺度的预报因子,再分析资料常用来代替观测资料,预报量则使用观测站数据,我们使用多种来源的再分析和观测数据来评估由降尺度模拟中不同再分析和观测格点数据产品导致的不确定性。模式应用于0.5度分辨率的印度雨季。关于数据和这篇分析文字的方法在下一章列出。

  1. 数据和方法

统计量尺度所需数据为月大尺度预测因子(来自再分析数据和GCM输出数据)和月局地预报量(降水)。此处使用再分析数据为NCEP/NCAR再分析数据和ERA再分析数据。对于印度夏季降水数据,我们使用印度气象局的三种格点数据产品:India Meteorological Department (IMD) [Rajeevan et al.,2006;Rajeevan and Bhate,2008],Asian Precipitation-Highly-Resolved Observational Data Integration Towards Evaluation (APHRODITE) [Yatagai et al.,2012],和University of Delaware (UDel_AirT_Precip data provided by the NOAA/Oceanicand Atmospheric Research/Earth System Research Laboratory Physical Science Division, Boulder, Colorado,USA,from their Web site at http://www.esrl.noaa.gov/psd/) referred to UoD,均为0.5分辨率。要说明的是格点数据集的资料并不相同,这基本取决于所用的测站数目和其使用的插值技术。与另外两种降水产品相比,IMD数据使用更多测站数据。两种再分析数据和三种降水资料均为1979-2005年间的数据,它们构成六种训练方式,被应用于当前工作。
这里所用的降尺度模型,包括预测变量的误差纠正方法、主成分分析、线性回归得到主成分和各格点降水关系。预测因子选择了海平面气压、比湿、气温、陆面和500hpa的经向风速。不同气象分区的预测因子具有不同的空间范围。主成分至少解释了85%的预测因子变化,其被用于测试SD模型中的线性回归关系。

我们使用三重交叉校准,27年的数据(1979-2005)被分为三个均等部分,两个子数据集用于训练,另外一份用于验证。此次过程将使用所有可能的组合,重复三次。根据所有训练方式,统计关系可以得到优化,然后将其用用于CMIP5中的10个GCM模拟数据中。GCM模拟使用标准化纠偏,多源和多模式数据导致的不确定性用方差来进行量化。未来(2070-2099)预期平均降水和历史阶段1979-2005数据,首先都从所有的10个GCM和6个训练方式获得。对于第i种GCM和第j种训练方式其变化用Xij表示。对于第i种GCM,数据不确定性用其与所有训练方式的方差来表示。数据不确定性均值则用前一步所有GCM的平均值来表示。对于第j种训练方式,GCM不确定性根据其与所有的GCM方差得出。然后GCM不确定性根据所有GCM模式平均值获得。

  1. 结果与讨论

SD模型首先用三重交叉验证技术校准,由三重交叉验证得到标准差(RSEM)和R2在图S3和S4中给出。一般来说,SD模型技巧合理。然而,采用同样的再分析数据训练时,使用IMD格点降水数据时的标准差较APHRODI和UoD产品高。西部和东北地区,误差较其他地区高,同时这些地区降水量也较大。由于地形和局地因素不同,印度降水有明显的空间变化,三种降水数据均显示了这种不均匀性,西部丘陵和印度东北部降水较强。作为一种低分辨率的模型,GCMs难以模拟高分辨率的地球物理过程,导致了CMIP5项目中超过50%的偏差。基于线性回归的统计降尺度方法用六种训练方式减少了多模式CMIP5平均数据的误差。所有方案中降尺度中的误差处于同一量级。与其他资料相比,使用IMD降水资料得到的结果误差更大,且更不均匀,这可能是由于跟APHRODITE和UoD相比,IMD格点数据生成中考虑了更多的测站数据。降尺度模式的技巧高低似乎取决于降水格点数据产品的选择而非再分析数据。

未来的多模式集合平均项目在空间上与印度季风降水变化不一致,这种空间不均匀在所有的训练方式中均被发现。当IMD格点数据被包括在SD校准中时,空间不均一性更大,不同搭配关系的项目不一致,甚至在一些区域相反。用相同再分析预测因子,不同降水数据产品预报量训练的降尺度模型具有类似的变化,这一点从图1中同一行的图中可以看出。这是由于不同再分析数据预测的差异引起的。这种NCEP/NCAR和ERA-interim间的差异经平均和标准化后再图S6中展示。这种差异导致预测因子和预报量之间统计关系的不同,然后传递和反应在未来预期变化中。

我们发现未来季风降水降尺度也有空间不一致性,这与低分辨率模拟的原项目不同。原GCMS项目的降水均表现出空间上升变化,同样的空间不均一也在别的降尺度模型中发现。这里我们研究了这种不同背后的原因,发现它来源于预测量和预测因子中不同的偏相关性。

用多种大气环流模式平均模拟的2070-2099年的项目几乎在全国范围内都表现出ISMR的增长。为理解预测GCM模拟中因子和预报量之间关系的变化,我们首先得到了1979-2005的预测因子与内插预报量之间的关系,然后将其应用于预测由相同GCM模拟的未来 (2070年-2099) 预测因子中。图 1a 和 2 c相同但为对比选择了不同的颜色条。每个GCM模式都显示出同样的结果。这在MIROC模拟的例子中可以看出。为深入分析这一点,我们计算了预测因子主成分和局地预报量的偏相关系数,用于计算回归系数。印度中部地区的主成分平均海平面气压和高分辨率降水产品的偏相关系数在图2h-2j中显示,各自为MIROC历史时期(1979-2005),MIROC未来时期(2070-2099)和根据IMD-NCEP/NCAR数据得到的。这些图显示出两个重要的发现。第一,MIROC模拟的预测因子和预报量之间的偏相关系数与根据观测数据得到的不同,肯是由于GCMs难以很好的模拟高分辨率过程。使用别的GCMs时也同样出现这种状况,类似的图已在图s7中给出。第二个是历史时期和未来模拟在偏相关系数方面不同,表明预测因子和预报量之间的关系可能发生变化。统计降尺度假设预测因子和预报量之间的关系是不变的,因为这种局限,降尺度输出结果应谨慎使用。

来自不同数据产品和GCMs的不确定性根据GCMs和校准数据集的方差量化。首先对每个格点计算不确定性。数据不确定性如图3a,在印度北部,南部和东北丘陵地区,这种不确定性要比多种GCMs引起的高。东北丘陵的高不确定性是由于没有充足的规范测站供格点数据产品使用引起的。山区和丘陵地区地域广大,降水不均匀也十分明显,需要更多的标准测站。GCM不确定性已被广泛研究,但是不同观测/再分析数据产品引起的不确定性仍未被探查。当我们结合这些来源的不确定性时,我们发现大的不确定性在降尺度项目评估中必须被考虑,结合起来的不确定性只有在数据不确定性高的地区中被表现为高。这表明数据不确定性是降尺度项目不确定性的主要来源。同样要指出的是SD模型用post-1979年的数据进行过校准,这些数据部分依赖于卫星产品,因此我们希望再分析资料有更小的不一致性,然而,这在降水不确定性方面并没有得到反映。

如图4所见,数据不确定性主要来源于不同的在分析产品,我们对不同再分析校准资料使用两种不同颜色的pdf,发现在北部、南部和东北丘陵,不同再分析资料项目间的变化显著不同。从图3a中也可以看出这一点。由于不同降水产品的使用,特定区域产生不确定性的可能性很大,但这点在图4a-4g中未显示。为了解训练阶段这些不确定评估的敏感性,我们使用完全随机的12中训练和校准数据,每一种中的18年数据进行训练,另外9年供校准使用。12种资料中的数据和GCM不确定性如箱线图所示,他们均表现出来源于数据的不确定性比GCM要高。

结论:

我们的结果强调降尺度与印度季风降水的预期变化中关于气候模式不确定性评估的研究要对多模型不确定性、情景不确定性或降尺度不确定性进行处理。这里我们发现另一种来源于模型训练中的多种再分析和降水资料的不确定性。

研究结论如下:

  1. 由于多种再分析和降水数据的使用引起的不确定性要高于多种GCM模式所引起的。因为这种不确定所引起的变化在未来预期降水变化上甚至可能导致相反的结果,所以在影响评估应该作为重要考量。
  2. 经研究发现降尺度项目与原GCM模拟显示出不一样的变化。
  3. 统计降尺度方法有预测因子和预报量之间的统计关系的假设。GCM 显示出的预测银子和预报量之间的关系有可能会变化。
  4. 在原始 GCM 之间观察到的预测因子和预报量的关系也是不可靠的,因为多个大气环流模式模拟间的偏相关系数很少一致。
  5. 为研究气候变化中降尺度模型的有效性,系统的研究和实验设计是不可或缺的。

我们的结果表明区域模式制造者们需要关注降尺度模型校准中多种数据产品的使用引起的不确定性,在使用它们做影响评估前,应该用系统的方式来检测预测因子和预报量之间关系假设的有效性。

图1 2070-2099年季风降水与1979-2005年季风降水的变化图。(a)-(f)分别对应6种训练方式。(a)NCEP-IMD,(b)NCEP-APHRODTIE,(c)NCEP-UOD(d)ERA-Interim-IMD,(e)ERA-Interim-APHROODITE, (f)ERA-Interim-UoD

图2 原GCM数据与GCM降尺度模拟数据比对。(a)原GCM多模式平均(b)降尺度数据,其降尺度模型用NCEP/NCAR和IMD格点降水资料校准,与原数据有差异,(c)降尺度模型由GCM数据提供预测因子进行校正所得结果,历史时期为1979-2005年,未来为2070-2099年。(d-f)与前图类似,但为单一GCM的情况,此处为MROC模式的情况。降水与平均海平面气压第一主分量篇相关系数也给出,(g)印度中部降水区域(h)历史时期(1979-2005年)GCM模拟降水与平均海平面气压偏相关系数,(i)未来(2070-2099年)GCM模拟降水与平均海平面气压偏相关系数,(j)与观测值(1979-2005)的偏相关系数

图3 不确定性分布图。(a)来源于多重数据源,(b)来源于多种GCM,(c)来自于多重数据源和多种gcm

图4 来自于不同再分析资料的区域不确定性估计。由6种训练方式导致的格点数据在平均降水上的pdf:(a)中心,(b)查莫克米什尔,(c)东北部,(d)东北丘陵地带,(e)北部,(f)南部,(g)印度西部地区,(h)各地区不同训练方式不确定性敏感性分析图。

图4a-图4b展示了降尺度项目中不同再分析资料作为模型校准的预报因子的区别。

参考文献:

Ash

剩余内容已隐藏,支付完成后下载完整资料


英语译文共 7 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[29872],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付