基于广义帕雷托分布和广义极值分布的四川盆地极端降水量的拟合_第1页
基于广义帕雷托分布和广义极值分布的四川盆地极端降水量的拟合_第2页
基于广义帕雷托分布和广义极值分布的四川盆地极端降水量的拟合_第3页
基于广义帕雷托分布和广义极值分布的四川盆地极端降水量的拟合_第4页
基于广义帕雷托分布和广义极值分布的四川盆地极端降水量的拟合_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于广义帕雷托分布和广义极值分布的四川盆地极端降水量的拟合

在分布模型分析方面的应用短时强降水是指短期内的强降水强度高,在一定时间内达到或超过一定体积的降水现象。这一量值的规定,各地气象台站不尽相同。中央气象台将短时强降水定义为≥20mm/h。气候要素本身是一个随机变量,极值就是这些随机变量的某种函数。虽然难以定量预报气候要素的极值,但可以借用统计推断的手段寻求气候极值的分布模型,推算一定重现期的可能极值,揭示其内在规律。短历时强降水的极值作为随机变量具有一定的不确定性,但它仍表现出明显的统计规律。对于短历时强降水逐时降水量的极值统计分析,由于一般难以获取大范围长时间的逐时降水资料,国内现有的各种有关短历时降水的工作,基本上都是利用局部区域内少数站点或单站的逐时降水资料进行的分析研究。关于短历时降水极值的理论概率分布,目前尚无公认的统一模型,如美国采用耿贝尔分布和对数正态分布,中国许多城市直接采用《室外排水设计规范》建议的指数分布或皮尔逊-Ⅲ型分布模型,并没有用多种概率模型进行对比分析研究。目前,中国一般采用的频率分布曲线主要有以下四种分布线型:皮尔逊-Ⅲ型分布、指数分布、极值I型分布(耿贝尔分布)以及对数正态分布。前三种在城市暴雨强度公式的统计中应用较为广泛,至于哪种更为适合一直处于争论之中。吴息等用不同的分布模式对北京市城区和郊区的自动气象站的部分小时降水量资料进行了分析和概率分布的拟合;王海军等用广义极值分布(Gumbel、Frechet、Weibull)拟合了长江三峡地区宜昌、巴东两站短历时年最大降水量的概率分布;毛慧琴等用不同的分布模型研究了广州短历时降水的极值分布等。近年来,广义帕雷托分布GPD(GeneralizedParetoDistribution)已广泛应用于经济、金融、保险和环境科学等领域,在国内大气科学界也得到了不少应用[13,14,15,16,17,18]。GPD由Pickands在1975年首次提出,Davison,Smith,VanMontfort和Writer做了进一步研究,后Hosking,etal进一步发展了该模型的应用。极值模型主要有分块样本极大值BM(BlockMaxima)模型和超门限峰值POT(PeaksOverThreshold)模型。它们具有超越样本数据的估计能力,可以准确地描述分布尾部的分位数。传统极值理论如在实际应用中采用的是BM抽样。POT模型基于传统极值理论,考虑超越门限(阈值)的数据,将这些数据看做极值水平,然后利用GPD的概率分布来拟合这些超门限的数据。建模重在估计超过某门限的超门限样本所服从的分布,并在此基础上估计总体的分布并计算风险。BM抽样往往造成大量数据的浪费,不能满足参数估计所需的样本量,增加了估计的误差。POT模型比BM更能充分利用样本数据所包含的极值信息,是一种基于超过某一门限的极端值建模的有效方法,被认为是目前极端值建模实践中最有用的模型之一。两个模型都只考虑尾部的近似表达,而不是对整个分布进行建模。本文在四川盆地短历时强降水极值估计中,利用四川盆地12站的逐时降水资料,运用GPD和GEV两种模型,借助于L-矩的参数估计方法,对12站的逐时极端降水量进行拟合,并对两种模型的拟合效果进行比较,研究探讨上述两种分布在小时极端降水量估计中的适用性,在此基础上推算出各站给定重现期的小时降水量的极端值,为四川盆地城市化较快地区排水系统的建设管理等提供一定的依据。1数据和方法1.1资料与数据分析研究短时强降水极值分布特征,需要得到长时间序列的1h雨量资料。本文选取四川盆地12个测站1991—2007年地面逐时降水观测资料作为研究对象,由于有些站存在缺测,将缺测严重的年份剔除,处理后都能保证资料年数至少有10a。本文在此资料的基础之上进行统计分析。12站的分布如图1所示。1.2方法1.2.1gev分布参数估计式中α为尺度参数,β为位置参数,k为形状参数。当k=0时,GEV化为TippettI型,即Gumbel分布;当k<0时,则为II型分布;当k>0时则为III型分布,即Weibull分布。广义帕雷托分布(GPD)的分布函数为式中α为尺度参数,β为门限值,k为形状参数。本文选用稳健性较强的L-矩估计法估计参数。随机变量的第r阶概率加权矩(PWM)为其无偏估计式可具体写为其中xj(j=1,2,…,n)表示从大到小排列的样本取值,即为有序样本x1≥x2≥…≥xn。L矩就是由前r个概率加权矩的线性组合构成的,即根据文献,GEV分布参数的估计式为:其中Γ()为Gamma函数。GPD分布的参数的估计式为1.2.2dn及均方误差ss选用相关系数R、柯尔莫哥洛夫-斯米尔洛夫(K-S)检验统计量Dn及均方误差SS为检验指标。其中当P(Dn≤Dn0.05)=1-0.05时表示通过K-S检验,Dn0.05表示信度为0.05的临界值。再定义统计量由此式可看出,D*越小表示效果越好。1.2.3门限值的确定依据Pickands的理论,在使用POT模型时,对于给定的门限值,当样本的超门限数(样本值减去门限值)服从广义Pareto分布时,如何确定门限值成了运用的关键。门限值选得过高,超门限样本数就少,使估计出来的参数方差很大;选得过低,会造成样本中样品的独立性较差,而使估计值产生大的偏差。而门限值的选取有多种方法,如Hill图解法,超额限望图,试凑法,拟合优度法等。Hill图是基于Hill估计量的一种阈值图形分析法,Hill估计量是用来估计尾部指数的一种常用方法。Hill估计量的定义为本文通过构造Hill图,观察Hill图中尾部指数稳定区域来选择合适的门限值。所谓Hill图(Hillplot)是一种定义坐标k和1/Hk,n两点所构成的曲线,但通过观察得到的1/Hk,n开始趋于稳定的点,主观性较强,本文选取Hill图中尾部指数开始趋于稳定的区域,并且使统计量D*达到最小的点所对应的样本容量n及从大到小排列的有序样本第k个值所对应的样本数据xk+1作为其最佳门限。1.2.4门限的独立性检验由于逐时降水历时较短,特别是持续的强降水,短时间内可能有多个极大值,如果门限值选得过低,两两极值事件之间的时间间隔过短,可能出现超门限样本间的不独立,即前一个极大值对后一个极大值产生影响,因此有必要对样本进行独立性检验。假定超门限的小时降水极值出现的次数服从泊松分布,则每年发生超门限的次数k的概率为λ为Poisson分布的参数,这里表示年交叉率。年交叉率λ=N/T,N是超门限的次数,T为资料记录的总年数。通过K-S检验其拟合优度,判断超门限值发生次数是否符合泊松分布,并由此判断通过POT抽样得到的各次超门限极值是否独立。1.2.5gev极值分个数的估计对于具有重现期T的分位数,有分布函数由上式结合GEV的分布函数(1)、(2)式,可求得GEV极值分位数的估计式为由GEV与GPD模式参数的关联性,得GPD极值分位数的估计式为2四川盆地12个站点的随机降水量极值分布调整2.1样本数的选取和重现期降水图2(a-c)分别是广元、高坪和遂宁3站的1/Hk,n随样本数的变化,三站资料年数分别是17a、14a、10a。由图可以看出,由图可看出这3站的1/Hk,n在样本数为30~50的时候开始趋于稳定。图2d是这三站的D*随样本数变化,可以看出样本数分别在41、39、39时D*最小,对应的门限值分别为24.4mm、21.1mm、18.5mm。另外,高平和遂宁的D*有多个连续的小值,分别求出对应的门限的重现期降水量,发现在-2~2mm之间波动,误差在2%以下,仍取D*在数值上的最小者为最佳。此外,D*都小于1,表明都通过K-S检验。表1列出了12站的资料年数、最佳门限值、形状和尺度参数的相关信息。2.2超门限内累积概率与泊松累积概率的计算Poisson分布的参数λ即为年交叉率,由POT数算得广元(17a)、高坪(14a)、遂宁(10a)的年交叉率分别为2.412、2.786、3.900。图3(a、b、c)分别是广元、高坪和遂宁三站超门限小时降水极值出现次数的实测累积概率与泊松累积概率分布图,均通过K-S检验,其它九站也通过检验,表明通过POT抽样的样本之间是相互独立的。由图也可以看出,资料年份越长,出现超门限次数的年数也越多,效果自然也越好。2.3模型拟合效果检验图4为广元、高坪、遂宁三站GPD与GEV的理论分布和实测分布图,由图3以及表2可以看出,GPD的拟合效果要好于GEV,两种模型实测与模拟的相关系数都达到0.98以上(其中GPD都达到了0.99以上),并都通过了K-S检验(D*<1),但GPD模型的统计量D*、相关系数以及均方误差都要好于GEV模型。表中GPD的样本数n均已选取最佳门限值。2.4降水极值的季节和年数用GEV模式拟合时,由于资料年限较短,采用BM抽样的时间段为半年,以便得到足够的数据,则年交叉率为2,在用GEV极值分位数的公式(21)、(22)计算极值分位数时,T前要乘以2。图5(a、b)分别是四川盆地12站重现期为50a和100a的估计出的极端降水量,其中泸州的50a一遇和100a一遇的降水极值分位数都超过了100mm。图5(c)为两种模型估计的相对误差,由图可见,除了达县以外,两种模型估计的极值分位数的相对误差基本都在10%以下,达县误差较高的原因可能BM抽样使GEV模型的结果受资料年数的影响高于GPD模型。GEV模型抽样的时间段为半年,一年仅有两个数据,并且一些站点半年最大小时降水量仅有几毫米,但也将它作为极值样本了。还有一个原因可能是分段抽样的条件不能保证都相同,由各站的月平均降水量(图略)可知,上半年(1—6月)和下半年(7—12月)的降水量是不平衡的,下半年降水量都要高于上半年。对各站极值的数值大小分析(结果略)发现,多数年份的极值在数值上,下半年是大于上半年的,甚至下半年的第二大极值也大于上半年,但却不能将其作为极值样本。鉴于GPD模型用的是POT抽样,能够充分利用有限的极值样本,因此认为用GPD推算出来的给定重现期极端降水量的可信度更高。3两种模型拟合的对比本文运用广义Pareto分布(GPD)和广义极值分布(GEV),借助于基于概率加权矩的L-矩的参数估计方法,通过Hill图,结合柯尔莫哥洛夫-斯米尔洛夫(K-S)检验所构建的统计量D*确定GPD的最佳门限值,对四川盆地12站的逐时极端降水量进行拟合,并对两种模型的拟合效果进行比较,推算出各站由两种模型求出的50a和100a一遇的极值分位数,得到如下结论:(1)用GPD模型拟合时,先通过确定Hill图中尾部指数开始趋于稳定的区域,再结合D*统计量来确定最佳门限值,可以避免通过观察Hill图得到最佳门限的主观性。对用此方法得到的样本进行独立性检验,结果表明样本之间是独立的,用这种方法来确定最佳门限值是合适的。(2)两种模型的拟合

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论