第四章水文统计的基本知识及方法_第1页
第四章水文统计的基本知识及方法_第2页
第四章水文统计的基本知识及方法_第3页
第四章水文统计的基本知识及方法_第4页
第四章水文统计的基本知识及方法_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1/60工程水文学2/60第4章 水文统计的基本知识及方法4.1 概述4.2 概率的基本概念4.3 随机变量及其概率分布4.4 统计参数估算4.5 现行水文频率计算方法适线法4.6 相关分析3/60水文现象水文现象受多种因素影响,具有随机性,故为随机现象。譬如: 同一距离用同一皮尺测多次,所得的结果彼此有差异; 给定相同的降雨强度和降雨时间,在同一块场地上进行多次人工降雨实验,每次所得结果彼此不同; 某水文站年平均流量每年都不相同。上述例子说明,在基本条件保持不变的情况下,多次试验会获得不一致的结果。其原因是除主要条件外,还有许多次要因素作用。随机性规律需要用大量资料加以统计,以得到统计规律及

2、相应的数字特征,常采用概率论和数理统计进行研究。4.1 概述4/60水文统计将概率论和数理统计理论引入水文学,研究水文现象的统计变化规律和数字特征的学科被称为水文统计。基本任务利用所获得的水文、气象资料,研究和分析随机水文现象(如河川径流)的统计变化规律,并以此为基础,对其未来的长期变化作出概率意义下的定量预估,为水利工程的规划、设计、施工和运行管理提供水文依据。譬如: 某流域修建一个水库,其规模取决于水库运行期间(未来100年)的径流和洪水的大小。但是,未来100年的径流和洪水有多大?必须做出估计。 南水北调工程西线方案中,调多少水量为最优? 某水电站装机容量和多年平均发电量是多少?等等5/

3、604.2 概率的基本概念事件:在一定的条件组合下,随机试验的结果。其结果分为三类:必然事件、不可能事件和随机事件。概率:随机事件A出现的可能性大小,称为事件A发生的概率,计算式为P(A)m/n式中,P(A)为事件A的概率;m为事件A出现的次数;n为所有试验次数。上式为古典随机试验,满足“随机等可能,独立同分布”。6/60事实上,由于水文事件不具备这种性质。为此,要计算随机水文事件的概率,引出了“频率”的概念。频率:设随机事件A在重复试验n次中出现m次,则称为事件A的频率。即W(A)m/n实践证明,当n时,P(A)稳定并趋于概率值。水文上,将计算的频率作为概率的近似值。续型的随机变量两类。水文

4、统计研究的对象是水文随机变量。连续型随机变量自记水位过程 Z(t)t自记雨量过程 P(t)tACB7/604.3 随机变量及其概率分布4.3.1 随机变量概念:指随机试验结果发生变化的变量,分为离散型的和连离散型随机变量年降雨量年径流量年最大洪峰年最高水位8/60X=x1,X=x2,X=xn-1, X=xnW =W1,X=W2,X=Wn-1, X=WnQm =Qm1,X=Qm2,X=Qmn-1, X=QmnZmZm1,XZm2,XZmn1,XZmn4.3.2 随机变量的概率分布离散型的用随机变量的分布序列表示,即P(Xxi)pi(i1,2,n)其概率分布满足两个条件:0pi1,且 pi1连续型

5、的用随机变量X大于某值xp的概率p表示,即F(X)P(Xx)x-f(x)dx或F(X)P(Xxp)p密度函数:分布函数导数的负值,记为f(x),即f(x)-F(x)-dF(x)/dx9/6010/60如p.80 所示,则有F(X)P(Xx)xpf(x)dx其概率分布曲线如p.80 所示,也称作水文频率曲线或累积频率曲线。图4-411/604.3.3 随机变量的分布(统计) 参数一方面,虽然随机变量的概率分布能完整地描述其统计变化规律,实际上,有时仅需要知道它的统计参数(数字特征)就足够了。另一方面,随机变量的统计参数分为总体统计参数和样本统计参数,而水文随机变量的总体始终是未知的,所以只能用样

6、本统计参数来估计总体的统计参数。水文水利计算中常用的统计参数包括位置特征参数(平均数、众数、中位数)和离散特征参数(均值、均方差、变差系数、偏态系数等)。12/60位置特征参数描述随机变量在数轴上位置的特征数。平均数 随机分布的中心离散型平均数:连续型平均数:E(X)ni=1xipiE(X)abx f(x)dx众数 概率密度分布的峰点值 p.81 Fig.5-5中位数 位置居中的数字 p.81 Fig.5-6X1x2x3X1x2x3XXf(x)f(x)x = E (X ) = p i x x i离散型随机变量连续型随机变量设水文随机变量观测序列x1,x2,x3,xn,则其均值为:均值为分布的中

7、心,表示系列的平均情况,即总体水平的高低,能反映出河流规模的大小。13/60均值或数学期望值 x 或 E(x)ni=1i+x = E (X ) = xf (x )dx =1 nn i=1x =x 1 + x 2 + L + x nnki =1将上式两端同除以均值,则有式中,称为模比系数或变率。表明模比系数的均值等于1。利用Ki,能使随机变量数字特征的表达式中减少一个参数。14/601 nn i=1=k =k1 + k2 +L+ knn = D(X) = (xi E(X) pi (x E(X) f (x)dx ( x15/60离散型随机变量连续型随机变量设有水文随机变量观测序列x1,x2,x3,

8、xn,则均方差为:ni=12+ =D(X) =2n2ini = 1 x ) =离散特征参数刻划随机变量分布离散程度的指标。标准差(均方差) 16/60均方差表示分布函数的绝对离散程度;均方差越大,分布函数越分散,其值变化幅度也越大,反之亦然。图4-7=17/60离势系数(离差系数或变差系数) Cv离差系数表示分布函数的相对离散程度;Cv越大,分布函数越分散,反之亦然。 E (X ) xCv =图4-8例1:若系列1为5,10,15和系列2为1,10,19;计算均方差并比较它们的离散程度。答案1:14.08和27.35例2:若序列1为5,10,15和序列2为995,1000,1005;计算变差系

9、数并比较它们的离散程度。答案2:EX110,14.08,Cv1=0.408和EX21000,24.08,Cv20.00408问1:甲地区年降雨量的均值为1200mm,均方差为1360mm;乙地区年降雨量的均值为800mm,均方差为1320mm。试比较甲、乙两地区降水量的分散程度。18/60 问2:一条河流上、下游断面的年平均流量的Cv值哪个大?为什么? (x x ) ( K i 1)或= i = 1Cs =n CsnC 3v19/60偏态系数(偏差系数) CsCs0时,分布函数对称,随机变量大于均值与小于均值出现机会相等;Cs0时,分布函数正偏,随机变量大于均值比小于均值出现的机会小;Cs x

10、p) =f 可知:若p已知,推求设计值Xp的关从定义键在于确定随机变量X的概率密度函数f(x)。由于水文随机变量复杂多变,其概率分布的确定十分困难。目前,国内外水文计算中经常使用的概率分布曲线(或水文频率曲线),大致可分为正态分布和P-III型分布两种类型。20/60+xpx)dx = p4.3.4 几种常用的概率分布曲线理论频率曲线:由实测的水文要素样本系列,通过理论频率分布方程式估算出相应的频率值,再用频率曲线拟合频率点据所得到的频率曲线。常用的理论频率分布线与x轴围成的面积为99.7%。21/601)正态分布型:包括正态分布、对数正态分布、三参数对数正态分布、正态分布 概率密度函数,XN

11、(u,2),其均值u和均方差完全确定了分布函数的形状。一般地,水文测量误差、抽样误差服从正态分布。密度曲线的特点:单峰;关于均值u对称,即Cs0;曲线两端无限,且与x轴渐进;处出现拐点,曲线与x轴围成的面积为68.3%;3之间的曲e(xU)22212f(x) =图5-10(x a0) e(xa0)2)皮尔逊(Pearson)分布型:包括PIII型分布、对数PIII型分布、PIII型分布 英国生物学家皮尔逊研究各种非正态分布函数曲线时,提出了13种分布曲线类型,其中第III型被引入水文学中,其概率分布函数为1()f(x) =式中, ()为的伽玛函数(gamma);、a0分别为形状参数、尺度参数和

12、位置参数。22/6023/60PIII型曲线的形状及其特点:一端有限,另一端无限的曲线;单峰而倒置的铃形;不对称的正偏分布;其位置取决于参数a0,形状取决于,与Cs有关。、和a0三个参数一经确定,PIII型密度函数随之确定。P.84 图5-11图5-11 = Cs 2 = a 0 = x (1 可以证明,三参数与均值、Cv、Cs有如下关系:经过以往大量的研究表明,我国多数河流的水文变量近似服从PIII分布(参见SL44-93水利水电工程设计洪水计算规范)。24/60)2CvCsxCvCs 4 2x()x(xa0)1e dx25/60离均系数 采用PIII型理论分布,对水文现象的长期变化规律作出

13、概率意义下的定量预估,即给出指定频率p所对应的随机变量之取值xp。例如:已知p1%(百年一遇)的设计洪峰流量,需要对密度曲线进行积分,求出等于和大于xp的累积频率p值。计算公式如下:上式直接积分是非常繁杂的。为便于在工作中运用,因此水文上制作专用的离均系数值表,以供查算。pp = p(x xp) =(xa0) ,则= f (,C )d若令式中,是均值为零、方差1的标准化变量,称为离均系数。上式包含Cs、p与p的关系。根据不同的Cs值,通过积分求出p与p之间的关系,可制成专用的值表,供查值计算之用,见p.293 附表2 所示。如:给定P和Cs值,从值表查得P,再将已知的均值和Cv代入的p值,得到

14、一系列的xp,便可绘制出理论频率曲线。26/60 x xxCV(1x = x 或+Cv)dx = xCvd psp于是,对于频率p,则有: p( ) =+ p即)xp = x(1中,Cv可求出相应的xP值。类似地,取不同xp = x(变为 Cv PKP1PCv,则KP,式中KP与p和Cs有关,可查p.295 附表3。假如有了p和xp的一组对应值,即可绘制理论频率分布曲线。27/60+ pCv)例如:某站年平均径流深系列符合p型分布,已知该系列的R1000mm,162.5mm,Cs2Cv,计算设计保证率p1%的设计年径流量。解:由Cv/R162.5/6500.25,则Cs2Cv0.5,p1%,查

15、表得2.68代入xp = x(1进行计算,有R1%100(12.680.25)1670mm另外,当Cs/Cv等于一定倍数时,可令模比系数+x28/604.4 统计参数估算上述各种频率曲线都含有未知的分布参数。要推求某一指定频率P的随机变量取值XP,就必须确定这些未知分布参数。同时,前面给出了随机变量X的总体统计参数估计方法。事实上,水文变量的总体是未知的,只知道一个观测样本系列x1,x2,xn(n为样本容量),又如何用有限的样本(时间序列)估计总体的分布参数呢?参数估计方法有很多,如矩法、三点法、权函数法、极大似然法、概率权重矩法等。 = i 1 xi(xi x)29/604.4.1 样本估计

16、总体样本 随机水文系列样本容量 样本的项数,即水文系列长度总体 随机变量全体这里仅介绍用矩法进行PIII型分布的参数估计方法。矩法:设水文随机变量X的一个样本x1,x2,xn,把计算的统计参数加以修正后,可得到无偏估计值公式如下:均值均方差的无偏估计量 S2n 1 =S=ni=1x =1 nn(xi x)30/604.4.2 无偏估计量若为未知参数的估计量,且满足E(),则称为的无偏估计量。由于矩法估计的统计参数(均值、Cv、Cs)具有抽样误差,不能直接作为总体的统计参数,需进行无偏修正。可以证明样本平均数是总体平均数的无偏估计量:E(x)E(X)均方差的无偏估计量:2n 1 =S=ni=1

17、(K i 1) (K i 1) 2(xi x)(xi -x)n (K i (K iCv的无偏估计量Cs的无偏估计量在水文频率计算中,可以用矩法估计值作为初始值,最终采用适线法来确定。31/602=n 1nnn 1ni=1ni=1Cv =33S3n(n-1)(n-2)ni=1nCs= i=1(n3)S3或 Cs=2nC1)3v2(n 1)(n 2)C s =n1)3i=1(n 3)Cv 3ni=14.4.3 抽样误差用有限的样本资料计算得到的统计参数代替总体的统计参数而引起的误差。水文系列是一个随机抽样的样本,其分布为抽样分布。抽样分布的误差通常用正态分布来估计。P-III型分布的统计参数(X、

18、Cv、Cs)的抽样误差可分别用均方误来表示:p.87-88 公式 (4-28)、(4-29)、(430)、(431)32/601+ Cs21+ 2Cv2 + Cs2 2CvCs(1+ Cs +33/60关于 P-III型分布各统计参数的均方误差公式:n x =34342nCv2n = Cv =5163 22Cs4)6n Cs =数学期望公式切哥达也夫公式海森公式xm式中,p为等于和大于xm的经验频率;m为等于和大于34/60 的序号;n为样本容量,即实测资料的总项数。100%mn +1p =100%m 0 . 3n + 0.4p =100%m 0 . 5np =4.5 现行水文频率计算方法适线

19、法4.5.1 经验频率由实测的水文要素样本系列,用经验频率公式计算得到的频率。常用的有三种经验频率计算公式如下:4.5.2 重现期指某随机变量的取值重复出现的平均时间间隔数,用T表示,单位:年。水文计算中常用“重现期”来代替“频率”,又称为“多少年一遇”。譬如:某洪水设计标准为百年一遇 p1%,则有T100年,表示平均每100年出现一次;某洪水设计标准为千年一遇p0.1,则有T1000年,表示平均每1000年出现一次。35/6036/60水流量,表示小于和等于这样的流量平均十年会出现一次。1)当研究暴雨洪水问题时,一般p50%,用 T = 1P 计算;当某一洪水的频率为p1%时,则T100年,

20、称此洪水为百年一遇洪水,表示大于和等于这样的洪水平均百年会出现一次。2)当考虑枯水问题时,一般 p50%,用 T = 11 计 P算;对于p90%的枯水流量,则T10年,称此为十 年一遇枯37/60采用目估适线法绘制经验频率曲线的步骤如下:1)将实测资料由大到小排列,计算各项的经验频率,在频率格纸上点绘经验点据(纵坐标为变量取值,横坐标为对应的经验频率);2)选定水文频率分布线型,我国一般选用P型;4.5.3 适线法通过估计总体的统计参数(均值、Cv、Cs)推求频率p对应的设计值xP的一种计算方法,也称为目估适线法。根据经验频率分布绘制经验频率曲线,进而估计总体分布相应的参数。38/603)假

21、定一组参数(均值、Cv、Cs),为了使假定值大致接近实际,用矩法求出该3个参数作为第一次适线的假定值。当用矩法估计时,因Cs的抽样误差太大,一般不直接计算Cs,而是根据经验假定Cs为Cv的某一倍数(如CsnCv,n为常数系数);4)根据假定的均值、Cv、Cs,查p.293 附表2或附表3;计算xp值;以xp为纵坐标,p为横坐标,绘制理论频率曲线。目估与经验点据配合的情况,若不理想,则调整参数(Cv、Cs)重复进行计算,到满意为止;5)选择最佳频率曲线与经验点据的配合情况,作为采用的理论频率曲线;同时,该曲线的参数便被作为总体参数的估值;6)最后,根据指定的频率,得到水文变量相应的设计值xP。参

22、见 p.90-93 算列(K i 1)(K i 1)239/60另例:已知某枢纽有实测21年的年最 大洪峰流量资料,试用矩法初选参数并配线,并推求百年一遇的洪峰流量。解:1)用期望公式计算经验频率p值2)用矩法初估统计参数(均值和Cv)100%mn+1p =xix =ni=11n2=n 1nnn 1ni=1ni=1Cv =40/603)点绘经验频率曲线41/60Qp11246(13.330.6)3730m3/s。 pCv)4)选配理论频率曲线5)推求百年一遇的设计洪峰流量由频率曲线图,可查得 p1时对应的流量为Qp3730m3/s。或用式 xp = x(1+ 直接计算,也可以得到42/60正态

23、分布频率曲线:纵横坐标均匀划分,在50对称的S形曲线;P-III型概率格纸:将横坐标按标准正态频率曲线转换成“中间较密,两端稀疏”不均匀划分,在50对称的直线。重现期99.9999.8 99.99899 99.59580906070402030101250.50.05 0.1 0.210001000100 2002050105252010100001000200 1005000.0180070060050040030020010050频率(%)43/60统计参数对频率曲线的影响值大的曲线位于均值小的曲线之上;均值大的曲线较均值小的曲线陡。x 对频率曲线的影响:当Cv、Cs相同时,均Cv对频率曲

24、线的影响:为消除均值影响,用模比系数k为纵坐标绘制频率曲线。当C=1.0,Cv0时,k1,频率曲线为一条水平线;且Cv越大,频率曲线越陡。P.90 图5-12图5-1244/60Cs对频率曲线的影响:正偏情况下,当Cv相同时,Cs越大,频率曲线中部向左偏,上部越陡,下部变平缓。P.90 图4-13图4-1345/6046/604.6 相关分析4.6.1 相关关系的概念研究两个或多个随机变量之间联系的方法。相关现象在水文计算中广泛存在,例如:降雨与径流(PR)、上下游洪水(Q上Q下)、水位与流量(ZQ)等。有三种相关情况:完全相关(函数关系)p.93 图4-15图415零相关(相互独立) p.9

25、3 图4-16统计相关(相关关系) p.94 图4-17图4-1647/60图4-1748/604.6.2 相关的种类简相关:研究两个变量之间的相关关系,在水文计算中应用较多。复相关:研究3个或3个以上变量的多元相关关系,在水文预报中应用较多。4.6.3 简相关直线相关的图解法 把(xi,yi)点绘在方格纸上,通过目测确定出相关直线的方法。(y ) = (y yi) =(yi abxi)249/60即直线相关的分析法 回归方程方法yabx式中,x为自变量;y为因变量;a,b为待定常数。a、b的估计:采用最小二乘法(LSM)估计若观测点与配合的直线在纵轴方向的离差为:要使直线拟合“最佳 ,须使离

26、差” yi的平方和为“最小”,ii2 ni=1n ni=1 i=12(yi abxi)(yi abxi)2 (xi x)(yi y) (xi x)2(xi x)(yi y)(xi x) (yi y)(K xi 1)(K yi 1)(K xi 1) (K yi 1)50/60可分别对a和b求一阶导数,并使其等于零,即令和2= 0ani=1= 0bni=1 y x= rb =ni=1ni=1联立上述两方程组,解得:a = y bx = y r x=r =22ni=1n ni=1 i=122ni=1n ni=1 i=1(xi x)(yi y) xi, y = yi51/60 x =1 nn i=11 nn i=1式中,r为相关系数,表示x、y间关系的密切程度,将a、b代入yabx,得y y = r (x x) yx,即y xp.95 图4-18RxRy y x= r22n 1n 1ni=1, y =ni=1 x =yiyxixK xi=, K yi =52/60相关分析的误差:回归线(方程)的误差 一般

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论