版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、内 容: 水文统计的意义及基本概念 频率和概率 经验频率曲线 随机变量的统计参数 理论频率曲线 抽样误差 水文频率分析方法 相关分析水文现象具有二重性:水文现象具有二重性:水文现象包含着必然性水文现象包含着必然性(Inevitability) 水文现象也包含着偶然性水文现象也包含着偶然性(Contingency) ,对水文的偶然现象或称随机现象所遵循的对水文的偶然现象或称随机现象所遵循的规律一般称做统计规律。规律一般称做统计规律。 1. 1. 概述概述物理成因分析法物理成因分析法概率论和数理统计分析方法概率论和数理统计分析方法水文分析计算常用到数理统计的方法水文分析计算常用到数理统计的方法 这
2、种对未来长期的径流情势属随机变量这种对未来长期的径流情势属随机变量的估计,只能依据其统计规律,利用数理统计的的估计,只能依据其统计规律,利用数理统计的方法进行方法进行“概率预估概率预估”。 所谓所谓“概率预估概率预估”,即分析水文变量出现大,即分析水文变量出现大过或小于某个数值的可能性为多少。过或小于某个数值的可能性为多少。 它是指随机试验结果的一个数量。在水文它是指随机试验结果的一个数量。在水文学中,常用大写字母表示,记作学中,常用大写字母表示,记作X X,而随机变,而随机变量的可能取的值记作量的可能取的值记作x x,即:,即: X = x1, X = x2, X = x1, X = x2,
3、 X = xn X = xn 一般称之为随机系列或随机数列。一般称之为随机系列或随机数列。 总体总体 (Population/TotalityPopulation/Totality) 在统计数学中,把某种随机变量在统计数学中,把某种随机变量所取数值的全体,称为总体。所取数值的全体,称为总体。 水文变量如年径流量的总体数是无水文变量如年径流量的总体数是无穷的,故无法取得总体。穷的,故无法取得总体。 实测的水文系列可看成总体的一个随机样本,因实测的水文系列可看成总体的一个随机样本,因此资料样本的代表性是指样本的统计特征能否反此资料样本的代表性是指样本的统计特征能否反映总体的统计特征。映总体的统计特
4、征。 样本对总体的代表性的好坏反映在样本的统计参数样本对总体的代表性的好坏反映在样本的统计参数与总体统计参数的接近程度。依据数理统计原理,当与总体统计参数的接近程度。依据数理统计原理,当样本容量愈大,则抽样误差愈小,说明长系列样本代样本容量愈大,则抽样误差愈小,说明长系列样本代表性高的可能性要大。增加资料系列长度的手段有表性高的可能性要大。增加资料系列长度的手段有3种种:插补展延、增加历史资料、坚持长期观测。:插补展延、增加历史资料、坚持长期观测。4.4.概率和频率概率和频率 Probability & FrequencyProbability & Frequency nmAP
5、)( 式中 ,P(A) :一定条件下随机事件A的概率; n :试验中所有可能的出现的结果数; m :出现随机事件A的结果数。简单简单( (古典古典) )的随机事件的概率定义用下式表示:的随机事件的概率定义用下式表示:有利于有利于A的试验结果数的试验结果数m为介于为介于0 n之间的数,之间的数,即即根据事件出现的可能性是否能预先估计,分为:根据事件出现的可能性是否能预先估计,分为: 事先概率事先概率 事后概率事后概率nm 01)(0 AP随机事件随机事件A的概率的概率例:袋中有手感完全相同的例:袋中有手感完全相同的20个白球和个白球和10个黑球,个黑球,问:摸出白球、黑球的概率各是多少?摸出白球
6、问:摸出白球、黑球的概率各是多少?摸出白球或黑球的概率为多少?摸出红球的概率为多少?或黑球的概率为多少?摸出红球的概率为多少? 设事件设事件A A在在n n 次随机试验中出现了次随机试验中出现了m m 次,则次,则定义:定义:nmAW )(2 2频率频率 (FrequencyFrequency)为事件为事件A A 在在n n 次试验中出现的频率。次试验中出现的频率。 注意:注意:n n 不是所有可能的结果总数,仅不是所有可能的结果总数,仅是随机试验的次数。是随机试验的次数。频率与概率的关系频率与概率的关系 因为各种水文要素其可能出现的总数是无限的,因为各种水文要素其可能出现的总数是无限的,可见
7、水文现象的概率不能视为古典概率。因而,通可见水文现象的概率不能视为古典概率。因而,通常将有限的实测水文数据当作多次重复试验结果,常将有限的实测水文数据当作多次重复试验结果,故可用上式故可用上式 ,式中,式中n为事件为事件A 随机试验次数随机试验次数推求的频率作为概率的近似值。推求的频率作为概率的近似值。nmAW )(1)(1)概率相加定理概率相加定理互斥事件:在一次试验中,只有一个事件发生,其互斥事件:在一次试验中,只有一个事件发生,其余事件均不能发生,这类事件称为互斥事件;余事件均不能发生,这类事件称为互斥事件;概率相加定理:互斥的各事件中,至少有一个发生概率相加定理:互斥的各事件中,至少有
8、一个发生的概率等于各个事件发生的概率总和。的概率等于各个事件发生的概率总和。 例例 袋中有手感完全相同的袋中有手感完全相同的2020个白球和个白球和1010个黑球,个黑球,问:摸出白或黑求的概率是多少?问:摸出白或黑求的概率是多少?32102020)(白P31102001)(黑P13132)()()(黑白白或黑PPP例某测站有40年的实测枯水位记录,各种水位出现的频率如表3.1所示,试确定水位H2.0m和H2.7m的概率?%70)0 . 4()5 . 3()7 . 2()0 . 2(WWWHP%5 .92%70%5 .22)7 . 2()0 . 2()7 . 2(HPWHP某站水位频率计算 表
9、3.1 序号水位H(m)频数f(a)频率W(%)累积频率P (%)123454.01.921016935254022.57.55307092.5100 40100 注:表中水位为相对高程。(2)(2)概率相乘定理概率相乘定理独立事件:某一事件的出现并不影响其他事件的出现,独立事件:某一事件的出现并不影响其他事件的出现,这类事件称为独立事件;这类事件称为独立事件;概率相乘定理:几个独立事件一并先后出现的概率概率相乘定理:几个独立事件一并先后出现的概率等于各事件出现的概率之积。等于各事件出现的概率之积。 例:有三条互不影响的排水管道,它们遭遇满溢的破坏概率各例:有三条互不影响的排
10、水管道,它们遭遇满溢的破坏概率各为为1/101/10,求这三条排水管道在工作中同时都出现满溢的概率。,求这三条排水管道在工作中同时都出现满溢的概率。 p=1/101/101/10 =1 p=1/101/101/10 =1 条件概率:条件概率:在事件在事件B B发生的情况下事件发生的情况下事件A A的概率。记为的概率。记为P(AP(AB)B)P(AB)=P(B)P(AP(AB)=P(B)P(AB)B)例:一纸箱中有相同大小的乒乓球例:一纸箱中有相同大小的乒乓球5050个,其中白色个,其中白色4040个,黄色个,黄色1010个,现任意从中取一个不放回,再从中取另一个,问两次取球均为白色的概率。个,
11、现任意从中取一个不放回,再从中取另一个,问两次取球均为白色的概率。nn2211PxXPPxXPPxXP )()()( 上式中上式中P1, P2, Pn 表示随机变量表示随机变量X 取值取值x1, x2, xn 所对应的概率。所对应的概率。 x1 x2 x3 x4 xnXP 离散型随机变量概率分布图离散型随机变量概率分布图 一般将这种对应关系称作随机变量的概率分布规一般将这种对应关系称作随机变量的概率分布规律,简称为分布律。可以用以下的分布图形表示:律,简称为分布律。可以用以下的分布图形表示: 变量的取值充满整个数值区间,无变量的取值充满整个数值区间,无法一一列出其每一个可能值,只能以法一一列出
12、其每一个可能值,只能以区间的概率来分析其分布规律。区间的概率来分析其分布规律。 连续系列按由大到小顺序排列,分连续系列按由大到小顺序排列,分成成N组,组距值组,组距值 x=xi-xi+1,任一组,任一组内概率为内概率为 p,组间平均概率为,组间平均概率为f= p/ x,此值称为,此值称为 x区间对应的概率密区间对应的概率密度。度。 区间足够小时,区间足够小时, 水文学上习惯研究随机变量的取值等于或大水文学上习惯研究随机变量的取值等于或大于某个值的概率,表示为:于某个值的概率,表示为: 它是它是x的函数,称作随机变量的函数,称作随机变量X 的分布函数的分布函数(Distribution func
13、tion),记作,记作F(x),即,即 表示随机变量表示随机变量X大于或等于值大于或等于值x的概率,其几的概率,其几何曲线称作随机变量的概率分布曲线水文学上何曲线称作随机变量的概率分布曲线水文学上通常称累计频率曲线,简称频率曲线)。通常称累计频率曲线,简称频率曲线)。)(xXP dxxfxXPxFx )()()(f(x)f(xi)F(x)xi密度曲线密度曲线分布曲线分布曲线dxxfxFx )()(xxdxdxxfxXPxFx )()()(可见,随机变量的二个函数的物理意义:可见,随机变量的二个函数的物理意义: 例题:某站有例题:某站有6262年的降水资料书中年的降水资料书中4141页表页表3.
14、33.3)。分析年降水量的概率分布规律。)。分析年降水量的概率分布规律。 将将6262年降水量按大小每隔年降水量按大小每隔x=200mmx=200mm划分为一划分为一组,统计各组值出现的次数,计算各组值相应组,统计各组值出现的次数,计算各组值相应得频率、频率密度、累积次数、累积频率的值。得频率、频率密度、累积次数、累积频率的值。 以年降水量为纵坐标,以频率密度为横坐标,以年降水量为纵坐标,以频率密度为横坐标,绘成频率密度直方图,而以累积频率为横坐标,绘成频率密度直方图,而以累积频率为横坐标,绘成累积频率直方图。绘成累积频率直方图。 1 1累积频率与随机变量的关系累积频率与随机变量的关系 水文特
15、征值属于连续型随机变量,在分析水水文特征值属于连续型随机变量,在分析水文系列的概率分布时,用文系列的概率分布时,用xxixxi的概率。累积频的概率。累积频率是指等量值和超量值累计出现的次数与总观率是指等量值和超量值累计出现的次数与总观测次数之比。在实际应用中用样本系列频率分测次数之比。在实际应用中用样本系列频率分布代替整体系列的频率分布。当样本容量相当布代替整体系列的频率分布。当样本容量相当的大,而组距很小时,可以绘出频率分布曲线。的大,而组距很小时,可以绘出频率分布曲线。 频率:工程上习惯把累积频率称为频率。频率:工程上习惯把累积频率称为频率。根据选取样本系列的方法不同,频率分为:根据选取样
16、本系列的方法不同,频率分为: 年频率:采用年最大值法选样,得到的频率年频率:采用年最大值法选样,得到的频率称为年频率。称为年频率。 次频率:采用超定量法或超大值法选样,得次频率:采用超定量法或超大值法选样,得到的频率称为次频率。到的频率称为次频率。2) 2) 重现期重现期 Recurrence interval/return Recurrence interval/return periodperioda.a.当研究洪水或暴雨问题当研究洪水或暴雨问题 水文上关心的是大于等于某洪水或某暴雨水文上关心的是大于等于某洪水或某暴雨量发生的频率,因而,重现期指在很长时期量发生的频率,因而,重现期指在很长
17、时期N N年内,出现大于等于某水文变量年内,出现大于等于某水文变量XP XP 事件的平事件的平均重现的间隔期均重现的间隔期T T:式中式中:T-:T-重现期,以年计;重现期,以年计;P-P-大于等于某水文变量大于等于某水文变量 XPXP事件的频率。事件的频率。1TP 频率频率P P与重现期与重现期T T关系的两种表示法:关系的两种表示法: 水文上关心的是小于水文上关心的是小于XP的事件出现的频率及的事件出现的频率及相应的重现期。相应的重现期。 重现期指在很长的时期内重现期指在很长的时期内(N年年)出现小于某水文出现小于某水文变量变量XP事件的平均重现间隔期。若水文变量大于事件的平均重现间隔期。
18、若水文变量大于等于等于XP的频率为的频率为P ,则小于,则小于XP事件的频率应为:事件的频率应为:1-P,在,在N年内小于年内小于XP事件出现的次数应为事件出现的次数应为N(1-P),因此其重现期为:因此其重现期为:注意:重现期不是固定多少年重复一次。注意:重现期不是固定多少年重复一次。b. b. 当研究枯水问题当研究枯水问题1=(1-)1-NTNPP 例例1、P=5%的丰水年,重现期等于的丰水年,重现期等于_年。年。例例2、P=95%的枯水年,重现期等于的枯水年,重现期等于_年。年。 工程上习惯把设计频率叫做设计保证率,即供水工程上习惯把设计频率叫做设计保证率,即供水或供电来水得到保证的程度
19、或供电来水得到保证的程度(频率频率50%)。例:供水保证率为例:供水保证率为90%,其重现期为,其重现期为_年。年。例:发电年设计保证率为例:发电年设计保证率为95%,重现期则为,重现期则为_年。年。注意:重现期不是固定多少年重复一次。注意:重现期不是固定多少年重复一次。c. c. 设计保证率设计保证率例:例:P=5%P=5%的丰水年,重现期等于的丰水年,重现期等于_年。年。例:例:P=95%P=95%的枯水年,重现期等于的枯水年,重现期等于_年。年。例:百年一遇洪水,是指例:百年一遇洪水,是指 a、大于等于这样的洪水每隔、大于等于这样的洪水每隔100年必然会出现一次年必然会出现一次b、大于等
20、于这样的洪水平均、大于等于这样的洪水平均100年可能出现一次年可能出现一次c、小于等于这样的洪水正好每隔、小于等于这样的洪水正好每隔100年出现一次年出现一次d、大于等于这样的洪水平均、大于等于这样的洪水平均100年可能出现一次年可能出现一次 水文现象具有明显的地区性和随机性,因而无法水文现象具有明显的地区性和随机性,因而无法用水文特征值出现的量值做为工程设计的标准。主管用水文特征值出现的量值做为工程设计的标准。主管部门根据工程的规模、工程在国民经济的地位以及工部门根据工程的规模、工程在国民经济的地位以及工程失事后果等因素,在各种工程设计规范中规定各种程失事后果等因素,在各种工程设计规范中规定
21、各种水文特征值的水文资料,通过水文分析计算,求出对水文特征值的水文资料,通过水文分析计算,求出对应于设计频率的水文特征值,作为工程设计的依据。应于设计频率的水文特征值,作为工程设计的依据。 4.5 4.5 设计标准设计标准5.5.经验频率曲线经验频率曲线【例】已知某地年降雨量的观测资料【例】已知某地年降雨量的观测资料(n=12),并由大,并由大 到小排列,按到小排列,按 计算频率。计算频率。式中,式中,P:大于或等于某一变量值:大于或等于某一变量值 x 的经验频率;的经验频率; m:x 由大到小排列的序号,即在由大到小排列的序号,即在n 次观测资次观测资料中出现大于或等于某一值料中出现大于或等
22、于某一值 x 的次数。的次数。nmP 经验频率计算表:经验频率计算表:n =12由此得到经验频率分布曲线由此得到经验频率分布曲线: :0 .02 0 .04 0 .06 0 .08 0 .01 0 0 .0P (% )8 0 01 0 0 01 2 0 01 4 0 0年 降 雨 量 (m m )经经 验验 分分 布布 曲曲 线线P (Xx)x%31.92112121 nmP经验频率的计算公式:经验频率的计算公式:这样,当这样,当m=n=12 时,时,该公式在水文计算中通常称为期望公式该公式在水文计算中通常称为期望公式1 nmP2 2经验频率曲线的绘制经验频率曲线的绘制 如果有n年实测资料,可
23、按下列步骤绘经验频率曲线:1将按时间顺序排列的实测资料按递减顺序排列成x1,x2,xn,对应的序号m为1,2,n。2利用公式分别计算对应各个变量的经验频率。3以水文变量x为纵坐标,以频率P为横坐标,在坐标纸上点绘经验频率点,目估通过点群中心绘一条光滑的曲线,这就是经验频率曲线。4根据工程设计标准指定的频率,在曲线上查出所需的水文数据。 绘在一般坐标纸上的频率曲线,其两端坡度较陡,绘在一般坐标纸上的频率曲线,其两端坡度较陡,即上部急剧上升,下部急剧下降,而两端正是工即上部急剧上升,下部急剧下降,而两端正是工程设计频率所用的部位。为了比较方便和精确的程设计频率所用的部位。为了比较方便和精确的绘制频
24、率曲线,人们采用频率计算专用的概率格绘制频率曲线,人们采用频率计算专用的概率格纸。常用的概率格纸的横坐标是按正态曲线的概纸。常用的概率格纸的横坐标是按正态曲线的概率分布分格制成的。所以,正态概率分布曲线绘率分布分格制成的。所以,正态概率分布曲线绘在这种格纸上呈直线,非正态概率分布曲线绘在在这种格纸上呈直线,非正态概率分布曲线绘在这种格纸上,其两端曲线坡度也会大大变缓,有这种格纸上,其两端曲线坡度也会大大变缓,有利于曲线外延。概率格纸的纵坐标,可以是均匀利于曲线外延。概率格纸的纵坐标,可以是均匀分格,也可以是对数分格。分格,也可以是对数分格。3 3经验频率曲线的外延经验频率曲线的外延由于实测资料
25、年数不多,用其绘制的经验频率曲线位于概率格纸的中间部分,而工程上往往需要推求稀遇频率的水文数据,对经验频率曲线进行外延就是一种常用的推求方法。然而,由于没有实测点据控制,目估使曲线外延往往带有相当大的主观成分。其次,由于水文现象的随机性,有时点绘的经验频率点分布比较散乱,使得经验频率曲线的定线比较困难。这样,就会影响设计水文数据的精度。为了解决定线和外延上的困难,人们提出用数学方程式来表示频率曲线,这就是理论频率曲线。 在实际问题中,随机变量的分布函数有各在实际问题中,随机变量的分布函数有各种形式,不易确定,或有时不一定需要用复杂种形式,不易确定,或有时不一定需要用复杂的完整的形式来说明随机变
26、量的分布规律,而的完整的形式来说明随机变量的分布规律,而只要知道其主要特征就可以。故采用随机变量只要知道其主要特征就可以。故采用随机变量的分布函数和密度函数中的一些特征参数如的分布函数和密度函数中的一些特征参数如均值、变差系数、偏态系数),来反映随机变均值、变差系数、偏态系数),来反映随机变量分布的特点:如有的分布集中,有的分布分量分布的特点:如有的分布集中,有的分布分散,有的分布对称,有的分布非对称,等等。散,有的分布对称,有的分布非对称,等等。在统计学中用以表示随机变量这些分布特征的在统计学中用以表示随机变量这些分布特征的某些参数,称之为随机变量统计参数。某些参数,称之为随机变量统计参数。
27、x式中式中 N样本系列的总项数,样本系列的总项数,N=f1+f2+fn。 加权平均法加权平均法设有一实测系列由x1,x2,xn组成,各个随机变量出现的次数分别为f1,f2, ,fn,则系列均值为: niiinnnfxNfffxfxx11111平均 算术平均法算术平均法 若实测系列内各随机变量很少重复出现,可以不考若实测系列内各随机变量很少重复出现,可以不考虑出现次数的影响,用算术平均法求均值。虑出现次数的影响,用算术平均法求均值。niixnx11平均式中式中 n样本系列的项数。样本系列的项数。 对于水文系列来说,一年内只选一个样或几对于水文系列来说,一年内只选一个样或几个样,水文特征值重复出现
28、的机会很少,一般使个样,水文特征值重复出现的机会很少,一般使用算术平均值。用算术平均值。 均值的物理意义均值的物理意义 (1 1反映系列的数值水平均值反映了随机变量的平反映系列的数值水平均值反映了随机变量的平均水平,能代表整个随机变量系列的水平高低。系列均水平,能代表整个随机变量系列的水平高低。系列数值水平高的,其平均数大,系列数值水平低的,其数值水平高的,其平均数大,系列数值水平低的,其平均数小。平均数小。 (2 2概率论中大数定律指出,当项数增大时,平均数概率论中大数定律指出,当项数增大时,平均数将渐趋一个稳定值。根据这一特性,在水文学中常利将渐趋一个稳定值。根据这一特性,在水文学中常利用
29、均值推求设计频率的水文特征值;也可以利用均值用均值推求设计频率的水文特征值;也可以利用均值表示各种水文特征值的空间分布情况,绘制成各种等表示各种水文特征值的空间分布情况,绘制成各种等值线图。例如,年径流等值线图、年降水量等值线图、值线图。例如,年径流等值线图、年降水量等值线图、最大最大24h24h雨量等值线图。该图显示各地水文现象的地区雨量等值线图。该图显示各地水文现象的地区差异。差异。模比系数变率模比系数变率K =1 =1niixnx11平均xxiniinKnnKKKK1211.kxxkii,11121 niinknnkkkk 令称模比系数,那么 该参数用以反映随机变量分布离散程度该参数用以
30、反映随机变量分布离散程度(相对相对于随机变量分布中心即平均值的差距于随机变量分布中心即平均值的差距)的指标,通的指标,通常有以下几种:常有以下几种:s值愈大,分布愈分散;值愈大,分布愈分散;s 值愈小,分布愈集中。值愈小,分布愈集中。2)(xxE 1 2 2 1f(x)x标准差对密度标准差对密度函数的影响函数的影响 均方差s的因次与变量xi相同。s值较小时,表示系列的离差较小,说明变量间的变化幅度较小,分布比较集中;s值较大时,则说明变量间的变化幅度较大,分布比较分散,即离散程度较大。同时,均方差s还可以说明均值对系列的代表性,s值越小,均值的代表性越强。例如: 甲系列: 150,125,10
31、0,75,50 乙系列: 120,110,100,90,80 甲系列和乙系列的均值大小相等, ,其均方差分别为s甲39.5、 s乙15.8、s甲s乙说明甲系列的离散程度比乙系列大。例子:例子:x=10004.08二个系列:二个系列:第一系列:第一系列:5,10,15,第二系列:第二系列:995,1000,1005,x=10= 4.08但对于均值的相对离散程度则不同:但对于均值的相对离散程度则不同:第一系列:最大值和最小值与均值差都是第一系列:最大值和最小值与均值差都是5,相当于均值的相当于均值的5/10=0.5;第二系列:最大值和最小值与均值差都是第二系列:最大值和最小值与均值差都是5,但相当
32、于均值的但相当于均值的5/1000=0.005,可见该系列对,可见该系列对均值的差距极小,比第一系列分布更集中。均值的差距极小,比第一系列分布更集中。因此以离差系数能更好地比较出二系列的离因此以离差系数能更好地比较出二系列的离散程度:散程度: CV1=0.408 CV2=0.00408xxECV )(CV1CV2CV2 CV1f(x)x变差系数对密变差系数对密度函数的影响度函数的影响CV值愈大,分布愈分散;值愈大,分布愈分散;CV 值愈小,分布愈集中。值愈小,分布愈集中。对于均值不同的二个系对于均值不同的二个系列,用均方差来比较其列,用均方差来比较其离散程度就不合适,则离散程度就不合适,则要采
33、用均方差和均值的要采用均方差和均值的比值来表示:比值来表示:离差系数的物理意义离差系数的物理意义(1Cv是流域形状的一种特征参数。狭长流域Cv的一般大于枝状流域;小流域Cv大于大流域。(2测站位置与Cv的关系同一流域,各支流汇合前Cv大,汇合后的干流段Cv小,同一河流,上游Cv大,下游Cv小。(3实测时段长短与Cv的关系同一水文现象,长系列Cv小,短系列Cv大。例如,月降水量Cv小,日降水量Cv大。(4地理位置与Cv的关系各类河流的Cv值一般为沿海小,内陆大;南方小,北方大;平原小,山区大。f(x)x偏态系数对密度函数的影响偏态系数对密度函数的影响当密度曲线对当密度曲线对 对称,对称,CS =
34、 0 ;若不对称:;若不对称: CS 0 , 称为正偏;称为正偏;CS 0Cs033)( xXECs(8-8)x 矩在统计学中常用来描述随机变量的分布特征,均矩在统计学中常用来描述随机变量的分布特征,均值等统计参数有些可以用矩来表示。矩可分为原点值等统计参数有些可以用矩来表示。矩可分为原点矩和中心矩两种。矩和中心矩两种。- 原点矩原点矩 随机变量随机变量X对原点离差的对原点离差的r次幂的数学期望次幂的数学期望EXr),称为随机变量),称为随机变量X的的r阶原点矩,以符号阶原点矩,以符号mr表示,即表示,即:mr= EXr)(r = 1,2,3,。,。,n) 对离散型随机变量,r阶原点矩为: m
35、r= EXr)= 对连续型随机变量,r阶原点矩为: mr= EXr)= 当r=1时,m1= EX1)= ,即一阶原点矩就是数学期望,也就是算术平均数均值)。 - 中心矩中心矩 随机变量X对分布中心EX离差的r次幂的数学期望EX-EX) r,称为随机变量X的r阶中心矩,以符号r表示,即: r = EX-EX) r 对离散型随机变量,r阶中心矩为: r= EX-EX) r= 对连续型随机变量,r阶中心矩为: r= EX-EX) r= 当r=2时,2 = EX-EX) 2= 2 ,即二阶中心矩就是标准差的平方称方差)。 由大数定律可知,样本矩依概率收敛于总体矩。矩法是用样本矩估计总体矩,并通过矩和参
36、数之间的关系,来估计频率曲线参数的一种方法。 前述,一阶原点矩的计算公式就是均值 ,均方差的计算式为二阶中心矩开方,偏态系数CS计算式中的分子则为三阶中心矩。 我们希望由样本系列计算出来的统计参数与总体更接近些,为无偏估值,因而,需要将上述公式加以修正 。根据统计学的证明可知:根据统计学的证明可知: 由 矩 法 求 到 的 样 本 平 均 值由 矩 法 求 到 的 样 本 平 均 值 为总体平均数的无偏估计量,然而二阶为总体平均数的无偏估计量,然而二阶中心矩、中心矩、CV , CS CV , CS 则不是总体相应参数则不是总体相应参数的无偏估计量,称为有偏估计量。故需的无偏估计量,称为有偏估计
37、量。故需要对参数要对参数CV , CS CV , CS 进行修正,使其变成进行修正,使其变成无偏估计量。无偏估计量。x无偏估计量:无偏估计量: 由统计学的定义,假设由统计学的定义,假设 是未知数是未知数 的的估计量,而且估计量,而且 ,则称,则称 为为 的无的无偏估计量。偏估计量。 )(E 因而,需要将上述公式加以修正,修正后的参数计算式为: 31323132)3()1()2)(1()1()2)(1(VniiVniissCnKnnnCnKnnnCC (当当 n 较大时较大时)1)1(112 nKnnCCniivv求求 Cv , Cs Cv , Cs 的无偏估计量的修正计算式:的无偏估计量的修正
38、计算式: 用上述的无偏估算公式计算的很多同容量的样本的用上述的无偏估算公式计算的很多同容量的样本的统计参值的均值,可望等于总体的同名参数。统计参值的均值,可望等于总体的同名参数。7.7.水文中常用的概率分布曲线水文中常用的概率分布曲线(8-9) xexfxx222)(21)(式中,式中, :平均数;:平均数; :标准差。:标准差。x 许多随机变量如水文测量误差、抽样误差许多随机变量如水文测量误差、抽样误差等一般服从正态分布。等一般服从正态分布。xxxf (x) a. 单峰,只有一个众数;单峰,只有一个众数; b. 对于平均数对称对于平均数对称, Cs= 0; c. 曲线二端趋于曲线二端趋于 ,
39、 并以并以x 轴为渐近线轴为渐近线; d. 1)(dxxf正态分布曲线的特点:正态分布曲线的特点:x 33)()(0.997)33(0.683)(xx2xxxx2xxdxe21xXxPdxe21xXxP2222 xxxf (x)x3 x3 经验频率曲线目估定线和外延会产生较大的经验频率曲线目估定线和外延会产生较大的误差,因此借助于某些数学形式的频率曲线误差,因此借助于某些数学形式的频率曲线作为定线和外延的依据。作为定线和外延的依据。1 1、实测资料中选取或算得、实测资料中选取或算得2323个有代表性的个有代表性的特征值作参数;特征值作参数;2 2、选配一些数学方程作为总体系列频率密度、选配一些
40、数学方程作为总体系列频率密度曲线的假想数学模型;曲线的假想数学模型;3 3、按一定方法确定累积频率曲线。、按一定方法确定累积频率曲线。 注意:注意:理论理论非物理意义上严格被证明水文非物理意义上严格被证明水文现象概率频率符合这种曲线。现象概率频率符合这种曲线。概率密度函数表达式:概率密度函数表达式: )(100)()()(axeaxxf 式中式中, () 的伽玛函数的伽玛函数, , , a 0:三个参数,与三个统计参数:三个参数,与三个统计参数有一定的关系,其表达式为:有一定的关系,其表达式为: dxexx 01)(VSx CC,VSSVSCaxCCxC C02242(1) 可见,当以上三个参
41、数确定后,可见,当以上三个参数确定后,P-III型密度函型密度函数亦完全确定。数亦完全确定。皮尔逊曲线特点:皮尔逊曲线特点:1、只有一个众数,该处斜率为零;、只有一个众数,该处斜率为零;2、曲线两端或一端以横轴为渐近线。、曲线两端或一端以横轴为渐近线。f(x)皮尔逊皮尔逊 型概率密度曲线型概率密度曲线 a0 xP PxdxxfP)(xP-III型曲线的特点:型曲线的特点:一端有限另一端无限的不对称单峰正偏曲线,一端有限另一端无限的不对称单峰正偏曲线,很多水文变量均符合很多水文变量均符合P-III型分布。型分布。 PxaxPdxeaxxXPP)(100)()()( (1) 在水文计算中,一般要求
42、出指定概率在水文计算中,一般要求出指定概率 P 所相应所相应的随机变量的取值的随机变量的取值 xP,即求出的,即求出的 xP满足下列等式:满足下列等式:VCxxx)( )1(VCxx VCx,SC dCfPPsP),()( 0.031.302.473.321.292.403.233.940.10.001.282.333.093.720.0501010.10.01P(%)P CsP-III型曲线离均系数型曲线离均系数 P 值表值表 被积函数含有参数被积函数含有参数 , Cs ,而,而 包含在包含在 中,制成中,制成 对应关系表:对应关系表:,VxCPsPC VCxxx)(
43、xCxVPP)1( 因而,由给定的因而,由给定的CS 及及P,从,从P-III型曲线离型曲线离均系数均系数 值表,查出值表,查出P ,再由下式求:,再由下式求:即求出指定概率即求出指定概率 P 所相应的随机变量的取值所相应的随机变量的取值 xP知知: : 某地年平均降雨量某地年平均降雨量 =1000 mm, CV =1000 mm, CV =0.5, CS =1.0,=0.5, CS =1.0,假定年降雨量符合假定年降雨量符合P - IIIP - III型型分布分布试求:试求:P = 1% P = 1% 的年降雨量。的年降雨量。x求解:求解: 由由 CS =1.0CS =1.0及及P =1%P
44、 =1%,查附表,查附表1 1得得P = 3.02 P = 3.02 1%(1)(3.020.5 1)1000= 2510PPVxx Cxmm + +引入模比系数:引入模比系数: x/xKPP 1 VPPCKxCxVPP1)( 由由由此建立由此建立 的的 对应数值关系对应数值关系P-III型型曲线模比系数曲线模比系数 KP 值表见附表值表见附表4)PKCPVmmxKxKP1%P251010002.512.51 P-III型曲线模比系数型曲线模比系数 KP 值表附表值表附表4, P231) P(%)CV0.030.512510205075909599(一)(一) CS=CV0
45、.021.111.091.071.041.000.970.940.920.891.5011.68.858.027.366.876.005.113.923.002.040.64-0.10-0.53-0.70-0.89(二)(二)CS=1.5CV0.05(三)(三) CS=2CV (三)(三) CS=6CV统计参数对频率曲线的影响:统计参数对频率曲线的影响:(1 1均值均值 对频率曲线的影响对频率曲线的影响x(2 2CvCv对频率曲线的影响对频率曲线的影响(3 3CsCs对频率曲线的影响对频率曲线的影响 P-III P-III型曲线只是作为实测系列频
46、率密度型曲线只是作为实测系列频率密度曲线的一种数学模型,因此实际应用中还应联曲线的一种数学模型,因此实际应用中还应联系水文现象的物理特征,即不可能为负值。需系水文现象的物理特征,即不可能为负值。需有:有:a00a00 因此得到因此得到CS2CVCS2CVP-III型曲线的应用问题型曲线的应用问题 由于水文系列总体是无限的,而样本的容由于水文系列总体是无限的,而样本的容量是有限的,因而,由样本求到的参数对于总量是有限的,因而,由样本求到的参数对于总体存在一定的误差,则称为抽样误差。因而,体存在一定的误差,则称为抽样误差。因而,以样本参数替代相应的总体参数时,必须考虑以样本参数替代相应的总体参数时
47、,必须考虑这一误差。该误差无法准确求到,只能在概率这一误差。该误差无法准确求到,只能在概率意义下作出某种估计。意义下作出某种估计。8. 抽样误差:抽样误差:Sampling error 抽样类型:抽样类型:1、随机抽样、随机抽样 2、分层随机抽样、分层随机抽样3、均匀抽样、均匀抽样 4、适时抽样、适时抽样 抽样误差:抽样误差: 从总体中抽样,可得到多个随机样本,它们从总体中抽样,可得到多个随机样本,它们的统计参数具有一定的频率分布,称为抽样误的统计参数具有一定的频率分布,称为抽样误差分布。抽样分布大多认为属正态分布。差分布。抽样分布大多认为属正态分布。 称为均方误差或标准误差。称为均方误差或标
48、准误差。 样本均值组成系列样本均值组成系列xi均值为总体均值均值为总体均值x总,总, xi -x总总=x,由抽样引起,称为抽样误差。由抽样引起,称为抽样误差。 xxxf (x)x3 x3 mxxsix2)(总 同理,与样本平均数的抽样误差类似,样同理,与样本平均数的抽样误差类似,样本的本的 CV , CS 的抽样误差,可以它们相应的的抽样误差,可以它们相应的抽样分布的均方误抽样分布的均方误 来表示来表示 。SVCC , 因而,只要样本参数的均方误为已知的,因而,只要样本参数的均方误为已知的,则可以对该样本参数的抽样误差可作出估计。则可以对该样本参数的抽样误差可作出估计。nx (1)24312S
49、Cn (2)SVSVVCCCCCnCV24321222 (3)CC(nSSCS421652316 (4) 当总体为当总体为P-III型分布时,其样本各参数的型分布时,其样本各参数的均方误计算式由统计数学可以导出分别为:均方误计算式由统计数学可以导出分别为:9. 现行水文频率计算方法配线法现行水文频率计算方法配线法 (适线法适线法) Curve fitting method 是以经验频率点据为基础,在一定的适是以经验频率点据为基础,在一定的适线准则下,求出与经验点据拟合最优的频率线准则下,求出与经验点据拟合最优的频率曲线参数,这是一种较好的参数估计方法,曲线参数,这是一种较好的参数估计方法,是我
50、国估计某些水文变量如径流量、降雨是我国估计某些水文变量如径流量、降雨量等频率曲线统计参数的主要方法。量等频率曲线统计参数的主要方法。1mPn SVC,C,xVC,xVSKCC 知:经验频率分布知:经验频率分布 求:总体分布参数求:总体分布参数12SVC,C,xPxP经验点据经验点据 理论频率曲线理论频率曲线【水文学习题】 1在水文频率计算中,我国一般选配皮尔逊在水文频率计算中,我国一般选配皮尔逊型曲线,型曲线,这是因为这是因为 A、已经从理论上证明它符合水文统计规律、已经从理论上证明它符合水文统计规律 B、已支撑该线型的、已支撑该线型的 值表供查用,使用方便值表供查用,使用方便 C、已制成该线
51、型的、已制成该线型的KP值表供查用,使用方便值表供查用,使用方便 D、经验表明该线型能与我国大多数地区水文变量的、经验表明该线型能与我国大多数地区水文变量的频率分布配合良好频率分布配合良好2甲乙两河,通过实测年径流量资料的分析计算,获得甲乙两河,通过实测年径流量资料的分析计算,获得各自的年平均径流值和离差系数如下:各自的年平均径流值和离差系数如下:甲河:甲河: Q甲甲100 m3/s, CV甲甲0.42;乙河:乙河: Q乙乙500 m3/s , CV乙乙0.25,两者比较可知:两者比较可知: A、甲河水资源丰富,径流量年际变化大、甲河水资源丰富,径流量年际变化大B、甲河水资源丰富,径流量年际变
52、化小、甲河水资源丰富,径流量年际变化小C、乙河水资源丰富,径流量年际变化大、乙河水资源丰富,径流量年际变化大D、乙河水资源丰富,径流量年际变化小、乙河水资源丰富,径流量年际变化小3用配线法进行频率计算时,判断配线是否良好用配线法进行频率计算时,判断配线是否良好所遵循的原则是所遵循的原则是 : A、抽样误差最小原则、抽样误差最小原则B、统计参数误差最小原则、统计参数误差最小原则C、理论频率曲线与经验频率点据配合最好、理论频率曲线与经验频率点据配合最好原则原则D、设计值偏于安全原则、设计值偏于安全原则 4 某河某站有某河某站有24年实测径流资料,经频率计算已年实测径流资料,经频率计算已求得理论频率
53、曲线为求得理论频率曲线为PIII型,年径流深均值型,年径流深均值R=667mm,CV=0.32,CS=2.0 CV,试求十年一遇,试求十年一遇丰水年和十年一遇枯水年的年径流深为多少?丰水年和十年一遇枯水年的年径流深为多少?十年一遇洪水年,十年一遇洪水年,p=1/T=10%,十年一遇枯水年,十年一遇枯水年,p=1-1/T=90%10.相关分析 1相关的意义与应用 有些测站,或因建站较晚实测资料系列较短,或有若干年缺测,整个系列不连续。为了提高系列的代表性,需要对已有的实测资料系列进行插补和延长。 相关分析可以用来延长和插补短系列。 自然界中有许多现象之间是有一定联系的。研究分析两个或多个随机变量
54、之间的关系称为相关分析。 2相关的种类 根据变量之间相互关系的密切程度,变量之间的关系有三种情况:即完全相关、零相关、统计相关。 - 完全相关函数关系) 两变量x 与y 之间,如果每给定一个x 值,就有一个完全确定的y 值与之对应,则这两个变量之间的关系就是完全相关或称函数相关)。完全相关的形式有直线关系和曲线关系两种 - - 零相关没有关系)零相关没有关系) 两变量之间毫无联系,两变量之间毫无联系,或某一现象变量的变或某一现象变量的变化不影响另一现象变量化不影响另一现象变量的变化,这种关系则称为的变化,这种关系则称为零相关或没有关系。零相关或没有关系。 - - 统计相关统计相关 若两个变量之
55、间的关系界于完全相关和零相关若两个变量之间的关系界于完全相关和零相关之间,则称为相关关系或统计相关。当只研究两个之间,则称为相关关系或统计相关。当只研究两个变量的相关关系时,称为简相关;当研究变量的相关关系时,称为简相关;当研究3 3个或个或3 3个个以上变量的相关关系时,则称为复相关。在相关的以上变量的相关关系时,则称为复相关。在相关的形式上,又可分为直线相关和非直线相关。形式上,又可分为直线相关和非直线相关。 3相关分析的内容 相关分析或回归分析的内容一般包括三个方面:(1确定变量间的数量关系回归方程或相关线;(2判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度; (3根据自变量的值,预报或延长、插补倚变量的值,并对该估值进行误差分析。 简单直线相关 1相关图解法 设xi和yi代表两系列的观测值,共有n 对,把对应值点绘于方格纸上,得到很多相关点。如果相关点的平均趋势近似直线,即可通过点群中间及 点绘出相关直线。 2相关分析法 为避免相关图解法在定线上的任意性,常采用相关计算法来确定相关线的方程,即回归方程。简直线相关方程的形式为: y = a + bx 式中 x 自变量; y 倚变量; a、b 待定常数。待定常数a、b 由观测点与直线拟合最佳,通过最小二乘进行估计。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 9月高一上学期班主任工作计划范文
- 2025年电销工作总结与2025年计划
- 度宣传工作总结及某年工作计划
- 9月份销售工作计划例文
- 第二学期保教管理的工作计划
- 2025财务出纳工作总结与2025计划
- 2025幼儿园健康教育工作计划范例
- 关于学生个人实习计划
- 《食品农药残留检测》课件
- 《食管癌鉴别诊断》课件
- 数据通信与计算机网络智慧树知到期末考试答案章节答案2024年四川铁道职业学院
- 心理成长与发展智慧树知到期末考试答案章节答案2024年武汉职业技术学院
- 青少版新概念3B-U21市公开课一等奖省赛课微课金奖课件
- 储能业务培训
- 2024年四川省水电投资经营集团普格电力有限公司招聘笔试参考题库含答案解析
- 2024届新高考物理冲刺复习:“正则动量”解决带电粒子在磁场中的运动问题
- PLC控制Y-△降压启动控制设计
- 义务教育音乐(2022版)新课程标准考试测试题及答案5套
- 财产损害赔偿起诉状范本
- 创业管理(上海财经大学)智慧树知到期末考试答案2024年
- 【安徽山鹰纸业股份有限公司盈利能力探析(任务书+开题报告)3000字】
评论
0/150
提交评论