[自然科学]3 水文统计基本原理与方法.ppt_第1页
[自然科学]3 水文统计基本原理与方法.ppt_第2页
[自然科学]3 水文统计基本原理与方法.ppt_第3页
[自然科学]3 水文统计基本原理与方法.ppt_第4页
[自然科学]3 水文统计基本原理与方法.ppt_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章 水文统计基本原理与方法,3.1 概率统计理论基础 3.2 随机变量的概率分布 3.3 水文经验频率曲线 3.4 水文理论频率曲线线型与参数估计 3.5 抽样误差与相关分析 3.6 水文频率计算适线法,3.1 概率统计理论基础,3.1.1 随机事件与随机变量,水文现象都属于随机事件。,事件分类,1.必然事件,2.不可能事件,3.随机事件,事件:在一定条件下发生的事情。,随机变量:表示随机事件各次试验结果的实数值变量。,随机变量分类,1.连续型随机变量,2.离散型随机变量,随机变量系列(系列):随机变量可以取的一系列数值。,大多数水文现象,3.1 概率统计理论基础,3.1.2 总体和样本,2.样本:从总体中随机抽取的一部分试验结果值,称为随机变量的样本。,总体分类,1.有限总体,2.无限总体,1.总体:随机变量所有可取试验结果的全体。,样本容量:样本的数目。,抽样:从总体中抽取样本。,大多数水文现象的总体,3.1 概率统计理论基础,3.1.3 概率与频率,式中:m随机事件A出现的总次数。 n试验结果的总数。,简单随机事件:若试验的可能结果是有限的,而且所有事件出现的可能性都相等。,1.概率(机率、几率):随机变量X取值的可能性。,2.频率:在n次重复的随机试验中,事件A实际出现的次数f与试验总次数n的比值,称为事件A的频率。,简单随机事件的概率:,3.1 概率统计理论基础,3.1.3 概率probability与频率frequency,用实测样本的频率特性来分析推论事件总体的概率特性,是数理统计方法的基本原理。,3.1 概率统计理论基础,3.1.4 累积频率与重现期,1.累积频率:在n次重复随机试验中,大于等于某量值累计出现的次数与总次数的比值。,破坏率:建筑物每年遭到洪水破坏的可能性。P 安全率:建筑物每年正常运行的可能性。1P 保证率:在n年内保持正常运行的可能性。(1-P)n 风险率:在n年内遭到破坏的可能性。1(1-P)n,3.1.4 累积频率与重现期,2.重现期:水文破坏事件在长时期观测中可能再现的平均时间间隔,单位为年。,当确定设计洪峰流量或水位xi时, 破坏率: 破坏事件(Xxi)的重现期:,3.1.4 累积频率与重现期,当确定设计枯水位或年最小流量xi时, 安全率: 破坏率: 破坏事件(Xxi)的重现期:,3.2 随机变量的概率分布,随机变量可以取得所有可能值中的任何一个值,但取得某一可能值的机会并不相同,有的机会大,有的机会小。也就是说随机变量是以一定的概率来取某个可能值的,即随机变量的取值与其概率之间有一定的对应关系。 P(X=x1)=p1, P(X=x2)=p2 P(X=x3)=p3,P(X=x4)=p4 一般将这种对应关系称为随机变量的概率分布规律, 简称为概率分布。,1.概率分布,3.2 随机变量的概率分布,对连续性随机变量而言,由于其取值可能无限,所以取具体某个值的概率趋于零,只能研究某个区间的概率,即用随机变量落在某个区间的概率来分析其概率分布规律。 对于连续型随机变量,通常还研究随机变量取值大于等于某一值的概率,即研究Xx的概率,可表示为 P(Xx) 显然P(Xx)是x的函数,这个函数称为随机变量X的分布函数,即 F( x )= P(Xx),2.概率分布函数,3.2 随机变量的概率分布,举例 右图表示某雨量站年雨量的分布曲线。若x=800mm,由分布曲线知 P(X800)=0.6。这表明该站年雨量从多年平均来看,超过800mm的可能性为60%。 根据曲线分析该站年降水在800-900mm之间的概率为多少? 随机变量落在(x,x+x)内的概率为: P( x+xX x )= F(x)-F(x+x) 年降水量落在800-900mm之间的概率为: 0.6-0.28=0.32,3.2 随机变量的概率分布,随机变量X落在区间(x,x+x)内的概率与区间长度x的比值为 上式表示随机变量落入区间(x,x+x)的平均概率,而 式中: 为分布函数 F(x)的一阶导数,令 f(x)= 。,2.概率分布函数,3.2 随机变量的概率分布,3.概率密度函数,函数 f(x) 为概率密度函数(密度函数或分布密度函数)。密度函数f(x)的几何曲线为密度曲线。通过密度曲线可以很方便地求出随机变量x落在区间dx上的概率,它等于 f(x) dx。,3.2 随机变量的概率分布,3.概率密度函数,F(x)与f(x)的关系式 F(x)的几何意义就是表示位于x轴上边的密度曲线所包围的面积。 密度函数和分布函数从不同角度反应了随机变量的概率分布规律。,频率密度曲线一般为“铃形”。 频率分布曲线通常呈“倒S形”。,3.3 水文经验频率曲线,3.3.1 计算水文 经验累积频率的实用公式,一实测水文样本系列 可计算与各实测值xm对应的累积频率Pm=P(Xxm),则称由点据集 绘制的平面曲线为经验累积频 率曲线,Pm为经验累积频率, 简称经验频率。,3.3 水文经验频率曲线,3.3.1 计算水文经验累积频率的实用公式,由于水文资料有限,而总体无限,因此样本的最小值一般大于总体的最小值,往往会出现 的不合理结果。,各国应用最广的经验频率公式:维泊尔(Weibull)公式,又称均值公式、数学期望公式,即,P 样本系列中第m项(以递减次序排列)随机变量的 经验频率(); m计算随机变量的序号(递减次序),等于该系列中 满足(Xxm)的累计频数; n 实测水文样本系列的容量。,3.3 水文经验频率曲线,3.3.2 水文经验累积频率曲线的绘制与局限性,1.水文经验累积频率曲线的绘制步骤 (1)实测水文样本系列按大小递减次序重新排列。 (2)统计各实测值xi的频数fi及累计频数 (3)计算累积频率 当各实测值xi的频数fi均为1时, (4)点绘经验累积频率曲线 (5)若n100,可由设计频率(横坐标)查得设 计值(纵坐标),例:,3.3 水文经验频率曲线,3.3.2 水文经验累积频率曲线的绘制与局限性,2.水文经验累积频率曲线的外延 设计洪水流量都是小频率的特大洪水流量。一般情况下,实测洪水资料的年份有限,为了求设计洪水流量,必须将经验频率曲线外延。 经验频率曲线呈S形,两端陡中间平缓。求很小频率的设计流量需向左端上方外延,这样可能产生很大的误差。,3.3 水文经验频率曲线,3.3.2 水文经验累积频率曲线的绘制与局限性,2.水文经验累积频率曲线的外延 海森(A.Hazen,1913)频率格纸 主要特点:使正态分布的分布曲线(频率曲线)在坐标纸上呈一条直线。 频率为横坐标,以P50为中心对称分格,中间格密而两边渐疏; 随机变量(流量、降雨量、潮水位等)为纵坐标,均匀分格或对数分格。,利用实测流量资料推求桥涵的设计流量时,往往需要将频率曲线的头部外延很远,采用海森机率格纸,仍有较大的任意性,同样会产生很大的误差。 显然,仍不能满足水文计算的要求,必须进一步寻求绘制和外延频率曲线的方法。,3.3 水文经验频率曲线,例:某水文站有22年不连续的年最大流量资料,列于表25第3栏,试绘制该站的经验频率曲线,并目估延长,推求洪水频率为2、1和0.33的流量。 把历年的年最大流量资料,按大小递减次序排列,如表25第5栏; 采用维泊尔公式计算各项流量的经验频率P,列入表25第6栏。 然后,按表中经验频率和流量数值,在海森机率格纸上绘出经验频率点,如图25中的圆点; 再依点群的趋势描绘成一条圆滑的曲线,如图中的细实线,就是该水文站的经验频率曲线; 将经验频率曲线向上延长(图25中的细虚线),可由图中直接读出所求洪水频率的流量,3.4 统计参数,3.4 统计参数,3.4.1 均值、中值、众值,1.均值: (1)加权平均法 设有一实测系列由x1,x2,xn组成,各个随机变量出现的次数分别为f1,f2, ,fn,则系列均值为: 式中N样本系列的总项数N=f1+f2+fn。 (2)算术平均法 若实测系列内各随机变量很少重复出现,可以不考虑出现次数的影响,用算术平均法求均值。 式中 n样本系列的项数。,3.4 统计参数,3.4.1 均值、中值、众值,2.模比系数(变率)K 系列中各个变量与均值的比值。 而且,3.4 统计参数,3.4.1 均值、中值、众值,3. 中值(中位数) 系列中的随机变量为等权时,按大小递减次序排列,位置居于正中间的那个变量。 也就是几率为50的变量,恰好平分密度曲线以下的面积。,4. 众值 系列中出现次数最多的那个变量。 也就是系列中几率最大的变量。,3.4 统计参数,3.4.2 均方差、变差系数,1. 离均差(离差):,2. 均方差(标准差) 离均差平方和的平均数的平方根。 对于样本系列应采用下列修正公式,仅适用于总体,适用于样本,例:甲系列:10 50 90 乙系列:49 50 51 均值都为50。 甲40 乙1,3.4 统计参数,3.4.2 均方差、变差系数,均值相同,均方差越小,均值的代表性就越强。 均值不同,均方差就不足以说明离散程度的大小。,3.变差系数(离差系数,离势系数) 甲地区的年雨量分布,EX11200mm,标准差1360mm;乙地区的年雨量分布,EX2800mm,标准差2320mm。尽管12,但是 EX1 EX2,应从相对观点来比较这两个分布的离散程度。 采用一个无因次的数字(均方差与均值的比值)来衡量分布的相对离散程度,称为变差系数,3变差系数(离差系数,离势系数) 或 算得两个地区年雨量的变差系数,CV1360/1200=0.30,CV2=320/8000.40。说明甲地区的年雨量离散程度较乙地区的为小。,3.4 统计参数,3.4.3 偏差系数(偏态系数),反映分布对均值是否对称的特征参数,记为CS如果不对称,是大于均值的数出现的多,还是小于的多 1.当密度曲线对EX对称,CS0,为正态分布; 2.若不对称,当正离差(离均差)的立方占优时,CS0,称为正偏(左偏); 3.当负离差的立方占优势时,CS 0,称为负偏(右偏)。,适用于总体,适用于样本,3.5 水文理论频率曲线,1. 理论频率曲线 根据自然界大量实际资料的频率分布趋势,很多学者建立了一些频率曲线的线形,并选配了相应的数学函数式。这种具有一定数学函数式的频率曲线,习惯上称为理论频率曲线。,2. 皮尔逊型曲线 理论频率曲线的线形很多,适合于水文现象的也不少。根据我国多年使用经验,认为皮尔逊型曲线(Pearson-)比较符合我国多数地区水文现象的实际情况。,3.5.1 水文理论频率曲线,2. 皮尔逊型曲线 是类似于铃形的曲线,这种曲线有两个特点: (1)只有一个众数; (2)曲线的两端或一端以横轴为渐近线。,式中三个参数与总体 的关系,皮尔逊型频率密度曲线:,实际上,皮尔逊型频率曲线:,式中:xP频率为P的随机变量设计值; P离均系数, 可查离均系数表,见附录2; KP模比系数,,皮尔逊型频率曲线的方程:,皮尔逊型频率曲线的参数Cs物理条件:,a0总体最小值,xmin样本最小值,注意:当Cs2时, 皮尔逊型频率曲线 将不呈铃形而为单调 的乙字形,3.5 水文理论频率曲线,1. 矩法,3.5.2 水文理论频率曲线的参数估计,(1)样本的均值X,它与总体均值相对应,即 (2)样本标准差S 与总体标准差相对应,即 (3)样本离势系数Cv与总体离势系数相对应,即 (4)样本偏态系数CS,与总体参数偏态系数相对应,即 只要掌握了样本,借助上列公式估计出参数;就可推出概率分布曲线,这种方法叫做矩法。,原矩法公式得出的S、CV 、和CS 并不是无偏估计量,目前水文上采用的是经修正后的矩法公式:,3.5 水文理论频率曲线,2. 三点法,3.5.2 水文理论频率曲线的参数估计,S偏度系数。S-P1、P2、P3Cs,见附录3。,2. 三点法,2. 三点法(其他推导方法),由样本参数估计总体参数总会出现误差,称为抽样误差。 例如,就样本平均值而言,各个样本平均值的抽样误差当然是不同的,有的大,有的小。由于EX是未知的,对某一样本平均值的抽样误差无法求得。 样本平均数的抽样误差与其样本平均数抽样分布有关,其大小可以用表征抽样分布离散程度的均方差x来度量,称样本平均值的均方差。,3.6 抽样误差与相关分析,3.6.1 抽样误差,以上对样本平均数抽样误差的讨论,其基本原则完全适用于其他样本参数。据统计理论,可推导出各参数均方误(均方差)的公式,它与总体分布有关。,样本参数的均方误差(相对误差,%),由表中可见,CS的误差很大。当n100时,CS的误差在40%126%之间。n10时,则在126%以上,超出了CS本身的数值。水文资料一般都很短(n100)可见直接由资料按矩法公式算得的CS值,抽样误差太大。,推求桥涵水文设计变量时,一般认为需要的样本容量,说明:由于目前我国水文样本资料系列一般在3050年左右,少于100年,直接用矩法计算Cs的相对均方误太大,不能满足实际工程设计的要求。 因此在实际水文设计中,一般是广泛采用适线法估计皮尔逊型频率曲线的参数,也就是用矩法、三点法等确定初选参数 、 ,而 一般不计算,而是假定Cs为Cv的某一倍数。,3.6.2 相关分析,自然界中有许多现象并非各自独立,其相互间往往存在着一定的联系。 例如,气温与蒸发、降雨与径流、水位与流量、上下游水位(或流量)等都是有联系的。 这种现象之间的联系在解决水文分析问题中经常被用到。这是由于在水文分析中,常常遇到某一种现象的资料很少,一旦与其有关的另一种现象的资料项数却很多,我们就可以通过这两种现象之间的关系,利用长系列资料展延(或内插)短系列资料。这种关系的推求在数理统计中是用相关计算这个工具。,3.6.2 相关分析,自然界中有许多现象之间是有一定联系的。按数理统计法建立上述两个或多个随机变量之间的联系,称之为近似关系或相关关系。把对这种关系的分析和建立称为相关分析。相关分析可以用来延长和插补短系列。 根据变量之间相互关系的密切程度,变量之间的关系有三种情况:即,相关关系,1.完全相关,2.零相关,3.统计相关,相关关系,完全相关,零相关,统计相关,简单相关,复相关,直线相关,曲线相关,正相关,负相关,若两个变量之间的关系界于完全相关和零相关之间,则称为统计相关。 当只研究两个变量的相关关系时,称为简单相关;当研究3个或3个以上变量的相关关系时,则称为复相关。在相关的形式上,又可分为直线相关和非直线相关.,相关分析(或回归分析)的内容一般包括三个方面: (1)判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度; (2)确定变量间的数量关系回归方程或相关线; (3)根据自变量的值,预报或延长、插补因变量的值,并对该估计值进行误差分析。,一、简直直线相关,1.相关图解法 设xi 和yi 代表两系列的观测值,共有n 对,把对应值点绘于方格纸上,得到很多相关点。如果相关点的平均趋势近似直线,即可通过点群中间点绘出相关直线。 有了这条相关线,就可以利用长系列资料来延长另一短系列资料。,相关图解法,解析法,分析方法,2相关计算法(解析法),为避免相关图解法在定线上的任意性,常采用相关计算法来确定相关线的方程,即回归方程。简单直线相关方程的形式为: y = a + bx 式中 x 自变量; y 因变量; a、b 待定常数。 待定常数a、b 由观测点与直线拟合最佳,通过最小二乘法进行估计。,相关系数r的性质和意义,表示了变量系列之间的相关程度 r=0 零相关 r=1 完全相关 0r1 统计相关,相关分析的前提: 1)两自然现象(变量)之间存在客观联系,具有 可参照性; 2)两变量具有较为密切的相关性,r0.8; 3),3.7.1 水文资料系列的审查,适线法:由于样本和总体之间的差异性,致使Pearson理论频率曲线与经验频率点群偏离较大。通过调整统计参数Cv、Cs值,能够选配一条与经验频率点群拟合最好的理论频率曲线,然后,依据设计洪水频率,推算设计流量。,3.7 水文频率计算适线法,可靠性,一致性,资料审查,代表性,独立性,(1)资料的可靠性:即鉴定资料的可靠程度。应从资料来源、资料的测验和整编方法有无问题、刊印是否有误进行检查,可以通过上下游或干、支流水量平衡,流域年降水量等检查,数据是否合理。 (2)资料的一致性:一般认为,影响年最大流量的流域气候条件在短期内是相对稳定的;资料的一致性主要分析流域内下垫面条件是否稳定。否则,资料的一致性将遭到破坏。例如,设计断面上游修建了大型引水工程后,使设计断面资料一致性遭到破坏,必须对资料修正后方可进行计算。 (3)资料的代表性:是指资料是否包括了丰水年、平水年和枯水年,若代表性差,就不能很好地反映总体的规律,统计计算结果的实际误差就大,为了提高资料的代表性,应尽可能展延径流系列的长度。 (4)资料的独立性:系列中的变量必须相互独立。,资料的审查内容如下:,3.7.2 水文频率计算适线法的计算步骤,具体步骤如下: 1. 将实测资料由大到小排列,计算各项的经验频率,在频率格纸上点绘经验点据(纵坐标为变量的取值,横坐标为对应的经验频率)。 2. 选定水文频率分布线型(一般选用皮尔逊型)。 3. 先采用矩法或三点法估计出频率曲线参数的初估值 、Cv,而Cs凭经验初选为Cv的倍数。 4. 根据拟定的 、Cv和Cs,查附表2或附表3,计算xP值。以xP为纵坐标,P为横坐标,即可得到频率曲线。将此线画在绘有经验点据的图上,看与经验点据配合的情况。若不理想,可通过调整参数(主要调整Cv和Cs),再次进行计算,重新适线。 5. 最后根据频率曲线与经验点据的配合情况,从中选出一条与经 验点据配合较好的曲线作为采用曲线,相应于该曲线的参数便看作是总体参数的估值。 6. 求指定频率的水文变量设计值。,3.7.2 水文频率计算适线法的计算步骤,点评:适线法得到的结果仍具有抽样误差,而这种误差目前还难以精确估算。因此对于工程上最终采用的频率曲线及其相应的统计参数,不仅要从水文统计方面分析,而且还要密切结合水文现象的物理成因及地区分布规律进行综合分析。,3.7.3 水文频率计算适线法的若干问题讨论,1.统计参数对皮尔逊型频率曲线的影响,图3.14 均值对频率曲线的影响,为了避免修改参数的盲目性,需要了解参数对频率曲线的影响。 由频率曲线图可明显看出,CV值愈大,曲线愈陡。 若曲线左端偏低而右端偏高,则应增大CV值。,图3.15 变差系数Cv对频率曲线的影响,图316 偏态系数Cs对频率曲线的影响,由频率曲线图可明显看出,当CS增大时,曲线上段变陡而下段趋于平缓。 若理论频率曲线左端和右端都偏低,则应增大CS 配线法采用了概率格纸,以正态分布曲线成直线来划分概率坐标的。当CS0,频率曲线在概率纸上为一直线。其特点是横坐标的两端分格较稀而中间较密,纵坐标为均匀分格或对数分格。这样,曲线两端的坡度变缓,使用起来比较方便。,3.7.3 水文频率计算适线法的若干问题讨论,2.不连序系列的水文频率分析方法,连序系列(系列中没有特大洪水值),不连序系列(系列中有特大洪水值),根据有无特大洪水,设某河流断面的实测年最大洪峰流量资料系列为 x1,x2,xn,其中有a2个特大洪水值。 在调查考证的N年内发现另有a1个历史洪水为特大洪水。,(1)不连序系列的经验频率计算 一般洪水系列的经验频率计算,m一般洪水递减排列序号, m=a2+1,.,n,N其中最大的特大洪水值的重现期; n实测系列的年数。 Nn,3.7.3 水文频率计算适线法的若干问题讨论,2.不连序系列的水文频率分析方法,(1)不连序系列的经验频率计算 一般洪水系列的经验频率计算,m一般洪水递减排列序号,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论