桥涵水文 第三章-水文统计原理_第1页
桥涵水文 第三章-水文统计原理_第2页
桥涵水文 第三章-水文统计原理_第3页
桥涵水文 第三章-水文统计原理_第4页
桥涵水文 第三章-水文统计原理_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

桥涵水文齐洪亮第三章水文统计原理水文统计原理第二节几率和频率2第一节水文现象的特性和分析方法

31第三节频率分布33第四节经验频率曲线4第五节统计参数5第六节理论频率曲线6第七节相关分析72023/2/42水文统计原理周期性气候因素明显地以年为周期而变化,一年四季气候条件各不相同,年年如此,循环不已。因此,直接受气候因素影响的水文现象,也同样具有以年为周期而循环变化的性质。每一条河流在一年之内,都与气候条件相对应,而存在着洪水期、平水期和枯水期的周期性变化规律;在长久年代中,还存在着丰水年、平水年和枯水年的年际周期性变化规律。3.1水文现象的特性和分析方法一、水文现象的特性2023/2/43水文统计原理周期性3.1水文现象的特性和分析方法2023/2/44水文统计原理地区性气候、地理和流域海域特征,都因地区不同而各异,水文现象在这些因素的综合影响下,也具有随地区不同而变化的性质,这就是水文现象的地区性。例如我国南方河流比北方河流汛期早、水量大,山区河流的洪水暴涨暴落面,平源河流涨落平缓,都是明显的地区性表现。处于同一地区或者流域特征相类似的河流,水文现象具有相类似的特点,这也是地区性的变化规律。3.1水文现象的特性和分析方法2023/2/45水文统计原理不重复性(偶然性)影响水文现象的因素很多,而且各种因素相互之间的关系错综复杂。因此,水文现象在总体上虽然存在着周期性的变化规律,但是具体出现时间和数量大小每年都不完全相同,有一定的偶然性,称为水文现象的不重复性(偶然性)。3.1水文现象的特性和分析方法2023/2/46水文统计原理成因分析法地区归纳法数理统计法3.1水文现象的特性和分析方法二、水文现象的分析方法2023/2/47水文统计原理3.1水文现象的特性和分析方法研究水文现象的物理成因以及同其它自然现象之间的相互关系,通过成因分析寻求水文现象的客观规律,建立水文现象各要素之间的定性、定量关系。如新安江模型、陕北模型等径流形成模型。成因分析法这种分析方法推理清楚、物理概念明确,但由于影响因素错综复杂,使定性和定量分析都存在很多困难,目前公路和铁路工程多应用一些半经验半理论公式。复杂的洪水形成数学模型路桥工程中尚未应用。2023/2/48水文统计原理3.1水文现象的特性和分析方法根据水文现象的地区性特点,利用实测水文资料进行综合归纳,寻求水文区域现象的分布规律。地区归纳法这种分析方法以实际资料为依据,虽然缺乏物理成因的分析,当应用较为简易,对于缺乏实测资料地区有一定的实用意义,应用较多。2023/2/49水文统计原理3.1水文现象的特性和分析方法利用水文现象的随机性特点,对实测水文资料进行统计分析,寻求水文现象的统计规律,预估其今后的变化;数理统计法水文统计法是目前大中桥水文分析计算的基本方法;采用数理统计法推算桥梁的设计流量时,应满足这样一个基本条件:建桥前后河流的自然条件必须基本相同,以保证桥梁使用期限内,河流的流量变化与建桥前基本具有相同的规律性;2023/2/410水文统计原理3.2几率和频率1、随机试验把对某种随机现象的一次观察、观测或测量等称为一个试验。如果这个试验在相同的条件下可以重复进行,且每次试验的结果事前不可预知,则称此试验为随机试验,简称为试验。2、随机事件在随机试验中,随机试验的结果称为事件。按照事件结果出现的可能性大小,将事件分为必然事件、不可能事件和随机事件。3、随机变量随机事件的某一结果。连续型随机变量和离散型随机变量。许多随机变量组成的一列数值,称为随机变量系列,简称为系列。

2023/2/411水文统计原理3.2几率和频率4、几率(概率)

对于随机事件,它在一定条件下可能现也可能不出现,若用一个具体数值来表示客观上出现的可能程度(可能性大小),这个数值就称为该事件的几率(或概率)。几率的古典定义:古典概型(古典随机试验)

如果随机试验满足:①试验的可能结果总数是有限的;②试验的可能结果都是等可能的。这种随机试验称为古典概型,这种事件称为简单随机事件。2023/2/412水文统计原理3.2几率和频率4、几率(概率)随机事件的概率计算公式:2023/2/413因为:

当P(A)=1,A为必然事件;当P(A)=0,A为不可能事件。0<P(A)<1,A为随机事件。式中:P(A):在一定的条件下,随机事件A出现的概率;m:随机事件A出现的可能结果数;n:试验的所有可能结果总数。水文统计原理3.2几率和频率4、几率(概率)2023/2/414解:掷硬币可以看作是一种随机试验,出现的可能结果总数只有正、反两种,即n=2,有限的。出现正、反面是等可能的,故为古典概型。设A“掷硬币出现正面”这一事件,出现正面的可能结果数只有一种,即m=1,故:【例3-3】掷硬币,求出现正面的概率。水文统计原理3.2几率和频率5、频率在一系列重复的独立试验中,某一事件出现的次数与试验总次数的比值,则称为该事件的频率。由实践和理论证明,当试验次数较少时,事件的频率具有明显的偶然性,摆动的幅度较大,但随着试验次数的增多,事件的频率则逐渐趋于稳定,最终将十分接近于它的几率。因此,当事件不属于古典概型,可以用频率估计其概率。2023/2/415水文统计原理3.2几率和频率2023/2/416用频率估计概率实例:

十八世纪,法国科学家Buffon和英国生物学家和统计学家K.Pearson用掷硬币试验,证明了随着试验次数逐渐增大时,频率会逐渐趋近于概率,证明了可以用频率估计概率。

试验者试验总次数n

出现正面次数m

正面频率WBuffon404020480.5069Pearson1200060190.5016Pearson24000120120.5005频率不是常数,随试验次数而变。水文统计原理3.2几率和频率

6、频率与几率的不同:

几率是随机事件在客观上出现的可能程度,是事件固有的客观性质,不随人们试验的情况和次数而变动,是一个常数,是理论值;频率是利用有限的试验结果推算而得的,是一个经验值,将随试验次数的多少而变动,只有试验次数达到无限多时,才稳定在一个常数并等于理论值——几率。事先几率和经验几率。2023/2/417水文统计原理3.2几率和频率7、总体和样本数理统计中,把随即变量系列的全体,亦即包含整体情况的全部系列,称为总体。从总体中抽出的一部分随机变量,称为总体的一个样本。总体或样本中随机变量的项数,分别称为总体或样本的容量。样本是总体的一部分,在一定程度上可反映总体的特征。样本总体2023/2/418水文统计原理3.2几率和频率就是利用已有的实测水文资料组成有限的随机变量系列,作为无限总体中的一部分,以样本的规律推断总体的规律,来解决工程中的水文计算问题。就是将流量、降雨量等实测资料(实测数值)作为随机变量,通过统计分析和计算,推算水文现象(随机事件)客观规律的方法。8、水文统计法:2023/2/419水文统计原理3.3频率分布一、频率密度和累积频率二、累积频率和重现期三、设计洪水频率2023/2/420水文统计原理3.3频率分布——频率密度和累积频率1、频率分布

随机变量的取值总是伴随着相应的频率,而频率的大小随着随机变量取值而变化,这种随机变量与其频率之间的一一对应关系,称为随机变量的频率分布

N→∞,概率分布2、频率密度单位组距的频率。3、累积频率等量或超量值累计出现的次数与总观测次数的比值。P(X≥Xi)2023/2/421水文统计原理3.3频率分布——频率密度和累计频率4、曲线绘制(1)数据分组(2)统计各组出现的次数(频数)(3)计算各组的频率、频率密度和累积频率(4)以随机变量的值为横坐标,以该组的频率为纵坐标绘出直方形,即为频率直方图。(5)连接频率密度直方图顶部即为频率密度分布曲线。(6)以随机变量为纵坐标,累积频率为横坐标,即可绘出频率分布曲线。2023/2/422水文统计原理3.3频率分布——频率密度和累计频率2023/2/423某水文站75年最大流量实测资料表流量(m3/s)出现次数(年)频率(%)累积出现次数(年)累积频率(%)1400-130011.311.31300-120011.322.71200-110022.745.31100-100034.079.31000-90056.71216.0900-800810.72026.7800-7001418.73445.3700-6002026.7547276586.7500-40068.07194.7400-30034.07498.7300-20011.375100.0合计75100

水文统计原理3.3频率分布——频率密度和累计频率5、曲线的意义2023/2/424水文统计原理3.3频率分布——累积频率和重现期1、累积频率水文统计中,等于或大于某一流量值出现的次数(即累积出现次数)与总次数的比值,称为该流量的累积频率P,工程应用简称为该流量的频率P,以百分数(%)或以多少分之一表示,如P为1%。2、年最大值法(年频率)洪峰流量的选择中,每年只选取最大的一个瞬时洪峰流量作为频率计算的样本。3、重现期工程上习惯用水文现象的重现期来表示其频率。所谓重现期是指某随机事件重复出现的平均间隔时间,即平均隔多少年出现一次,又称多少年一遇。2023/2/425水文统计原理3.3频率分布——累积频率和重现期对P=1%的洪水

,对应的T=1/P=100年,其意思是:A.所谓百年一遇洪水是指大于或等于这样的洪水在长时期内平均每100年发生一次。B.所谓百年一遇洪水是指等于这样的洪水在长时期内平均每100年发生一次。C.所谓百年一遇洪水是指大于或等于这样的洪水每隔100年发生一次。D.所谓百年一遇洪水是指大于或等于这样的洪水发生的可能性为1%,所以每100年就会发生一次。2023/2/426水文统计原理3.3频率分布——设计洪水频率桥涵工程均采用一定的洪水频率作为设计标准,称为设计洪水频率设计流量:与设计洪水频率相应的洪峰流量;水文统计法就是根据频率曲线推算对应于设计洪水频率的流量,作为桥涵的设计流量;公路等级高速公路一级公路二级公路三级公路四级公路设计洪水频率1/1001/1001/501/25按具体情况确定路基设计洪水频率2023/2/427水文统计原理3.3频率分布——设计洪水频率2023/2/428水文统计原理3.4经验频率曲线

根据实测(样本)资料所绘制出的频率曲线即为经验频率曲线。一、经验频率的计算

数学期望公式二、经验频率曲线的绘制

随机变量按递减排列,计算累积频率,以频率为横坐标,随机变量为纵坐标,点绘各观测值的频率分布图。随机变量序号(递减)样本容量2023/2/429P

xP水文统计原理3.4经验频率曲线三、经验频率曲线的外延

如前可知,设计洪水流量都是小频率的特大洪水流量。一般情况下,实测洪水资料的年份有限,为了求设计洪水流量,必须将经验频率曲线向上外延。普通坐标纸:S型曲线专门的概率坐标纸:近直线2023/2/430水文统计原理3.4经验频率曲线海森概率坐标纸

纵坐标为普通的等分坐标,也可为对数坐标;累积频率P的横坐标为不等分分格,中间密、两端疏,横坐标分格距离见附录。2023/2/431水文统计原理3.4经验频率曲线——外延存在的问题然而目估延长法受主观因素影响较大,也无法检验外延部分的正确性。为解决累积频率曲线的外延问题,可利用数学方法,寻求一种适合的数学模型,即具有一定数学方程式的频率分布曲线,一般称之为理论累积频率曲线。由于水文资料观测的年代有限,目前还不能完全由水文现象的实测资料建立一个完善的理论累积频率曲线公式,而只能选择与水文现象变化规律类似的线型,作为水文现象总体的频率曲线,进行频率分析计算。依据实测系列,找出一条理论的累积频率曲线(即数学模型),以此曲线来解决经验累积频率曲线外延的任意性和求解一定设计频率标准下的设计值。2023/2/432水文统计原理3.5统计参数随机变量系列的频率分布特征和频率分布曲线形状,能够用该系列的几个数值特征值来确定,系列的数值特征值称为该系列的统计参数。一般水文系列常用反映三方面分布特征的统计参数有:反映系列中随机变量数值大小的特征——均值X、中值或众值;反映各随机变量离均程度——均方差,或变差系数CV。反映各随机变量对均值的对称性——偏差系数CS2023/2/433水文统计原理3.5统计参数——均值、中值、众值均值、中值、众值都是代表系列数值大小平均情况的参数值,能反映其频率分布高低位置特征。

1.均值

均值是系列中随机变量的算术平均数,以X表示,但随机变量的取值不是在试验前就能得知的,所以均值又不同于普通的平均数的概念,概率论中也称为数学期望值。权重相同不同权重连续型随机变量2023/2/434水文统计原理3.5统计参数——均值、中值、众值一个新的概念:模比系数K水文统计中两个性质:2023/2/435对流量:水文统计原理3.5统计参数——均值、中值、众值均值的代表意义:均值是系列中所有随机变量的平均数,与每个变量都有直接关系,是各个变量的共同代表,它反映了系列在数值上的大小(系列水平的高低),可作为不同系列间随机变量数值大小(水平高低)的比较标准;均值是系列的分布中心,也就是位于几率分布中心处的变量。在密度曲线图(图2-5-1)中,通过均值垂直于横坐标的直线,恰好是曲线以下面积的重心轴。均值的大小,能反映系列分布中心和密度曲线的位置。2023/2/436水文统计原理3.5统计参数——均值、中值、众值2、中值系列中的随机变量为等权时,按大小递减次序排列,位置居于正中间的那个变量,称为中值。对于连续型随机变量系列,中值的定义则为:系列中大于中值的和小于中值的随机变量几率相同,各为50%,即中值是系列的中间项,也就是几率为50%的变量,通过中值垂直于横坐标的直线,恰好平分曲线以下的面积。中值的大小,能反映系列中间项和密度曲线的位置。2023/2/437水文统计原理3.5统计参数——均值、中值、众值3、众值系列中出现次数最多的那个变量,就称为众值。众值与变量的项数以及其他各变量的数值都没有关系。对于连续型随机变量系列,密度函数f(x)为极大时的变量值,就是众值。

众值就是系列中几率最大的变量。在密度曲线图(图1-5-1)中,恰好是曲线峰顶处的横坐标值。众值的大小,能反映系列中最大几率项和密度曲线的位置。2023/2/438水文统计原理3.5统计参数——均值、中值、众值4、三者的位置关系在密度曲线图中,均值、中值和众值的相对位置,如图2-5-1所示。曲线为对称形时(峰居中),表示系列的频率分布对称于均值(分布中心,称为正态分布,三者的位置重合;曲线不对称时(峰偏离中心),表示其频率分布偏离均值(分布中心),称为偏态分布,三者的位置分离,中值在其他二者的中间,峰偏左时称为正偏态,峰偏右时称为负偏态。均值、中值和众值的大小可以表明密度曲线的位置,而且三者的差值越大表明曲线越偏,它们反映了频率分布的位置特征。2023/2/439水文统计原理3.5统计参数——均方差和变差系数1、离均差/离差

系列中个变量对均值的差值,表示变量间变化幅度的大小。2、均方差/方差离均差平方的平均数的平方根。均方差和变差系数都是代表系列离均分布情况的参数.表明系列分布对均值是比较分散还是比较集中,反映频率分布对均值的离散程度,可以进一步说明频率分布的特征。2023/2/440水文统计原理3.5统计参数——均方差和变差系数2、均方差/方差

均方差的量纲与变量相同。σ值较小时,表示系列的离均差较小,说明变量间的变化幅度较小,分布比较集中,即系列的离散程度较小(对均值而言);σ值较大时,则说明变量的变化幅度较大,分布比较分散,即离散程度较大。同时,均方差还可以说明均值对系列的代表性,σ值越小,均值的代表性越强。例如:2023/2/441例题1:两系列:甲---5,10,15;乙---1,10,19。比较其离散程度表明:乙系列的离散程度大于甲系列水文统计原理3.5统计参数——均方差和变差系数3、变差系数

但是,对于水平不同的两个系列(均值大小不等),由于均值的影响,均方差就不足以说明它们的离散程度大小。在数理统计中,通常采用相对值(即均方差与均值的比值)来反映系列的相对离散程度,作为系列间的衡量标准,称为变差系数或离差系数,以CV表示(无量纲)。利用样本推算总体的变差系数,可采用下式:

CV值较小时,表示系列的离散程度较小,即变量间的变化幅度较小,频率分布比较集中;CV较大,表示系列离散程度大,频率分布比较分散。2023/2/442我国降水量与径流量的变差系数,一般是南方小,北方大;沿海小,内陆大;平原小,山区大。在0.2~1.5之间。水文统计原理3.5统计参数——偏差系数偏差系数表明系列分布对均值是对称的还是不对称的,反映频率分布对均值的偏斜程度,以CS表示,并可按下式计算CS=0,频率分布对称于均值;CS〉0,正偏态,大于均值的变量比小于均值的变量出现机会少,均值对应的频率小于50%CS<0,负偏态,大于均值的变量比小于均值的变量出现机会多,均值对应的频率大于50%年最大流量系列,一般不出现负值,多呈正偏态分布。2023/2/443水文统计原理3.5统计参数——统计参数与曲线关系四、统计参数同密度曲线及频率曲线的关系均值反映密度曲线位置的变化;变差系数反映密度曲线的高矮情况;偏差系数反映密度曲线的偏斜程度2023/2/444水文统计原理3.5统计参数——统计参数与曲线关系根据上述分析,对一个已知系列,可以用它的统计参数来描述频率分布和频率曲线的特征。同理,对一个未知系列,若能求得它的统计参数,就可以利用这些统计参数来确定它的频率分布和频率曲线。水文统计中,就是利用实测水文资料系列(样本)推求近似总体的统计参数,并用以确定总体的频率分布和频率曲线.2023/2/445水文统计原理3.6理论频率曲线

由于目估定线或外延会产生较大的误差,往往需要借助于某些数学形式的频率曲线作为定线和外延的依据。这种用数学形式确定的、符合经验点分布规律的曲线称为理论频率曲线。根据我国多年使用经验,认为皮尔逊Ⅲ型曲线比较符合我国多数地区水文现象的实际情况。因此,我国水利、公路、铁路等工程有关规范,在水文统计中,大多采用皮尔逊Ⅲ型曲线,作为近似于水文现象总体的频率曲线线形,在洪(枯)水流量、降雨径流以及波浪高度的频率分析中广泛应用。另外,耿贝尔曲线(第Ⅰ型极值分布曲线)也适用我国洪水频率分析,特别在最高、最低潮水位的频率分析时普遍应用。2023/2/446水文统计原理3.6理论频率曲线一、皮尔逊Ⅲ型曲线的频率密度函数其中,参数α、β、α0都可以用实测系列的三个统计参数来表示。所以2023/2/447水文统计原理3.6理论频率曲线二、皮尔逊Ⅲ型曲线的应用水文统计需推求给定频率下的变量或某一变量的频率;

频率分布曲线可以由密度函数积分而得。2023/2/448水文统计原理3.6理论频率曲线二、皮尔逊Ⅲ型曲线的应用2023/2/449

若已知的桥位断面洪水统计参数、CV、CS值和设计频率P,用P、CS查Ф值表得出ФP值,然后利用已知的、CV,即可求出相应于P的xP

值;或由P、

CV

、CS/CV

,查KP

值表得出KP

值,求出相应于P

的xP

值。水文统计原理3.6理论频率曲线三、统计参数对频率曲线的影响2023/2/450水文统计原理3.6理论频率曲线三、统计参数对频率曲线的影响2023/2/451在均值、Cv一定的情况下,随着Cs的增大,理论频率曲线的上段变陡,中段曲率变大,下段变平缓。水文统计原理3.6理论频率曲线四、抽样误差由抽样方法所造成的误差,即为抽样误差。可通过延长观测年限、增大样本容量、增强样本的代表性等措施,来逐步减小。抽样误差也是随机变量,也具有一定的概率分布,一般为正态分布。置信区间和置信水平分析表明:抽样误差出现在±σ范围内的频率为68.3%;抽样误差出现在±3σ范围内的频率为99.7%;抽样误差出现在±E范围内的频率为50%;抽样误差出现在±4E范围内的频率为99.3%;2023/2/452水文统计原理3.6理论频率曲线皮尔逊Ⅲ型曲线的抽样误差2023/2/453水文统计原理3.6理论频率曲线四、耿贝尔频率分布曲线该曲线对于海洋潮汐最高、最低设计潮水位的频率分析更为合理。指数型分布频率分布函数为:给定频率的随机变量xP为:2023/2/454水文统计原理3.7相关分析

数理统计中把不同种类的随机变量之间的近似相互关系或平均的相互关系称为相关,把对这种关系的分析和建立相关关系称为相关分析。在水文分析计算中,相关分析的目的主要是为了插补展延资料系列.提高资料系列的代表性,也可用于建立水文预报方案等。

根据变量间的相关程度,可以将其分为三类:完全相关、零相关和统计相关。2023/2/455水文统计原理3.7相关分析2023/2/456水文统计原理3.7相关分析——直线相关的回归方程

当两变量间的相关关系可以近似与直线来表示时,称其为直线相关。

直线方程的一般表达式:

最佳的拟合直线:各实测点与直线在垂直方向的离差和最小。如果回归直线与实测点群配合最好,其离差平方和必然达到最小。这种以离差平方和达到最小的条件来选择参数a、b的方法称为最小二乘法。2023/2/457水文统计原理3.7相关分析——直线相关的回归方程根据二元函数求极值的方法,欲使上式取最小值,可分别对a、b求一阶偏导数,并令其等于零。联立求解,可得则y倚x的回归方程为:2023/2/458水文统计原理3.7相关分析——相关系数一、问题的提出任意二变量都可以通过最小二乘法得到一个相应的直线方程。建立了回归方程,必须对变量间的相关密切程度进行检验,以评价该方程的实用效果。相关系数就是衡量变量间相关密切程度的定量指标。二、相关系数的推求离差平方和Q的推导过程:2023/2/459水文统计原理3.7相关分析——相关系数二、相关系数的推求1、Q=02、Q>03、Q≮0≯14、≮0所以:越接近1,相关程度越好2023/2/460水文统计原理3.7相关分析——相关系数二、相关系数的推求令:相关系数R:2023/2/461水文统计原理3.7相关分析—回归方程和回归系数的其他形式xi和yi两系列随机变量的均方差分别为σx和σy

:2023/2/462水文统计原理3.7相关分析—相关分析的误差直线相关,实有点据并不是完全位于一条直线上.而是分散干直线的两侧。直线与实有点据之间,即依据直线所得y值与实际变量yi值之间存在着一定的误差,这就是回归线(或回归方程)的误差,按正态分布考虑,其误差可用均方误差Sy(或Sx)表示为:2023/2/463水文统计原理3.7相关分析—容许相关系数的最小值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论