第三章-水文统计原理_第1页
第三章-水文统计原理_第2页
第三章-水文统计原理_第3页
第三章-水文统计原理_第4页
第三章-水文统计原理_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章水文统计原理第二节几率和频率

2第一节水文现象的特性和分析方法

31第三节频率分布

33第四节经验频率曲线4第五节统计参数5第六节理论频率曲线6第七节相关分析7NanjingUniversityofTechnology周期性气候因素明显地以年为周期而变化,一年四季气候条件各不相同,年年如此,循环不已。因此,直接受气候因素影响的水文现象,也同样具有以年为周期而循环变化的性质。每一条河流在一年之内,都与气候条件相对应,而存在着洪水期、平水期和枯水期的周期性变化规律;在长久年代中,还存在着丰水年、平水年和枯水年的年际周期性变化规律。3.1水文现象的特性和分析方法一、水文现象的特性NanjingUniversityofTechnology周期性3.1水文现象的特性和分析方法周期性就是许多水文现象具有周期循环变化的性质。水文现象有着以年或者年际(若干年)变化的规律。长江汉口水文站1954年和1955年流量过程线NanjingUniversityofTechnology地区性

地区性是表示水文现象随地区而异,即每个地区都有各自的特殊性。南方同北方水文现象差异就很大。这主要是由于地区而异,影响水文现象的气候和下垫面条件不同。相互临近的流域,气候和下垫面条件往往有一定的相似性,水文现象,在一定程度上就具有相似性。例如我国南方河流比北方河流汛期早、水量大,山区河流的洪水暴涨暴落面,平源河流涨落平缓,都是明显的地区性表现。潮湿地区河流的径流年内分配较为均匀,而干旱地区的就很不均匀。处于同一地区或者流域特征相类似的河流,水文现象具有相类似的特点,这也是地区性的变化规律。3.1水文现象的特性和分析方法NanjingUniversityofTechnology不重复性(偶然性)影响水文现象的因素很多,而且各种因素相互之间的关系错综复杂。因此,水文现象在总体上虽然存在着周期性的变化规律,但是无论什么时候都不可能完全重复出现具体出现时间和数量大小每年都不完全相同,井带有一定的偶然性,称为水文现象的不重复性(偶然性)。3.1水文现象的特性和分析方法NanjingUniversityofTechnology成因分析法地区归纳法数理统计法3.1水文现象的特性和分析方法二、水文现象的分析方法NanjingUniversityofTechnology3.1水文现象的特性和分析方法研究河川水文现象的物理成因以及同其它自然现象之间的相互关系,通过成因分析寻求水文现象的客观规律,建立水文现象各要素之间的定性、定量关系。成因分析法这种分析方法推理清楚、物理概念明确,但由于影响因素错综复杂,使定性和定量分析都存在很多困难,目前公路和铁路工程多应用一些半经验半理论公式。复杂的洪水形成数学模型路桥工程中尚未应用。NanjingUniversityofTechnology3.1水文现象的特性和分析方法根据河川水文现象的地区性特点,利用实测水文资料进行综合归纳,寻求水文区域现象的分布规律。地区归纳法这种分析方法以实际资料为依据,虽然缺乏物理成因的分析,但应用较为简易,对于缺乏实测资料地区有一定的实用意义,应用较多。NanjingUniversityofTechnology3.1水文现象的特性和分析方法利用河川水文现象的随机性特点,对实测水文资料进行统计分析,寻求水文现象的统计规律,预估其今后的变化;数理统计法水文统计法是目前大中桥水文分析计算的基本方法;采用数理统计法推算桥梁的设计流量时,应满足这样一个基本条件:建桥前后河流的自然条件必须基本相同,以保证桥梁使用期限内,河流的流量变化与建桥前基本具有相同的规律性;NanjingUniversityofTechnology3.2几率和频率一、随机事件事件分为三类:必然事件、随机事件和不可能事件。水文现象,既有必然性的一面,又有偶然性的一面。例如水文现象中年最大流量的出现是必然事件,但是出现的时间和大小,则为随机事件。由于水文现象具有不重复性特点,所以各种水文要素的具体数量的出现,都是偶然性的,属于随机事件。随机事件的统计规律——平均情况。

NanjingUniversityofTechnology二、随机变量

在多次试验中,随机事件出现的种种结果,都是以实数值来表示,这些数值就成为随机变量。

随机变量能代表随机事件的出现结果,水文统计法就是利用流量、降雨量、潮水位、波浪高度等实测水文资料作为随机变量,通过统计分析,推求出水文现象的客观规律性。随机变量分为两类:连续型随机变量和离散型随机变量。

3.2几率和频率NanjingUniversityofTechnology许多随机变量组成的一列数值,称为随机变量系列,一般简称为系列。系列的范围可以是有限的,也可以使无限的。水文资料一般都是无限系列。例如:某河流的年最大流量值所组成的随机变量系列——年最大流量系列,应该包括河流过去、现在和未来无限长年代中所有的每年最大洪峰流量值,因此,为一个无限的系列。3.2几率和频率NanjingUniversityofTechnology3.2几率和频率三、几率和频率对于随机事件,它在一定条件下可能现也可能不出现,若用一个具体数值来表示客观上出现的可能程度(可能性大小),这个数值就称为该事件的几率(或概率)。P(A)——一定条件下,随机事件A的几率;n——试验结果的总数;m——随机事件A出现的总数。NanjingUniversityofTechnology3.2几率和频率例:袋中有白球10个,黑球20个,其差别只在颜色方面,其形状、大小及触摸的感觉完全相同。问摸出白球的几率为多少?摸出黑球的几率为多少?NanjingUniversityofTechnology在一系列重复的独立试验中,某一事件出现的次数与试验总次数的比值,则称为该事件的频率。由实践和理论证明,当试验次数较少时,事件的频率具有明显的偶然性,摆动的幅度较大,但随着试验次数的增多,事件的频率则逐渐趋于稳定,最终将十分接近于它的几率。

P(A)=1,则表明试验结果全部出现事件A,则事件A为必然事件;

P(A)=0,则表明每次试验结果都不出现事件A,则事件A成为不可能事件;

0<P(A)<1,则表明A为随机事件。3.2几率和频率NanjingUniversityofTechnology3.2几率和频率

频率与几率的不同:

几率是随机事件在客观上出现的可能程度,是事件固有的客观性质,不随人们试验的情况和次数而变动,是一个常数,是理论值;

频率是利用有限的试验结果推算而得的,是一个经验值,将随试验次数的多少而变动,只有试验次数达到无限多时,才稳定在一个常数并等于理论值——几率。NanjingUniversityofTechnology几率分为事先几率和经验几率对于一些简单随机事件(如掷硬币试验),不必通过试验就能够事先得到的几率值,称为事先几率。对于那些不能事先得知几率的复杂随机事件,利用其频率估计得到的几率值,称为经验几率。如水文现象中的流量、水位、降雨量等都是非常复杂的随机事件,无法得知事先几率,只能利用实测水文资料计算其频率,以寻求它们的变化规律,推测未来可能出现的情况,满足工程的需要。3.2几率和频率NanjingUniversityofTechnology3.2几率和频率四、总体和样本数理统计中,把随即变量系列的全体,亦即包含整体情况的全部系列,称为总体。从总体中抽出的一部分随机变量,称为总体的一个样本。从总体中抽出样本称为抽样。总体或样本中随机变量的项数,分别称为总体或样本的容量。样本是总体的一部分,在一定程度上可反映总体的特征。从水文站历年流量观测资料中,每年选取一个洪水成因相同的最大洪峰流量,n年的观测资料中,可以选出n个流量值,组成一个n项容量的随机样本,称为年最大值法,也称为“年最大流量法”。样本总体NanjingUniversityofTechnology3.2几率和频率就是利用已有的实测水文资料组成有限的随机变量系列,作为无限总体中的一部分,以样本的规律推断总体的规律,来解决工程中的水文计算问题。就是将流量、降雨量等实测资料(实测数值)作为随机变量,通过统计分析和计算,推算水文现象(随机事件)客观规律的方法。水文统计法:NanjingUniversityofTechnology3.3频率分布一、频率分布及其特性二、累积频率和重现期三、设计洪水频率NanjingUniversityofTechnology3.3频率分布——频率分布及其特性1、频率分布

随机变量的取值总是伴随着相应的频率,而频率的大小随着随机变量取值而变化,这种随机变量与其频率之间的一一对应关系,称为随机变量的频率分布。它反映了随机变量系列的统计规律。

在工程中,当随机变量系列容量n足够大时,常把随机变量的频率分布近似地作为几率(概率)分布来看待。

即N→∞,概率分布

以各组出现次数与总次数之比表示各组所在区间流量值出现的可能程度,即频率。NanjingUniversityofTechnology3.3频率分布——频率分布及其特性NanjingUniversityofTechnology2、频率密度

单位组距的频率称为频率密度。为了反映系列中随即变量大小的连续性,按其数值由大到小的递减次序,等间距分为若干组,组距取100m3/s。3、累积频率

是各组累计出现次数与总次数的比值,表示等于和大于该组所在区间的流量值出现的可能程度,以百分数计。等量或超量值累计出现的次数与总观测次数的比值。P(X≥Xi)3.3频率分布——频率分布及其特性NanjingUniversityofTechnology流量与频率关系的直方图3.3频率分布——频率分布及其特性NanjingUniversityofTechnology

如果资料无限多,组距无限小,图中的密度直方图将趋于光滑的铃形曲线,称为频率密度曲线(简称为密度曲线)。

它表示某一变量X可能出现的频率P。

流量与频率关系的直方图——密度曲线

特别大的和特别小的流量出现次数较少,接近平均值的流量出现次数较多。绝大多数水文资料系列,都具有这样的规律。3.3频率分布——频率分布及其特性NanjingUniversityofTechnology

若以流量x为纵坐标,累积频率为横坐标,则可绘出流量和累积频率关系的阶梯形折线图来表示年最大流量的累积频率分布。流量的实测次数趋于无穷大,组距趋于无穷小时,累积频率多边图将成为光滑的S形累积频率曲线。

在水文计算中,一般采用累积频率曲线来说明水文特征值的统计规律,通称为频率曲线和分布曲线。3.3频率分布——频率分布及其特性NanjingUniversityofTechnology流量与累积频率关系的折线图3.3频率分布——频率分布及其特性NanjingUniversityofTechnology频率密度曲线和频率分布曲线3.3频率分布——频率分布及其特性NanjingUniversityofTechnology流量与累积频率关系折线图——分布曲线

累积频率分布函数可以由密度函数积分而得。即某变量X对应的密度曲线左侧下围面积P(图中阴影部分的面积)就是x所对应的累积频率,。3.3频率分布——频率分布及其特性NanjingUniversityofTechnology4、曲线绘制(1)数据分组(2)统计各组出线的次数(频数)(3)计算各组的频率、频率密度和累计频率(4)以随机变量的值为横坐标,以该组的频率为高绘出直方形,即为频率直方图。(5)连接频率密度直方图顶部即为频率密度分布曲线。(6)以随机变量为纵坐标,累计频率为横坐标,即可绘出频率分布曲线。3.3频率分布——频率分布及其特性NanjingUniversityofTechnology3.3频率分布——累积频率和重现期1、累计频率水文统计中,等于或大于某一流量值出现的次数(即累积出现次数)与总次数的比值,称为该流量的累积频率P,工程应用简称为该流量的频率P,以百分数(%)或以多少分之一表示,如P为1%。2、年最大值法(年频率)洪峰流量的选择中,每年只选取最大的一个瞬时洪峰流量最为频率计算的样本。NanjingUniversityofTechnology3、重现期某随机变量的取值在长时期内平均多少年出现一次(多少年一遇)重现期与频率之间的关系

3.3频率分布——累积频率和重现期频率和重现期都是指很长时期内的平均情况,以无限长的时期而论才是正确的。NanjingUniversityofTechnology3.3频率分布——设计洪水频率桥涵工程均采用一定的洪水频率作为设计标准,称为设计洪水频率设计流量:与设计洪水频率相应的洪峰流量;水文统计法就是根据频率曲线推算对应于设计洪水频率的流量,作为桥涵的设计流量;公路等级高速公路一级公路二级公路三级公路四级公路设计洪水频率1/1001/1001/501/25按具体情况确定路基设计洪水频率NanjingUniversityofTechnology3.3频率分布——设计洪水频率NanjingUniversityofTechnology3.3频率分布例:某桥位断面有40年最高水位实测资料,见下表,设容许破坏率[P]=5%,试确定相应的设计水位Zp。5254022.57.51005307092.5100NanjingUniversityofTechnology3.3频率分布解:有上述计算,当[P]=5%,Zp=30m,这表明,根据已有实测水位的逐个分析与计算结果,所求设计水位Zp=30m,其未来可能出现的破坏频率[P]=5%。显然安全率为95%。NanjingUniversityofTechnology3.4经验频率曲线

根据水文统计样本的实测水文资料系列,计算各项随机变量的经验频率,点绘经验频率与其对应的随机变量大小的曲线,称为该样本的经验频率曲线。(根据实测(样本)资料所绘制出的频率曲线即为经验频率曲线。)一、经验频率的计算

维泊尔公式(数学期望公式)随机变量序号(递减)样本容量NanjingUniversityofTechnology二、经验频率曲线的绘制1.把研究系列(随机变量)按照从大到小的顺序排列,分别统计各变量的频数;2.分别计算各个变量的频率及累积频率;3.以水文变量为纵坐标,以频率为横坐标展点;4.过各点作一条光滑的曲线。3.4经验频率曲线NanjingUniversityofTechnology3.4经验频率曲线三、经验频率曲线的外延设计洪水流量都是小频率的特大洪水流量。一般情况下,实测洪水资料的年份有限,为了求设计洪水流量,必须将经验频率曲线向上外延。普通坐标纸:S型曲线专门的概率坐标纸(海森概率坐标纸):近直线NanjingUniversityofTechnology3.4经验频率曲线海森概率坐标纸纵坐标为普通的等分坐标,也可为对数坐标;累积频率P的横坐标为不等分分格,中间密、两端疏,横坐标分格数值见《公路桥涵设计手册》。正态分布累积频率曲线在海森概率格纸中呈直线,NanjingUniversityofTechnology3.4经验频率曲线——外延存在的问题然而目估延长法受主观因素影响较大,也无法检验外延部分的正确性。为解决累积频率曲线的外延问题,可利用数学方法,寻求一种适合的数学模型,即具有一定数学方程式的频率分布曲线,一般称之为理论累积频率曲线。由于水文资料观测的年代有限,目前还不能完全由水文现象的实测资料建立一个完善的理论累积频率曲线公式,而只能选择与水文现象变化规律类似的线型,作为水文现象总体的频率曲线,进行频率分析计算。依据实测系列,找出一条理论的累积频率曲线(即数学模型),以此曲线来解决经验累积频率曲线外延的任意性和求解一定设计频率标准下的设计值。NanjingUniversityofTechnology3.5统计参数随机变量系列的频率分布特征和频率分布曲线形状,能够用该系列的几个数值特征值来确定,系列的数值特征值称为该系列的统计参数。一般水文系列常用的统计参数有:反映系列中随机变量数值大小的特征——均值X、中值或众值;反映各随机变量离均程度——均方差,或变差系数CV。反映各随机变量对均值的对称性——偏差系数CSNanjingUniversityofTechnology3.5统计参数——均值、中值、众值均值、中值、众值都是代表系列数值大小平均情况的参数值,能反映其频率分布高低位置特征。

1.均值

均值是系列中随机变量的算术平均数,以X表示,但随机变量的取值不是在试验前就能得知的,所以均值又不同于普通的平均数的概念,概率论中也称为数学期望值。(1)某一随机变量系列X1、X2、…Xn,共有n项,若其中各变量的出现次数都相同,即各变量占有同等比重时(等权),均值为:NanjingUniversityofTechnology(2)若其中各变量的出现次数都不相同(即不等权),X1出现f1次,X2出现f2次,…Xn出现fn次,且f1+f2+…+fn=n,由于各变量对平均数的影响不同,则均值应为系列中随机变量的加权平均值:3.5统计参数——均值、中值、众值NanjingUniversityofTechnology(3)对于连续型随机变量系列,均值则为:3.5统计参数——均值、中值、众值系列中各个变量与均值的比值,成为模比系数,以K表示:且NanjingUniversityofTechnology3.5统计参数——均值、中值、众值对于年最大流量系列,其均值为多年平均洪峰流量,以表示。若以表示系列中任一年最大流量值,以n表示流量观测的总年数,则:NanjingUniversityofTechnology3.5统计参数——均值、中值、众值均值的代表意义:均值是系列中所有随机变量的平均数,与每个变量都有直接关系,是各个变量的共同代表,它反映了系列在数值上的大小(系列水平的高低),可作为不同系列间随机变量数值大小(水平高低)的比较标准;均值是系列的分布中心,也就是位于几率分布中心处的变量。在密度曲线图中,通过均值垂直于横坐标的直线,恰好是曲线以下面积的重心轴。均值的大小,能反映系列分布中心和密度曲线的位置。NanjingUniversityofTechnology3.5统计参数——均值、中值、众值系列中的随机变量为等权时,按大小递减次序排列.位置居于正中间的那个变量,称为中值。中值仅与变量的位置(或项数)有关,而与其他各变量的数值无关,也称为中位数。系列中变量的项数为偶数时,则中值等于中间两项变量的平均数。对于连续型随机变量系列,中值的定义则为:系列中大于中值的和小于中值的随机变量几率相同,各为50%,即2、中值NanjingUniversityofTechnology3.5统计参数——均值、中值、众值中值是系列的中间项,也就是几率为50%的变量,比中值大的和比中值小的变量,恰好各占一半(项数相等)。在密度曲线图中,通过中值垂直于横坐标的直线,恰好平分曲线以下的面积。中值的大小,能反映系列中间项和密度曲线的位置。NanjingUniversityofTechnology3.5统计参数——均值、中值、众值系列中出现次数最多的那个变量,就称为众值。众值与变量的项数以及其他各变量的数值都没有关系。对于连续型随机变量系列,密度函数f(x)为极大时的变量值,就是众值。

众值就是系列中几率最大的变量。在密度曲线图中,恰好是曲线峰顶处的横坐标值。众值的大小,能反映系列中最大几率项和密度曲线的位置。3、众值NanjingUniversityofTechnology3.5统计参数——均值、中值、众值4、三者的位置关系在密度曲线图中,均值、中值和众值的相对位置,如图所示。曲线为对称形时(峰居中),表示系列的频率分布对称于均值(分布中心),称为正态分布,三者的位置重合;曲线不对称时(峰偏离中心),表示其频率分布偏离均值(分布中心),称为偏态分布,三者的位置分离,中值在其他二者的中间,峰偏左时称为正偏态,峰偏右时称为负偏态。均值、中值和众值的大小可以表明密度曲线的位置,而且三者的差值越大表明曲线越偏,它们反映了频率分布的位置特征。NanjingUniversityofTechnology3.5统计参数——均方差和变差系数均方差和变差系数都是代表系列离均分布情况的参数.表明系列分布对均值是比较分散还是比较集中,反映频率分布对均值的离散程度,可以进一步说明频率分布的特征。1、离均差(离差)和均方差(方差)系列中各变量xi对均值的差值、、…

等,称为离均差,表示变量间变化幅度的大小。离均差平方的平均数的平方根,称为均方差:NanjingUniversityofTechnology3.5统计参数——均方差和变差系数

均方差的量纲与变量相同。σ值较小时,表示系列的离均差较小,说明变量间的变化幅度较小,分布比较集中,即系列的离散程度较小(对均值而言);σ值较大时,则说明变量的变化幅度较大,分布比较分散,即离散程度较大。同时,均方差还可以说明均值对系列的代表性,σ值越小,均值的代表性越强。例如:NanjingUniversityofTechnology3.5统计参数——均方差和变差系数2、变差系数对于水平不同的两个系列(均值大小不等),由于均值的影响,均方差就不足以说明它们的离散程度大小。在数理统计中,通常采用相对值(即均方差与均值的比值)来反映系列的相对离散程度,作为系列间的衡量标准,称为变差系数或离差系数,以CV表示(无量纲)。利用样本推算总体的变差系数,可采用下式:NanjingUniversityofTechnology

CV值较小时,表示系列的离散程度较小,即变量间的变化幅度较小,频率分布比较集中;CV较大,表示系列离散程度大,频率分布比较分散。3.5统计参数——均方差和变差系数若引入模比系数Ki,则:或NanjingUniversityofTechnology3.5统计参数——偏差系数三、偏差系数也是代表系列分布情况的参数,表明系列分布对均值是对称的还是不对称的,反映频率分布对均值的偏斜程度,以CS表示,并可按下式计算NanjingUniversityofTechnology3.5统计参数——偏差系数利用样本计算时:引入模比系数Ki,则:NanjingUniversityofTechnology3.5统计参数——偏差系数CS=0,频率分布对称于均值;CS〉0,正偏态,大于均值的变量比小于均值的变量出现机会少,均值对应的频率小于50%CS<0,负偏态,大于均值的变量比小于均值的变量出现机会多,均值对应的频率大于50%年最大流量系列,一般不出现负值,多呈正偏态分布。NanjingUniversityofTechnology3.5统计参数——统计参数与曲线关系四、统计参数同密度曲线及频率曲线的关系均值反映密度曲线位置的变化;变差系数反映密度曲线的高矮情况;偏差系数反映密度曲线的偏斜程度NanjingUniversityofTechnology3.5统计参数——统计参数与曲线关系与频率分布曲线形状的关系若和值不变,则值愈大,曲线的位置愈高。NanjingUniversityofTechnology3.5统计参数——统计参数与曲线关系与频率分布曲线形状的关系值不变,则值愈大曲线愈陡;时,将成为一条水平线(纵坐标),而且无负值,曲线总是左高右低。NanjingUniversityofTechnology3.5统计参数——统计参数与曲线关系若值不变,则时,随值的增大,曲线头部变陡,尾部变缓而趋平,时,曲线尾部将趋向于水平线时,为正态分布,其与频率分布曲线形状的关系频率曲线在海森几率格纸上将成为一条直线;时,随值的减小,曲线头部趋平而尾部变陡,年最大流量系列的无负值,频率曲线总是头部较陡尾部平缓。NanjingUniversityofTechnology根据上述分析,对一个已知系列,可以用它的统计参数来描述频率分布和频率曲线的特征。同理,对一个未知系列,若能求得它的统计参数,就可以利用这些统计参数来确定它的频率分布和频率曲线。水文统计中,就是利用实测水文资料系列(样本)推求近似总体的统计参数,并用以确定总体的频率分布和频率曲线.3.5统计参数——统计参数与曲线关系NanjingUniversityofTechnology3.6理论频率曲线

由于目估定线或外延会产生较大的误差,往往需要借助于某些数学形式的频率曲线作为定线和外延的依据。这种用数学形式确定的、符合经验点分布规律的曲线称为理论频率曲线。根据我国多年使用经验,认为皮尔逊Ⅲ型曲线比较符合我国多数地区水文现象的实际情况。因此,我国水利、公路、铁路等工程有关规范.在水文统计中,大多采用皮尔逊Ⅲ型曲线,作为近似于水文现象总体的频率曲线线形,在洪(枯)水流量、降雨径流以及波浪高度的频率分析中广泛应用。另外,耿贝尔曲线(第Ⅰ型极值分布曲线)也适用我国洪水频率分析,特别在最高、最低潮水位的频率分析时普遍应用。NanjingUniversityofTechnology3.6理论频率曲线一、皮尔逊Ⅲ型曲线的频率密度函数皮尔逊曲线族,是英国生物学家皮尔逊与1895年,根据某些实际资料建立的一种概括性的曲线族,该曲线族按参数的不同分为13种线型,其中第三种线型就是皮尔逊Ⅲ型曲线原点在众值处的皮尔逊Ⅲ型曲线的密度函数为:ym——众值处的纵坐标值,即曲线的最大纵坐标值;a——曲线左端起点到众值点的距离;b——均值点到众值点的距离,称为偏差半径。NanjingUniversityofTechnology其中:3.6理论频率曲线NanjingUniversityofTechnology3.6理论频率曲线一、皮尔逊Ⅲ型曲线的频率密度函数原点在实际零点时皮尔逊型Ⅲ曲线的密度函数为:a0——曲线左端起点到系列零点的距离a0=-(a+d);——曲线的参数,,;

——为函数。NanjingUniversityofTechnology经换算,其中:3.6理论频率曲线NanjingUniversityofTechnology3.6理论频率曲线二、皮尔逊Ⅲ型曲线的应用水文统计需推求给定频率下的变量或某一变量的频率;频率分布曲线可以由密度函数积分而得。——频率为P的随机变量;

——离均系数,,是频率P和偏差系数的函数,;为了便于应用,预先制成了离均系数表,可供查阅。

——模比系数,,可以根据拟定的比值,预先制成模比系数值表,以便查阅。NanjingUniversityofTechnology对于年最大流量系列,其公式为:——平率为P的洪峰流量(m3/s)

——平均流量(m3/s)

——模比系数,

——离均系数,可查表3-6-13.6理论频率曲线NanjingUniversityofTechnology3.6理论频率曲线[例3-6-1] 某水文站有22年的年最大流量观测资料,如表3-6-2所示,试绘制该站年最大流量系列的经验频率曲线,计算三个统计参数、Cv、Cs,绘制理论频率曲线(P-Ⅲ曲线),并推算P=0.33%、P=1%和P=2%的洪水流量。NanjingUniversityofTechnology3.6理论频率曲线NanjingUniversityofTechnology3.6理论频率曲线根据设计频率P和偏差系数,查表3-6-1,得离均系数值NanjingUniversityofTechnology3.6理论频率曲线NanjingUniversityofTechnology水文统计的误差主要来源于两个方面:一个是水文资料的观测、整编和计算过程中形成的误差,二是利用样本推算总体的参数值所引起的误差,即抽样误差。抽样误差是统计方法本身造成的,可通过延长观测年限、增大样本容量、增强样本的代表性等措施,来逐步减小。抽样误差也是随机变量,也具有一定的概率分布,一般为正态分布。3.6理论频率曲线正态曲线的密度函数为:三、抽样误差NanjingUniversityofTechnology3.6理论频率曲线置信区间和置信水平分析表明:抽样误差出现在±σ范围内的频率为68.3%;抽样误差出现在±3σ范围内的频率为99.7%;抽样误差出现在±E范围内的频率为50%;抽样误差出现在±4E范围内的频率为99.3%;置信水平是指总体参数值落在样本统计值某一区内的概率。置信区间又称估计区间,是用来估计参数的取值范围的。NanjingUniversityofTechnology3.6理论频率曲线抽样误差可以用均方差σ表示,也可以用相对均方差表示皮尔逊Ⅲ型曲线的抽样误差对于维泊尔公式,经验频率P的相对均方差为均值的相对均方差NanjingUniversityofTechnology3.6理论频率曲线变差系数的相对均方差偏差系数的相对均方差众值的相对均方差B值可由图3-6-5查得NanjingUniversityofTechnology3.6理论频率曲线[例3-6-2] 根据例题3-6-1资料,计算

的抽样误差,以及第一项的经验频率P1的抽样误差。已知NanjingUniversityofTechnology3.6理论频率曲线由图3-6-5查得B=2.9且已知NanjingUniversityofTechnology3.6理论频率曲线NanjingUniversityofTechnology3.6理论频率曲线NanjingUniversityofTechnology3.6理论频率曲线四、耿贝尔频率分布曲线该曲线对于海洋潮汐最高、最低设计潮水位的频率分析更为合理。函数形式为指数型分布频率分布函数为:给定频率的随机变量xP为:其中:——给定频率P(%)相应的随即变量,如潮位、流量等——随机变量系列的均值,如平均最高(低)潮水位等NanjingUniversityofTechnology3.6理论频率曲线——随机变量系数的均方差,近似按系列总体的均方差计算——与频率P和系列容量n有关的参数,由表3-6-5查取NanjingUniversityofTechnology3.6理论频率曲线[例3-6-3] 己知某海湾22年的年最高潮水位观测资料如表3-6-6所示,要求推算重现期为100年和50年的最高潮位。NanjingUniversityofTechnology3.6理论频率曲线(1)将资料按递减次序排列,按维泊尔公式

计算各项资料的经验频率.如表3-6-6所示。(2)年最高潮位的均值为(3)均方差NanjingUniversityofTechnology3.6理论频率曲线(4)按表3-6-5查出n=22年,T=IOO年,即P=I%,n=22年,T=50年,即P=2%,(5)不同频率的高潮位NanjingUniversityofTechnology3.7相关分析水文现象中许多变量不是孤立的,相互之间存在联系,则分析研究两个或两个以上随机变量之间的关系,称作相关分析。相关分析的意义与应用

应用:相关分析可以用来延长和插补短系列,从而提高系列的代表性,增加样本估计总体的计算精度,如建立上、下游水位的相关关系,由上游水位预报下游水位。

前提:在相关分析时,首先要分析随机变量之间是否在成因上确有联系,对毫无关联的现象是不能用相关分析的。NanjingUniversityofTechnology3.7相关分析水文计算中的相关分析的主要任务:(1)确定两个变量间相关关系的数学表达式,以相关方程或回归方程表示,用以由已知变量推求未知变量;(2)判断两个变量间相关关系的密切程度,用一称为相关系数的参数来表示。NanjingUniversityofTechnology3.7相关分析水文计算中,一般处理两个变量间的相关关系,称简单相关,有时也要处理三个或三个以上变量关系,称为复相关。简单相关可分为直线相关和曲线相关。曲线相关直线相关NanjingUniversityofTechnology3.7相关分析

如果两个变量x,y,其中变量x的每一个值,变量y都有一个或多个确定值与之对应,而且x,y成函数关系,即x,y的关系点完全落在直线或曲线上,则称这二个变量是完全相关的。完全相关yx完全相关(函数关系〕直线关系曲线关系随机变量之间的关系有以下三种情况:NanjingUniversityofTechnology3.7相关分析零相关YXb.零相关(没有关系)如果两个变量x,y之间互不影响互不相关,则称这二个变量没有关系或零相关。即x,y的关系点毫无规律,十分分散。NanjingUniversityofTechnology3.7相关分析yx如果两个变量x,y之间关系介于以上二者之间,x,y的关系点虽有点分散,但有明显的趋势,数学上可以用一定的表达式进行拟合。则称这二个变量关系为统计相关或相关关系。统计相关c.统计相关(相关关系〕NanjingUniversityofTechnology3.7相关分析一、直线相关的回归方程

图解法:根据实测值,将对应点绘于方格纸上,如果点群分布平均趋势为一直线,则可以直线来近似代表这种相关关系。通过点群中心目估绘出一条直线,然后在图上量出直线的斜率a和截距b,则直线方程:

y=a+bx即为所求的相关方程。该方法简便实用,而且一般情况下精度可以保证。NanjingUniversityofTechnology3.7相关分析

相关分析法:若相关点分布较散,目估定线有一定任意性,为保证一定精确性,最好采用解析法来确定相关线的方程。设该直线方程形式为:

y=a+bx式中,x:自变量

y

:倚变量

a,b

:分别为一常数,待定。则相关点与直线在纵轴方向必然存在离差。NanjingUniversityofTechnology配合曲线与观测点在纵轴方向的离差为:xiy3.7相关分析NanjingUniversityofTechnology3.7相关分析要求配合曲线与所有的观测点能“最佳”拟合,即满足所有的观测点的离差

y

的平方和为最小,即:分别对a,b

求一阶偏导数,并令其为零:NanjingUniversityofTechnology3.7相关分析求解上列两联立方程式,可得NanjingUniversityofTechnology3.7相关分析此式即为y倚x的回归方程(直线方程)同理,可得

x倚

y的回归方程(直线方程)将a,b代入y=a+bx中得:NanjingUniversityofTechnology3.7相关分析二、相关系数R回归方程只是一种计算工具,它反映了两个变量之间的平均关系,并不能说明两个变量之间的关系是否密切。在数理统计法中,一般采用相关系数来描述和判别两变量之间的相关程度。NanjingUniversityofTechnology3.7相关分析式中

:x,y

系列的变差系数(按不偏估计公式计算):

R:相关系数;

Kxi

,Kyi:分别为xi,yi系列的模比系数:NanjingUniversityofTechnology3.7相关分析相关系数的性质:①若R2=1,表示相关点(xi,yi)均落在回归线上,两变量间具有直线函数关系;②若R2=0,说明y的变化与x毫无直线关系,称为零相关;③若0<R2<1,R2愈接近于1,点据越靠近回归直线,关系越密切。R为正时,表示正相关;R为负时,表示负相关。NanjingUniversityofTechnology3.7相关分析相关系数R可以用作相关系数的描述和判别:R=±1时为完全相关,表明两变量之间存在直线函数关系R=0时为零相关,表明两变量之间不存在直线相关;R=-1~1时为统计相关,表明两变量之间存在直线相关,而且R的绝对值愈接近1,相关程度愈密切。

注:当相关系数R很小或接近于0时,只能说明两变量之间的直线相关程度很差或直线相关不存在,但可能存在某种曲线相关。NanjingUniversityofTechnology3.7相关分析三、回归方程和回归系数的其他形式和两系列随机变量的均方差为和NanjingUniversityofTechnology3.7相关分析回归线的斜率b,又称回归系数y依x的回归方程为:NanjingUniversityofTechnology3.7相关分析四、相关分析的误差

由于x、y并非确定性关系,对于x=x0,无法知道其相应的真正值y0,通过回归方程求到:仅仅是真正值y0的一个估计值。故其与真正值y0存在偏差。根据统计学的研究,由于随机因素的影响,y0在估计值上下波动呈正态分布,其误差大小可用均方误表示。NanjingUniversityofTechnology3.7相关分析NanjingUniversityofTechnology3.7相关分析

如用Sy表示y倚x回归线的均方误,yi为观测值,为回归线上的对应值,n为系列项数,则

式中,Sy

:y倚x回归线的均方误;

yi

:观测点的纵坐标值;

y:由回归方程求到的纵坐标值;

n:观测项的数目

同样,x倚y回归线的均方误Sx为NanjingUniversityofTechnology3.7相关分析利用样本推算时,其均方误为如前所述,可以用均方误进行误差分析,即对于任一固定的x=x0值,若以作为y的估值,其误差不超过Sy的可能性为68.3%;其误差不超过3Sy的可能性为99.7%。NanjingUniversityofTechnology3.7相关分析五、容许相关系数的最小值相关系数是根据有限的实测资料(样本)计算出来的,故相关系数也不免带有抽样误差

故水文上为了推断二个变量的相关性,必须对样本相关系数作统计检验。假设检验:先假设总体具有某种统计特性(如具有某种参数,或遵从某种分布等),然后再检验这个假设是否可信,这种方法称为假设检验。

NanjingUniversityofTechnology3.7相关分析原假设H0:R总体=0(不相关);备选假设H1:R总体≠0(相关)。先假设R总体=0,即总体不相关。但总体不相关的两个变量,样本相关系数的大小可以在0~1之间变化,不同的R样本,其出现的概率也不同,即样本的相关系数是一随机变量,它也具有一定的概率分布。小概率原理:如果在指定的随机试验中,某事件出现的概率非常微小,那么就可以认为,在一次试验中此事件是不可能发生的。NanjingUniversityofTechnology3.7相关分析具体的检验步骤:

假设两变量X,Y在总体上不相关;

从不相关的两变量总体中抽出大量的样本(如n个),进行相关分析,并分别计算各样本的相关系数R1,R2,…Rn,由于假设总体不相关,可以判断R1,R2,…Rn

为较小值的可能性大,为较大值的可能性小.

选定一个衡量事件发生可能性(概率)很小的指标(水文统计学中称显著性水平

或称信度水平

),对于容量为n的样本,则有一相应的临界值

R

(

R

为较大值),样本相关系数R(根据原先假定R

应为很小的值)

超过±R

的可能性(概率)应为较小值

(水文上一般选

=0.05或0.01作为小概率),即:NanjingUniversityofTechnology3.7相关分析由于

值很小,故R

R

为一小概率事件.

取某一个具体的样本所计算的R与

R

作比较,以判断总体是否相关:

若R≥

R

,说明样本相关系数绝对值较大,且超过了临界值

R

,说明“小概率事件”发生了,则原先的假定是不能接受的,总体很大可能性是相关的。NanjingUniversityofTechnology3.7相关分析

若R≤

R

,说明样本相关系数绝对值较小,未超过临界值

R

,则原先的假定可以成立,即总体很大可能性是不相关的。实用上,可查n~R

~

表求R

(表3-7-1,p66)n-2(n为样本容量)

0.10.050.020.01R

80.54940.6319

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论