版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基本原理与方法第三章水文统计2023/2/41了解其它有关水文统计的知识。掌握经验累积频率曲线绘制;PⅢ
形理论频率曲线;直线相关分析;统计参数计算;重点2023/2/42§3—1水文统计的意义及基本概念本节自学:1、水文统计为何要采用数理统计法2、自然界中的现象可分为哪三种类型,举例说明3、统计规律性、连续性随机变量、离散性随机变量、总体、样本、随机样本、样本容量、有限总体。2023/2/434、数理统计法对水文资料的要求是什么检查资料的可靠性检查资料的代表性检查资料的一致性检查资料的随机性检查资料的独立性简介2023/2/44§3—2概率与频率P(A)=mn一、概念1、概率0≤P(A)≤1——随机事件在客观上出现的可能性大小的数值,也称机率。P(A)——随机事件A的出现机率;m——事件A在客观上出现的结果总数;n
——一切可能出现的结果总数(总体容量)。2023/2/45事先概率总体是有限的,其随机变量的机率可事先算出事后概率经验概率总体是无限的,其随机变量的机率无法事先算出水文统计是事后机率,因为水文特征值是无限总体2023/2/462、频率——在若干次重验复实验中,某事件出现的次数与实验总次数之比。W(A)=mnW(A)——随机事件A的频率。m——随机事件A的频数。n——总的实验次数。频率是随机实验时的实测值2023/2/473、频率与概率的关系频率是实测值概率是理论值当试验次数越多,频率与概率的值越接近2023/2/48二、概率运算定理1、概率相加定理:p(A1+A2+……+An)=P(A1)+P(A2)+……+P(An)2、概率相乘定理:p(A1*A2*……*An)=P(A1)*P(A2)*……*P(An)2023/2/49三、随机变量的概率分布随机变量与其概率的一一对应关系,称随机变量的概率分布。1、随机变量的概率分布2、频率及有关概念将水文观测资料由大到小排列,按等区间分成若干组,各组出现的次数与总次数之比,即为频率。(1)频率——表示每组所在区间的变量值出现的可能程度2023/2/410(2)频率密度(A)频率~变量;(B)频率密度~变量;——频率在区间内的平均值即:(3)直方图——(4)频率密度曲线——当△x→0时,直方图近乎曲线,此曲线即频率密度曲线。
2023/2/411pxx频率密度曲线(A)密度函数:dxdpx
D
pxp=D=lim)(2023/2/412(B)密度曲线形状见图3.2多呈铃形(正态)分布,中间值频率较大,两头较小。由曲线形状可以知道:密度曲线呈中间大,两头小的。而大多数的水文现象具有此规律性。故密度曲线和密度函数可用来描述连续型随机变量的统计规律。2023/2/413四、累积频率与重现期1、累积频率——等量或超量值的累积频数与总观测次数之比。是机率相加定理的应用公式2023/2/414p(x≥xi)——累积频率m——累积频数n——总观测次观测年限越长,则样本容量越大,其预见性越可靠。其中:2023/2/415xp观测年限越长,则样本容量越大,其预见性越可靠。累积频率曲线频率分布曲线2023/2/4162、重现期——等于或大于某随机变量xi的值,平均多少年(或多少次)可能遇见一次,简称多少年(或多少次)一遇。重现期较累积频率更易懂、具体2023/2/417T=1p(p≤50%)T=11-p(p≥50%)其中:
T——重现期p——累积频率对于洪水频率对于枯水频率2023/2/418p=95%时,表示20年一遇的枯水p=5%时,表示20年一遇的洪水例而重现期是指长期内平均若干年可能出现一次,而不是固定周期。注意频率是指多年平均出现的机会2023/2/419同等级建筑物的设计频率值相同,但因实际的水文现象不尽相同,故设计值也存在着差异。设计频率标准由工程的重要性及建筑物的等级确定;五、设计频率标准(简介)2023/2/4201、频率设计标准——是根据工程的重要性及建筑物的等级来制定的允许破坏率和安全率——建筑物正常运转遭到破坏的可能性——在年内都能保证安全的机率破坏率保证率它与安全率是两个不同的概念2023/2/4212、保证率的计算PM=(1-p)n
在n年内都能保证安全的机率n——保证安全的年数P——破坏率n
越小,保证率越大,即要求保证的年数越小,可以达到的保证率越大。2023/2/422§3—3经验累积频率曲线一、经验累积频率曲线——将某水文变量按由大到小的顺序排列,计算大于等于某变量的累积频数,并计算其累积频率。以累积频率作为横坐标,相应的变量作为纵坐标,并将其对应值点绘在坐标中,且目估一条光滑的曲线,此曲线即经验累积频率曲线。经验累积频率曲线2023/2/423二、经验累积频率公式1、古典公式:其中:m——随机变量序号n——随机变量总数适用于系列比较长,即n很大时,否则p不合理,故水文计算中一般不采用此种公式。2023/2/424注意:m
是按由大到小排列的变量序号。如:m=10,
n=10,则p=100%,显然与事实相背,因为样本中的,最小值不一定是总体中的最小值,故此式不尽合理。2023/2/4252、数学期望公式(维泊尔公式):3、中值公式(切哥达也夫):符号的意义同上。常用此公式2023/2/4264、海森公式:以上几个公式各有特点,从形式上难以确定哪个更符合实际,因为不管哪个公式都存在一定的抽样误差,且愈靠近两端,误差愈大,故只有增大样本容量,才能使计算结果更接近实际。实践证明,维泊尔公式的结果偏于安全,且公式形式简单,工程水文中常用此式。2023/2/4272023/2/428三、经验累积频率曲线的绘制和应用选定经验累积频率公式据公式计算系列中变量的经验频率以频率为横坐标,随机变量为纵坐标,将各计算值点绘在坐标纸上将各点用一条光滑的曲线相连,即为经验累积频率曲线。步骤2023/2/429四、经验累积频率曲线的外延由于在实际工程中,往往需要将实测的频率曲线向两端延长,以满足于设计频率标准。但若在普通坐标纸上点绘曲线,由于曲线两端曲率变化较大,如果只凭目测使其延长,则误差太大,故可采用以下的方法:2023/2/4301、应用机率格纸绘制经验累积频率曲线一般采用海森机率格纸(1)可以使密度曲线为正态分布的分布曲线,在海森机率格纸上呈现一条直线;(2)由于实测水文资料系列,其密度曲线很少呈现严格的正态分布,故此分布曲线也并非一条完全的直线,外延仍有一定的误差。特点2023/2/4312、利用数学方程式(即理论累积频率曲线)对水文资料的频率密度曲线选配一条合适的数学模型,利用数学的方法推求累积频率曲线方程式安全与经济是一对矛盾体,解决问题的办法就是由国家统筹考虑给出的设计频率。2023/2/432§3-4随机变量的统计参数统计参数某些随机事件虽然有共同的统计规律,但不同的系列中,其取值也不同,故描述频率分布的密度曲线和分布曲线也具有不同的形状。为了选配合适的密度曲线数学模型,就必须选好合适的统计参数。——在数理统计法中,为描述不同系列的频率分布和曲线形状,所采用的能反映其特征的几个具体数据。2023/2/433水文统计常用的几个统计参数:1、均值x与系列中所有变量有关,反映系列变量平均水平的参数,是系列量的代表。2、计算:一、均值加权平均法算数平均法2023/2/434如:有一实测系列:x1,x2,x3,……,xn
,
相应的频数是:f1,f2,f3,……,fn
。则有:(1)加权平均法2023/2/435(2)算数平均法:当各变量占有同等比重(即出现的次数相同)时。可写为:均值的大小能反映系列分布中心和密度曲线的位置2023/2/436二、均方差、变差系数(离散系数)1、均值的数学特性:2、均方差s描述系列各变量的离散程度。可用以比较系列的均值相同时,其离散程度的大小。2023/2/437(1)公式:水文资料应是样本,故一般应用此式。总体样本n——总数2023/2/438如:有两系列甲:10,50,90s=40=50乙:49,50,51=50s=1(2)注:只用均值无法表示系列的离散程度,由s可以知道甲系列比乙系列的离散程度大。故若比较系列的离散程度应考虑均值和均方差2023/2/439当均值都相同时,均方差越大,则离散程度越大。当均方差相同时,均值越大,则离散程度越小。此时可用以下的变差系数判别2023/2/440表示系列的相对离散程度3、变差系数Cv均方差与均值的比可用来比较均值不同,均方差相同的两个系列的离散程度。2023/2/441(1)公式总体样本若引入模比系数则公式为:3—16式2023/2/442(2)例:乙系列:995,1000,1005甲系列:5,10,15=10,s甲=5,Cv甲=0.5x甲=1000,s乙=5,Cv乙=0.005X乙注:当甲、乙系列的s相同,但可比较Cv,Cv小则离散程度小。不相同时,即:当均方差相同时,均值越小,离散程度越大2023/2/443(3)影响Cv
的因素1>流域形状狭长形流域的Cv>枝状形流域的Cv大流域的<小流域的径流均匀、波动小的<波动激烈的2023/2/4442>河网的布置下游<上游同一流域,各支流洪水汇合后的干流段Cv
<汇合前;3>实测系列时段的长短同一水文现象,时段长的
Cv<时段短的Cv2023/2/445三、偏态系数(偏差系数)1、偏态系数Cs衡量一个系列在均值两侧对称程度的参数。(1)公式:总体样本2023/2/446(2)Cs对曲线的影响Cs>0Cs=0Cs<0正偏态分布正态分布负偏态分布2023/2/447§3—5理论累积频率曲线理论累积频率曲线——用数学方程式建立起的频率曲线方程理论累积频率曲线并非是由理论导出的公式,只是这种数学方程式的特点与水文统计规律能较好的符合,故此式只是可用以分析水文样本系列的数学工具,不能说明水文现象的本质。用数学公式可以达到延长经验频率曲线的目的。而频率曲线的形状与三个参数有关,故要选配合适的理论曲线,就须先设定好三个参数。2023/2/448一、皮尔逊Ⅲ型曲线1、方程:若将坐标原点定在众值处,可写成:)1(0dxdaeaxyy-+=)()()(100-G=---axeaxybaaab3—26式3—25式2023/2/449其中:Γ(α)——函数;a0——曲线左端起点到系列零点的距离;α、β——曲线的参数。d——均值到众值的距离(偏差半径);y0——众值处的纵坐标;a——曲线左端起点到众值的距离;e——自然对数的底。众值——系列中出现次数最多的变量。2023/2/4502、曲线方程中各参数的计算见式3—273、皮尔逊Ⅲ型曲线的应用皮尔逊Ⅲ型曲线积分,可以得到理论累积频率曲线的随机变量值公式。2023/2/451φp—离均系数(查附录3)kp—模比系数(查附录4)是p、cs
的函数(1)公式:其中:(2)举例:设某水文站平均Q=1000m3/s,cv=0.5,
cS=1.5,求此理论频率曲线及设计洪峰流量
Q1%。2023/2/4521>皮尔逊Ⅲ型曲线只是一种数学模型,具体应用时应联系具体的水文现象作分析;(2)问题:2>为了寻求一条与经验频率符合的较好的理论频率曲线的参数,需多次调整参数:
x、cv为此,可采用试算的方法。2023/2/4534、统计参数对皮—Ⅲ
型曲线的影响皮—Ⅲ型曲线是密度曲线Cv
次之,最小。X用三个统计参数建立起的数学模型去推论总体的情况,Cs带来的误差最大,2023/2/454(1)均值反映位置变化x1x2yx当Cv、Cs不变时,曲线形状基本不变,X但曲线位置随变化沿X轴移动。<2023/2/455(2)Cv
反映密度曲线的高矮情况:yx
Cv1
Cv2<
Cv1
Cv2Cv=0若及Cs都不变,则Cv
越大,表示频率分布越分散,曲线越矮。
Cv=0时,成为一条垂直横坐标的垂线。2023/2/456(3)Cs
反映密度曲线的偏斜情况:yxCs1Cs2若及Cv
都不变,则Cs
>0,曲线峰偏左,Cs越大,峰越向左偏。因为年最大流量系列Cs无负值,故曲线总是峰偏左(正偏态)。>2023/2/4575、统计参数对理论累积频率曲线形状的影响的影响:(1)
cv、cS
一定时,曲线形状不变,分布曲线水平的高低随而变。xp<的增减即上、下位置影响曲线的2023/2/458(2)cv
的影响:、cS一定时,cv增大,则曲线左端上升,右端下降;cv
=0时,曲线变为一条水平线。xPcv1cv3cv2cv1cv2cv3=0>>2023/2/459(3)cS
的影响:cv
、一定,且cS
>0时,cS
愈大,则曲线左上端愈陡,中段下落,右端变缓。当cS>
2~3时,曲线下端水平。xPcS1cS2cS3cS1cS2cS3=0>>2023/2/460二、克里茨基—闵凯里曲线——是水文学中常用的理论频率密度曲线之一(3)具有一个众值0<x<∞、cS
、cv(1)可以求出三个独立的统计参数:(2)特征值的变化范围是:应用条件2023/2/461此曲线的适应性大,适合于分析我国北方河流的径流资料。但因此曲线将下限定于零点,与实际不符(最大流量与年径流量的最小值均不可能为零),故不常用,常用的是p—Ⅲ型曲线。Cs<2时,曲线下端出现负值,也与事实不符。2023/2/462§3—6抽样误差一、误差来源水文资料的观测、整编和计算过程中造成的误差。抽样误差:——由样本的统计参数来代替总体的统计参数,这种抽样引起的误差称为抽样误差。2023/2/463第一种误差随着科技的发展,计算法的继续改进,及对资料的认真审查,将会减小到最低程度;抽样误差是统计方法本身造成的,只能采取延长观测年限,增大样本容量,增强样本的代表性等措施,来逐渐减小之。2023/2/464二、抽样误差概述1、抽样误差的种类:最大误差机误均方误平均情况或然情况2023/2/4651>均方误——误差的平均值或平均误差2>机误——凡是使误差落在与不落在它们均方误两侧(即大于和小于误差均值)各一个定值范围内的机率相等(50%),则这一定值称机误。3>最大误差——误差理论一般认为,左右一个均方误为一般误差范围;三个均方误或四个机误为误差的极限范围,即最大误差。2023/2/466由误差理论可知,当误差界限取均值两旁各一个均方差或机误时,有:
由此可知,均方差或机误是给实际样本以一种估计其准确性的界限,并称之为置信区间。
置信区间越小,则误差越小,因而样本的代表性也越好。2023/2/467(1)抽样误差的作用:1>为保证设计安全,可作为一种安全系数加以考虑2>可用来评价所统计的水文资料是否超出给定的精度3>选配理论累积频率曲线时,可作为修正统计参数的参考值。2、计算2023/2/468(2)计算:见p62水文计算中常以皮—Ⅲ型曲线或正态分布曲线为机率密度函数的假想数学模型2023/2/469§3—7水文频率分析频率分析——即确定合适的统计参数在水文计算中,统计参数的正确与否会直接影响最终的设计值,故应使统计参数尽可能的与实测资料相符。(1)试错适线法(2)矩法常用的频率分析法有经验适线法p682023/2/470一、方法公式:1、矩法——由实测系列算出三个统计参数,而后计算cvcS设计值xp。此法要求系列长,即样本容量要大,否则cS误差大,会造成计算结果不可靠,故一般极少直接应用。2023/2/4712、适线法——矩法与经验累积频率点据相结合,以选配合适的理论频率曲线的方法。试错适线法三点适线法有略2023/2/472先假定一个cS值,与实测系列的及
cv
相结合,求得一条理论曲线,经过多次调整cS
值,使其与实测曲线基本吻合,最后再计算xp
。试错适线法2023/2/473(1)将实测点据点绘在机率格纸上(x~p
)的关系;经验累积频率曲线(2)由实测系列计算有关的参数:、cv
,ki(ki
–1)2据此查出φp,算出kp=φpcv+1。试选几种cS[(2~4)cv],步骤2023/2/474(4)据选定的曲线查算xp
。(3)将不同cS
对应的理论曲线同时点绘在经验累积频率曲线的机率格纸上,找出一条最合适的理论曲线。例3—102023/2/475§3—8相关分析自然界中许多现象不是孤立的,而是相互之间有一定的联系,人们在长期的实践中发现,两个变量之间的关系可以归纳为两大类。函数关系相关关系即:2023/2/476——变量之间有确定的一一对应值,这种关系称作函数关系。(1)函数关系(2)相关关系——对于变量的每一个确定的值,对应的值没有确切的值,但经大量的观察后可发现它们之间存在某种关系,这种关系称为相关关系。2023/2/477一、相关分析的意义1、相关分析——对变量之间数量关系的分析,称为相关分析。2、意义——当某一水文现象资料较短,而与之有关的另一水文现象资料较长时,可用相关分析法来延长较短的系列或插补缺测的资料。2023/2/4781、按相关变量的多少可分为:二、相关分析分类简单相关复相关研究两个以上变量的关系研究两个变量之间的关系2023/2/4792、按相关的密切程度可分为:——变量之际的关系非常密切,相互成严格的函数关系。——变量各自独立,互不影响,彼此之间没有关系。——介于以上两者之间,变量之间不是相互独立的,但彼此间的关系也不是非常的密切。完全相关零相关统计相关水文计算多属于统计相关计算2023/2/480xyxy直线相关曲线相关统计相关2023/2/481xyxyxy完全相关xy零相关2023/2/4821、相关图解法适用条件:计算精度要求不太高;特点:简单、方便。三、简单直线(线性)相关方法多点平均定线法目估法两点平均定线法2023/2/483(1)目估法——在点据中心且过均值绘一条直线,两侧点据的正负离差大致相等。B、此法在相关较密切,点据变化规律较明显时,效果较好。A、利用解析几何法确定直线方程。2023/2/484(2)*两点平均定线法:步骤:(1)将资料xi由大到小排列(yi
与之对应);(2)按项目n分成上、下两部分(偶数时上、下部分相等;奇数时,可一部分多一项);(3)计算上、下两部分的平均值(xa,ya),和(xb,yb);2023/2/485方程式:(5)通过a、b两点连成一直线,即y依x变回归直线。(4)将实测点据与平均值点据点在同一坐标纸上;2023/2/486(3)*多点平均定线法当实测点据较散乱时可用此法。步骤:(1)将资料xi由大到小排列(yi
与之对应);(2)取相邻两点的平均值,再取平均值的平均值……,分别得到四点、八点……平均值。(3)将实测点据与平均值点据点在同一坐标纸上;(4)通过平均值点据作一条直线(或曲线),再按解析几何法求直线方程。2023/2/4872、相关分析法(2)回归线——将两系列的随机变量对应值点绘在坐标纸上,若点据的分布趋势呈直线,则证明两系列的变量之间存在直线相关,可通过点据配合一条最佳的直线,此直线称变量之间的回归线。——即两个变量之间的关系可近似的配成一条直线(1)简单直线相关2023/2/488(3)回归方程——描述回归线的方程式称变量之间的回归方程y
依
x
变回归方程式baxy+=)(xxssyyxy-=-g3—48式x
依y
变回归方程式b’ya’x+=)(yyssxxyx-=-g2023/2/489xyxyx0y0x0y0y0△y
∑
△yi2=最小x0△x∑
△xi2=最小y
依
x
变回归方程式x
依
y
变回归方程式2023/2/4903、、相关系数γ和回归系数其中:<10<(1)γ=0γ(2)=1γ(3)统计相关完全相关零相关(1)相关系数γ:计算式:3—46式2023/2/491(2)回归系数见p75——回归系数=0,零相关>0,正相关<0,负相关y
依
x
变回归2023/2/492在统计相关的计算中,因两变量之间不是函数关系,回归线也只是实测点据的最佳配合线,故相关分析也存在误差。4、相关分析的误差2023/2/493(1)回归直线误差(y依
x
变回归)一般可按均方误差或机误计算1>均方误差)(2-=ånyysiy总体——2)(2--=ånyysiy样本——3—49式(n-2)相当于自由度,当只有两个测点时,直线必过此二点,无误差;若有三个点,会出现点线之间的离差,此是因多一个点据所造成的;若有n个点据,则认为将有(n-2)个点引起误差。2023/2/4942>机误Ey=0.6745sy3>回归直线误差的几何意义最大误差范围可认为是3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《高等数学基础知识》课件
- 湖南省名校联考联合体2024-2025学年高三上学期第四次联考历史试题(含答案)
- 巨大胎儿的健康宣教
- 亚急性皮肤红斑狼疮的健康宣教
- 药物性鼻炎的健康宣教
- 家族性进行性色素沉着的临床护理
- 家族性黏液血管纤维瘤的临床护理
- 1.4.2用空间向量研究夹角问题第2课时(教学课件)高二数学选择性必修第一册(人教A版2019)
- JJF(陕) 056-2021 等电位测试仪校准规范
- 金融行业品牌推广策略计划
- 高中音乐鉴赏 《舞动心弦-中国舞蹈音乐》
- GB/T 4985-2021石油蜡针入度测定法
- GB/T 3920-2008纺织品色牢度试验耐摩擦色牢度
- GB/T 16865-1997变形铝、镁及其合金加工制品拉伸试验用试样
- GB/T 14602-2014电子工业用气体氯化氢
- 基坑开挖、土方回填危险源辨识及风险分级评价清单
- 装置气密性的检验课件
- 不朽的艺术:走进大师与经典 期末考试答案
- 豁免知情同意申请表【模板】
- 奥运会的历史课件
- 医学高级职称评审答辩报告PPT模板
评论
0/150
提交评论