版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、水文统计基本原理及方法水文统计基本原理及方法 内内 容:容: 3.1 3.1 水文统计的意义及基本概念水文统计的意义及基本概念 3.2 3.2 频率和概率频率和概率 3.3 3.3 经验频率曲线经验频率曲线 3.4 3.4 随机变量的统计参数随机变量的统计参数 3.5 3.5 理论频率曲线理论频率曲线 3.6 3.6 抽样误差抽样误差 3.7 3.7 水文频率分析方法水文频率分析方法 3.8 3.8 相关分析相关分析 重重 点:点: 水文频率及水文相关分析等水文统计基本知识;水文频率及水文相关分析等水文统计基本知识; 水文频率及水文相关分析等水文统计计算。水文频率及水文相关分析等水文统计计算。
2、 难难 点:点: 水文频率及水文相关分析等水文统计计算水文频率及水文相关分析等水文统计计算3.1 水文统计的意义及基本概念水文统计的意义及基本概念3.1.1 水文统计的意义水文统计的意义 水文现象具有必然性、偶然性(随机性);水文现象具有必然性、偶然性(随机性); 利用概率论和数理统计的理论和方法,研究和分析水文的利用概率论和数理统计的理论和方法,研究和分析水文的随机现象(已经观测到的水文现象),找出水文现象的统随机现象(已经观测到的水文现象),找出水文现象的统计规律性;计规律性; 以此为基础,对水文现象未来可能的长期变化做出概率意以此为基础,对水文现象未来可能的长期变化做出概率意义下的定量预
3、估,以满足工程规划、设计、施工以及运营义下的定量预估,以满足工程规划、设计、施工以及运营期间的需要。期间的需要。3.1.2 事件事件 随机试验:对随机现象的观测随机试验:对随机现象的观测 事件:随机试验的结果。包括:事件:随机试验的结果。包括:1)1)必然事件:在一定能够的条件组合下,必然会发生的必然事件:在一定能够的条件组合下,必然会发生的事情。事情。2)2)不可能是件:在一定的条件组合下,一定不可能发生不可能是件:在一定的条件组合下,一定不可能发生的事情。的事情。3)3)随机事件:在一定的条件组合下,可能发生也可能不随机事件:在一定的条件组合下,可能发生也可能不发生的事件。发生的事件。3.
4、1.3 总体、样本、样本容量总体、样本、样本容量 随机变量:受随机因素影响,遵循统计规律的变量。通俗随机变量:受随机因素影响,遵循统计规律的变量。通俗地讲,地讲,指在随机试验中测量到的数量。指在随机试验中测量到的数量。对于水文现象而言,对于水文现象而言,指某种水文特征值,如某地区流域出口的年径流量和洪峰指某种水文特征值,如某地区流域出口的年径流量和洪峰流量等。分:流量等。分: 连续性随机变量,如水位、流量;连续性随机变量,如水位、流量; 离散性随机变量,如投掷硬币的正反面。离散性随机变量,如投掷硬币的正反面。 总体:随机变量所能取值的全体,分有限和无限总体。总体:随机变量所能取值的全体,分有限
5、和无限总体。 样本:从总体中随机抽取出的一组观测值。样本:从总体中随机抽取出的一组观测值。 样本容量:样本中所含随机变量的项数。样本容量:样本中所含随机变量的项数。有的现象无法得到总体,例如水文现象。有的现象无法得到总体,例如水文现象。水文统计:各种水文现象的调查和实测过程当作水文统计:各种水文现象的调查和实测过程当作随机试验随机试验, 把已观测到的水文资料当作总体的一个把已观测到的水文资料当作总体的一个随机样本随机样本(样本应足够大,才能比较好的反应总体的近似情况),(样本应足够大,才能比较好的反应总体的近似情况), 利用利用数理统计数理统计的方法分析样本的统计规律,的方法分析样本的统计规律
6、, 考虑考虑抽样误差抽样误差作为总体的规律,应用到工程中作为总体的规律,应用到工程中去解决实际问题。去解决实际问题。3.1.4 数理统计法对水文资料的要求数理统计法对水文资料的要求检查资料的可靠性;检查资料的可靠性;检查资料的一致性;检查资料的一致性; 要求所使用的资料系列必须是要求所使用的资料系列必须是同一类型或者在同一条件同一类型或者在同一条件下下产生的。如:暴雨洪水和雨雪洪水;瞬时水位和日平均水产生的。如:暴雨洪水和雨雪洪水;瞬时水位和日平均水位。位。检查资料的代表性;检查资料的代表性; 一般认为资料系列越长,平丰枯水段齐全,其代表性越高。一般认为资料系列越长,平丰枯水段齐全,其代表性越
7、高。检查资料的随机性;检查资料的随机性;检查资料的独立性。检查资料的独立性。3. 2 频率和概率频率和概率3.2.1概率和频率概率和频率(1)频率)频率 指在具体重复的实验中,某随机事件指在具体重复的实验中,某随机事件A出现的次数出现的次数(频数)(频数)m与试验总次数与试验总次数n的比值,即:的比值,即:nmAW)((2)概率)概率 概率是指随即事件在客观上出现的可能性,即该事件概率是指随即事件在客观上出现的可能性,即该事件的发生率,亦称为机率。根据事件出现的可能性是能够预的发生率,亦称为机率。根据事件出现的可能性是能够预先估计出来,可分为事先概率和事后概率:先估计出来,可分为事先概率和事后
8、概率: 事先概率:试验之前某随机事件出现的可能性可以预事先概率:试验之前某随机事件出现的可能性可以预先估计出来,如先估计出来,如 投硬币出现正面和反面的机率;投硬币出现正面和反面的机率; 事后概率:随机事件出现的可能性不能在试验之前预事后概率:随机事件出现的可能性不能在试验之前预先估计出来,必须通过大量的重复试验之后才能估计先估计出来,必须通过大量的重复试验之后才能估计出它出现的可能性。出它出现的可能性。(3)频率与概率的关系(表)频率与概率的关系(表3.1) 频率是经验值,概率是经验值;频率是经验值,概率是经验值; 可以通过实测样本的频率分析来推论事件总体概率特性;可以通过实测样本的频率分析
9、来推论事件总体概率特性; 样本容量越大,结果越准确;样本容量越大,结果越准确; 对于水文现象,只能采用有限的多年实测水文资料组成样对于水文现象,只能采用有限的多年实测水文资料组成样本系列,推求频率作为概率的近似值。本系列,推求频率作为概率的近似值。)()(limAPAWn3.2.2 概率运算定律概率运算定律(1)(1)概率相加定理概率相加定理 互斥事件:在一次试验中,只有一个事件发生,其余事件互斥事件:在一次试验中,只有一个事件发生,其余事件均不能发生,这类事件称为互斥事件;均不能发生,这类事件称为互斥事件; 概率相加定理:互斥的各事件中,至少有一个发生的概率概率相加定理:互斥的各事件中,至少
10、有一个发生的概率等于各个事件发生的概率总和。等于各个事件发生的概率总和。(2 2)概率相乘定理)概率相乘定理 独立事件:多个事件中,某一事件的出现并不影响其他事独立事件:多个事件中,某一事件的出现并不影响其他事件的出现。件的出现。 概率相乘定理概率相乘定理: :几个独立事件一并出现的概率等于各事件几个独立事件一并出现的概率等于各事件出现概率之积。出现概率之积。(3)条件概率)条件概率【例】某测站有某测站有40年的实测枯水位记录,各种水位出现的频率如表年的实测枯水位记录,各种水位出现的频率如表3.2所示,试确所示,试确定水位定水位H2.0m和和H2.7m的概率?的概率?%70)0 . 4()5
11、. 3()7 . 2()7 . 2(WWWHP%5 .92%70%5 .22)7 . 2()0 . 2()0 . 2(HPWHP某站水位频率计算 表3.2 序号序号水位水位H(m)频数频数f(a)频率频率W(%) 累积频率累积频率P (%)123454.01.921016935254022.57.55307092.5100 401003.2.3 随机变量的概率分布随机变量的概率分布 随机变量与其概率一一对应,这种随机变量与概率一一对随机变量与其概率一一对应,这种随机变量与概率一一对应的关系称为随机变量的概率分布规律简称应的关系称为随机变量的概率分布规律简称概率分布概率分布 随
12、机变量可分为两类:离散型随机变量和连续型随机变量随机变量可分为两类:离散型随机变量和连续型随机变量 水文学关心随机变量取值大于等于某一定值的概率,即水文学关心随机变量取值大于等于某一定值的概率,即P(Xxi),而该概率是),而该概率是x的函数的函数 【例例3.6】 离散型随机变量及其概率分布离散型随机变量及其概率分布Xx1x2xiP(X=xi)p1p2pidxxfxxPxFixi)()()( F(X)= P(Xx) 代表代表X大于某一取值大于某一取值x的概率,其几何曲线的概率,其几何曲线称为概率分布曲线;如果用实测资料点绘的,水文上称为称为概率分布曲线;如果用实测资料点绘的,水文上称为累积频率
13、曲线。累积频率曲线。3.2.4 累积频率和重现期累积频率和重现期(1)累积频率和随机变量的关系)累积频率和随机变量的关系 水文特征值属于连续性随机变量水文特征值属于连续性随机变量 在分析水文系列的概率分布时,不用单个的随机变量(在分析水文系列的概率分布时,不用单个的随机变量(x=xi)的概率,而是用的概率,而是用xxi(或者(或者xxi )的)的概率概率P( xxi )(或者)(或者P( xxi )。)。 累计频率指等于或大于(等于或小于)某水文要素出现可能累计频率指等于或大于(等于或小于)某水文要素出现可能性的量度。性的量度。 一般在实际应用中,用样本的频率分析曲线代替总体系列的一般在实际应
14、用中,用样本的频率分析曲线代替总体系列的概率分布。概率分布。累积频率累积频率 样本足够大时,可以绘出累积频样本足够大时,可以绘出累积频率曲线。率曲线。 在一个确定的随机变量系列内,在一个确定的随机变量系列内,各个随机变量对应着一个累积频各个随机变量对应着一个累积频率值,随机变量的大小于累积频率值,随机变量的大小于累积频率成反比。率成反比。 工程上一般把累积频率为频率。工程上一般把累积频率为频率。 根据选用样本的不同,频率分为根据选用样本的不同,频率分为 年频率年频率和和次频率次频率。(2)重现期)重现期 重现期:指等于及大于(或等于及小于)一定数量级的水重现期:指等于及大于(或等于及小于)一定
15、数量级的水文要素出现一次的平均间隔年数,以该量级频率的倒数。文要素出现一次的平均间隔年数,以该量级频率的倒数。 当洪峰流量、洪水位、暴雨时,使用的设计频率当洪峰流量、洪水位、暴雨时,使用的设计频率P50%,则则 T=1/P 当研究枯水流量、枯水位时,设计频率当研究枯水流量、枯水位时,设计频率P常采用大于常采用大于50%的值,则的值,则 T=1/(1-P)(设计保证率)(设计保证率) 水文现象无固定的周期性。水文现象无固定的周期性。注意:注意:累积频率是指多年平均出现的机会;重现期则是平均累积频率是指多年平均出现的机会;重现期则是平均若干年出现一次,而不是固定的周期。若干年出现一次,而不是固定的
16、周期。 *年一遇年一遇 3.2.5 设计标准设计标准 水文现象具有明显的地区性和随机性,因而无法用水文特水文现象具有明显的地区性和随机性,因而无法用水文特征值出现的量值为工程设计的标准。征值出现的量值为工程设计的标准。 主管部门根据工程的规模、工程在国民经济中的地位以及主管部门根据工程的规模、工程在国民经济中的地位以及工程失事后果等因素,工程失事后果等因素,在各种工程设计规范中规定在各种工程设计规范中规定各种水各种水文特征值的设计频率文特征值的设计频率(或重现期或重现期)作为工程设计标准。作为工程设计标准。各地各地工程业务部门,根据当地实测的水文资料,通过水文分析工程业务部门,根据当地实测的水
17、文资料,通过水文分析计算,求出对应于设计频率的水文特征值,作为工程设计计算,求出对应于设计频率的水文特征值,作为工程设计的依据。的依据。3.3 经验频率曲线经验频率曲线3.3.1 经验频率公式经验频率公式我国目前采用的数学期望公式为:我国目前采用的数学期望公式为:当当m=1时,时,P=1/(n+1)当当T=100a, 则则 T=1/P=n+1=100mxm在在n项观测资料中按递减顺序排列的序号,即在项观测资料中按递减顺序排列的序号,即在n次次观测试验中大于或等于观测试验中大于或等于xm的次数的次数%1001nmP3.3.2 经验频率曲线的绘制和应用经验频率曲线的绘制和应用 如果有如果有n年的水
18、文资料。年的水文资料。1)将按时间顺序排列的实测资料按其数值大小进行递减顺序)将按时间顺序排列的实测资料按其数值大小进行递减顺序的排列。成的排列。成x1,x2,xn,对应序号,对应序号m为为1,2,n2)利用公式分别计算对应各个变量的经验频率。)利用公式分别计算对应各个变量的经验频率。3)以实测资料为变量)以实测资料为变量 作为纵坐标,以频率作为纵坐标,以频率P 为横坐标,在为横坐标,在坐标纸上点绘经验频率点距(坐标纸上点绘经验频率点距(Pi,xi),通过点群中心,目),通过点群中心,目估绘制一条光滑的曲线,该曲线为经验频率曲线。估绘制一条光滑的曲线,该曲线为经验频率曲线。4)根据工程设计指定
19、的频率,在该曲线上查出设计所需的相)根据工程设计指定的频率,在该曲线上查出设计所需的相应设计频率的水文数据。应设计频率的水文数据。 将某水文变量将某水文变量f 按递减顺序排列,排列中的序号不仅表示排列大按递减顺序排列,排列中的序号不仅表示排列大小的次序,而且也表示变量自大到小小的次序,而且也表示变量自大到小(大于或等于大于或等于)的累积次数。的累积次数。3.3.3 经验频率曲线的外延经验频率曲线的外延概率格纸概率格纸水平:正态曲线的概率分水平:正态曲线的概率分布制成分格制成的。布制成分格制成的。非正态曲线:两端曲线坡度非正态曲线:两端曲线坡度变缓,有利于曲线外延变缓,有利于曲线外延3.4 随机
20、变量的统计参数随机变量的统计参数 统计参数统计参数是反映随机变量系列数值大小、变化幅度、对称是反映随机变量系列数值大小、变化幅度、对称程度等情况的数量特征值,程度等情况的数量特征值,因而能反映水文现象基本的统因而能反映水文现象基本的统计规律,概括水文现象的基本特征和分布特点,也是进行计规律,概括水文现象的基本特征和分布特点,也是进行理论频率曲线估计的基础。理论频率曲线估计的基础。 统计参数有总体统计参数和样本统计参数。在水文学中主统计参数有总体统计参数和样本统计参数。在水文学中主要应用样本统计参数,来估计总体统计参数。要应用样本统计参数,来估计总体统计参数。 水文频率分析主要使用的统计参数包括
21、水文频率分析主要使用的统计参数包括 均值均值 变差系数变差系数 偏态系数偏态系数 矩矩 3.4.1 均值均值均值是反映随机变量系列平均情况的数。均值是反映随机变量系列平均情况的数。 加权平均法加权平均法 算术平均法算术平均法 若实测系列内各随机变量很少重复出现,可以不考虑若实测系列内各随机变量很少重复出现,可以不考虑出现次数的影响,用算术平均法求均值。出现次数的影响,用算术平均法求均值。 对于对于水文系列水文系列,一年内只选一个样或者几个样,水文特,一年内只选一个样或者几个样,水文特征值重复出现的机会很少,一般使用征值重复出现的机会很少,一般使用算术平均值算术平均值,若系列内出现了相同的水文特
22、征值,将相同值排在一起,若系列内出现了相同的水文特征值,将相同值排在一起,各占一个序号。各占一个序号。 niixnx11推求的是推求的是累积频率累积频率l 均值特性均值特性 平均数反映了随机变量的平均水平,代表整个随机变量系平均数反映了随机变量的平均水平,代表整个随机变量系列的水平高低,故又称数学期望。列的水平高低,故又称数学期望。 利用均值可以推求设计频率的水文特征值。利用均值可以推求设计频率的水文特征值。 利用均值表示各种水文特征值的空间分布情况,绘制成各利用均值表示各种水文特征值的空间分布情况,绘制成各种等值线图。种等值线图。l 模比系数模比系数 niixnx11xxKiiniinKnn
23、KKKK121113.4.2 均方差和变差系数均方差和变差系数 要反映整个系列的变化幅度,或者系列在均值两侧分要反映整个系列的变化幅度,或者系列在均值两侧分布的离散程度,需要使用布的离散程度,需要使用均方差和变差系数。均方差和变差系数。(1)均方差)均方差 为了避免一阶离差代数和为为了避免一阶离差代数和为0,一般取,一般取 的平均值的平均值的开方作为离散程度的计量标准,称为均方差。即:的开方作为离散程度的计量标准,称为均方差。即: 对于样本系列有下列修正公式:对于样本系列有下列修正公式: 2)(xxnxxsi2)(1)(2nxxsi 均方差表征的意义:表示分布函数的绝对离散程度。均方差表征的意
24、义:表示分布函数的绝对离散程度。均均方差越大,系列在均值两旁分布越分散,其值变化幅度方差越大,系列在均值两旁分布越分散,其值变化幅度越大;反之,依然。越大;反之,依然。【例例】 甲系列:甲系列:48,49,50,51,52 其均值其均值=50 ;56均值均值51 乙系列:乙系列:10,30,50,70,90 其均值其均值=50; 80均值均值55 经计算后甲系列的均方差经计算后甲系列的均方差s甲甲=1.58, s乙乙=31.4。 甲系列离散程度小,乙系列离散程度大。甲系列离散程度小,乙系列离散程度大。 例:平均值相同,例:平均值相同, 均方差不同进行比较。均方差不同进行比较。均方差小的均值代表
25、性好,均均方差小的均值代表性好,均方差大的系列均值代表性差方差大的系列均值代表性差(2)变差系数)变差系数 均方差不仅受到系列分布的影响,也与系列的水平有关。均方差不仅受到系列分布的影响,也与系列的水平有关。 变差系数变差系数又称离差系数或者离势系数,是一个又称离差系数或者离势系数,是一个系列的均方系列的均方差差与其与其均值均值的的比值比值 用模比系数带入上式有:用模比系数带入上式有:【例例】同上一例,计算得同上一例,计算得Cv甲甲=0.005, Cv乙乙=0.33,甲系列在均值两旁要集中,甲系列在均值两旁要集中,离散程度小离散程度小【例例】见教材见教材p50例例3.8【思考思考】一条河流上、
26、下游断面的年平均流量的一条河流上、下游断面的年平均流量的 Cv 值哪个大?为什么?值哪个大?为什么? 1)(12nxxxxsCiv1) 1(2nKCiv3.4.3 偏态系数偏态系数偏态系数:对系列在均值两旁的对称情况的反映。偏态系数:对系列在均值两旁的对称情况的反映。表达式表达式(对于样本系列):(对于样本系列):当当Cs=0时,系列在均值两旁对称分布;时,系列在均值两旁对称分布;当当Cs0属正偏分布;属正偏分布;当当Cs0属负偏分布;属负偏分布; 3333)3()1()3()(viisCnKsnxxC 一般认为没有上百年的资料,无法获得比较合理的一般认为没有上百年的资料,无法获得比较合理的C
27、s值。因此一般在实际计算中往往按照值。因此一般在实际计算中往往按照Cs和和Cv的经验关系确的经验关系确定。定。设计暴雨量:设计暴雨量: Cs=3.5 Cv设计最大流量:设计最大流量: Cv0.5 Cs=(23) Cv年径流及年降水:年径流及年降水: Cs=2 Cv3.5 理论频率曲线理论频率曲线 经验频率曲线的缺点:经验频率曲线的缺点:由于实测系列的项数较小,所绘经验频率曲线往往不能由于实测系列的项数较小,所绘经验频率曲线往往不能满足推求稀遇频率特征值的要求满足推求稀遇频率特征值的要求目估定线或外延会产生较大的误差。目估定线或外延会产生较大的误差。 需要借助某些数字形式的频率曲线作为定线和外延
28、需要借助某些数字形式的频率曲线作为定线和外延的依据。通常在实测资料中选取或者算的的依据。通常在实测资料中选取或者算的23个有代表性个有代表性的特征值作参数,并据此选配一些数学方程作为总体系的特征值作参数,并据此选配一些数学方程作为总体系列频率密度曲线的列频率密度曲线的假想数学模型假想数学模型,在按一定的方法确定,在按一定的方法确定累积频率曲线。这种用数学形式确定的、符合经验点据累积频率曲线。这种用数学形式确定的、符合经验点据分布规律的的曲线称为分布规律的的曲线称为理论频率曲线理论频率曲线【外延和内插的工外延和内插的工具具】 我国水文分析常用到的理论频率曲线有:皮尔逊我国水文分析常用到的理论频率
29、曲线有:皮尔逊型曲型曲线;特殊情况下也可以用指数线;特殊情况下也可以用指数分布曲线,对数分布曲线,对数分布分布曲线,极值分布曲线,对数正态分布和威布尔分布曲线。曲线,极值分布曲线,对数正态分布和威布尔分布曲线。理论频率曲线理论频率曲线皮尔逊皮尔逊型曲线型曲线 英国生物学家皮尔逊研究各种非正态的分布函数曲线形式,英国生物学家皮尔逊研究各种非正态的分布函数曲线形式,提出了提出了13种分布曲线类型,其中第种分布曲线类型,其中第III型被引入水文学中,型被引入水文学中,并被我国采纳。并被我国采纳。(1 1)皮尔逊)皮尔逊型曲线是型曲线是 一条一端有限、一条一端有限、 一端无限的不对称一端无限的不对称
30、单峰正偏曲线,单峰正偏曲线, 数学上常称数学上常称 伽玛分布。伽玛分布。 曲线特点:曲线特点: 只有一个众数只有一个众数 曲线的两端或一端以曲线的两端或一端以 横轴为渐近线横轴为渐近线 由此建立微分方程式求解得:由此建立微分方程式求解得:()的伽玛函数的伽玛函数 、 、a0分别为形状参数、尺度参数分别为形状参数、尺度参数 和位置参数。和位置参数。0, 0 。)(100)()()(axeaxxf 、 、a0一经确定,一经确定,PIII型密度函数随之确定。可以证明,型密度函数随之确定。可以证明,三参数与均值、三参数与均值、Cv、Cs有如下关系:有如下关系: 皮尔逊皮尔逊型频率曲线的密度函数可表示为
31、以型频率曲线的密度函数可表示为以 、Cv、Cs为为参数的函数参数的函数 y=f( , Cv ,Cs , x) 24sC)21 (0svCCxasvCCx2xx(2)皮尔逊皮尔逊型频率曲线及其绘制型频率曲线及其绘制 水文计算中,一般需要求出指定频率水文计算中,一般需要求出指定频率P所相应的随机所相应的随机变量取值变量取值xp,也就是通过对密度曲线进行积分,即,也就是通过对密度曲线进行积分,即: 求出等于及大于求出等于及大于xp的累积频率的累积频率P值。直接由上式计算值。直接由上式计算P值值非常麻烦,实际做法是通过变量转换,变换成下面的积分非常麻烦,实际做法是通过变量转换,变换成下面的积分形式形式
32、 dxeaxxxPxFpxaxp)(100)()()()(dCPpsp),()(vCxxx 离均系数离均系数 被积函数只含一个参数被积函数只含一个参数Cs。只要给定。只要给定Cs就可以算出就可以算出P和和p的对应值,最终制定出的对应值,最终制定出PCsp 的对应数值表。的对应数值表。(教材教材附录附录3) 如何来绘制如何来绘制 在频率计算中,现由已知的在频率计算中,现由已知的Cs查查值表得出不同频率下值表得出不同频率下P的离均系数的离均系数P,然后将,然后将P及已知的及已知的x,Cv带入下式,即可带入下式,即可求得对应于频率求得对应于频率P的水文特征值的水文特征值xp。 由不同的由不同的P及相
33、应的及相应的xp,可绘制出一条与参数相应的理论,可绘制出一条与参数相应的理论频率曲线频率曲线1)1(vppvppCKxCx理论频率曲线绘制的步骤如下:理论频率曲线绘制的步骤如下:1)由实测的资料,统计并计算)由实测的资料,统计并计算x,Cv2)确定)确定Cs3)由)由Cs查表,得不同的查表,得不同的P的离均系数的离均系数P值。值。4)求出)求出Kp5)由)由xp=Kpx,求不同,求不同P的的xp,在海森概率格纸上,以,在海森概率格纸上,以P为横为横坐标,坐标, xp为纵坐标,点绘理论点据(为纵坐标,点绘理论点据(P,xp),根据理论),根据理论点据分布趋势,目估并绘制一条光滑曲线点据分布趋势,
34、目估并绘制一条光滑曲线【例例3.9】见教材见教材p56。 均值对频率曲线的影响均值对频率曲线的影响当皮尔逊当皮尔逊型频率曲的两型频率曲的两个参数个参数Cv和和Cs不变时,由不变时,由于均值于均值 的不同,可以使频的不同,可以使频率曲线发生很大的变化。率曲线发生很大的变化。 (4 4)统计参数对频率曲线的影响)统计参数对频率曲线的影响a.Cv、Cs相同时,均值大的曲相同时,均值大的曲线位于均值小的曲线之上;线位于均值小的曲线之上; (与均值成正比关系与均值成正比关系)b.均值大的曲线较均值小的曲均值大的曲线较均值小的曲线陡。线陡。c.均值不同的理论频率曲线无均值不同的理论频率曲线无交点交点 为了
35、消除均值为了消除均值 的影响,以的影响,以模比系数模比系数K为变量绘制频率为变量绘制频率曲线,如图所示。图中曲线,如图所示。图中cs=1.0,cv=0时,随机变量时,随机变量的取值都等于均值,此时频的取值都等于均值,此时频率曲线即为率曲线即为k=1的一条水平的一条水平线,线,随着随着cv的增大,频率曲的增大,频率曲线的偏离程度也随之增大,线的偏离程度也随之增大,曲线显得越来越陡。曲线显得越来越陡。 不同不同Cv的曲线在的曲线在Kp=1的位置的位置处有交点处有交点变差系数对频率曲线的影响变差系数对频率曲线的影响偏态系数对频率曲线的影响偏态系数对频率曲线的影响 正偏情况下,正偏情况下,Cv相同时相
36、同时 ,Cs愈大,均值愈大,均值(即图中(即图中k=1)对应的频率愈对应的频率愈小,频率曲线小,频率曲线的中部愈向左的中部愈向左偏,且上段愈偏,且上段愈陡,下段愈平陡,下段愈平缓。缓。 3.6 抽样误差抽样误差 用一个样本的统计参数来代替总体的统计参数是存在一定用一个样本的统计参数来代替总体的统计参数是存在一定误差的,这种误差是由于从总体中随机抽取的样本与总体误差的,这种误差是由于从总体中随机抽取的样本与总体有差异而引起的,与计算误差不同,称为抽样误差。有差异而引起的,与计算误差不同,称为抽样误差。 抽样误差的大小由均方误差来衡量。计算均方误差的公式抽样误差的大小由均方误差来衡量。计算均方误差
37、的公式与总体分布有关。与总体分布有关。公式见教材公式见教材p61 公式公式3.31 抽样误差的大小,随样本项数抽样误差的大小,随样本项数 n、Cv和和Cs的大小而变化。的大小而变化。样本容量大,对总体的代表性就好,其抽样误差就小,这样本容量大,对总体的代表性就好,其抽样误差就小,这就是为什么在水文计算中总是想方设法取得较长的水文系就是为什么在水文计算中总是想方设法取得较长的水文系列的原因。列的原因。 3.7 水文频率分析方法水文频率分析方法水文频率计算的目的水文频率计算的目的,作为工程规划设计的依据。,作为工程规划设计的依据。 先在机率格纸上按经验频率公式点绘出水文系列的经验频率点,先在机率格
38、纸上按经验频率公式点绘出水文系列的经验频率点, 选定频率曲线线型,选定频率曲线线型, 取与经验点据拟合最佳的那条曲线和相应的参数,作为最终的取与经验点据拟合最佳的那条曲线和相应的参数,作为最终的计算结果。计算结果。确定最佳拟合频率曲线,可使用不同的准则,因而有不同的方法和确定最佳拟合频率曲线,可使用不同的准则,因而有不同的方法和结果。目前常用到的适线法有两种,包括结果。目前常用到的适线法有两种,包括经验适线法经验适线法和优化适线法。和优化适线法。(1)经验适线法(目估适线法)经验适线法(目估适线法) 根据实测资料和经验频率数学期望公式可以绘出一条经验根据实测资料和经验频率数学期望公式可以绘出一
39、条经验频率曲线,由皮尔逊频率曲线,由皮尔逊型频率密度曲线积分,可以绘出一型频率密度曲线积分,可以绘出一条理论频率曲线条理论频率曲线。由于统计参数有误差,两者不一定配合。由于统计参数有误差,两者不一定配合得好,得好,必须通过试算来确定合适的统计参数必须通过试算来确定合适的统计参数这种方法也这种方法也叫叫 本法是以经验频率点据为基础,给它们选配一条符合较好本法是以经验频率点据为基础,给它们选配一条符合较好的理论频率曲线,并以此来估计水文要素总体的统计规律。的理论频率曲线,并以此来估计水文要素总体的统计规律。具体步骤如下:具体步骤如下:(1)将审核过的实测资料由大到小排列,计算各项的经验频率,)将审
40、核过的实测资料由大到小排列,计算各项的经验频率,在频率格纸上点绘经验点据(纵坐标为变量的取值,横坐标为对在频率格纸上点绘经验点据(纵坐标为变量的取值,横坐标为对应的经验频率);应的经验频率);(2)计算均值、变差系数,假定偏态系数;)计算均值、变差系数,假定偏态系数;(3)确定线型(一般选用皮尔逊)确定线型(一般选用皮尔逊型型 ););(4)根据拟定的统计参数查表计算理论频率曲线纵坐标,绘理论)根据拟定的统计参数查表计算理论频率曲线纵坐标,绘理论频率曲线;频率曲线;(5)将此线画在绘有经验点据的图上,看与经验点据配合的情况)将此线画在绘有经验点据的图上,看与经验点据配合的情况 。若不理想,可通
41、过调整若不理想,可通过调整 统计参数重新点绘频率曲线。统计参数重新点绘频率曲线。(6)最后根据频率曲线与经验点据的配合情况,从中选出一条与)最后根据频率曲线与经验点据的配合情况,从中选出一条与经验点据配合较好的曲线作为采用曲线,相应于该曲线的参数便经验点据配合较好的曲线作为采用曲线,相应于该曲线的参数便看作是总体参数的估值看作是总体参数的估值。【例例】某站共有实测降水量资料某站共有实测降水量资料24年,求频率为年,求频率为10%和和90%的年降水量。的年降水量。 计算步骤为:计算步骤为: 1.将原始资按大小次序排列,列入表(将原始资按大小次序排列,列入表(4)栏。)栏。 2.计算经验频率计算经
42、验频率Pm =m/(n+1) 列入表(列入表(5)栏)栏,并与并与xm 对对应点绘于概率格纸上。幻灯片应点绘于概率格纸上。幻灯片 46 3.计算出多年的平均值为计算出多年的平均值为666.4mm,Cv=0.23 4.选定选定CV0.25,假定,假定CS0.50。查表得查表得P,求得,求得 xP x(PCV1)幻灯片)幻灯片 46 根据表中(根据表中(1)、()、(3)两栏的对应数值点绘曲线,发)两栏的对应数值点绘曲线,发 现曲线头部和尾部都偏于经验频率点据之下。现曲线头部和尾部都偏于经验频率点据之下。 5.改变参数,选定改变参数,选定CV0.30,CS0.75,查表计算出各,查表计算出各xP值
43、。值。 绘制频率曲线,该线与经验点据配合较好,取为最后绘制频率曲线,该线与经验点据配合较好,取为最后采用的频率曲线。采用的频率曲线。3.8 相关分析相关分析3.8.1 概述概述(1)相关分析的意义和应用)相关分析的意义和应用 自然界中有许多现象之间是有一定联系的。自然界中有许多现象之间是有一定联系的。 按数理统计法建立上述两个或多个随机变量之间的联按数理统计法建立上述两个或多个随机变量之间的联系,称之为近似关系或相关关系。把对这种关系的分系,称之为近似关系或相关关系。把对这种关系的分析和建立称为析和建立称为。(2)相关的种类)相关的种类 根据变量之间相互关系的密切程度,变量之间的关系有三种根据
44、变量之间相互关系的密切程度,变量之间的关系有三种情况:即完全相关、零相关、统计相关。情况:即完全相关、零相关、统计相关。 两变量两变量x 与与y 之间,如果每之间,如果每给定一个给定一个x 值,就有一个完值,就有一个完全确定的全确定的y 值与之对应,则值与之对应,则这两个变量之间的关系就这两个变量之间的关系就是是完全相关完全相关。 两变量之间毫无联系,或某一现象两变量之间毫无联系,或某一现象(变量)的变化不影响另一现象(变量)的变化不影响另一现象(变量)的变化,这种关系则称为(变量)的变化,这种关系则称为 零相关零相关 。 若两个变量之间的关系界于完全相关和零相关之间,则称为若两个变量之间的关
45、系界于完全相关和零相关之间,则称为统计相关统计相关。当只研究两个变量的相关关系时,称为。当只研究两个变量的相关关系时,称为简单相关简单相关;当研究当研究3 3个或个或3 3个以上变量的相关关系时,则称为个以上变量的相关关系时,则称为复相关复相关。在。在相关的形式上,又可分为相关的形式上,又可分为直线相关直线相关和和非直线相关非直线相关。 (3)相关分析的内容)相关分析的内容相关分析(或回归分析)的内容一般包括三个方面:相关分析(或回归分析)的内容一般包括三个方面: 判定变量间是否存在相关关系,若存在,计算其相关系数,判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度;以判
46、断相关的密切程度; 确定变量间的数量关系确定变量间的数量关系回归方程或相关线;回归方程或相关线; 根据自变量的值,预报或延长、插补倚变量的值,并对该根据自变量的值,预报或延长、插补倚变量的值,并对该估值进行误差分析估值进行误差分析。 3.8.2 简单直线相关简单直线相关(1)相关图解法)相关图解法 设设xi 和和yi 代表两系列的观代表两系列的观测值,共有测值,共有n 对,把对应值对,把对应值点绘于方格纸上,得到很多点绘于方格纸上,得到很多相关点。如果相关点的平均相关点。如果相关点的平均趋势近似直线,即可通过点趋势近似直线,即可通过点群中间及群中间及 、 点绘出相关直点绘出相关直线,线, xy
47、(2)相关分析法)相关分析法 直线回归方程直线回归方程 为避免相关图解法在定线上的任意性,常采用相关计算法为避免相关图解法在定线上的任意性,常采用相关计算法来确定相关线的方程,即回归方程。简直线相关方程的形来确定相关线的方程,即回归方程。简直线相关方程的形式为式为: 式中式中 x 自变量;自变量; y 倚变量;倚变量; a、b 待定常数待定常数。 待定常数待定常数a、b 由观测点与直线拟合最佳,通过最小二乘由观测点与直线拟合最佳,通过最小二乘进行估计。最后得到如下形式的回归方程进行估计。最后得到如下形式的回归方程: )()()(2xxxxyyxxyyiiii此式称为此式称为y 倚倚x 的回归方
48、程,它的图形称为的回归方程,它的图形称为y 倚倚x 的回归线,如的回归线,如前图(前图(a)线所示。若以)线所示。若以y 求求x ,则要应用,则要应用x 倚倚y 的回归方程,如的回归方程,如前图(前图(b)线所示,方程为将上式中)线所示,方程为将上式中x,y对调。对调。一般一般y 倚倚x 与与x 倚倚y 的两回归线并不重合,但有一个公共交点的两回归线并不重合,但有一个公共交点。 相关系数与回归系数相关系数与回归系数1)相关系数:反映两个变量之间关系的密切程度。)相关系数:反映两个变量之间关系的密切程度。222222)()()()()(yyxxyyxxyyxxaABiiiii相关系数越接近于相关
49、系数越接近于1 1,两变量间关系越密切。,两变量间关系越密切。2)回归系数:回归直线的斜率在回归方程中称为回归系数。)回归系数:回归直线的斜率在回归方程中称为回归系数。两个系列的均方差为两个系列的均方差为经整理有:经整理有:直线回归方程可以写成:直线回归方程可以写成:1)(1)(22nxxsnyysixiy22)()(xxyyssiixyxyssa)(xxssyyxy 相关分析的误差相关分析的误差1)回归线的误差)回归线的误差 回归线仅是观测回归线仅是观测点据的最佳配合线,点据的最佳配合线,通常观测点据并不完通常观测点据并不完全落在回归线上,而全落在回归线上,而是散布于回归线的两是散布于回归线的两旁。旁。 因此,回归线只反映两变量间的平均关系。按此关系由因此,回归线只反映两变量间的平均关系。按此关系由 推求的推求的 和实际值之间存在着误差,误差大小一般采用均方和实际值之间存在着误差,误差大小一般采用均方误差来表示。误差来表示。 如用如用Sy 表示表示y 倚倚x 回归线的均方误差,回归线的均方误差,yi 为观测值,为观测值,y为为回归
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业园区电梯井道安装项目合同
- 建材厂建设土石方施工协议
- 智慧城市项目延期还款协议
- 海洋工程投标质量保证承诺书
- 教育培训顾问服务合同
- 环卫推广瓦工施工合同范本
- 买卖超市车位协议范本
- 展览展示招投标文件移交
- 环保改造以此合同为准
- 矿山开采总价包干承诺书
- 4S店展厅改造装修合同
- 送货简易合同范本(2篇)
- 全国职业院校技能大赛赛项规程(高职)智能财税
- 七年级上册音乐教案 人音版
- 某小区住宅楼工程施工组织设计方案
- 3-4单元测试-2024-2025学年统编版语文六年级上册
- 北师版数学八年级上册 5.8三元一次方程组课件
- 2025届湖北省武汉市新洲一中阳逻校区高二上数学期末学业水平测试模拟试题含解析
- 眼镜验光员(高级)技能鉴定考试题及答案
- 企业单位消防安全规范化管理指导手册
- 小学高年级课后服务 scratch3.0编程教学设计 二阶课程 项目4趣味潜水艇 第4节 躲避障碍教学设计
评论
0/150
提交评论