版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
工程水文学第六章水文统计第一页,共一百零五页,2022年,8月28日6.2概率的基本概念
一、事件
事件是指随机试验的结果。
必然事件:如果可以断定某一事件在试验中必然发生,称此事件必然事件。
不可能事件:可以断定试验中不会发生的事件称为不可能事件。
随机事件:某种事件在试验结果中可以发生也可以不发生,这样的事件就称为随机事件。第二页,共一百零五页,2022年,8月28日二、概率
随机事件在试验结果中可能出现也可能不出现,但其出现(或不出现)可能性的大小则有所不同。为了比较这种可能性的大小,必须赋于一种数量标准,这个数量标准就是事件的概率。6.2概率的基本概念
第三页,共一百零五页,2022年,8月28日三、频率
水文事件不属古典概率事件,只能通过试验来估算概率。设事件在n次试验中出现了m次,则称
为事件A
的频率。
6.2概率的基本概念
第四页,共一百零五页,2022年,8月28日掷币试验出现正面的频率表
试验者掷币次数出现正面次数频率蒲丰404020400.5080皮尔逊1200060180.5016皮尔逊24000120140.5006在试验次数足够大的情况下,事件的频率和概率是十分接近的。
6.2概率的基本概念
第五页,共一百零五页,2022年,8月28日P(A+B)=P(A)+P(B)-P(AB)式中,P(A+B)-事件A与B之和的概率;
P(A)-事件A的概率;
P(B)-事件B的概率。
P(AB)-事件A和B共同发生的概率。四.概率加法定理和乘法定理1.概率加法定理
6.2概率的基本概念
第六页,共一百零五页,2022年,8月28日2、概率乘法定理
P(AB)=P(A)P(B/A)
=P(B)P(A/B)式中,P(A/B)-事件A在事件B已发生情况下的概率,简称为A的条件概率。P(B/A)-事件B在事件A已发生情况下的概率,简称为B的条件概率。对于两个独立事件:P(AB)=P(A)P(B)6.2概率的基本概念
第七页,共一百零五页,2022年,8月28日AB互斥P(AB)=0P(A+B)=P(A)+P(B)AB相容P(AB)=P(A)P(B/A)
=P(B)P(A/B)ABP(A)+P(B)=1P(A)=1-P(B)
P(B)=1-P(A)对立AB独立
P(AB)=P(A)P(B)
P(A/B)=P(A)
P(B/A)=P(B)第八页,共一百零五页,2022年,8月28日例:某地区位于河流甲与乙的汇合点。当任一河流泛滥时,该地区即被淹没,设在某时期内河流甲泛滥的概率为0.1,河流乙泛滥的概率为0.2;又知当河流甲泛滥时,河流乙泛滥的概率为0.3。求在该时期内这个地区被淹没的概率。又当河流乙泛滥时河流甲泛滥的概率?
第九页,共一百零五页,2022年,8月28日例:某地区位于河流甲与乙的汇合点。当任一河流泛滥时,该地区即被淹没,设在某时期内河流甲泛的概率为0.1,河流乙泛滥的概率为0.2;又知当河流甲泛滥时,河流乙泛滥的概率为0.3。求在该时期内这个地区被淹没的概率。又当河流乙泛滥时河流甲泛滥的概率?
解:记河流甲泛滥为事件A,河流乙泛滥为事件B。这个地区被淹没的概率为:
P(A+B)=P(A)+P(B)-P(AB)=P(A)+P(B)-P(B/A)P(A)=0.1+0.2-0.3×0.1
=0.27由于P(A/B)P(B)=P(B/A)P(A)
故当河流乙泛滥时,河流甲泛滥的概率为=0.3×0.1/0.2=0.15P(A/B)=P(B/A)P(A)/P(B)第十页,共一百零五页,2022年,8月28日6.3随机变量及其概率分布
一、随机变量
随机变量是表示随机试验结果的数量表示,随机变量可分为两大类型:离散型随机变量,连续型随机变量。水文随机变量一般指水文特征值,属于连续型随机变量。
第十一页,共一百零五页,2022年,8月28日
二、随机变量的概率分布
随机变量的取值与其概率有一定的对应关系,称为随机变量的概率分布,数理统计学上记为F(x)=P(X≤x),称为随机变量的概率分布函数。
水文统计中通常研究随机变量的取值大于某一个值的概率,F(x)=P(X>x)在水文统计学上也称此为随机变量的概率分布函数(或概率分布曲线)。
第十二页,共一百零五页,2022年,8月28日某雨量站的年雨量分布曲线0.60.40.211001000900800700x0.81.0P(X>x)第十三页,共一百零五页,2022年,8月28日若x=800mm,由分布曲线知P(X>800)=0.6,表明年雨量超过800mm的概率等于60%。
年雨量在800mm~900mm间的概率是多少呢?
这就要讨论的随机变量落在某区间(x,x+Δx)内的概率,可用下式表示:
P(x+Δx>X≥x)=F(x)-F(x+Δx)
从图3—1得:F(800)=0.60;F(900)=0.21
故:P(900>x≥800)=0.60-0.21=0.39
年雨量落在800mm至900mm之间的可能性是39%。
第十四页,共一百零五页,2022年,8月28日函数f(x)=-F’(x)为概率密度函数,简称为密度函数或密度曲线。
f(x)xf(x)dxdx概率密度函数第十五页,共一百零五页,2022年,8月28日f(x)x密度函数F(xp)=P(X>xp)xp第十六页,共一百零五页,2022年,8月28日f(x)xxp概率分布函数与密度函数关系
F(xp)=P(X>xp)F(x)F(xp)x第十七页,共一百零五页,2022年,8月28日三、随机变量的统计参数概率分布曲线完整地刻划了随机变量的统计规律。但在一些实际问题中,有时只要知道概率分布某些特征数值。这种以简便的形式显示出随机变量分布规律的某些特征数字称为随机变量的统计参数。
第十八页,共一百零五页,2022年,8月28日
统计参数有总体统计参数与样本统计参数之分。水文计算中常用的样本统计参数有均值、均方差、变差系数和偏态系数。
第十九页,共一百零五页,2022年,8月28日1.均值
均值表示系列中变量的平均情况。设某水文变量的观测系列(样本)为x1,x2,…,xn,则其均值为:第二十页,共一百零五页,2022年,8月28日令,称模比系数,则:
第二十一页,共一百零五页,2022年,8月28日2.均方差
均方差是反映系列中各变量集中或离散的程度。研究系列集中或离散程度,常采用方差或均方差,计算公式为第二十二页,共一百零五页,2022年,8月28日均方差对频率曲线的影响σ1σ2第二十三页,共一百零五页,2022年,8月28日3.离势系数(离差系数,变差系数)
例如:甲地区的年雨量分布,
=1200mm,均方差σ1=360mm;乙地区的年雨量分布,
=800mm,均方差σ2=320mm。尽管σ1>σ2,但是>,应从相对观点来比较这两个分布的离散程度。
采用一个无因次的数字来衡量分布的相对离散程度,称为离势系数
第二十四页,共一百零五页,2022年,8月28日4.偏态系数(偏差系数)
反映分布是否对称的特征CS参数,记为
用来表征分布不对称的情况。当密度曲线对EX对称,CS=0;若不对称,当正离差的立方占优时,CS>0,称为正偏;当负离差的立方占优势时,CS<0,称为负偏。
第二十五页,共一百零五页,2022年,8月28日Cs
>0Cs=0Cs
<0Cs对密度曲线的影响第二十六页,共一百零五页,2022年,8月28日
水文分析计算中使用的概率分布曲线俗称水文频率曲线,习惯上把由实测资料(样本)绘制的频率曲线称为经验频率曲线,而把由数学方程式所表示的频率曲线称为理论频率曲线。
第二十七页,共一百零五页,2022年,8月28日
所谓水文频率分布线型是指所采用的理论频率曲线(频率函数)的型式,目前不论哪种线型都缺乏物理依据,它的选择主要取决于与大多数水文资料的经验频率点据的拟合情况(皮尔逊III型分布)。第二十八页,共一百零五页,2022年,8月28日6.4.1分布线型6.4.1.1正态分布
概率密度函数形式:
式中,—平均数
σ—标准差
正态分布在误差估算时将会应用。
6.4水文频率计算
第二十九页,共一百零五页,2022年,8月28日正态分布密度曲线
f(x)68.3%第三十页,共一百零五页,2022年,8月28日6.4.1.2皮尔逊Ⅲ型分布
皮尔逊III型曲线为一端有限一端无限的不对称单峰曲线,概率密度函数
式中,α,β,a0-参数,且有:
第三十一页,共一百零五页,2022年,8月28日如果已知设计值xP,推求
xp
取决于p、α、β和αO四个数,并且当α、β、αO
三个参数为已知时,则xp只取决于p了。α、β、αO与分布曲线的EX,CV和CS有关,因此只要确定EX、CV和CS,xp仅与p有关,可以由p唯一地来计算xp。第三十二页,共一百零五页,2022年,8月28日P-3型分布的积分无解析解,实用中制表查用。
取标准化变量Ф(离均系数)
将之代入式(3—22)得
被积函数只含一个参数CS。只要给定CS就可以算出ФP和P的对应值,最终制定出ФP~Cs~p的对应数值表(表3-2)。
第三十三页,共一百零五页,2022年,8月28日由给定的CS及p从表3—2查出ФP,通过xP=(ФPCV+1)EX即可决定出xP。因此,已知EX,CV,CS就可求出与各种p值相应的xP值,也就可以绘制分布曲线或频率曲线。例如,已知某地年平均雨量EX=1000mm、CV=0.5、CS=1.0,求p=1%的设计年雨量。由CS=1.0,p=1%查得ФP=3.02,
X1%=(ФP
Cv+1)EX=(3.02×0.5+1)1000=2510(mm)CSp第三十四页,共一百零五页,2022年,8月28日
在频率计算时,由已知的Cs值,查Φ值表得出不同的P的Φ,然后利用已知的EX、Cv,通过Φ公式即可求出与各种P相应的x,从而可绘制出皮尔逊Ⅲ型频率曲线。
第三十五页,共一百零五页,2022年,8月28日
把频率曲线画在普通方格纸上,频率曲线的两端特别陡峭,又因图幅的限制,对于特小频率或特大频率,尤其是特大频率的点子很难点在图上。频率格纸,就能较好地解决这个问题,所以在频率计算时,一般都是把频率曲线点绘在频率格纸上。频率格纸第三十六页,共一百零五页,2022年,8月28日频率格纸(0.01,3.720),(50,0.000)第三十七页,共一百零五页,2022年,8月28日6.4.2频率曲线参数估算
在概率分布函数中包含有,CV,CS三个参数。为了唯一确定概率分布函数,就得估算这些参数。
一、样本估计总体
随机变量所取数值的全体称为总体,从总体中任意抽取的一部分称为样本,样本中所包括的项数称为样本容量。水文变量的总体是指自古迄今以至未来长远岁月所有的水文系列,是不知道的,需要靠观测到的样本去估计总体参数。现有的水文观测的系列可以当作总体的一个随机样本来处理。第三十八页,共一百零五页,2022年,8月28日随着样本容量的增即随着观测次数的增加,频率w就非常接近于概率p,经验分布曲线就非常接近于总体分布曲线。在某种程度上由样本的经验分布来推测总体分布,总体的参数就可以通过抽出的样本(观测的系列)
来加以估算。
第三十九页,共一百零五页,2022年,8月28日(
1)样本的均值X,即
(2)样本标准差S‘,即
(3)样本离势系数CV
‘,即
矩法公式第四十页,共一百零五页,2022年,8月28日(4)样本偏态系数CS
’
,即
只要掌握了样本,借助上列公式估计出参数;就可推出概率分布曲线,这种方法叫做矩法。注意:以上样本参数不等于总体参数!第四十一页,共一百零五页,2022年,8月28日第四十二页,共一百零五页,2022年,8月28日原矩法公式得出的S‘,CV
‘,和CS
’并不是无偏估计量,目前水文上采用的是经修正后的矩法公式:
第四十三页,共一百零五页,2022年,8月28日第四十四页,共一百零五页,2022年,8月28日
用一个样本的统计参数来代替总体的统计参数是存在一定误差的,这种误差是由于从总体中随机抽取的样本与总体有差异而引起的,与计算误差不同,称为抽样误差。抽样误差第四十五页,共一百零五页,2022年,8月28日第四十六页,共一百零五页,2022年,8月28日第四十七页,共一百零五页,2022年,8月28日第四十八页,共一百零五页,2022年,8月28日第四十九页,共一百零五页,2022年,8月28日第五十页,共一百零五页,2022年,8月28日第五十一页,共一百零五页,2022年,8月28日第五十二页,共一百零五页,2022年,8月28日一、经验频率
根据实测水文资料,按从大到小的顺序排列,然后用经验频率公式计算系列中各项的频率,称为经验频率。以水文变量x为纵坐标,以经验频率P为横坐标,点绘经验频率点据,根据点群趋势绘出一条平滑的曲线,称为经验频率曲线。6.4.2.2适线法第五十三页,共一百零五页,2022年,8月28日
经验频率的计算
目前我国水文计算广泛采用的是数学期望公式:式中p-等于和大于xm的经验频率;m-xm的序号,即等于或大于xm的项数;n-系列的总项数。第五十四页,共一百零五页,2022年,8月28日某地年降雨量经验分布曲线
020406080100p(%)
x
1200
1000
800二、经验频率曲线
p(X≥xi)=i/n+1
第五十五页,共一百零五页,2022年,8月28日经验频率曲线存在的问题
经验频率曲线计算工作量小,绘制简单,查用方便,但受实测资料所限,往往难以满足设计上的需要。为此,提出用理论频率曲线来配合经验点据,这就是水文频率计算适线法。第五十六页,共一百零五页,2022年,8月28日
频率这个词比较抽象,为便于理解,有时采用重现期这个词。所谓重现期是指某随机变量的取值在长时期内平均多少年出现一次,又称多少年一遇。
在工程水文中,重现期用字母T表示,一般以年为单位。频率与重现期的关系第五十七页,共一百零五页,2022年,8月28日第五十八页,共一百零五页,2022年,8月28日第五十九页,共一百零五页,2022年,8月28日第六十页,共一百零五页,2022年,8月28日第六十一页,共一百零五页,2022年,8月28日第六十二页,共一百零五页,2022年,8月28日(6)今后10年内不发生超标准洪水的概率(7)今后10年内发生超标准洪水的概率(8)今后10年内堤防受破坏的概率第六十三页,共一百零五页,2022年,8月28日三、目估适线法
根据经验频率分布点据,找出与之配合最佳的频率曲线,其相应的分布参数,作为总体分布参数的估计值。
第六十四页,共一百零五页,2022年,8月28日(1)点绘经验点据纵坐标为变量值,横坐标为经验频率,采用期望值公式估计。
(2)初定一组参数用矩法公式的估算EX和CV,并假定CS与CV的比值K估算CS
。
(3)根据初定的EX、CV和CS,计算频率曲线,并绘在点有经验点据的图上。若与经验点据配合不理想,则修改参数再次配线,主要调整CV以及CS
。
(4)选择一条与经验点据配合最佳曲线作为采用曲线。该曲线的参数看作总体参数的估计值。
计算步骤:
第六十五页,共一百零五页,2022年,8月28日为了避免修改参数的盲目性,需要了解参数对频率曲线的影响。
由频率曲线图可明显看出,CV值愈大,曲线愈陡;当CS增大时,曲线上段变陡而下段趋于平缓。
配线法采用了概率格纸,以正态分布曲线成直线来划分概率坐标的。当CS=0,频率曲线在概率纸上为一直线。其特点是横坐标的两端分格较稀而中间较密,纵坐标为均匀分格或对数分格。这样,曲线两端的坡度变缓,使用起来比较方便。
第六十六页,共一百零五页,2022年,8月28日某站年降水量频率计算表
某站共有实测降水量资料24年,求频率为10%和90%的年降水量。
(1)将原始资按大小次序排列,列入表(4)栏。
(2)按期望值公式计算经验频率,列入表(5)栏。并将X与P对应点绘于概率格纸上。
第六十七页,共一百零五页,2022年,8月28日(3)用矩法计算系列的多年平均降水量和离差系数。
第六十八页,共一百零五页,2022年,8月28日(4)选定CV=0.30,并假定CS=2CV=0.60查表3-2得φP,求得xP
=(φPCV+1),如表(3)栏。根据表中(1)、(3)两栏的对应数值点绘曲线,发现曲线头部和尾部都偏于经验频率点据之下。
(5)改变参数,重新配线。因为曲线头尾部偏低,故需增大CS,CV=0.30不变,CS=3CV=0.90,查算出各xP值,列入表(4)、(5)栏,点绘后曲线的头部和尾部反而有些偏离,配线仍不理想。
第六十九页,共一百零五页,2022年,8月28日(6)再次改变参数,第三次配线。把CS稍微调小一些。选定CV=0.30,CS=2.5CV=0.75,查表计算出各xP值,列入表(6)、(7)栏中。绘制频率曲线,该线与经验点据配合较好,取为最后采用的频率曲线。
(7)求得p=10%的年降水量为933mm,p=90%的年降水量为433mm。
第七十页,共一百零五页,2022年,8月28日第七十一页,共一百零五页,2022年,8月28日频率曲线选配计算表第七十二页,共一百零五页,2022年,8月28日第七十三页,共一百零五页,2022年,8月28日
适线法得到的成果仍具有抽样误差,而这种误差目前还难以精确估算,因此对于工程上最终采用的频率曲线及相应的统计参数,不仅要从水文统计方面分析,而且还要密切结合水文现象的物理成因及地区规律进行综合分析。第七十四页,共一百零五页,2022年,8月28日一、相关关系的概念1.相关的意义与应用
按数理统计法建立上述两个或多个随机变量之间的联系,称之为相关关系。把对这种关系的分析和建立称为相关分析。
水文上用相关分析可以延长和插补短系列,使水文资料满足代表性要求。
相关分析第七十五页,共一百零五页,2022年,8月28日第七十六页,共一百零五页,2022年,8月28日第七十七页,共一百零五页,2022年,8月28日第七十八页,共一百零五页,2022年,8月28日3.相关分析的内容
(1)判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度;
(2)确定变量间的数量关系――回归方程或相关线;
(3)根据自变量的值,预报或延长、插补倚变量的值,并对该估值进行误差分析。
第七十九页,共一百零五页,2022年,8月28日二、直线相关
1.相关图解法
设xi
和yi
代表两系列的观测值,共有n对,把对应值点绘于方格纸上,如果相关点的平均趋势近似直线,即可通过点群中间及(,)点绘出相关直线,说明变量x与y为线性相关,满足方程:
y=a+bx
第八十页,共一百零五页,2022年,8月28日某
流
域
年
降
雨
径
流
资
料
年份年雨量X年径流Y19542014136219551211728195617281369195711576951958125772019591029534196013067781961102933719621316809196313569291964126679619651052383第八十一页,共一百零五页,2022年,8月28日第八十二页,共一百零五页,2022年,8月28日2.相关计算法
为避免相关图解法在定线上的任意性,常采用相关计算法来确定相关线的方程,即回归方程。直线相关方程的形式为:y=a+bx
式中x
――自变量;
y
――倚变量;
a、b―待定常数。
第八十三页,共一百零五页,2022年,8月28日第八十四页,共一百零五页,2022年,8月28日第八十五页,共一百零五页,2022年,8月28日第八十六页,共一百零五页,2022年,8月28日第八十七页,共一百零五页,2022年,8月28日第八十八页,共一百零五页,2022年,8月28日若以y求x,则要应用x倚y的回归方程。x倚y的回归方程为:
一般y倚x与x倚y的两回归线并不重合,但有一个公共交点()。第八十九页,共一百零五页,2022年,8月28日某流域年降雨径流资料年份年雨量X年径流Y19542014136219551211728195617281369195711576951958125772
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宁夏中卫市(2024年-2025年小学五年级语文)统编版阶段练习(上学期)试卷及答案
- 中纤板购销合同范本
- 特价活动合同范本
- 电器范本合同范本
- 政府项目保密管理制度
- 房屋建设合同范本格式
- 邢台学院《小学语文课标解读与教材分析》2022-2023学年第一学期期末试卷
- 邢台学院《现代教育技术在生物学教学中的应用》2023-2024学年第一学期期末试卷
- 邢台学院《外国法制史》2022-2023学年第一学期期末试卷
- 邢台学院《数据结构实验》2021-2022学年期末试卷
- 人工智能训练师(中级数据标注员)理论考试题库大全(含答案)
- 手机综合症小品台词
- 偏差管理控制程序
- 供应商现场审核评分表(详细)
- 客户信息登记表
- 二手车复习题终极版本
- 毕业设计说明书螺旋精确称重给料机设计
- 十大危险作业
- 组织文化研究文献综述
- 停电施工专项施工方案(π接
- 高三地理一模成绩分析
评论
0/150
提交评论