水文统计原理_第1页
水文统计原理_第2页
水文统计原理_第3页
水文统计原理_第4页
水文统计原理_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、桥桥 涵涵 水水 文文Hydrology for Bridge and Culvert Engineering长沙理工大学水利工程学院长沙理工大学水利工程学院盛丰(博士,讲师)盛丰(博士,讲师)Telmail:第三章第三章 水文统计原理水文统计原理长沙理工大学水利工程学院长沙理工大学水利工程学院盛丰(博士,讲师)盛丰(博士,讲师)Telmail:水文统计水文统计(hydrological statistics ):用概率论和用概率论和数理统计学的原理和方法研究水文事件随机规律数理统计学的原理和方法研究水文事件随机规律的技术途径的技术途径内容:

2、内容:3.1 水文现象的特征和分析方法水文现象的特征和分析方法3.2 几率和频率几率和频率3.3 频率分布频率分布3.4 经验频率曲线经验频率曲线3.5 统计参数统计参数3.6 理论频率曲线理论频率曲线3.7 相关分析相关分析3.1 水文现象的特征和分析方法水文现象的特征和分析方法1. 水文现象的特征水文现象的特征(1) 周期性周期性(Periodicity ) 原因:原因:地球的自转、公转和月亮围绕地球的公转地球的自转、公转和月亮围绕地球的公转。(2) 地区性地区性(regionality) 原因:原因:影响水文过程的因素(如气候、地理和流影响水文过程的因素(如气候、地理和流域特征)具有地区

3、性。域特征)具有地区性。(3) 随机性随机性(stochasticity) 原因:原因:水文过程的影响因素多、关系复杂,各因水文过程的影响因素多、关系复杂,各因素自身就不由很高的不确定性。素自身就不由很高的不确定性。2. 水文现象的分析方法水文现象的分析方法(1) 成因分析法:成因分析法:由观测资料,从物理成因上研究由观测资料,从物理成因上研究水文变化规律,只定性分析,在定量上不能满足工水文变化规律,只定性分析,在定量上不能满足工程设计要求。程设计要求。(2) 地区归纳法(地理综合法):地区归纳法(地理综合法):由地区经验公式由地区经验公式和等值线图分析,揭示水文现象的地区分布规律。和等值线图

4、分析,揭示水文现象的地区分布规律。(3) 数理统计法:数理统计法:运用概率统计理论对长期观测的运用概率统计理论对长期观测的资料进行统计计算,以寻求其规律性。资料进行统计计算,以寻求其规律性。在解决实际问题时,上述三种方法常同时使用,它在解决实际问题时,上述三种方法常同时使用,它们是相辅相成、互为补充。我国已初步形成一种具们是相辅相成、互为补充。我国已初步形成一种具有自己特点的研究方法,概括为有自己特点的研究方法,概括为“多种方法,综合多种方法,综合分析,合理选定分析,合理选定”的原则。的原则。3.2 几率和频率几率和频率3.2.1 随机事件随机事件水文现象都属于随机事件。水文现象都属于随机事件

5、。事件分类事件分类1.必然事件必然事件2.不可能事件不可能事件3.随机事件随机事件事件:在一定条件下发生的事情。事件:在一定条件下发生的事情。p随机变量随机变量:表示随机事件各次试验结果的实数值:表示随机事件各次试验结果的实数值变量。变量。p随机变量分类随机变量分类1.连续型随机变量连续型随机变量2.离散型随机变量离散型随机变量p随机变量系列(系列):随机变量可以取的一系随机变量系列(系列):随机变量可以取的一系列数值。列数值。大多数水文现象大多数水文现象3.2.2 随机变量随机变量3.2.3 几率与频率几率与频率 式中:式中:m随机事件随机事件A出现的总次数。出现的总次数。 n试验结果的总数

6、。试验结果的总数。p简单随机事件:若试验的可能结果是有限的,而简单随机事件:若试验的可能结果是有限的,而且所有事件出现的可能性都相等。且所有事件出现的可能性都相等。p1.几率几率(机率、概率):随机变量客观上出现的可能(机率、概率):随机变量客观上出现的可能性。性。p2.频率频率:在:在n次重复的随机试验中,事件次重复的随机试验中,事件A实际出实际出现的次数现的次数f与试验总次数与试验总次数n的比值,称为事件的比值,称为事件A的频的频率。率。简单随机事件的概率:简单随机事件的概率:( )mP An( )fW An3 . 几率几率(probability)与频率与频率(frequency)之间的

7、关系之间的关系( )fW Anlim( )( )nW AP Ap用用实测样本实测样本的的频率特性频率特性来分析推论来分析推论事件总体事件总体的的概概率特性率特性,是数理统计方法的基本原理。,是数理统计方法的基本原理。3.2.4 总体和样本总体和样本p2.样本样本:从总体中随机抽取的一部分试验结果值,:从总体中随机抽取的一部分试验结果值,称为随机变量的样本。称为随机变量的样本。p总体分类总体分类1.有限总体有限总体2.无限总体无限总体p1.总体总体:随机变量所有可取试验结果的全体。:随机变量所有可取试验结果的全体。p样本容量:样本的数目。样本容量:样本的数目。p抽样:从总体中抽取样本。抽样:从总

8、体中抽取样本。大多数水文现象的总体大多数水文现象的总体3.3 频率分布频率分布随机变量可以取得所有可能值中的任何一个值,但取随机变量可以取得所有可能值中的任何一个值,但取得某一可能值的机会并不相同,有的机会大,有的得某一可能值的机会并不相同,有的机会大,有的机会小。也就是说机会小。也就是说随机变量是以一定的频率来出现随机变量是以一定的频率来出现的。的。即即随机变量的取值与其频率之间有一定的对应随机变量的取值与其频率之间有一定的对应关系关系。一般将随机变量与其出现频率之间的对应关系称为随一般将随机变量与其出现频率之间的对应关系称为随机变量的频率分布规律,简称为机变量的频率分布规律,简称为频率分布

9、频率分布。3.3.1 频率分布频率分布3.3.2 累积频率与重现期累积频率与重现期1.累积频率累积频率:在:在n次重复随机试验中,大于等于某量次重复随机试验中,大于等于某量值累计出现的次数与总次数的比值。值累计出现的次数与总次数的比值。)()(xXPxF 频率频率密度密度曲线一般为曲线一般为“铃形铃形”。 频率频率分布分布曲线通常呈曲线通常呈“倒倒S形形”。2.重现期重现期:水文破坏事件在长时期观测中可能再现:水文破坏事件在长时期观测中可能再现的平均时间间隔,单位为年。的平均时间间隔,单位为年。1TP若已知大于某洪峰流量的累积频率为若已知大于某洪峰流量的累积频率为P 破坏率:破坏率:建筑物每年

10、遭到洪水破坏的可能性,建筑物每年遭到洪水破坏的可能性,P 安全率:安全率:建筑物每年正常运行的可能性,建筑物每年正常运行的可能性,1P 保证率:保证率:在在n年内保持正常运行的可能性。年内保持正常运行的可能性。(1-P)n 风险率:风险率:在在n年内遭到破坏的可能性。年内遭到破坏的可能性。1(1-P)n当确定设计洪峰流量或水位当确定设计洪峰流量或水位xi时,时, 破坏率:破坏率: 破坏事件破坏事件(Xxi)的重现期:的重现期:当确定设计枯水位或年最小流量当确定设计枯水位或年最小流量xi时,时, 安全率:安全率: 破坏率:破坏率: 破坏事件破坏事件(X100,可由设计频率,可由设计频率(横坐标横

11、坐标)查得设计值查得设计值(纵坐纵坐标标)1niif11()1miimmmiifPP Xxf1mmPn2. 例题例题3.4.3 水文经验累积频率曲线的外延水文经验累积频率曲线的外延设计洪水流量都是设计洪水流量都是小频率小频率的的特大洪水流量特大洪水流量。一般情况下。一般情况下,实测洪水资料的年份有限,为了求设计洪水流量,实测洪水资料的年份有限,为了求设计洪水流量,必须将经验频率曲线必须将经验频率曲线外延外延。由于经验频率曲线呈由于经验频率曲线呈S形,形,两端陡中间平缓两端陡中间平缓。求很小频。求很小频率的设计流量需率的设计流量需向左端上方外延向左端上方外延,这样可能产生很大,这样可能产生很大的

12、误差。的误差。 海森海森(A.Hazen,1913)频率格纸频率格纸 主要特点:使正态分布的分布曲线主要特点:使正态分布的分布曲线(频率曲线频率曲线)在坐标在坐标纸上呈一条直线。纸上呈一条直线。 频率为横坐标,以频率为横坐标,以P50为中心对称分格,中间格为中心对称分格,中间格密而两边渐疏;密而两边渐疏; 随机变量随机变量(流量、降雨量、潮水位等流量、降雨量、潮水位等)为纵坐标,均匀为纵坐标,均匀分格或对数分格。分格或对数分格。 利用实测流量资料推利用实测流量资料推求桥涵的设计流量时求桥涵的设计流量时,往往需要将频率曲,往往需要将频率曲线的头部外延很远,线的头部外延很远,采用海森机率格纸,采用

13、海森机率格纸,仍有较大的任意性,仍有较大的任意性,同样会产生很大的误同样会产生很大的误差。差。 显然,仍不能满足水显然,仍不能满足水文计算的要求,必须文计算的要求,必须进一步寻求绘制和外进一步寻求绘制和外延频率曲线的方法。延频率曲线的方法。例:某水文站有例:某水文站有22年不连续的年最大流量资料,列年不连续的年最大流量资料,列于表于表25第第3栏,试绘制该站的经验频率曲线,栏,试绘制该站的经验频率曲线,并目估延长,推求洪水频率为并目估延长,推求洪水频率为2、1和和0.33的流量。的流量。例:例:某水文站有某水文站有22年不连续的年最大流量资料,列于表年不连续的年最大流量资料,列于表25第第3栏

14、,试绘制该站的经验频率曲线,并目估延长,推栏,试绘制该站的经验频率曲线,并目估延长,推求洪水频率为求洪水频率为2、1和和0.33的流量。的流量。把历年的年最大流量资料,按大小递减次序排列,如表把历年的年最大流量资料,按大小递减次序排列,如表25第第5栏;栏;采用维泊尔公式计算各项流量的经验频率采用维泊尔公式计算各项流量的经验频率P,列入表,列入表25第第6栏。栏。然后,按表中经验频率和流量数值,在海森机率格纸上绘然后,按表中经验频率和流量数值,在海森机率格纸上绘出经验频率点,如图出经验频率点,如图25中的圆点;中的圆点;再依点群的趋势描绘成一条圆滑的曲线,如图中的细实线再依点群的趋势描绘成一条

15、圆滑的曲线,如图中的细实线,就是该水文站的经验频率曲线;,就是该水文站的经验频率曲线;将经验频率曲线向上延长将经验频率曲线向上延长(图图25中的细虚线中的细虚线),可由图中,可由图中直接读出所求洪水频率的流量直接读出所求洪水频率的流量32%31%30.33%3180/3420/3800/QmsQmsQms统计参数统计参数反映随机变量的特征反映随机变量的特征均值均值 、中值、中值 、众值、众值数值大小数值大小均方差均方差 、变差系数、变差系数离均程度离均程度偏差系数偏差系数对均值的对称性对均值的对称性3.5 统计参数统计参数xsCzxcxvC3.5.1 均值、中值、众值均值、中值、众值1. 均值

16、均值:(1)加权平均法)加权平均法 设有一实测系列由设有一实测系列由x1,x2,xn组成,各个随机变量出现的组成,各个随机变量出现的次数分别为次数分别为f1,f2, ,fn,则系列均值为则系列均值为: 式中式中N样本系列的总项数样本系列的总项数N=f1+f2+fn。(2)算术平均法)算术平均法 若实测系列内各随机变量很少重复出现,可以不考虑出若实测系列内各随机变量很少重复出现,可以不考虑出现次数的影响,用算术平均法求均值。现次数的影响,用算术平均法求均值。 式中式中 n样本系列的项数。样本系列的项数。1 1111nnniiinx fx fxx fffN11niixxn2. 模比系数(变率)模比

17、系数(变率)K 系列中各个变量与均值的比值。系列中各个变量与均值的比值。 而且而且iixKx1niiKn1(1)0niiKiiQKQ11niiQQn3. 中值中值(中位数中位数)系列中的随机变量为等权时,按大小递减次序排列,系列中的随机变量为等权时,按大小递减次序排列,位置居位置居于正中间于正中间的那个变量。的那个变量。也就是几率为也就是几率为50的变量,恰好平分密度曲线以下的面积。的变量,恰好平分密度曲线以下的面积。cx、 x1( )( )2ccxxf x dxf x dxzx x、4. 众值众值系列中系列中出现次数最多出现次数最多的那个变量。也就是系列中的那个变量。也就是系列中几率最大几率

18、最大的的变量。变量。3.5.2 均方差、变差系数均方差、变差系数1. 离均差(离差):离均差(离差):12() ()()nxxxxxx、 、2. 均方差(标准差)均方差(标准差) 离均差平方和的平均数的平方根。离均差平方和的平均数的平方根。 对于对于样本样本系列应采用下列修正公式系列应采用下列修正公式 22211(nniiiixxxxnn)仅适用于总体仅适用于总体21(1niixxn)适用于样本适用于样本例:例:甲系列:甲系列:10 50 90 乙系列:乙系列:49 50 51 均值都为均值都为50。 甲甲40 乙乙13.变差系数(离差系数,离势系数)变差系数(离差系数,离势系数) 甲地区的年

19、雨量分布,甲地区的年雨量分布,EX11200mm,标准差,标准差1360mm;乙地区的年雨量分布,;乙地区的年雨量分布,EX2800mm,标准差,标准差2320mm。尽管。尽管12,但是,但是 EX1 EX2,应从相对观点,应从相对观点来比较这两个分布的离散程度。来比较这两个分布的离散程度。 采用一个无因次的数字(采用一个无因次的数字(均方差与均值的比值均方差与均值的比值)来衡量)来衡量分布的相对离散程度,称为分布的相对离散程度,称为变差系数变差系数均值相同,均方差越小,均值的代表性就越强。均值相同,均方差越小,均值的代表性就越强。均值不同,均方差就不足以说明离散程度的大小。均值不同,均方差就

20、不足以说明离散程度的大小。变差系数(离差系数,离势系数)变差系数(离差系数,离势系数) 或或 对上题,算得两个地区年雨量的变差系数,对上题,算得两个地区年雨量的变差系数,CV1360/1200=0.30,CV2=320/8000.40。说明甲地区的年雨。说明甲地区的年雨量离散程度较乙地区的为小。量离散程度较乙地区的为小。 21(11niivKCn)21(11niivxxCnxx)211niivKnCn3.5.3 偏差系数(偏态系数)偏差系数(偏态系数)反映分布对均值是否对称的特征参数,记为反映分布对均值是否对称的特征参数,记为CS。如果不对称,。如果不对称,是大于均值的数出现的多是大于均值的数

21、出现的多,还是小于的多还是小于的多 1.当密度曲线对当密度曲线对EX对称,对称,CS0,为正态分布;,为正态分布; 2.若不对称,当正离差(离均差)的立方占优时,若不对称,当正离差(离均差)的立方占优时,CS0,称,称为为正偏(左偏)正偏(左偏); 3.当负离差的立方占优势时,当负离差的立方占优势时,CS 0,称为,称为负偏(右偏)负偏(右偏)。 3311333(nniiiisvxxxxCnnx C)适用于总体适用于总体33113331(3)(3)nniiiisvvxxKCnCnx C适用于样本适用于样本3.5.4 统计参数与频率分布曲线的关系统计参数与频率分布曲线的关系1.均值对频率曲线的影

22、响均值对频率曲线的影响 2. 变差系数变差系数Cv对频对频率曲线的影响率曲线的影响p为了避免修改参数的盲为了避免修改参数的盲目性,需要了解参数对目性,需要了解参数对频率曲线的影响。频率曲线的影响。由频率曲线图可明显看由频率曲线图可明显看出,出,CV值愈大,曲线值愈大,曲线愈陡愈陡。p若曲线左端偏低而右端若曲线左端偏低而右端偏高,则应增大偏高,则应增大CV值值。3. 偏态系数偏态系数Cs对频率曲线对频率曲线的影响的影响p由频率曲线图可明显看出,当由频率曲线图可明显看出,当CS增大增大时,曲线时,曲线上段变陡上段变陡而而下下段趋于平缓段趋于平缓。若理论频率曲线左端和右端都若理论频率曲线左端和右端都

23、偏低,则应增大偏低,则应增大CS p配线法采用了概率格纸,以正配线法采用了概率格纸,以正态分布曲线成直线来划分概率态分布曲线成直线来划分概率坐标的。当坐标的。当CS0,频率曲线在,频率曲线在概率纸上为一直线。其特点是概率纸上为一直线。其特点是横坐标的两端分格较稀而中间横坐标的两端分格较稀而中间较密,纵坐标为均匀分格或对较密,纵坐标为均匀分格或对数分格。这样,曲线两端的坡数分格。这样,曲线两端的坡度变缓,使用起来比较方便度变缓,使用起来比较方便。3.6 水文理论频率曲线水文理论频率曲线p1. 理论频率曲线理论频率曲线 根据自然界大量实际资料的频率分布趋势,很多根据自然界大量实际资料的频率分布趋势

24、,很多学者建立了一些频率曲线的线形,并选配了相应学者建立了一些频率曲线的线形,并选配了相应的数学函数式。这种具有一定数学函数式的频率的数学函数式。这种具有一定数学函数式的频率曲线,习惯上称为曲线,习惯上称为理论频率曲线理论频率曲线。p2. 皮尔逊皮尔逊型曲线型曲线 理论频率曲线的线形很多,适合于水文现象的也理论频率曲线的线形很多,适合于水文现象的也不少。根据我国多年使用经验,认为不少。根据我国多年使用经验,认为皮尔逊皮尔逊型型曲线(曲线(Pearson-)比较符合我国多数地区水文现比较符合我国多数地区水文现象的实际情况。象的实际情况。3.6.1 水文理论频率曲线水文理论频率曲线p2. 皮尔逊皮

25、尔逊型曲线型曲线 是类似于铃形的曲线,这种曲线有两个特点:是类似于铃形的曲线,这种曲线有两个特点: (1)只有一个众数;)只有一个众数; (2)曲线的两端或一端以横轴为渐近线。)曲线的两端或一端以横轴为渐近线。0()10( )()( )x ayf xxaeSVCCx、svsvsCCxaCCxC212402式中三个参数与总体式中三个参数与总体 的关系的关系皮尔逊皮尔逊型频率密度曲线:型频率密度曲线:实际上实际上( , )vsyy x C C x0()10()()( )()( )ppppxx axPP XxF xf x dxxaedx皮尔逊皮尔逊型频率曲线:型频率曲线:皮尔逊皮尔逊型频率曲线的方程

26、:型频率曲线的方程:1PPvPxKCx 式中:式中:xP频率为频率为P的随机变量设计值;的随机变量设计值; P离均系数,离均系数, 可查离均系数表可查离均系数表3-6-1; KP模比系数,模比系数,( ,)Psf P C 3.6.2 皮尔逊皮尔逊型曲线的应用型曲线的应用(1)PVPPxCxK x1PPPVVxxKxCC (1)PVPPQCQK Q000,0221svvsaxCCCaxCmin221vvsCCCK皮尔逊皮尔逊型频率曲线的参数型频率曲线的参数Cs物理条件:物理条件:min00minmin22(1)1vvssxaCCaxCCKKminx=xa0总体最小值,总体最小值,xmin样本最小

27、值样本最小值注意:当注意:当Cs2时,时,皮尔逊皮尔逊型频率曲线型频率曲线将不呈铃形而为单调将不呈铃形而为单调的的乙字形乙字形例例1例例2 由由样本样本参数估计参数估计总体总体参数总会出现误差,称为参数总会出现误差,称为抽样误差抽样误差。 例如,就样本平均值而言,各个样本平均值的抽样误差例如,就样本平均值而言,各个样本平均值的抽样误差当然是不同的,有的大,有的小。由于当然是不同的,有的大,有的小。由于EX是未知的,对是未知的,对某一样本平均值的抽样误差无法求得。某一样本平均值的抽样误差无法求得。 样本平均数的抽样误差与其样本平均数抽样分布有关,样本平均数的抽样误差与其样本平均数抽样分布有关,其

28、大小可以用表征抽样分布离散程度的均方差其大小可以用表征抽样分布离散程度的均方差x来度量,来度量,称样本平均值的均方差。称样本平均值的均方差。样本样本 样本均值样本均值 均值的抽样误差均值的抽样误差 第第 1 1 个样,个样,1 1x x1 1,1 1x x2 2,1 1x xn n X Xn1n1 x x1 1X Xn1n1- -EXEX 第第 2 2 个样,个样,2 2x x1 1,2 2x x2 2,2 2x xn n X Xn2n2 x x2 2X Xn2n2- -EXEX 第第 3 3 个样,个样,3 3x x1 1,3 3x x2 2,3 3x xn n X Xn3n3 x x3 3

29、X Xn3n3- -EXEX 3.6.3 抽样误差抽样误差 以上对样本平均数抽样误差的讨论,其基本原则完全适以上对样本平均数抽样误差的讨论,其基本原则完全适用于其他样本参数。据统计理论,可推导出各参数用于其他样本参数。据统计理论,可推导出各参数均方误均方误(均方差)(均方差)的公式,它与总体分布有关。的公式,它与总体分布有关。相对均方误EX CV CS 参数 N CV 100 50 25 10 100 50 25 10 100 50 25 10 01 1 1 2 3 7 50 14 22 126 178 252 390 03 3 4 6 10 7 10 15 23 51 72 102 162

30、05 5 7 10 12 8 11 16 25 41 58 82 130 07 7 10 14 22 9 12 17 27 40 56 80 126 10 10 14 20 23 10 14 20 32 42 60 85 134 样本参数的相对均方误差(样本参数的相对均方误差(%) 由表中可见,由表中可见,CS的误差很大。当的误差很大。当n100时,时,CS的误差的误差在在40%126%之间。之间。n10时,则在时,则在126%以上,超出以上,超出了了CS本身的数值。水文资料一般都很短(本身的数值。水文资料一般都很短(n100)可见)可见直接由资料按矩法公式算得的直接由资料按矩法公式算得的CS

31、值,抽样误差太大。值,抽样误差太大。 推求桥涵水文设计变量时,一般认为需要的样本容量推求桥涵水文设计变量时,一般认为需要的样本容量 参数参数 需要的样本容量需要的样本容量n 1020 2030 100 xvCsC 说明:由于目前我国水文样本资料系列一般在说明:由于目前我国水文样本资料系列一般在3050年左右年左右,少于,少于100年,直接用矩法计算年,直接用矩法计算Cs的相对均方的相对均方误太大,不能满足实际工程设计的要求。误太大,不能满足实际工程设计的要求。 因此在实际水文设计中,一般是广泛采用因此在实际水文设计中,一般是广泛采用适线法适线法估估计皮尔逊计皮尔逊型频率曲线的参数,也就是用型频

32、率曲线的参数,也就是用矩法矩法、三点三点法法等确定初选参数等确定初选参数 、 ,而,而 一般不计算,而是一般不计算,而是假定假定Cs为为Cv的某一倍数。的某一倍数。xvCsC3.7 相关分析相关分析自然界中有许多现象并非各自独立,其相互间往往自然界中有许多现象并非各自独立,其相互间往往存在着一定的联系。存在着一定的联系。例如,气温与蒸发、降雨与径流、水位与流量、上例如,气温与蒸发、降雨与径流、水位与流量、上下游水位(或流量)等都是有联系的。下游水位(或流量)等都是有联系的。这种现象之间的联系在解决水文分析问题中经常被这种现象之间的联系在解决水文分析问题中经常被用到。这是由于在水文分析中,常常遇

33、到某一种用到。这是由于在水文分析中,常常遇到某一种现象的资料很少,一旦与其有关的另一种现象的现象的资料很少,一旦与其有关的另一种现象的资料项数却很多,我们就可以通过这两种现象之资料项数却很多,我们就可以通过这两种现象之间的关系,利用长系列资料展延(或内插)短系间的关系,利用长系列资料展延(或内插)短系列资料。这种关系的推求在数理统计中是用列资料。这种关系的推求在数理统计中是用相关相关计算计算这个工具。这个工具。 自然界中有许多现象之间是有一定联系的。按数理自然界中有许多现象之间是有一定联系的。按数理统计法建立上述两个或多个随机变量之间的联系统计法建立上述两个或多个随机变量之间的联系,称之为近似

34、关系或,称之为近似关系或相关关系相关关系。把对这种关系的。把对这种关系的分析和建立称为分析和建立称为相关分析相关分析。相关分析可以用来延。相关分析可以用来延长和插补短系列。长和插补短系列。根据变量之间相互关系的密切程度,变量之间的关根据变量之间相互关系的密切程度,变量之间的关系有三种情况:即系有三种情况:即p相关关系相关关系1.完全相关完全相关2.零相关零相关3.统计相关统计相关相关关系相关关系完全相关完全相关零相关零相关统计相关统计相关简单相关简单相关复相关复相关直线相关直线相关曲线相关曲线相关正相关正相关负相关负相关若两个变量之间的关系界于完全相关和零相关之间若两个变量之间的关系界于完全相

35、关和零相关之间,则称为统计相关。当只研究两个变量的相关关,则称为统计相关。当只研究两个变量的相关关系时,称为简单相关;当研究系时,称为简单相关;当研究3个或个或3个以上变量个以上变量的相关关系时,则称为复相关。在相关的形式上的相关关系时,则称为复相关。在相关的形式上,又可分为直线相关和非直线相关。,又可分为直线相关和非直线相关。两变量之间关系的三种情况:两变量之间关系的三种情况:相关分析(或回归分析)的内容一般包括三个方相关分析(或回归分析)的内容一般包括三个方面:面: (1)判定变量间是否存在相关关系,若存在,计)判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度;算其相关系数,以判断相关的密切程度;(2)确定变量间的数量关系)确定变量间的数量关系回归方程或相关回归方程或相关线;线;(3)根据自变量的值,预报或延长、插补因变量)根据自变量的值,预报或延长、插补因变量的值,并对该估计值进行误差分析。的值,并对该估计值进行误差分析。 2.7.1 简单直线相关简单直线相关 1.相关图解法相关图解法设设xi 和和yi 代表两系列的观

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论