气象统计方法 第四章 一元线性回归分析_第1页
气象统计方法 第四章 一元线性回归分析_第2页
气象统计方法 第四章 一元线性回归分析_第3页
气象统计方法 第四章 一元线性回归分析_第4页
气象统计方法 第四章 一元线性回归分析_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、气象统计方法气象统计方法主讲:温 娜南京信息工程大学大气科学学院2014年9月本课件主要参考南信大李丽平老师的课件概述概述基本概念基本概念原理原理方差分析方差分析相关系数和线性回归相关系数和线性回归回归方程的显著性检验回归方程的显著性检验1.1.概述概述 回归分析回归分析是用来寻找若干变量之是用来寻找若干变量之间的统计联系一种方法,利用找到间的统计联系一种方法,利用找到的统计关系对某一变量作出未来时的统计关系对某一变量作出未来时刻的估计,称为刻的估计,称为预报值预报值。包括线性。包括线性回归和非线性回归,常用的线性回回归和非线性回归,常用的线性回归。归。 如:为了预报某地某月平均气温如:为了预

2、报某地某月平均气温(预报量)未来时刻的变化,选择预报(预报量)未来时刻的变化,选择预报前期已发生的多个有关的气象要素(预前期已发生的多个有关的气象要素(预报因子),利用回归分析方法报因子),利用回归分析方法分析多个分析多个预报因子和预报变量之间的相互关系,预报因子和预报变量之间的相互关系,建立统计关系方程式建立统计关系方程式,最后利用其对未,最后利用其对未来时刻的气温作出预报估计。来时刻的气温作出预报估计。线线 性性 回回 归归非非 线线 性性 回回 归归一一 元元 回回 归归线线 性性 回回 归归非非 线线 性性 回回 归归多多 元元 回回 归归回回 归归 模模 型型2.2.基本概念基本概念

3、 一元回归处理的是一元回归处理的是两个变量两个变量之之间的关系,即间的关系,即一个一个预报量预报量和和一个一个预预报因子报因子之间的关系。之间的关系。3.3.原理原理 一般来说,对样本量为一般来说,对样本量为n的预报量的预报量y y与预与预报因子报因子x的一组样本,如果认为的一组样本,如果认为y与与x是一种是一种线性统计关系,预报量的估计量与线性统计关系,预报量的估计量与x有如下有如下关系:关系: (1 1) 或者写为一般的回归方程或者写为一般的回归方程 iibxayni, 2 , 1bxay a a是截距,是截距,b b是斜率。是斜率。 对所有的对所有的 ,若,若 与与 的的偏差偏差最小,就

4、认为(最小,就认为(1 1)所确定的直线能最)所确定的直线能最好地代表所有实测点的散布规律。好地代表所有实测点的散布规律。 为了消除偏差符号的影响,可以用为了消除偏差符号的影响,可以用偏差偏差的平方的平方来反映偏差的绝对值偏离情况。来反映偏差的绝对值偏离情况。ixiy iy全部观测值与回归估计值的全部观测值与回归估计值的离差平方和离差平方和记为记为它刻画了它刻画了全部观测值与回归直线偏离程度全部观测值与回归直线偏离程度。显然,显然,Q Q值越小越好值越小越好。a a和和b b是待定系数,根据是待定系数,根据微积分学中的极值原理,要求:微积分学中的极值原理,要求:ntiiyybaQ12)(),(

5、0aQ0bQ满足上面关系的满足上面关系的Q Q值最小。整理得到:值最小。整理得到:上式称为求上式称为求回归系数的标准方程组回归系数的标准方程组。展。展开:开:niiiiniiixbxaybxay110)(20)(2niniiiniiininiiiyxxbxayxbna111211回归系数也可直接表示为:回归系数也可直接表示为:212211212111)(1)(1xxyniiniiininiiininiiniiiiSSxnxyxnyxxnxyxnyxbxbya上述求回归系数的方法称为上述求回归系数的方法称为最小二乘法最小二乘法距平形式的回归方程距平形式的回归方程: : 即当变量为距平时,回归方程

6、可以不用求即当变量为距平时,回归方程可以不用求a,a,因为因为a=0,a=0,回归直线通过原点。回归直线通过原点。标准化距平形式的回归方程标准化距平形式的回归方程: :)(xxbyy*xryxyxyxyxxyrSSSSb24.4.回归问题的方差分析回归问题的方差分析 (1 1)意义)意义 评价回归方程的优劣。评价回归方程的优劣。 (2 2)预报量的方差可以表示成回归估计值)预报量的方差可以表示成回归估计值 的方差(的方差(回归方差回归方差)和误差方差()和误差方差(残残 差方差差方差)之和)之和。222eyySSS即:即: 方差分析表明,预报量方差分析表明,预报量y y的变化可以看成由的变化可

7、以看成由前期前期因子因子x x的变化所引起的,同时加上的变化所引起的,同时加上随机因素随机因素e e变化变化的的影响,这种前期因子影响,这种前期因子x x的变化影响可以归为一种的变化影响可以归为一种简简单的线性关系单的线性关系,这部分关系的变化可以用,这部分关系的变化可以用回归方差回归方差的大小的大小来衡量。来衡量。如果回归方差大,表明用线性关系如果回归方差大,表明用线性关系解释解释y y与与x x的关系比较符合实际情况,回归模型比较的关系比较符合实际情况,回归模型比较好。好。niiiniiniiyynyynyyn121212)(1)(1)(1误差方差误差方差回归方差回归方差预报量方差预报量方

8、差有时候,两边同时乘以有时候,两边同时乘以n变成各变量离差平方和的关变成各变量离差平方和的关系。系。U和和Q分别称为分别称为回归平方和回归平方和及及残差平方和残差平方和, 称为称为总总离差平方和离差平方和。niiyyU12)(niiyyQ12)(QUSyyyyS1.总离差平方和总离差平方和( )反映因变量的 n 个观察值与其均值的总离差。2.回归平方和回归平方和(U) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和可解释的平方和。3.残差平方和残差平方和(Q)n反映除 x 以外的其它因素对 y 取值的影

9、响,也称为不可解释的平方和或剩余平方和。不可解释的平方和或剩余平方和。yySniiiiniiixbxaybxay110)(20)(25. 5. 相关系数与线性回归相关系数与线性回归- (1 1)因为回归方差不可能大于预报量的)因为回归方差不可能大于预报量的方差,可以用它们的比值来衡量方程的拟方差,可以用它们的比值来衡量方程的拟合效果。即:合效果。即:yyniiniiyySUyynyynSS121222)(1)(1b b代入上式得代入上式得: :2xxySSb 222xyyyrSS22212122121222)()()()(yxniiniiniiniiyySSbyyxxbyyxbabxaSS上式

10、含义:上式含义: 表明了预报因子表明了预报因子x x对预报量对预报量y y方差的线方差的线性关系程度,这一比值又称为性关系程度,这一比值又称为解释方差解释方差( (方方差贡献率差贡献率) )。 也可以说明相关系数的含义:也可以说明相关系数的含义:它是衡它是衡量两个变量线性关系密切程度的量,量两个变量线性关系密切程度的量,又被又被称为回归方程的判决系数。称为回归方程的判决系数。判决系数判决系数R2 (coefficient of determination)1. 回归平方和回归平方和占总离差平方和的比例;占总离差平方和的比例;(2)回归系数回归系数b b与相关系数之间的关系与相关系数之间的关系r

11、 r与与b b同号。同号。xyxyxxyrSSSSb26. 回归方程的显著性检验回归方程的显著性检验 原假设回归系数原假设回归系数b b为为0 0的条件下,上述统计量遵的条件下,上述统计量遵从分子自由度为从分子自由度为1 1,分母自由度为,分母自由度为(n-2n-2)的的F F分布分布,若线性相关显著,则回归方差较大,因此统计量若线性相关显著,则回归方差较大,因此统计量F F也较大;反之,也较大;反之,F F较小。对给定的显著性水平较小。对给定的显著性水平 , , 查表得到查表得到F F临界值临界值 ,如果,如果 , ,则拒绝原假则拒绝原假设,认为线性相关显著。设,认为线性相关显著。)2(1n

12、QUFFFF上式还可以表示为:上式还可以表示为:222eyySSS)2(122nSSFey2122nrr222xyyyrSS由于回归系数由于回归系数b b已经知道,根据已经知道,根据计算出计算出x x和和y y的相关系数,然后可以求得的相关系数,然后可以求得F.F.bSSryxxy21122112)(1)(1niiniiniiniiynyxnxb注意注意: : 对于一元线性回归来说,因为对于一元线性回归来说,因为F F的相关的相关系数表达式开方就是相关系数系数表达式开方就是相关系数t t检验的表达检验的表达式式, ,故回归方程的检验与相关系数的检验一故回归方程的检验与相关系数的检验一致。致。2

13、12nrrt2122nrrFl提出假设H0:1=0, 线性关系不显著线性关系检验的步骤概括如下:线性关系检验的步骤概括如下: 气象中经常使用回归方程的距平形气象中经常使用回归方程的距平形式,对回归方程的显著性检验可以只对式,对回归方程的显著性检验可以只对因子的回归系数进行检验。因子的回归系数进行检验。 遵从自由度为遵从自由度为n-2n-2的的t t分布分布;或者根据;或者根据F F分布与分布与t t分布的关系有:分布的关系有:2nQcbt112)(niixxc22nQcbFcbU2)2(1nQUFl 上式与之前方差检验的公式完全一上式与之前方差检验的公式完全一致,但致,但 在检验单个变量在回归

14、方程中的在检验单个变量在回归方程中的作用时更为常用。作用时更为常用。22nQcbF8.8.预报的置信区间(预报的置信区间(95%95%置信区间)置信区间) 因为因为 可以看成遵从可以看成遵从 的分的分布,所以其布,所以其95%95%的置信区间为的置信区间为 。 是总体均方差(误差均方差)的无偏估计量。是总体均方差(误差均方差)的无偏估计量。 2nQ96. 1 iy2)(21122nQyynniiiiy);(20ixN96.1)(iyE1)计算回归系数,确定方程)计算回归系数,确定方程2)回归方程显著性检验:)回归方程显著性检验:3)计算预报值得置信区间,作出预测)计算预报值得置信区间,作出预测

15、:niiyyU12)(niiyyQ12) (21212)(ynyyySniiniiyy总离差平方和总离差平方和x x离差平方和离差平方和X X和和y y离差积之和离差积之和 一一组组计计算算公公式式yxnyxyyxxSniiiniiixy11)(21212)(xnxxxSniiniixxxxxySSU2xxxyyySSSQ22xxySSb 1. 1. 相关分析中,变量相关分析中,变量 x x 变量变量 y y 处于平等的地位;处于平等的地位;回归分析中,变量回归分析中,变量 y y 称为因变量,处在被解释称为因变量,处在被解释的地位,的地位,x x 称为自变量,用于预测因变量的变化。称为自变量,用于预测因变量的变化。2. 2. 相关分析中所涉及的变量相关分析中所涉及的变量 x x 和和 y y 都是随机变量;都是随机变量;回归分析中,因变量回归分析中,因变量 y y 是随机变量,自变量是随机变量,自变量 x x 可以是随机变量,也可以是非随机的确定变量。可以是随机变量,也可以是非随机的确定变量。3. 3. 相关分析主要是描述两个变量之间线性关系的密相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量切程度;回归分析不仅可以揭

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论