气象统计方法第四章一元线性回归分析_第1页
气象统计方法第四章一元线性回归分析_第2页
气象统计方法第四章一元线性回归分析_第3页
气象统计方法第四章一元线性回归分析_第4页
气象统计方法第四章一元线性回归分析_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

气象统计方法主讲:温娜南京信息工程大学大气科学学院2014年9月本课件主要参考南信大李丽平老师的课件第四章一元线性回归(huang28)

主要内容概述基本概念原理方差分析相关系数和线性回归回归方程的显著性检验1.概述

回归分析是用来寻找若干变量之间的统计联系一种方法,利用找到的统计关系对某一变量作出未来时刻的估计,称为预报值。包括线性回归和非线性回归,常用的线性回归。

如:为了预报某地某月平均气温(预报量)未来时刻的变化,选择预报前期已发生的多个有关的气象要素(预报因子),利用回归分析方法分析多个预报因子和预报变量之间的相互关系,建立统计关系方程式,最后利用其对未来时刻的气温作出预报估计。回归模型的类型2.基本概念一元回归处理的是两个变量之间的关系,即一个预报量和一个预报因子之间的关系。3.原理

一般来说,对样本量为n的预报量y与预报因子x的一组样本,如果认为y与x是一种线性统计关系,预报量的估计量与x有如下关系:(1)或者写为一般的回归方程

a是截距,b是斜率。对所有的,若与的偏差最小,就认为(1)所确定的直线能最好地代表所有实测点的散布规律。为了消除偏差符号的影响,可以用偏差的平方来反映偏差的绝对值偏离情况。

xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^全部观测值与回归估计值的离差平方和记为它刻画了全部观测值与回归直线偏离程度。显然,Q值越小越好。a和b是待定系数,根据微积分学中的极值原理,要求:满足上面关系的Q值最小。整理得到:上式称为求回归系数的标准方程组。展开:回归系数也可直接表示为:上述求回归系数的方法称为最小二乘法距平形式的回归方程:

即当变量为距平时,回归方程可以不用求a,因为a=0,回归直线通过原点。标准化距平形式的回归方程:4.回归问题的方差分析(1)意义评价回归方程的优劣。(2)预报量的方差可以表示成回归估计值的方差(回归方差)和误差方差(残差方差)之和。即:方差分析表明,预报量y的变化可以看成由前期因子x的变化所引起的,同时加上随机因素e变化的影响,这种前期因子x的变化影响可以归为一种简单的线性关系,这部分关系的变化可以用回归方差的大小来衡量。如果回归方差大,表明用线性关系解释y与x的关系比较符合实际情况,回归模型比较好。误差方差回归方差预报量方差有时候,两边同时乘以n变成各变量离差平方和的关系。U和Q分别称为回归平方和及残差平方和,称为总离差平方和。1.总离差平方和()反映因变量的n个观察值与其均值的总离差。2.回归平方和(U)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和。3.残差平方和(Q)反映除x以外的其它因素对y取值的影响,也称为不可解释的平方和或剩余平方和。5.相关系数与线性回归----(1)因为回归方差不可能大于预报量的方差,可以用它们的比值来衡量方程的拟合效果。即:b代入上式得:上式含义:表明了预报因子x对预报量y方差的线性关系程度,这一比值又称为解释方差(方差贡献率)。也可以说明相关系数的含义:它是衡量两个变量线性关系密切程度的量,又被称为回归方程的判决系数。判决系数R2(coefficientofdetermination)1.回归平方和占总离差平方和的比例;反映回归直线的拟合程度;取值范围在[0,1]之间;

R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差;判决系数等于相关系数的平方,即R2=r2(2)回归系数b与相关系数之间的关系r与b同号。6.回归方程的显著性检验

原假设回归系数b为0的条件下,上述统计量遵从分子自由度为1,分母自由度为(n-2)的F分布,若线性相关显著,则回归方差较大,因此统计量F也较大;反之,F较小。对给定的显著性水平,查表得到F临界值,如果,则拒绝原假设,认为线性相关显著。上式还可以表示为:由于回归系数b已经知道,根据计算出x和y的相关系数,然后可以求得F.注意:

对于一元线性回归来说,因为F的相关系数表达式开方就是相关系数t检验的表达式,故回归方程的检验与相关系数的检验一致。提出假设H0:1=0,线性关系不显著计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F

作出决策:若F>F

,拒绝H0;若F<F

,不能拒绝H0线性关系检验的步骤概括如下:7.回归系数的显著性检验

气象中经常使用回归方程的距平形式,对回归方程的显著性检验可以只对因子的回归系数进行检验。

遵从自由度为n-2的t分布;或者根据F分布与t分布的关系有:

上式与之前方差检验的公式完全一致,但在检验单个变量在回归方程中的作用时更为常用。8.预报的置信区间(95%置信区间)因为可以看成遵从的分布,所以其95%的置信区间为。

是总体均方差(误差均方差)的无偏估计量。

例1:1)计算回归系数,确定方程X变化一个单位,气温降低0.23度。2)回归方程显著性检验:3)计算预报值得置信区间,作出预测:总离差平方和x离差平方和X和y离差积之和

一组计算公式回归分析与相关分析的区别1.相关分析中,变量x

变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化。2.相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x

可以是随机变量,也可以是非随机的确定变量。3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论