第二章回归分析_第1页
第二章回归分析_第2页
第二章回归分析_第3页
第二章回归分析_第4页
第二章回归分析_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章回归分析第1页,课件共60页,创作于2023年2月回归分析:

研究处于同一总体中两个或两个以上变量之间的相关关系的数学工具。

相关关系

1.确定关系(函数关系)如:U=IR···2.相关关系(不确定关系)如:树高与胸径,产量与施肥量的关系。第2页,课件共60页,创作于2023年2月

相关关系——如给定X的任一具体取值,对应的Y是一随机变量,服从一定的概率分布;同时给定Y的任一个具体取值时,对应的X是一随机变量,服从一定的概率分布.

回归关系——相关关系中,如果X容易确定或可控制,即为非随机变量,Y是随机变量,则称Y对X存在回归关系。

X:预报因子Y:预报量相关关系与回归关系第3页,课件共60页,创作于2023年2月§2.1一元回归2.1.1回归分析概述第4页,课件共60页,创作于2023年2月

回归函数(

回归方程)

因变量自变量自变量:预报因子的取值因变量:预报量的期望(均值)问题1:回归方程有何意义?问题2:如何求得回归方程?第5页,课件共60页,创作于2023年2月

回归模型

第6页,课件共60页,创作于2023年2月

回归函数

散点图:把观测数据用散点表示在平面直角坐标上

实际中,回归函数不易得到,用如下办法确定:(1)先确定形式:用专业知识或散点图;(2)确定系数:用最小二乘法

X与У之间具有线性回归关系,散点图呈线性,回归函数是线性函数。第7页,课件共60页,创作于2023年2月一元线性回归自变量为一个(一元),回归函数是线性的。

设回归方程的形式为:

常数项回归系数一元线性回归方程模型

关键:求出常数项和一次项系数(回归系数)办法:由样本观测值,估计出直线方程。第8页,课件共60页,创作于2023年2月一元线性回归满足的前提正态,独立,等方差第9页,课件共60页,创作于2023年2月2.1.2参数估计1.普通最小二乘法(OLSE)第10页,课件共60页,创作于2023年2月

(1)构造残差平方和:求出常数项和回归系数回归值实测值请问:残差平方和表示什么?第11页,课件共60页,创作于2023年2月(2)确定系数,使残差达到最小(最小二乘法)求出常数项和回归系数为什么?怎么做?求导数并令导数为零第12页,课件共60页,创作于2023年2月解得:其中:预报因子平均值预报量平均值第13页,课件共60页,创作于2023年2月几个平方和记为:注意对比记忆公式第14页,课件共60页,创作于2023年2月

求回归方程的例题

例设从某油松林地随机抽得10株油松,测得胸径与树高如下表所示:胸径x(cm)4.25.15.96.57.38.18.69.09.7树高y(m)5.74.66.47.87.58.49.29.59.6试求树高y对胸径x的经验回归方程。第15页,课件共60页,创作于2023年2月解:设回归方程为:经计算得:第一行数据之和第二行数据之和两行数据交叉乘积之和第16页,课件共60页,创作于2023年2月计算平方和得:X的离差平方和X和Y的协方差第17页,课件共60页,创作于2023年2月所以:所求回归方程为:第18页,课件共60页,创作于2023年2月2.1.3一元线性回归的显著性检验3种方法1.方差分析法(F检验)2.样本相关系数法(r检验)3.T检验第19页,课件共60页,创作于2023年2月

1.方差分析法(F检验):总的离差平方和:回归平方和U=SSR残差平方和Q=SSE第20页,课件共60页,创作于2023年2月构造检验统计量即回归关系显著第21页,课件共60页,创作于2023年2月2.样本相关系数法

样本相关系数:大小能反映X与Y间的相关关系第22页,课件共60页,创作于2023年2月

样本相关系数的特点:

(1)

|r|≤1(2)

r>0,则X与Y正相关;

r<0,X与Y负相关;(3)|r|=1时,X与Y典型线性关系

(4)r=0,X与Y不相关(没线性关系)(5)|r|越大,线性相关关系越显著。第23页,课件共60页,创作于2023年2月样本相关系数特点第24页,课件共60页,创作于2023年2月

检验线性相关关系的步骤

(1)计算r值;(2)

临界值rα(n-2)(3)当|r|≥rα(n-2)时,X与Y的线性相关关系显著,否则,不显著。

第25页,课件共60页,创作于2023年2月样本决定系数法样本决定系数:样本决定系数=(样本相关系数)2第26页,课件共60页,创作于2023年2月3.T检验法

t统计量:第27页,课件共60页,创作于2023年2月回归分析的显著性检验的例题解:计算样本相关系数查表得临界值r0.01(8)=0.7646例:检验例9.2.1的线性关系是否显著∵r>r0.01(8)∴线性关系极显著

第28页,课件共60页,创作于2023年2月2.1.4

利用回归方程预测步骤:第29页,课件共60页,创作于2023年2月第30页,课件共60页,创作于2023年2月

回归分析的例题x(cm)林木平均高20222426283032343638y(m3)木材蓄积量314376436495585615671733755835例在某油松林地中,随机抽取10块样地测量其林木平均高与木材蓄积量的资料如下第31页,课件共60页,创作于2023年2月

(1)试求木材蓄积量y对林木平均高x的经验直线回归方程。(2)检验线性回归的显著性;(3)

当林木平均高为25m时,以95%的可靠性确定木材蓄积量的置信区间。自己考虑应如何解答?第32页,课件共60页,创作于2023年2月解:(1)设回归方程为:经计算得:第33页,课件共60页,创作于2023年2月所以:所求回归方程为:第34页,课件共60页,创作于2023年2月(2)解:计算样本相关系数对显著性水平0.01,查表得临界值r0.01(8)=0.7646∵r>r0.01(8)∴线性关系极显著第35页,课件共60页,创作于2023年2月第36页,课件共60页,创作于2023年2月第37页,课件共60页,创作于2023年2月第38页,课件共60页,创作于2023年2月

请利用一元回归分析的方法解决一个实际问题(包括收集数据,设计方法,并求解)例如:研究人的身高与体重的关系;数学成绩与外语成绩的关系……第39页,课件共60页,创作于2023年2月§2.2多元回归

第40页,课件共60页,创作于2023年2月2.2.1多元回归概述

因变量(响应变量)为y(一个),自变量(回归变量)为xi(i=1,2,…,k)(多个),多元线性回归模型:

其中β0称为截距

βi

(i=1,2,…,k)叫做偏回归系数,ε叫做误差第41页,课件共60页,创作于2023年2月

如果对各自变量及相应的因变量观测了n次,得到如下表所示的样本:

样本号因变量回归变量x1x2x3……xk1y1x11x12x13……x1k2y2x21x22x23……x2k┋┋┋┋┋……┋nynxn1xn2xn3……xnk第42页,课件共60页,创作于2023年2月令则模型矩阵表示为第43页,课件共60页,创作于2023年2月2.2.2参数估计利用最小二乘法,得第44页,课件共60页,创作于2023年2月例、设因变量y与其有关的自变量x1,x2得下表所示的数据:样本号(年份)因变量回归变量yx1x2180.56290.583120.7104110.5125130.8126171.212(7)?(1.7)(14)如果y与x1,x2的线性模型是第45页,课件共60页,创作于2023年2月(1)求回归方程y=b0+b1x1+b2x2(2)预测当x1=1.7,x2=14时,y的估计值(3)计算残差。由公式即可算出

其中故所求回归方程为当x1=1.7,x2=14时,y的预报值为

第46页,课件共60页,创作于2023年2月

我们可以通过回归方程计算出每一样点上的残差为:-0.1,0.0,0.3,0.1,-0.4,0.1于是残差平方和=0.27第47页,课件共60页,创作于2023年2月2.2.3方差分析与回归参数检验第48页,课件共60页,创作于2023年2月(一)方差分析法在讨论检验之前,先介绍几种平方和:1.残差平方和

回归的显著性检验

第49页,课件共60页,创作于2023年2月2.总平方和

3.回归平方和

反映模型的贡献,称为SSR

第50页,课件共60页,创作于2023年2月回归平方和的自由度,记为

fR=k残差平方和的自由度,记为fE=n-k-1进行F检验:我们就认为回归关系在α水平上是显著的;换句话说,模型在一定程度上反映了y与之间的相关关系。第51页,课件共60页,创作于2023年2月方差分析表变差来源离差平方和自由度均方F值临界值显著性回归SSRfR=kMSRF=MSR/

MSEFα(fR,fE)***-残差SSEfE=n-k-1MSE总和SSTfT=n-1第52页,课件共60页,创作于2023年2月(二)复相关系数法回归平方和在总平方和中所占份额,即可用来评价模型的有效性,称为决定系数,

称R为复相关系数,R越大,反映回归变量与因变量之间线性关系密切。第53页,课件共60页,创作于2023年2月

一般0≤R≤1,但R要多大才认为线性关系存在呢?要给出临界值(多元线性回归显著性检验复相关系数临界值表)

多元线性回归显著,否则不显著第54页,课件共60页,创作于2023年2月校正决定系数

(Adjusteddeterminationefficient)

响考虑了自变量个数的影,22RRc<第55页,课件共60页,创作于2023年2月(三)t检验:检验第j个自变量对Y影响是否显著第56页,课件共60页,创作于2023年2月

说明第j个自变量对Y影响显著,应保留,否则说明第j个自变量对Y影响不显著,可以剔除;如果同时有几个预报因子经检验都不显著,则先剔除|t|值最小的预报因子,每次只能剔除一个预报因子。第57页,课件共60页,创作于2023年2月剔除和引进变量的方法ⅰ)淘汰法(向后法backward)这种程序基本思想是,根据给定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论