第九章 直线回归与相关分析_第1页
第九章 直线回归与相关分析_第2页
第九章 直线回归与相关分析_第3页
第九章 直线回归与相关分析_第4页
第九章 直线回归与相关分析_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章直线回归与相关分析第一节回归和相关的概念对两个变量,一个变量用符号x表示,另一个变量用y表示,通过试验或调查获得两个变量的成对观测值,可表示为(x1,y1),(x2,y2),…,(xn,yn)。如果两个变量属于因果关系,一般用回归分析,表示原因的变量称为自变量,用x表示,表示结果的变量称为依变量,用y表示。可用x取值预测y取值范围。如果两个变量是平行关系,只能用相关分析进行研究两个变量之间相关程度和性质,不能用一个变量的变化去预测另一个变量的变化。回归和相关分析,需注意的问题(1)变量间是否存在相关以及在什么条件下会发生什么相关问题,都必须由学科本身决定。(2)研究两个变量之间的关系时,要求其余变量尽量保持在同一水平。(3)两个变量成对观测值≥5(4)回归预测必须限制自变量x的取值区间,超出这个区间,变量间的关系类型可能会发生改变。第二节直线回归一、直线回归方程的建立上式读作“y依x的直线回归方程”,其中x是自变量,是与x值相对应的依变量y的点估计值,a称为回归截距,b是回归直线的斜率,称为回归系数为了使公式1能最好地反应y和x两变量间的数量关系,根据最小二乘法得出:公式1例1:有人研究了黏虫孵化历期平均温度(x,℃)与历期天数(y,d)之间关系,试验资料如下表,试配合直线回归方程。二、直线回归的数学模型y=a+βx+εa为总体回归截距,β为总体回归系数,ε为随机误差如果是样本资料:y=α+bx+eα、b、e分别估计总体a、β、ε三、直线回归的假设检验(一)直线回归的变异来源U=bSPQ=SSy-U由于直线回归只有1个自变量,所以回归平方和的自由度为1,回归平方和等于回归方差,离回归平方和的自由度为n-1-1=n-2,回归平方和除以相应自由度离回归方差,记为sy/x2。sy/x为离回归标准差,习惯上称作回归估计标准误。(二)F检验H0:两变量间无线性关系;HA:有线性关系。试检验例1直线回归关系的显著性U=bSP=-2.5317×(-139.6937)=353.6628Q=SSy-U=377.2688-353.6628=23.6060(三)t检验H0:β=0;HA:β≠0。该方法是检验样本回归系数b是否来自β=0的双变量总体,以推断线性回归的显著性。回归系数的标准误sb和t值为:用t检验法检验例1回归关系的显著性F检验的结果与t检验的结果一致。事实上,统计学已证明,在直线回归分析中,这二种检验方法是等价的,可任选一种进行检验。四、直线回归的区间估计(一)总体回归截距a的置信区间回归截距a的标准误sa和t值为:L1=α-tasaL2=α+tasadf=n-2计算例1资料回归截距的95%和99%置信区间(二)总体回归系数β的置信区间L1=α-tasbL2=α+tasbdf=n-2计算例1回归系数的95%和99%置信区间(三)总体平均数μx/y置信区间对于给定的x,预测总体的平均数μx/y时:

称为回归估计标准误根据例1,估计出黏虫孵化历期平均温度为15℃时,历期天数为多少(取95%置信区间)。(四)单个y值的置信区间单个y观测值的标准误为:根据例1,若某年的历期平均温度为15℃,该年的历期天数为多少(95%置信概率)第三节直线相关一、相关系数和决定系数如果两个变量间呈线性关系,又不需要由x来估计y,只需了x和y相关以及相关的性质,可通过计算x和y相关程度和性质的统计数-相关系数来进行研究。相关系数r为:决定为r2。Excel计算相关系数为:“数据分析”中的相关系数r与b符号取决于SP,二者符号相同。r的绝对值越接近于1相关程度越高;越接近于0,越无相关性。R为正表示正相关,为负表示负相关。求例1的相关系数和决定系数以上结果表明,x与y呈负相关,决定系数表明x与y的变异有93.74%可用二者之间的线性关系来解释。二、相关系数的假设检验为了判断r所代表的总体是否存在直线相关,必须测定r来自ρ=0总体的概率。试检验例1相关系数的显著性回归系数的假设检验与相关系数检验的结果是一致的,因此只需计算一个即可。Excel计算方法1、用散点图法,计算直线方程及决定系数2、使用数据分析进行回归,计算直线方程、决定系数,方差分析、置信区间等参数。第三节可直线化的非线性回归分析下面是几种常用的能直线化的曲线函数类型及其图型,并将其直线化,供进行曲线回归分析时选用。一、双曲线函数1/y=a+b/x令y′=1/y,x′=1/x,则可将双曲线函数直线化为:y′=a+bx′。二、幂函数

y=axb(a>0)对幂函数两端取对数得:lny=lna+blnx令y′=lny,x′=lnx,a′=lna则可将幂函数直线化为:y′=a′+bx′。三、指数函数(a>0)(一)若指数函数y=aebx,两端取对数得:lny=lna+x令y′=lny,a′=lna则可将幂函数直线化为:y′=a′+bx。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论