第八章线形回归_第1页
第八章线形回归_第2页
第八章线形回归_第3页
第八章线形回归_第4页
第八章线形回归_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第八章第八章 线性相关与回归线性相关与回归( (Linear Correlation & Regression ) )060120180施氮量施氮量(kg N/ha)2468植物的生长量植物的生长量一、线性相关的基本概念一、线性相关的基本概念二、线性相关系数二、线性相关系数三、相关系数的显著性检验三、相关系数的显著性检验四、进行线性相关分析的注意事项四、进行线性相关分析的注意事项第一节第一节 线性相关(线性相关(linear correlation) ) 例例 从男青年总体中随机抽取从男青年总体中随机抽取1111名男青年组成样本,名男青年组成样本,分别测量每个男青年的身高和前臂长分别测量每个

2、男青年的身高和前臂长编号编号身高(身高(cmcm)前臂长(前臂长(cmcm)XYXYX X2 2Y Y2 2( (X X) )( (Y Y) )1 1 170170 4747 79907990 2890028900220922092 2 173173 4242 72667266 2992929929176417643 3 160160 4444 70407040 2560025600193619364 4 155155 4141 63556355 2402524025168116815 5 173173 4747 81318131 2992929929220922096 6 188188 50

3、50 94009400 3534435344250025007 7 178178 4747 83668366 3168431684220922098 8 183183 4646 84188418 3348933489211621169 9 180180 4949 88208820 3240032400240124011010 165165 4343 70957095 2722527225184918491111 166166 4444 31743174 285612856121162116合计合计1891189150050086185861853260813260812281022810一、线

4、性相关的基本概念一、线性相关的基本概念 为直观地判断两个变量之间的关系,可在直角坐标系中把每为直观地判断两个变量之间的关系,可在直角坐标系中把每对(对(X Xi i,Y,Yi i)值所代表的点绘出来,形成散点图。例如)值所代表的点绘出来,形成散点图。例如1212名男名男青年身高与前臂长资料绘制的散点图如图所示:青年身高与前臂长资料绘制的散点图如图所示: 身高190180170160150前臂长525048464442401. 如果两个随机变量中,当其中一个变量由小到大如果两个随机变量中,当其中一个变量由小到大变化时,另一个变量也相应地由小到大(或由大到变化时,另一个变量也相应地由小到大(或由大

5、到小)变化,并且其相应变化的散点图在直角坐标系小)变化,并且其相应变化的散点图在直角坐标系中呈现直线趋势,则称这两个随机变量存在中呈现直线趋势,则称这两个随机变量存在直线相直线相关关。 推断两个随机变量是否存在直线相关关系以及描推断两个随机变量是否存在直线相关关系以及描述这种相关关系大小的分析方法就是述这种相关关系大小的分析方法就是直线相关分析直线相关分析(linear correlation analysis),也称,也称简单相关分析简单相关分析(simple correlation analysis)。 男青年身高与前臂长散点呈直线趋势,即男青年身男青年身高与前臂长散点呈直线趋势,即男青年

6、身材高,前臂亦长,说明身高与前臂长之间存在线性材高,前臂亦长,说明身高与前臂长之间存在线性相关关系,我们把这种关系称为直线相关。相关关系,我们把这种关系称为直线相关。 线性相关用于双变量正态资料。它的性质可由散点图线性相关用于双变量正态资料。它的性质可由散点图直观地说明。散点图中点的分布即线性相关的性质和相关直观地说明。散点图中点的分布即线性相关的性质和相关之间的密切程度,可分为以下几种情况:之间的密切程度,可分为以下几种情况: 1.1.正相关正相关 2.2.负相关负相关 3.3.无相关无相关 2. 直线相关分析的适用条件 (1) 两个变量均为服从正态分布的随两个变量均为服从正态分布的随机变量

7、,即要求他们服从双变量正态机变量,即要求他们服从双变量正态分布分布 (bi-variable normal distribution); (2) 每对数据对应的点在直角坐标系每对数据对应的点在直角坐标系中呈现直线趋势。中呈现直线趋势。二、线性相关系数二、线性相关系数 在分析两个变量在分析两个变量X X与与Y Y之间关系时,常常要了解之间关系时,常常要了解X X与与Y Y之之间有无相关关系,相关是否密切,是呈正相关还是负相间有无相关关系,相关是否密切,是呈正相关还是负相关。关。相关系数就是相关系数就是说明具有直线关系的两个变量间相关说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。密切

8、程度和相关方向的统计量。 皮尔森皮尔森(Pearson)(Pearson)相关系数的计算公式为:相关系数的计算公式为: YXiiXYSSSSSPYYXXYYXXrr.)()()(22相关系数相关系数r r没有测量单位,其数值为没有测量单位,其数值为-1 -1 r 11 =LXY/LXX.LYY1/2相关系数的意义 (1)相关系数的符号反映两变量间的相相关系数的符号反映两变量间的相关方向:关方向: r0为正相关,为正相关,r 0,表示直线与纵轴的交点在原点的上方 a 0,直线从左下方走向右上方,直线从左下方走向右上方,Y 随随 X 增大而增大增大而增大 b0,直线从左上方走向右下方,直线从左上方

9、走向右下方,Y 随随 X 增大而减小增大而减小 b=0,表示直线与表示直线与 X 轴平行,轴平行,X 与与Y 无无直线关系直线关系b 的统计学意义是:的统计学意义是:X 每增加每增加(减减)一个单位,一个单位,Y 平均改变平均改变b个单位个单位 二、线性回归方程的计算二、线性回归方程的计算 例例10.3 10.3 有人研究了温度对蛙的心率的影响,得到了有人研究了温度对蛙的心率的影响,得到了表表10-210-2中所示的资料,试进行回归分析中所示的资料,试进行回归分析。对象对象温度(温度(X X) 心率(心率(Y Y) XY XY X X2 2Y Y2 21 1 2 2 5 5 1010 4 4

10、25252 2 4 4 1111 4444 1616 1211213 3 6 6 1111 6666 3636 1211214 4 8 8 1414 112112 6464 1961965 51010 2222 220220 100100 4844846 61212 2323 276276 144144 5295297 71414 3232 448448 196196102410248 81616 2929 464464 256256 8418419 91818 3232 576576 3243241024102410102020 3434 680680 4004001156115611112

11、222 3333 726726 48448410891089合计合计1321322462463622362220242024661066101.1.根据表根据表10-210-2数据绘制散点图,如下图所示数据绘制散点图,如下图所示:温度3020100蛙心律4030201002.2.计算回归系数与常数项计算回归系数与常数项 在本例中: 132X 20242X12X 246Y26610Y 22.363Y 3622XY222()()(132)(246)3622670111.523()132440202411XYXXXYXYlnbXlXn22.3631.523124.087aYbX4.0871.523Y

12、X则,回归方程为3. 3. 作回归直线作回归直线温度3020100蛙心律4030201004.087 1.523YX三、线性回归方程的显著性检验三、线性回归方程的显著性检验 对线性回归方程要进行假设检验,就是要检验对线性回归方程要进行假设检验,就是要检验b b是否为是否为 =0=0的总体中的一个随机样本。该假的总体中的一个随机样本。该假设检验通常用方差分析或者设检验通常用方差分析或者t t检验,两者的检检验,两者的检验效果等价。验效果等价。 HH0 0: : 0 0(两变量之间无直线关系)(两变量之间无直线关系) HH1 1:0 0 0.050.05 bsbt xxxyxyblsxxss.2.

13、)(2) (2.nyysxy2222)()()()(xxyyxxyybllyyxyyyn2对例对例10.310.3的回归方程用的回归方程用t t 检验进行假设检验检验进行假设检验(1 1)建立假设检验)建立假设检验 =0=0 00 =0.05 =0.05(2 2)计算统计量)计算统计量88.313.139Y Xs3.130.149440bs 1.523 010.220.149tV V =11=112=92=9 (3 3)确定)确定P P值作结论值作结论根据根据 V V =9=9, 0.01/2(9)t3.250, 3.250, P P 0.010.01,拒绝拒绝HH0 0,直线回归方程的应用直

14、线回归方程的应用1. 1. 描述两个变量之间的数量依存关系。描述两个变量之间的数量依存关系。2. 2. 利用回归方程进行预测利用回归方程进行预测(1 1)由现在已知的变量值预测将来未知的变)由现在已知的变量值预测将来未知的变量值量值 (父母身高预测子女身高)(父母身高预测子女身高)(2 2)由易测的变量值估算难测的变量值)由易测的变量值估算难测的变量值 (体重预测体表面积)(体重预测体表面积)3. 3. 利用回归方程进行控制利用回归方程进行控制 利用回归方程进行逆估计利用回归方程进行逆估计 四、进行线性回归分析的注意事项四、进行线性回归分析的注意事项 只有将两个内在有联系的变量放在一起进行回归

15、分析才是只有将两个内在有联系的变量放在一起进行回归分析才是有意义的。有意义的。 作回归分析时,如果两个有内在联系的变量之间存在的是一作回归分析时,如果两个有内在联系的变量之间存在的是一种依存因果的关系,那么应该以种依存因果的关系,那么应该以“因因”的变量为的变量为X X , ,以以“果果”的变量为的变量为Y Y 。如果变量之间并无因果关系,则应以易于测定、。如果变量之间并无因果关系,则应以易于测定、较为稳定或变异较小者为较为稳定或变异较小者为X X 。 在回归分析中,因变量是随机变量,自变量既可以是随机变在回归分析中,因变量是随机变量,自变量既可以是随机变量也可以是给定的量量也可以是给定的量,

16、 ,如果数据不符合要求,在进行回归分析如果数据不符合要求,在进行回归分析前,必须先进行变量的变换。前,必须先进行变量的变换。四、进行线性回归分析的注意事项四、进行线性回归分析的注意事项 回归方程建立后必须作假设检验,只有经假回归方程建立后必须作假设检验,只有经假设检验拒绝了无效假设,回归方程才有意义。设检验拒绝了无效假设,回归方程才有意义。 使用回归方程计算估计值时,不可把估计的使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的自变量的取值范围之范围扩大到建立方程时的自变量的取值范围之外。外。 第三节第三节线性相关和回归的区别与联系线性相关和回归的区别与联系 1. 应用情况不同应用情

17、况不同 说明两变量说明两变量依存变化依存变化的数量关系用回归的数量关系用回归 说明两变量间的说明两变量间的相关关系相关关系用相关用相关区别区别2.资料要求不同资料要求不同回归:回归:型回归型回归 y是随机正态变量,是随机正态变量, x是一般变量,可以精确测量和控制是一般变量,可以精确测量和控制的变量的变量 型回归型回归 双变量均为随机正态变量,双变量均为随机正态变量, 可计算两个回归方程可计算两个回归方程 由由x推推y的回归方程的回归方程 由由y推推x的回归方程的回归方程相关:双变量均为随机正态变量相关:双变量均为随机正态变量y.xy.xx.yx.yyab xxab y= =+ += =+ +区别区别3.意义:意义: b表示表示X每增(减)一个单位时,每增(减)一个单位时,Y平均平均改变改变b个单位;个单位;r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论