![8-直线回归与相关-ppt课件_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-1/24/73a104da-0fd8-49b7-91fe-acf38849a1da/73a104da-0fd8-49b7-91fe-acf38849a1da1.gif)
![8-直线回归与相关-ppt课件_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-1/24/73a104da-0fd8-49b7-91fe-acf38849a1da/73a104da-0fd8-49b7-91fe-acf38849a1da2.gif)
![8-直线回归与相关-ppt课件_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-1/24/73a104da-0fd8-49b7-91fe-acf38849a1da/73a104da-0fd8-49b7-91fe-acf38849a1da3.gif)
![8-直线回归与相关-ppt课件_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-1/24/73a104da-0fd8-49b7-91fe-acf38849a1da/73a104da-0fd8-49b7-91fe-acf38849a1da4.gif)
![8-直线回归与相关-ppt课件_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-1/24/73a104da-0fd8-49b7-91fe-acf38849a1da/73a104da-0fd8-49b7-91fe-acf38849a1da5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章第八章 直线回归与相关分析直线回归与相关分析2RS 统计关系是一种非确定关系,即一个变数的取统计关系是一种非确定关系,即一个变数的取值受到另一变数的影响,两者之间有关系,但又值受到另一变数的影响,两者之间有关系,但又不存在完全确定的函数关系。如:不存在完全确定的函数关系。如: 施肥量与产量的关系施肥量与产量的关系 药物浓度与反应率的关系;药物浓度与反应率的关系;一、函数关系与统计关系一、函数关系与统计关系 函数关系是一种确定的关系。例如圆面积与函数关系是一种确定的关系。例如圆面积与半径的关系为:半径的关系为:第一节第一节 直线回归与相关的基本概念直线回归与相关的基本概念 二、自变数与依变
2、数二、自变数与依变数 对据有统计关系的两个变数,分别用变数对据有统计关系的两个变数,分别用变数符号符号Y Y 和和X X 表示。根据两个变数的作用特点,表示。根据两个变数的作用特点,统计关系又可分为因果关系和相关关系两种。统计关系又可分为因果关系和相关关系两种。 两个变数间的关系若有原因和反应两个变数间的关系若有原因和反应( (结果结果) )的性质,则称这两个变数间存在因果关系,并的性质,则称这两个变数间存在因果关系,并定义原因变数为自变数定义原因变数为自变数, ,以以X X 表示;定义结果表示;定义结果变数为依变数变数为依变数, ,以以Y Y 表示。表示。 n如果两个变数并不是原因和结果的关
3、系,是如果两个变数并不是原因和结果的关系,是一种平行关系,呈现一种共同变化的特点,一种平行关系,呈现一种共同变化的特点,则称这两个变数间存在相关关系。如在人的则称这两个变数间存在相关关系。如在人的身高和体重关系中,它们不是互为因果,而身高和体重关系中,它们不是互为因果,而是同步增长、互有影响的。是同步增长、互有影响的。n相关关系中没有自变数和依变数之分。相关关系中没有自变数和依变数之分。相关关系:相关关系:n(1)(1)对具有因果关系的两个变数,统计分析的任务对具有因果关系的两个变数,统计分析的任务是由实验数据推算出一个表示是由实验数据推算出一个表示Y Y 随随X X 的改变而改变的改变而改变
4、的方程的方程 ,称之为回归方程,称之为回归方程(regression (regression equation of Y on X )equation of Y on X ),这一过程称为回归分析。,这一过程称为回归分析。n(2)(2)对具有相关关系的两个变数,统计分析的目标对具有相关关系的两个变数,统计分析的目标是计算表示是计算表示Y Y和和X X相关密切程度的统计数,并测验其相关密切程度的统计数,并测验其显著性。这一过程称为相关分析。显著性。这一过程称为相关分析。)(xfy n三、回归分析和相关分析三、回归分析和相关分析 相关分析只能研究两个变数相关分析只能研究两个变数y和和x相关密切程度
5、,相关密切程度,而不能用一个变量去预测和控制另一个变量的变化,而不能用一个变量去预测和控制另一个变量的变化,这是回归分析和相关分析区别的关键所在。这是回归分析和相关分析区别的关键所在。 但二者不能截然分开,由回归分析可以获得相但二者不能截然分开,由回归分析可以获得相关的一些重要信息,由相关分析可以获得回归的一关的一些重要信息,由相关分析可以获得回归的一些重要信息。些重要信息。 对于同一资料来说,回归系数和相关系数进行对于同一资料来说,回归系数和相关系数进行显著性检验,都是检验该总体有无直线关系。对于显著性检验,都是检验该总体有无直线关系。对于同一资料,回归显著,相关显著;反之也成立。同一资料,
6、回归显著,相关显著;反之也成立。回归分析和相关分析:回归分析和相关分析:n四、两个变数资料的散点图四、两个变数资料的散点图n将两个变数的将两个变数的n对观察值对观察值(x1,y1)、(x2,y2)、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面分别以坐标点的形式标记于同一直角坐标平面上得到的图,称为散点图上得到的图,称为散点图(scatter diagram)。1234x,生物产量生物产量(g)0.00.51.01.52.0y,稻谷产量稻谷产量(g)水稻单株生物产量与稻谷产量的散点图水稻单株生物产量与稻谷产量的散点图3.23.644.44.8x,每平方米颖花数每平方米颖花数(万万)05
7、560657075y,结实率结实率(%)水稻每平方米颖花数和结实率的散点图水稻每平方米颖花数和结实率的散点图34567890250300350400450 x,最高叶面积指数最高叶面积指数y,产量产量(kg/亩亩)水稻最高叶面积指数和亩产量的散点图水稻最高叶面积指数和亩产量的散点图利用散点图判断相关性质及密切程度利用散点图判断相关性质及密切程度r-1(d)r1(b)0r1(a)-1r0时)或减少(b0时)的单位数,叫回归系数(regression coefficeint)。bxay bxayn从上图得知,要使从上图得知,要使 能够最好地代表能够最好地代表y和和x在数量上的互变关系,必须使在数量
8、上的互变关系,必须使bxay为最小nyyQ12) (最小nbxayQ12)(yxbxay( yi- )实际观察值与估计值之差iy 二、求二、求a和和b值值n分别对分别对a a和和b b求偏导并令其为求偏导并令其为0 0,即:,即:0)(20)(2bxayxbQbxayaQxyxbxayxban2xbya22)(11xnxyxnxyb2)()(xxyyxxxSSSPn式中式中 是是x的离均差和的离均差和y的离均差的乘积的离均差的乘积之和,简称乘积和之和,简称乘积和(sum of products),记作记作SP。)(yyxx例例7.1一些夏季害虫盛发期的早迟和春季温度高一些夏季害虫盛发期的早迟和
9、春季温度高低有关。江苏武进连续低有关。江苏武进连续9年测定年测定3月下旬至月下旬至4 月中旬月中旬旬平均温度累积值旬平均温度累积值(x,旬旬.度度)和水稻一代三化螟盛发和水稻一代三化螟盛发期期(y,以以5月月10日为日为0)的关系,得结果于下表。试计算的关系,得结果于下表。试计算其直线回归方程。其直线回归方程。x累积温累积温35.534.131.740.336.840.231.739.244.2y盛发期盛发期12169273139-1三、直线回归方程的计算三、直线回归方程的计算解:解:1.由观察值计算一级数据由观察值计算一级数据7.3332.441.345.359xn49.125172 .44
10、1 .345 .352222x70)1(1612y4 .2436)1(2 .44161 .34125 .35794)1(16122222xyy2. 由一级数据计算二级数据由一级数据计算二级数据 0444.1599/ )707 .333(4 .2436/5556.2499/)70(794/)(6356.1449/) 7 .333(49.12517/)(222222nyxxySPnyySSnxxSSyx0778.379/7 .333/ nxx778.79/70/nyyn3.求求a和和b值值度旬天).( /0996. 16356.144/0444.159/xSSSPb)(5485.48)0778.3
11、70996. 1(7778. 7天xbyaxy0996. 15845.484. 求回归方程:求回归方程:n当当3 3月下旬至月下旬至4 4月中旬的积温月中旬的积温(x)(x)每提高每提高1 1旬旬度时,度时,一代三化螟的盛发期平均将提早一代三化螟的盛发期平均将提早1.11.1天;若积温为天;若积温为0 0,则一代三化螟的盛发期将在则一代三化螟的盛发期将在6 6月月27282728日日(x=0(x=0时,时,y y =48.5=48.5;因;因y y是以是以5 5月月1010日为日为0 0,故,故48.548.5为为6 6月月27282728日)。日)。n但在应用回归方程预测时,需限定但在应用回
12、归方程预测时,需限定x x的区间为的区间为31.731.7,44.244.2;如要在;如要在x x31.731.7或或44.244.2的区间外延,则必的区间外延,则必须有新的依据。须有新的依据。回归系数和回归截距的意义:回归系数和回归截距的意义: x,3月下旬至4月中旬旬平均温度累积值 旬平均温度累积值和一代三化螟盛发期的关系 四、直线回归方程的图示四、直线回归方程的图示xy0996. 15485.48n五、直线回归的估计标准误五、直线回归的估计标准误n满足满足 为最小的直线回归方程和实为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存测的观察点并不重合,表明该回归方程仍然存在随
13、机误差。在随机误差。nQ Q 就是误差的一种度量,称之为离回归平方和就是误差的一种度量,称之为离回归平方和或剩余平方和。或剩余平方和。2) (yyQn由于在建立回归方程时用了由于在建立回归方程时用了a a 和和b b 两个统计数,两个统计数,故故Q Q 的自由度的自由度=n-2=n-2。因此,可定义回归方程的。因此,可定义回归方程的估计标准误为:估计标准误为:2nQsxy2)(2nyynQ值的计算:值的计算: )() (22xySSSPSSyyQ 6670.746356.144)0444.159(5556.249 2Q)(266. 329667.742天nQsxy22)()(yyyyyy)(2
14、) () ( 22yyyyyyyy0)( yyyy因为 ) () ( )( 222yyyyyy故(1)F (1)F 检检验验第三节第三节 直线回归的假设测验直线回归的假设测验n一、直线回归的假设测验一、直线回归的假设测验n1 1、回归关系的假设测验、回归关系的假设测验(t (t 测验和测验和F F测验只选测验只选择择。具有的不同而引起的,它是由作则为回归平方和,简记的大小无关,具有它和,即离回归平方和上式的1)2() 1()(; 2 22nnxUyynxQ) y(y-xySSSPQSSyyU22)()( n例试用例试用F F测验法检测测验法检测7.17.1资料回归关系的显著性。资料回归关系的显
15、著性。著性。即可测定回归关系的显分布,故由的,差比遵循由于回归和离回归的方)2( /Q 21 21nUFFn变异来源变异来源DFSSMSFF0.01回归回归1174.8886174.8886 16.40*12.25离回归离回归774.667010.6667总变异总变异8249.5556n说明积温和一代三化螟盛发期是有极显著的直线回归关系。说明积温和一代三化螟盛发期是有极显著的直线回归关系。n(2)t (2)t 检验检验n若总体不存在直线回归关系,则总体回归系数若总体不存在直线回归关系,则总体回归系数=0=0;若总体存在直线回归关系,则总体回归;若总体存在直线回归关系,则总体回归系数系数00。n
16、所以对直线回归的假设测验为:所以对直线回归的假设测验为:nH0H0:=0 =0 对对HAHA:00。n回归系数回归系数b b的标准误为:的标准误为:xxyxybSSsxxss22)(bsbtn例试测验例试测验7.17.1资料回归关系的显著性。资料回归关系的显著性。05. 42715. 000996. 1 2716. 06356.144266. 3 ,266. 3,6356.144,0996. 1 tssSSbbxyx故有:已算得查附表查附表3 3,50. 305. 4|50. 3,36. 27 ,01. 07 ,01. 07 ,05. 0tttt现实得。n接受接受HAHA:00,即认为积温和一
17、代三化螟盛发期,即认为积温和一代三化螟盛发期是有真实的直线回归关系。是有真实的直线回归关系。第四节第四节 相关分析相关分析8.3.1 相关系数和决定系数相关系数和决定系数n一、相关系数IIIIVIIIXYIIIIVIIIXYIIIIVIIIXY设有一设有一X X、Y Y 均为随机变量的双变数总体,具有均为随机变量的双变数总体,具有N N对对(X(X,Y)Y)。若在标有这。若在标有这N N个个(X(X,Y)Y)坐标点的直角坐标上移动坐标点的直角坐标上移动坐标轴,将坐标轴,将X X轴和轴和Y Y轴分别平移到轴分别平移到XX和和YY上,则各点上,则各点位置不变,而所取坐标变为位置不变,而所取坐标变为
18、(X-X(X-X,Y-Y)Y-Y)。n后者是由X的不同而引起。显然,若坐标点愈靠近回归线,则U对SSy的比率愈大,直线相关就愈密切,故样本的相关系数r 为: 11rYSSUryxSSSSSPyxSSSSSP2)(22)()(yyyy从样本的角度分析,y 的平方和SSy是由离回归平方和 及回归平方和 构成的,2) (yyQxSSSPyyU/)()(22n二、决定系数二、决定系数n决定系数决定系数(determination coefficient):(determination coefficient):由由x x 不同引起的不同引起的 y y 的平方和的平方和 占总平方和占总平方和 的比率。的
19、比率。2)(yyU2)(yySSyyxyxSSSSSPSSSSSPr222)(/)(可见,决定系数即为相关系数r 的平方值。7008. 05556.2496356.144)0444.159( 8371. 05556.2496356.1440444.159 ,0444.159,5556.249,6356.14422rrSPSSSSyx代入公式有:已算得该资料的三、相关系数的性质n-1 r 1-1 r 1nr r的符号表示相关的性质的符号表示相关的性质nr r0 0为零相关或不相关为零相关或不相关nr r0 0为正相关为正相关nr r0 0为负相关为负相关nr r的绝对值表示相关的密切程度的绝对值
20、表示相关的密切程度nr r的绝对值越接近于的绝对值越接近于1 1,相关越密切;,相关越密切;nr r的绝对值越接近于的绝对值越接近于0 0,相关越不密切;,相关越不密切;nr r的绝对值为的绝对值为0 0,零相关或不相关;,零相关或不相关;nr r的绝对值为的绝对值为1 1,完全相关,完全相关nr=1,r=1,完全正相关完全正相关nr=-1,r=-1,完全负相关完全负相关回归分析和相关分析的区别和联系:回归分析和相关分析的区别和联系:区别:区别:n1.资料要求不同。回归要求依变量资料要求不同。回归要求依变量y服从正态分服从正态分布,布,X是可以控制的。相关则要求两个变量是可以控制的。相关则要求
21、两个变量X 和和y都服从正态分布,有两个回归方程。都服从正态分布,有两个回归方程。n2.回归反映两个变量之间的单向关系,相关表回归反映两个变量之间的单向关系,相关表示两个变量之间的双向关系。示两个变量之间的双向关系。n3.回归系数可以是如何实数,有单位;而相关回归系数可以是如何实数,有单位;而相关系数在系数在-1,1内取值,无单位。内取值,无单位。联络:联络:n1.方向一致。方向一致。n两者的符号是一致的。两者的符号是一致的。r为正时,说明两个变量的相为正时,说明两个变量的相关关系时同向变化的;关关系时同向变化的;b为正时,说明两个变量之为正时,说明两个变量之间由回归方程所确定的函数关系是递增
22、的。间由回归方程所确定的函数关系是递增的。n2.假设检验等价。可以互相替代。假设检验等价。可以互相替代。n3.相关和回归可以互相解释。相关和回归可以互相解释。n当当SS总不变的情况下,回归平方和的大小决定了总不变的情况下,回归平方和的大小决定了相关系数的大小,相关系数的大小, r2则可以反映回归平方和在总则可以反映回归平方和在总平方和中所占的比重。回归平方和接近总平方和平方和中所占的比重。回归平方和接近总平方和时,时, r2接近接近1,回归效果好。同时也可以从回归,回归效果好。同时也可以从回归的角度对相关程度做进一步的解释。如的角度对相关程度做进一步的解释。如r=0.5, r2=0.25,说明一个变量,说明一个变量y的总变异能够通过的总变异能够通过x变变量以直线回归的关系来估计的比重只占量以直线回归的关系来估计的比重只占25%,其,其余余75%的变异无法借助直线回归来估计,从而说的变异无法借助直线回归来估计,从而说明两变量间的相关关系实际意义不大。明两变量间的相关关系实际意义不大。直线回归和相关的应用要点:直线回归和相关的应用要点:n1.要由学科专业知识作指
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华东师大版数学八年级上册《11.1.1 平方根》听评课记录
- 大型商场商铺租赁合同范本
- 二零二五年度舞台搭建安全规范与责任落实协议
- 2025年度电梯维保与电梯安全评估及认证合同
- 二零二五年度足浴店转让与原址租赁续约协议
- 2025年度全国销售员绩效奖金与权益保障合同
- 2025年度自建房整体出租管理服务合同
- 二零二五年度铁路货运合同能源消耗及碳排放管理协议
- 二零二五年度烧烤店员工试用期与转正合同
- 2025年度鱼塘租赁与经营管理服务合同
- 江苏省2023年对口单招英语试卷及答案
- 易制毒化学品安全管理制度汇编
- GB/T 35506-2017三氟乙酸乙酯(ETFA)
- GB/T 25784-20102,4,6-三硝基苯酚(苦味酸)
- 特种设备安全监察指令书填写规范(特种设备安全法)参考范本
- 硬笔书法全册教案共20课时
- 《长方形的面积》-完整版课件
- PDCA降低I类切口感染发生率
- 工业企业现场监测工况核查表
- 沉淀池及排水沟清理记录表
- 急诊急救信息化课件
评论
0/150
提交评论