植物营养研究方法 第六章-4 回归分析_第1页
植物营养研究方法 第六章-4 回归分析_第2页
植物营养研究方法 第六章-4 回归分析_第3页
植物营养研究方法 第六章-4 回归分析_第4页
植物营养研究方法 第六章-4 回归分析_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四节第四节 回归分析回归分析回归和相关的概念回归和相关的概念一、变数间的关系一、变数间的关系二、直观描述变数间关系的散点图二、直观描述变数间关系的散点图变数间相依的性质(正负)及密切程度变数间相依的性质(正负)及密切程度变数间是直线关系还是非直线关系变数间是直线关系还是非直线关系是否存在一些特殊点表示有其他因素的是否存在一些特殊点表示有其他因素的干扰干扰散点图可以给出的三点信息散点图可以给出的三点信息三、回归模型和相关模型三、回归模型和相关模型 -回归分析与相关分析回归分析与相关分析1. 变数本身的特点变数本身的特点变数x各水平可控,不存在实验误差或实验误差小到可以忽略,而变数y具有明显的实

2、验误差回归回归x、y两个变数均具有明显的实验误差2. 变数间的关系变数间的关系x和y具有因果关系回归回归平行关系,仅表现为一定程度上的协同变异3.是否具有预测数量变化的功能是否具有预测数量变化的功能可以利用自变数x的取值来预测因变数y的取值相互间不存在数量上的预测功能回归回归直线回归直线回归分析的基本步骤:直线回归分析的基本步骤:做散点图,确定两变数间是否存在回归关系做散点图,确定两变数间是否存在回归关系建立直线回归方程建立直线回归方程作回归直线图作回归直线图直线回归的假设测验直线回归的假设测验一、直线回归方程的建立一、直线回归方程的建立bxay 22bxayyyQ 要使所得方程能够最好的代表

3、要使所得方程能够最好的代表y和和x在数量上的在数量上的关系,根据关系,根据最小二乘法最小二乘法:的的直直线线回回归归方方程程依依此此方方程程称称为为xy为为回回归归系系数数为为回回归归截截距距, ba的的估估计计值值中中是是数数对对yyxy),( xyxbxayxbanxbxaybxaybQaQ20)(20)(2 xnnSSSPxxyyxxxxyxxybxbya22121)()( )()(整理求解得:整理求解得:)(yyxxSP0) () (2 yyyyQba为为最最小小,同同时时使使的的取取值值后后,可可保保证证和和确确定定了了 x的离均差和的离均差和y的离均差的的离均差的乘积和乘积和 a的

4、取值决定了直线在坐标中的位置,而的取值决定了直线在坐标中的位置,而b的取值决定了的取值决定了直线的走向直线的走向 若若b等于等于0或与或与0的差异不显著,则表明的差异不显著,则表明y的变异和的变异和x的取值的取值大小没有关系,两个变数之间的直线回归关系不能成立大小没有关系,两个变数之间的直线回归关系不能成立b=0)(xxbybxxbyyxbya 代代入入回回归归方方程程原原式式得得将将),(,yxyyxx经过点经过点定定可见,所得回归直线必可见,所得回归直线必时时 ),(0) () (2yxyyyyQ回归直线必定经过点最小质:直线回归的三个基本性- -1 144.244.29 939.239.

5、2131331.731.73 340.240.27 736.836.82 240.340.39 931.731.7161634.134.1121235.535.5盛发期盛发期y y累积温度累积温度x x- -1 144.244.29 939.239.2131331.731.73 340.240.27 736.836.82 240.340.39 931.731.7161634.134.1121235.535.5盛发期盛发期y y累积温度累积温度x x解解: (1) 做做x、y的散点图的散点图例例( (月月 / /日日 ) )5 5/ /2 25 55 5/ /2 20 05 5/ /1 15 5

6、5 5/ /1 10 05 5/ /5 5- -5 50 05 51 10 01 15 52 20 03 30 03 34 43 38 84 42 24 46 6x x( (3 3月月下下旬旬至至4 4月月中中旬旬平平均均累累积积温温度度) )y y一一代代三三化化螟螟盛盛发发期期(2) 求各级统计数求各级统计数4 .2436) 1(2 .44.125 .35794) 1(.1270) 1(.1249.125172 .44.5 .357 .3332 .44.1 .345 .359222222xyyyxxn* 由观察值直接计算获得由观察值直接计算获得6个一级数据个一级数据7778. 79/70/

7、0778.379/7 .333/0444.1599/ )707 .333(4 .2436/5556.2499/)70(794/)(6356.1449/)7 .333(49.12517/)(222222nyynxxnyxxySPnyySSnxxSSyx* 由由由一级数据计算获得由一级数据计算获得5个二个二级数据级数据)(5485.48)0778.370996. 1(7778. 7)/(0996. 16356.144/0444.159/天度旬天xbyaSSSPbxxyxy1 . 15 .480996. 15485.48对于每一个具体的回归方程,根据所描述的对对于每一个具体的回归方程,根据所描述的对

8、象,回归系数和回归截距均有其专业意义。象,回归系数和回归截距均有其专业意义。(P161)* 最终计算得最终计算得(3) 获得回归方程为:获得回归方程为: 即找两个即找两个x值,计算对应两个点的回归值作值,计算对应两个点的回归值作一条经过这两个点的直线。一条经过这两个点的直线。 y = -1.0996x + 48.549-5-50 05 510101515202030303434383842424646x(3月下旬至4月中旬平均累积温度)x(3月下旬至4月中旬平均累积温度)y一代三化螟盛发期y一代三化螟盛发期(4) 做直线回归图做直线回归图),(yx该直线必经过点该直线必经过点(样样本本)(总总

9、体体)直直线线回回归归的的数数学学模模型型jjjjjjebxayXY 中的一个随机样本中的一个随机样本只是只是试验所得一组观察值试验所得一组观察值,固定固定随机,随机,析的基本假定析的基本假定按上述模型进行回归分按上述模型进行回归分),(),(.),(.)163(2/2/ XYiiXYXYNyxcXNYbXYap 二、直线回归的数学模型、基本假定及其二、直线回归的数学模型、基本假定及其方差分解方差分解(p163) 2222)() ()()(yyyyyyyyyySSy平方和的分解平方和的分解2) (2 nvxyyQ具具有有自自由由度度无无关关与与,称称为为离离回回归归平平方方和和,令令1)2()

10、1()(2 nnvxyyU具具有有自自由由度度引引起起,称称为为回回归归平平方方和和,由由令令UQSSy 直线回归的估计标准误直线回归的估计标准误离回归标准误离回归标准误样本的估计标准误为回归精确度的度量样本的估计标准误为回归精确度的度量估计标准误越小,回归方程估计估计标准误越小,回归方程估计 y 的精的精确度越高确度越高2)(2/2nyynQxys定义回归方程的估计标准误为:定义回归方程的估计标准误为:Q值的计算方法值的计算方法注意:计算时,尽量采用更低级别的数注意:计算时,尽量采用更低级别的数据,以免产生过多计算误差据,以免产生过多计算误差 xybyaySSbSSSPbSSSSyyQxyy

11、SSSPyx22)(2)()() (20:),(02 HXN即即的的概概率率很很小小体体判判定定是是否否样样本本不不属属于于总总三、直线回归的假设测验三、直线回归的假设测验1、直线回归的存在性测验、直线回归的存在性测验(1)t 测验测验测验回归系数测验回归系数b(例(例9.3,P163)bsbt )(2 nvxxyxxxysbSSss/2)(2/ )2/(/)()2/(1/2 nQSSSPnQUxF)(2, 121 nvv(2)F 测验测验使得回归平方和相对于离回归使得回归平方和相对于离回归平方和足够大平方和足够大注意:注意: t 测验和测验和F 测验的结果是完全相等的,因测验的结果是完全相等

12、的,因为在同一概率下,为在同一概率下,v11,v2n-2时的时的F 值正好值正好等于等于v n-2 的的t2。代代表表性性以以通通过过合合并并提提高高若若两两个个方方程程同同质质,则则可可否否同同质质数数和和回回归归截截距距是是判判定定两两个个方方程程的的回回归归系系 222122210)(. :对对:测测验验,相相同同的的误误差差即即是是否否具具有有同同质质首首先先判判定定两两组组数数据据是是否否AHHFa)22(2)21(1 nQnQF较较小小离离回回归归方方差差较较大大离离回回归归方方差差2、两个回归方程的同质性测验、两个回归方程的同质性测验xysF/标标准准误误合合并并得得到到合合并并

13、的的离离回回归归下下,将将两两个个离离回回归归方方差差测测验验差差异异不不显显著著的的情情况况)2()2(/2121 nnQQxys21210. :对对:归归系系数数是是否否相相等等判判定定两两个个回回归归方方程程的的回回AHHb2121bbsbbt 22/12/21xxyxxySSsSSsbbs )(421 nnv21210 xxSSSSSPSPbH程的回归系数得的情况下,合并回归方在接受21210. :对对:归截距是否相等归截距是否相等判定两个回归方程的回判定两个回归方程的回AHHc2121aasaat )1(22/2xxyaSSxnss )(421 nnv)11(222212112/21

14、xxxyaaSSxnSSxnss xbyaH 的的回回归归截截距距得得的的情情况况下下,求求回回归归方方程程在在接接受受0直线相关直线相关一、相关系数与决定系数一、相关系数与决定系数1、相关系数、相关系数 r44.451.458.465.472.436.943.950.957.964.9xyX Y IIIIVIII0)(0)( YXYX 0)(0)( YXYX 0)(0)( YXYX 0)(0)( YXYX 0)( YXYX 44.451.458.465.472.436.943.950.957.964.9xyX Y IIIIVIII0)( YXYX 0)(0)( YXYX 0)(0)( YXY

15、X 0)(0)( YXYX 0)(0)( YXYX 44.451.458.465.472.436.943.950.957.964.9xyX Y IIIIVIII0)(0)( YXYX 0)(0)( YXYX 0)(0)( YXYX 0)(0)( YXYX 0)( YXYX 直直线线相相关关的的程程度度和和性性质质可可以以度度量量两两个个变变数数 )(YXYX 的大小影响以及单位的值会受到数据采用的但是,NSP NYXNYYXX11 相关系数为相关系数为可以定义双变数总体的可以定义双变数总体的 222)(2)()()()()(1)(111 YXYXNYYNXXYXYXYXYYXXYXYXYXNY

16、XNNYXN yxSSSSSPyyxxyyxxr 22)()()(数数为为,双双变变数数样样本本的的相相关关系系如如果果以以样样本本数数据据来来表表示示xSSSPb 回回归归系系数数为为上上是是一一致致的的性性质质系系数数在在表表示示数数据据的的分分布布因因此此,相相关关系系数数和和回回归归yxxyxyxyxyxyxySSSSSPSSSSSPSSUSSSSSPSSSSSPSSUrr22/22/)(/)(2)(/)(2 的的平平方方即即决决定定系系数数是是相相关关系系数数的的比比率率,变变数数总总平平方方和和占占变变数数的的平平方方和和的的不不同同而而引引起起的的或或由由于于变变数数的的比比率率

17、,变变数数总总平平方方和和占占平平方方和和变变数数的的的的不不同同而而引引起起的的定定义义为为:由由于于变变数数)()()()(/xyxyxySSxUxySSyUyx2、决定系数、决定系数 r2 0,001,10)1(0022/yyxyyyxyyyyxyyyyxySSSSUSSSSUySSSSSSUSSSSSSUyrrUSSQrrSSUQ则则时时,则则时时,取取值值范范围围具具有有不不同同 更更加加密密切切欠欠密密切切的的密密切切程程度度不不同同和和表表达达的的22)2(rrrryx 无无法法知知道道正正负负相相关关可可以以知知道道正正负负相相关关相相关关的的性性质质和和是是否否能能反反映映2

18、)3(rryx3、相关系数相关系数与与决定系数决定系数的对比的对比nyxxySPnyySSnxxSSyx/)(/)(2222计算平方和与乘积和yxyxSSSSSPSSSSSPrr2)(2数计算相关系数与决定系4、相关系数相关系数与与决定系数决定系数的计算的计算分布分布有经转换后才符合有经转换后才符合逐渐呈钟形分布,但只逐渐呈钟形分布,但只密度密度的区间内具有相同概率的区间内具有相同概率在在时为矩形分布,即时为矩形分布,即时概率密度最小时概率密度最小形分布,形分布,时为时为两种两种和和只有只有时为二项分布,其取值时为二项分布,其取值不同会有不同分布不同会有不同分布因因tnrnrUnnn51 ,

19、14031)1(2 2212021rnrsrnrrrts )2( nv二、相关系数的假设测验二、相关系数的假设测验1、测验测验 H0:=022212 tvtrnrrrtt 值值显显著著性性的的临临界界值值转转换换后后可可以以获获得得判判断断,经经过过是是一一定定的的,此此时时一一定定的的情情况况下下在在r水平下的临界值和附表给出了01. 0=05. 0=结束分析结束分析不显著不显著做回归分析做回归分析一般先检验相关系数一般先检验相关系数相关系数检验相关系数检验回归系数检验回归系数检验对于同一组资料对于同一组资料显著显著 的取值而异的取值而异和和因因呈明显的偏态分布,且呈明显的偏态分布,且时,时

20、, nr0 近近似似正正态态分分布布值值,使使转转换换后后的的见见附附表表转转换换分分布布逼逼近近,可可通通过过也也不不能能再再由由换换取取值值很很大大,再再做做前前述述转转即即便便zztn)11( )0()ln()0()ln(|1|1211121rzrzrrrr )0()ln()0()ln(|1|1211121 zz31 nz 2、测验测验 H0:=Czzzu 的总体的总体个具有个具有,看此样本是否来自一,看此样本是否来自一例例90. 0)10(9201. 0: nr05. 0)2(90. 0:90. 0:)1(:0 AHH,解解4722. 1)ln(5897. 1)ln()3(|90. 0

21、|1|90. 0|121|9201. 0|1|9201. 0|121 zzzr 测验计算测验计算378. 03101 z 31. 0378. 04722. 15897. 1 zzzu 0,05. 0,96. 131. 0|Hpu接接受受 (4)(4)解释解释 此样本来自指定的总体此样本来自指定的总体2121zzrr和和都需要分别转换为都需要分别转换为和和31312121 nnzz 212121)()(zzzzzzu 3、测验测验 H0:1= 2应用直线回归与相关的注意事项应用直线回归与相关的注意事项 1.回归和相关分析要有学科专业知识作指导回归和相关分析要有学科专业知识作指导2.严格控制研究对

22、象以外的有关因素(即唯一差严格控制研究对象以外的有关因素(即唯一差异原则)异原则)3.正确理解回归或相关显著与否的含义正确理解回归或相关显著与否的含义直线回归或相关分析结果不显著并不意味着变量直线回归或相关分析结果不显著并不意味着变量x和和y之间没有关系,而只有能说明两变量间没有显之间没有关系,而只有能说明两变量间没有显著的直线关系著的直线关系一个显著的相关系数或回归系数亦并不意味着一个显著的相关系数或回归系数亦并不意味着x和和y的关系必定为直线,因为并不排除有能够更好地描的关系必定为直线,因为并不排除有能够更好地描述它们关系的非线性方程的存在述它们关系的非线性方程的存在直线回归与相关分析一般

23、是在一定取值区间内对两直线回归与相关分析一般是在一定取值区间内对两个变量间的关系进行描述个变量间的关系进行描述 4.一个显著的回归方程并不一定具有实践上的预一个显著的回归方程并不一定具有实践上的预测意义测意义主要看有无学科专业意义主要看有无学科专业意义一般而言,当需要由一般而言,当需要由X预测预测Y时,时,|r|需要要需要要大于大于0.7,此时,可以由,此时,可以由X说明的说明的Y的变异才的变异才接近和大于接近和大于505.两个变数的样本容量一般不少于两个变数的样本容量一般不少于5,回归分析中,回归分析中x变数的取值范围尽量宽一些变数的取值范围尽量宽一些多元线性回归多元线性回归研究因变量y与多个变量x之间的定量关系。(一)多元线性回归的数学模型(一)多元线性回归的数学模型如P177,表3-71;其多元线性回归方程为:bj-y对xj的偏回归系数,表示当其它x固定时,xj对y的贡献率。(二)(二)b0和和bj的求法的求法以例3.4.5为例,讲解excel中的方法:第一步,录入数据 第二步,计算过程(1)打开回归对话框。沿着主菜

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论