12-线性回归分析2-课件_第1页
12-线性回归分析2-课件_第2页
12-线性回归分析2-课件_第3页
12-线性回归分析2-课件_第4页
12-线性回归分析2-课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第12章线性回归分析第12章线性回归分析1两变量间的关系A无关系B有关系确定性关系:已知一个变量能够精确求出另一个变量的值,两变量是完全对应的。如I=U/R、V=S/T非确定性关系:两变量存在某种关系,但非完全的一一对应关系,而是具有某种趋势。例:正常人血压随年龄增高而增高,但不能讲某一年龄的人,他的血压一定是多少。

两变量间的关系A无关系2对于线性回归,若只有1个自变量,称为简单回归(simpleregression);若有2个或2个以上自变量,称为多重回归(multipleregression)。

当这种数量关系为曲线关系时,称为曲线回归/非线性回归(curveregression/nonlinearregression)。对于线性回归,若只有1个自变量,称为简单回归(simple3

例12-1用某饲料喂养12只大白鼠,得出大白鼠的进食量与体重增加量如表12-1,试绘其散点图.12-线性回归分析2-课件412-线性回归分析2-课件5由图12-1可见,体重增加量随进食量增加而增大且呈直线趋势,但并非12个点子恰好全都在一直线上。这与两变量间严格对应的函数关系不同,称为直线回归(linearregression)。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simpleregression)。由图12-1可见,体重增加量随进食量增加而增大且呈直线趋势,6

回归方程的一般形式:

a为回归直线在Y轴上的截距(intercept),即X=0时的Y的估计值。a>0表示回归直线与Y轴的交点在原点上方a<0表示回归直线与Y轴的交点在原点下方a=0表示回归直线通过原点回归方程的一般形式:7b为回归系数(coefficientofregression)

即回归直线的斜率(slope),b的统计学意义是X每增加(减少)一个单位,Y平均改变b个单位。b>0Y随X的增大而增大b<0Y随X的增大而减小b=0回归直线与X轴平行,Y与X之间无直线关系。b为回归系数(coefficientofregressi8直线回归方程的求法用最小二乘法(leastsquaremethod)求a、b,使得各实测点到该直线的纵向距离的平方和(残差,剩余平方和)最小,可得a和b的计算公式:直线回归方程的求法用最小二乘法(leastsquarem912-线性回归分析2-课件10求中间统计量lXX、lYY、lXY直线回归方程的求解过程求中间统计量lXX、lYY、lXY直线回归方程的求解113、按公式求a、b,并列出回归方程

则3、按公式求a、b,并列出回归方程12直线回归方程的图示

在X的实测范围内任取相距较远且易读的两个X值,代入回归方程,求相应的,然后将这两点连成一条线即可。可用下列两点来核对图形绘制是否正确:1、所绘直线必通过点(、)2、此直线与Y轴交点的纵坐标等于a(直线是否在自变量X的实测范围内)直线回归方程的图示

在X的实测范围内任取相距较远且易读的两个13直线回归系数的假设检验

b是的估计值,b存在抽样误差,其大小可用b的标准误Sb来表示。即使=0,,由于抽样误差的存在使所得b值也可能不为0,因此求得了b的大小还应该作=0的检验。具体有两种方法:方差分析法与t检验。直线回归系数的假设检验b是的估计值,b存在抽样误差,14因变量Y的变异分解图示●●●●●●●●●●●●●(一)、方差分析法

P(X,Y)因变量Y的变异分解图示●●●●●●●●●●●●●(一)、方差15lYY的分解:

表示为:=+总=回+剩

(总=n-1,回=1,剩=n-2)SS总SS回SS剩lYY的分解:SS总SS回SS剩16SS总是Y的离均差平方和,表示Y的总变异。SS回表示在Y的总变异中可用X来解释的部分,即使得总变异(Y-)2减少的那部分。SS回越大,说明回归效果越好。SS回=blXY=SS剩表示在Y的总变异中无法用X解释的部分,即除了X对Y的线性影响外,其它一切因素对Y变异的作用。SS总是Y的离均差平方和,表示Y的总变异。17将SS总分解为SS回与SS剩两部分,SS回越大表明回归效果越好,即X对Y的影响越大;SS剩越小,说明各实测点到回归直线越近,回归的估计误差越小。比较回归均方和误差均方,计算检验统计量F值

回=1,剩=n-2将SS总分解为SS回与SS剩两部分,SS回越大表明回归效果越18H0:体重的增加量与进食量之间无直线关系(=0)H1:体重的增加量与进食量之间有直线关系(0)

=0.05

SS总=lYY=193.3SS回=blXY=lXY2/lXX=2681.62/41389.4=173.7SS剩=SS总-SS回=193.3-173.7=19.6H0:体重的增加量与进食量之间无直线关系(=0)19

回=1,剩=12-2=10

查F界值表,得P<0.001,所以按=0.05水准拒绝H0,接受H1,故可认为体重的增加量与进食量之间有直线关系

,绘制回归直线0.107980.86326.9080.745410.7454回归91.6086总FMSSS回=1,剩=12-2=10查F界值表,得P<0.20(二、)t检验

当β=0时,样本回归系数b服从正态分布=剩=n-2Sb为样本回归系数b的标准误,SY.X为剩余标准差,反映了因变量在扣除了自变量的线性影响后的离散程度。

(二、)t检验当β=0时,样本回归系数b服从正态分布21H0、H1及同方差分析,代入公式求得t=9.42,查t界值表得P<0.001,结论同上。注意对同一份资料,F=t2,F检验与t检验所得的结论一致。回归系数的检验与相关系数的检验结论一致。H0、H1及同方差分析,代入公式求得t=9.42,查t界值22直线回归方程的应用

描述两变量在数量上的依存关系利用回归方程进行预测,也就是预报因子X等于某固定值X1时,预报量Y的波动范围(即Y的1-容许区间)利用回归方程进行统计控制,如要求因变量Y控制在一定范围内波动,可以通过控制自变量X的取值来实现。直线回归方程的应用描述两变量在数量上的依存关系23应用直线回归方程时注意:作回归分析要有实际意义。资料要求Y至少服从正态分布。散点图呈直线趋势才做直线回归分析.如散点图明显呈曲线趋势,应先通过变量变换使之直线化再作分析。可提示资料有无异常点。回归方程必须作假设检验。若回归/相关关系不显著,不绘制回归直线,以免引起误解。应用直线回归方程时注意:作回归分析要有实际意义。24回归方程的应用范围只限于原数据自变量的取值范围,不可任意延长回归直线,不能随意‘推算’到原数据范围之外。由于同一资料中由X推算Y与由Y推算X的两个直线回归方程不同,因此要根据专业知识正确选定自变量。若两变量间有因果关系,应以因为X;若无因果关系,则以较易被测量者或可以严格控制者为X。回归方程的应用范围只限于原数据自变量的取值范围,不可任意延长25第12章线性回归分析第12章线性回归分析26两变量间的关系A无关系B有关系确定性关系:已知一个变量能够精确求出另一个变量的值,两变量是完全对应的。如I=U/R、V=S/T非确定性关系:两变量存在某种关系,但非完全的一一对应关系,而是具有某种趋势。例:正常人血压随年龄增高而增高,但不能讲某一年龄的人,他的血压一定是多少。

两变量间的关系A无关系27对于线性回归,若只有1个自变量,称为简单回归(simpleregression);若有2个或2个以上自变量,称为多重回归(multipleregression)。

当这种数量关系为曲线关系时,称为曲线回归/非线性回归(curveregression/nonlinearregression)。对于线性回归,若只有1个自变量,称为简单回归(simple28

例12-1用某饲料喂养12只大白鼠,得出大白鼠的进食量与体重增加量如表12-1,试绘其散点图.12-线性回归分析2-课件2912-线性回归分析2-课件30由图12-1可见,体重增加量随进食量增加而增大且呈直线趋势,但并非12个点子恰好全都在一直线上。这与两变量间严格对应的函数关系不同,称为直线回归(linearregression)。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simpleregression)。由图12-1可见,体重增加量随进食量增加而增大且呈直线趋势,31

回归方程的一般形式:

a为回归直线在Y轴上的截距(intercept),即X=0时的Y的估计值。a>0表示回归直线与Y轴的交点在原点上方a<0表示回归直线与Y轴的交点在原点下方a=0表示回归直线通过原点回归方程的一般形式:32b为回归系数(coefficientofregression)

即回归直线的斜率(slope),b的统计学意义是X每增加(减少)一个单位,Y平均改变b个单位。b>0Y随X的增大而增大b<0Y随X的增大而减小b=0回归直线与X轴平行,Y与X之间无直线关系。b为回归系数(coefficientofregressi33直线回归方程的求法用最小二乘法(leastsquaremethod)求a、b,使得各实测点到该直线的纵向距离的平方和(残差,剩余平方和)最小,可得a和b的计算公式:直线回归方程的求法用最小二乘法(leastsquarem3412-线性回归分析2-课件35求中间统计量lXX、lYY、lXY直线回归方程的求解过程求中间统计量lXX、lYY、lXY直线回归方程的求解363、按公式求a、b,并列出回归方程

则3、按公式求a、b,并列出回归方程37直线回归方程的图示

在X的实测范围内任取相距较远且易读的两个X值,代入回归方程,求相应的,然后将这两点连成一条线即可。可用下列两点来核对图形绘制是否正确:1、所绘直线必通过点(、)2、此直线与Y轴交点的纵坐标等于a(直线是否在自变量X的实测范围内)直线回归方程的图示

在X的实测范围内任取相距较远且易读的两个38直线回归系数的假设检验

b是的估计值,b存在抽样误差,其大小可用b的标准误Sb来表示。即使=0,,由于抽样误差的存在使所得b值也可能不为0,因此求得了b的大小还应该作=0的检验。具体有两种方法:方差分析法与t检验。直线回归系数的假设检验b是的估计值,b存在抽样误差,39因变量Y的变异分解图示●●●●●●●●●●●●●(一)、方差分析法

P(X,Y)因变量Y的变异分解图示●●●●●●●●●●●●●(一)、方差40lYY的分解:

表示为:=+总=回+剩

(总=n-1,回=1,剩=n-2)SS总SS回SS剩lYY的分解:SS总SS回SS剩41SS总是Y的离均差平方和,表示Y的总变异。SS回表示在Y的总变异中可用X来解释的部分,即使得总变异(Y-)2减少的那部分。SS回越大,说明回归效果越好。SS回=blXY=SS剩表示在Y的总变异中无法用X解释的部分,即除了X对Y的线性影响外,其它一切因素对Y变异的作用。SS总是Y的离均差平方和,表示Y的总变异。42将SS总分解为SS回与SS剩两部分,SS回越大表明回归效果越好,即X对Y的影响越大;SS剩越小,说明各实测点到回归直线越近,回归的估计误差越小。比较回归均方和误差均方,计算检验统计量F值

回=1,剩=n-2将SS总分解为SS回与SS剩两部分,SS回越大表明回归效果越43H0:体重的增加量与进食量之间无直线关系(=0)H1:体重的增加量与进食量之间有直线关系(0)

=0.05

SS总=lYY=193.3SS回=blXY=lXY2/lXX=2681.62/41389.4=173.7SS剩=SS总-SS回=193.3-173.7=19.6H0:体重的增加量与进食量之间无直线关系(=0)44

回=1,剩=12-2=10

查F界值表,得P<0.001,所以按=0.05水准拒绝H0,接受H1,故可认为体重的增加量与进食量之间有直线关系

,绘制回归直线0.107980.86326.9080.745410.7454回归91.6086总FMSSS回=1,剩=12-2=10查F界值表,得P<0.45(二、)t检验

当β=0时,样本回归系数b服从正态分布=剩=n-2Sb为样本回归系数b的标准误,SY.X为剩余标准差,反映了因变量在扣除了自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论