第九章 直线相关与回归课件_第1页
第九章 直线相关与回归课件_第2页
第九章 直线相关与回归课件_第3页
第九章 直线相关与回归课件_第4页
第九章 直线相关与回归课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

直线回归与相关分析第九章直线相关与回归两变量间的关系1、确定性关系:函数2、不确定性关系:回归关系或相关关系2第九章直线相关与回归不确定性关系医学上,许多现象之间有相互联系,然而并不像函数那样是确定性关系。例如:身高与体重、体温与脉搏、年龄与血压等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。有些变量间关系密切,有些不密切以;有些是因果关系;但是,有的现象之间因果不清,只是伴随关系。

直线相关与回归就是用于研究和解释两个变量之间关系的统计方法。3第九章直线相关与回归直线回归Linearregression4第九章直线相关与回归“regression”一词的来源FGalton的研究5第九章直线相关与回归散点图(scatterdiagram)为了描述两变量之间的关系,首先在直角坐标系上描述这些点,这一组点集称为散点图。6第九章直线相关与回归为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。

第九章直线相关与回归图1078对父子身高间的关系

第九章直线相关与回归

直线回归就是用来描述一个变量如何依赖于另一个变量的统计方法。

dependentvariable(应变量)indepententvariable(自变量)9第九章直线相关与回归回归方程

直线回归的任务就是要找出因变量随自变量变化的直线方程,我们把这个直线方程叫做直线回归方程。

式中的是由自变量X推算应变量Y的估计值。

a是回归直线在Y轴上的截距,称为常数项(constant),即X=0时的Y值;

b为样本的回归系数(reg.Coeff.),即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。10第九章直线相关与回归最小二乘法(leastsquaremethod):直线一定经过“均数”点使各散点到直线的纵向距离的平方和最小。11第九章直线相关与回归回归直线的描绘

根据求得的回归方程,可以在自变量X的实测范围内任取两个值,代入方程中,求得相应的两个Y值,以这两对数据找出对应的两个坐标点,将两点连接为一条直线,就是该方程的回归直线。回归直线一定经过(0,a),。这两点可以用来核对图线绘制是否正确。12第九章直线相关与回归直线回归方程是从样本资料计算而得的,同样也存在着抽样误差问题。所以,需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得。为了判断抽样误差的影响,需对回归系数进行假设检验。总体的回归系数用β表示。

回归方程的检验13第九章直线相关与回归回归系数的假设检验H0:β=0H1:β≠0α=0.05选择合适的假设检验方法,计算检验统计量

(1)方差分析

F=MS回归/MS剩余

(2)t检验计算P值做出推论:统计学结论和专业结论第九章直线相关与回归X(1)回归系数的方差分析第九章直线相关与回归

Y的离均差平方和的分解16第九章直线相关与回归几个平方和的意义第九章直线相关与回归第九章直线相关与回归构建检验统计量F依据F分布判断P值19第九章直线相关与回归(2)采用t检验方法其中Sy.x为各观察值Y到回归直线的距离的标准差,表示去除X影响后Y的变异程度,称为剩余标准差。

20第九章直线相关与回归关于SY.X(standarddeviationofYforfixedX)21第九章直线相关与回归直线回归的应用

描述两变量之间的依存关系:通过回归系数的假设检验,若认为两变量之间存在直线回归关系,则可用直线回归方程来描述。利用回归方程进行预测:把自变量代入回归方程,对应变量进行估计,可求出应变量的波动范围。

利用回归方程进行统计控制。

与ANOVA结合,协方差分析。

22第九章直线相关与回归过定点的直线回归作标准曲线非常有用!(过原点)回归方程:23第九章直线相关与回归直线相关linearcorrelation

simplecorrelation

Pearson’scorrelation第九章直线相关与回归相关的类型第九章直线相关与回归

相关系数(correlationcoefficient),又称simplecorrelationcoefficient,coefficientofproduct–momentcorrelation,或Pearson’scorrelationcoefficient.

说明相关的密切程度和方向的指标。

相关系数概念26第九章直线相关与回归相关系数的计算说明两个变量X与Y之间关联的密切程度(绝对值大小)与关联的方向(正负号)。第九章直线相关与回归相关系数(r

)的意义相关系数r的值在-1和1之间,但可以是此范围内的任何值。正相关时,r值在0和1之间,散点云图是斜向上的,这时一个变量增加,另一个变量也增加;负相关时,r值在-1和0之间,散点云图是斜向下的,此时一个变量增加,另一个变量将减少。r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。28第九章直线相关与回归例题29第九章直线相关与回归相关系数的假设检验

上例中的相关系数r等于0.8529,是由样本计算所得,抽样误差难以避免。因为,即使总体相关系数(

)为零时,由于抽样误差,从总体抽出的12例,其r可能不等于零。所以,要判断该样本的r是否有意义,需与总体相关系数

=0进行比较,看两者的差别有无统计学意义。这就要对r进行假设检验,判断r不等于零是由于抽样误差所致,还是两个变量之间确实存在相关关系。

30第九章直线相关与回归相关系数的假设检验--t检验

=n-2

第九章直线相关与回归查表法原理:所以:相应地,有:32第九章直线相关与回归直线相关的应用相关是研究两个变量间的相互关系,而且这种相互关系是用相关系数反映的。在相关关系有统计学意义的前提下,如果r的绝对值越大,说明两个变量之间的关联程度越强;反之,r绝对值越小,则说明两个变量之间的关系越弱。一般说来,当样本量较大时,若r有统计学意义时,r的绝对值大于0.7,则表示两个变量高度相关;r的绝对值大于0.4,小于等于0.7时,则表示两个变量之间中度相关;r的绝对值大于0.2,小于等于0.4时,则两个变量低度相关。

33第九章直线相关与回归Statisticsinmedicine

|r|=0-0.25littleornorelationship0.25-0.5afairdegreeofrelationship

0.5-0.75amoderatetogoodrelationship>0.75averygoodtoexcellentrelationship

34第九章直线相关与回归应用直线相关与回归的注意事项

1.要有实际意义进行相关回归分析要有实际意义,不可把毫无关系的两个事物或现象用来作相关回归分析。

2.相关关系的正确理解相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系。

第九章直线相关与回归3.利用散点图对于性质不明确的两组数据,可先做散点图,在图上粗步观察它们有无线性关系及关系的的大体方向,以及有无离群点(outlier),然后再进行相关/回归分析。4.变量实测范围相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。5.相关、回归若无统计学意义,不等于无任何关系。第九章直线相关与回归相关与回归的区别

1.应用:研究两变量的相互关系,用相关分析,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。2.资料要求:回归分析要求Y呈正态分布;相关分析要求资料呈双变量正态分布(下页)。3.研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。4.相关系数r与回归系数b

:r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论