直线相关与回归_第1页
直线相关与回归_第2页
直线相关与回归_第3页
直线相关与回归_第4页
直线相关与回归_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

直线相关与回归第一页,共五十七页,2022年,8月28日

一、直线相关【目的】

掌握直线相关的作用、应用前提掌握线性相关SPSS操作方法正确解释线性相关的输出结果第二页,共五十七页,2022年,8月28日【原理】直线相关是分析两个不分主次的变量间的线性相关关系,适用于双变量正态分布的资料。相关并不表示一个变量的改变是另一个变量变化的原因,也有可能同时受另一个因素的影响。相关分析的任务是对相关关系给出定量的描述。通常用Pearson相关系数来定量地描述线性相关的程度。第三页,共五十七页,2022年,8月28日相关种类相关不相关第四页,共五十七页,2022年,8月28日相关系数没有量纲,且-1r1。当r>0,且H0(ρ=0)被拒绝时,认为两变量之间呈正相关关系;当r<0,且H0(ρ=0)被拒绝时,认为两变量之间呈负相关关系;当r值接近于零,且H0(ρ=0)被接受时,认为两变量之间不呈直线关系,但不能排除两变量之间可能存在某种曲线关系。第五页,共五十七页,2022年,8月28日线性相关的注意事项person相关系数的计算要求两个变量都服从正态分布,并且在作相关分析时,一般先作散点图,考虑是否有可能直线相关。相关系数需要做假设检验。如果变量X和Y不服从双变量正态分布,或均为多分类有序资料,可以用Spearman秩相关相关关系不一定是因果关系,可能仅是表面上的伴随关系,或两个变量同时受另一因素的影响,如小孩的身高和小树的树高同时受时间的影响,在校儿童的鞋的大小和阅读技能同时受年龄的影响。第六页,共五十七页,2022年,8月28日【操作步骤】路径:Analyze—>Correlate—>Bivariate…—>将分析变量选入Variables中,

—>在CorrelationCoefficients中选择Pearson—>在TestofSignificance中选择Two-tailed(双侧检验)—>OK。第七页,共五十七页,2022年,8月28日例8-1.某地10名一年级女大学生的胸围(cm)与肺活量(L)数据见下表,试分析两个变量有无线性相关关系?表8-1某地10名一年级女大学生的胸围(cm)与肺活量(L)第八页,共五十七页,2022年,8月28日【操作步骤】1.建立SPSS数据文件,如图8-1所示图8-1数据库文件第九页,共五十七页,2022年,8月28日2.绘制散点图,直观判断两个变量之间有无线性关系

Graphs—>Scatter/Dot…—>SimpleScatter—>Define,将胸围选入XAxis中,将肺活量选入YAxis中—>Titles…—>在Title的Line1中输入散点图的标题—>Continue—>OK。第十页,共五十七页,2022年,8月28日图8-210名女大学生胸围与肺活量散点图结果解释:从图中可以看出,胸围和肺活量似乎没有线性关系,但是具体结论要通过以下步骤的分析才能得到。第十一页,共五十七页,2022年,8月28日3.对两变量进行正态性判断

analyze—>descriptivestatistics—>explore—>“胸围”、“肺活量”导入dependentlist—>plots选项—>选中Normalityplotswithtests—>continue—>ok图8-3变量正态性检验结果结果分析,两变量均符合正态分布。第十二页,共五十七页,2022年,8月28日4.线性相关分析

Analyze—>Correlate—>Bivariate…—>将“胸围”、“肺活量”选入Variables中—>在CorrelationCoefficients中选择Pearson—>在TestofSignificance中选择Two-tailed(双侧检验)—>选择Flagsignificantcorrelations—>OK。第十三页,共五十七页,2022年,8月28日变量X和Y不服从双变量正态分布,或均为多分类有序资料,可以用Spearman秩相关第十四页,共五十七页,2022年,8月28日主要输出结果:图8-6correlations结果胸围与肺活量之间的相关系数为0.504,P=0.138,无统计学意义,那么我们可以认为女大学生胸围与肺活量之间不存在线性相关性。第十五页,共五十七页,2022年,8月28日

Spearman秩相关补充例题

某医生收集12例急性脑梗死(AMI)病人,记录了患者在抢救期间的总胆固醇,用爱丁堡-斯堪的纳维亚神经病学卒中SNSS量表评分标准评定患者的神经功能缺损程度,试分析总胆固醇与神经功能评分是否相关。第十六页,共五十七页,2022年,8月28日量表评分X总胆固醇Y104.04446.21154.83195.23144.71124.44154.38113.73996.00114.38124.00114.36表12例AMI患者的量表评分与胆固醇测量值第十七页,共五十七页,2022年,8月28日建立数据库设立两个变量X和Y,X代表量表评分,Y代表总胆固醇正态性检验Spearman秩相关第十八页,共五十七页,2022年,8月28日建立数据库第十九页,共五十七页,2022年,8月28日正态性检验P=0.000<0.05,差异有统计学意义结果分析,两变量均不符合正态分布。第二十页,共五十七页,2022年,8月28日Spearman秩相关第二十一页,共五十七页,2022年,8月28日rs=0.851,P=0.000<0.05,差异有统计学意义结果第二十二页,共五十七页,2022年,8月28日

二、直线回归【目的】

掌握简单线性回归的作用、应用前提掌握简单线性回归SPSS操作方法正确解释简单线性回归的输出结果第二十三页,共五十七页,2022年,8月28日【原理】

简单线性回归是分析两个连续型变量之间依存变化的数量关系的统计方法。线性回归中两变量的地位是不同的,其中一个作为自变量,亦称为解释变量,X用表示,另一个为因变量,Y用表示。如果自变量与因变量间关系有线性趋势,可以用某个适合的线性回归方程来描述的总体均数依赖于的数值变化。假设总体回归方程如下:

第二十四页,共五十七页,2022年,8月28日a是截距;b为回归系数,即直线的斜率

用样本数据建立的有关依存变化的线性表达式称为样本回归方程:第二十五页,共五十七页,2022年,8月28日

回归参数的估计,通常用回归参数估计的最小二乘原则。即用一定的数学方法确定a与b的适宜值,能使n个数据点的残差平方和达到最小值,则称这一对a与b为回归方程的最小二乘估计,使回归残差平方和最小的原则称为最小二乘原则。第二十六页,共五十七页,2022年,8月28日简单线性回归只有将两个内在有联系的变量放在一起进行回归分析才有意义做回归分析时,如果两个有内在联系的变量之间存在的是一种依存因果关系,那么应该以因的变量为X,以果的变量为Y。如果变量之间并无因果关系,则应以易于测定、较为稳定或变异较小者为X进行回归分析时,应先绘制散点图第二十七页,共五十七页,2022年,8月28日线性回归分析的前提条件线性(linear)反应变量Y与自变量X呈线性变化趋势独立(independent)任意两个观察值相互独立,一个个体的取值不受其他个体的影响给定X时,Y正态分布(normal)给定X取值时,Y的取值服从正态分布等方差(equalvariance)指对应于不同的X值,Y值的总体变异相同第二十八页,共五十七页,2022年,8月28日建立回归方程后,须对回归系数进行假设检验。使用回归方程进行估计与预测时,一般只适用于原来的观测范围,即自变量的取值范围,不能随意将范围扩大。在线性回归分析时,要注意远离群体的极端值对回归效果的影响。第二十九页,共五十七页,2022年,8月28日【操作步骤】路径:Analyze—>Regression—>Linear,弹出LinearRegression主对话框,自变量选入Independent框因变量选入Dependent框—>单击Statistics,打开Statistics对话框—>选择Descriptives、Estimates、Modelfit—>Continue—>OK.第三十页,共五十七页,2022年,8月28日例8-2.某地方病研究所调查8名正常儿童的尿肌酐含量(mmol/24h),估计尿肌酐含量(y)对其年龄(x)的回归方程表8-28名正常儿童的年龄与尿肌酐含量第三十一页,共五十七页,2022年,8月28日【操作步骤】1.建立SPSS数据文件第三十二页,共五十七页,2022年,8月28日2.绘制散点图,判断两变量之间有无线性趋势

Graphs—>Scatter/Dot…—>SimpleScatter—>Define,将年龄选入XAxis中,将尿肌酐含量选入YAxis中—>OK第三十三页,共五十七页,2022年,8月28日图8-108名正常儿童年龄与尿肌酐含量散点图第三十四页,共五十七页,2022年,8月28日3.对因变量进行正态性判断

analyze—>descriptivestatistics—>explore—>“尿肌酐含量”导入dependentlist—>plots选项—>选中Normalityplotswithtests—>continue—>ok图8-11因变量正态性检验结果结果解释:Z=0.94,P=0.612>0.05,无统计学意义,认为正常儿童的尿肌酐含量符合正态分布第三十五页,共五十七页,2022年,8月28日4.模型拟合Analyze—>Regression—>Linear—>在LinearRegression对话框中将年龄选入Independent(s)中,将尿肌酐含量选入Dependent中—>在Method中选择Enter—>

第三十六页,共五十七页,2022年,8月28日

单击Statistics,打开子对话框—>在RegressionCoefficients中选择Estimates选择Modelfit—>Continue—>OK。第三十七页,共五十七页,2022年,8月28日主要输出结果

图8-14拟合过程中变量进入/退出模型的情况线性回归中只有一个自变量,并且采取强行进入的方法第三十八页,共五十七页,2022年,8月28日图8-15模型的拟合优度情况模型中相关系数R=0.882,决定系数为0.778,校正决定系数为0.740第三十九页,共五十七页,2022年,8月28日图8-16整个模型的检验结果所拟合的回归模型F值为20.968,P为0.004,因此拟合模型是有意义的(直线回归中,模型中只有一个自变量,对模型的检验就等价于对回归系数的检验)第四十页,共五十七页,2022年,8月28日图8-17常数项和系数的检验结果常数项和系数的检验结果,均有意义;回归系数t检验所得P值与整个模型检验结果相等,未标化回归系数为0.139,常数项为1.622第四十一页,共五十七页,2022年,8月28日结果解释(1)得到的直线回归方程为:(2)方程整体假设检验结果:F=20.968,P=0.004<0.05,回归方程有统计学意义。(3)回归方程系数的解释:儿童的年龄每增加1岁,其24小时尿肌酐含量增加0.139mmol。第四十二页,共五十七页,2022年,8月28日对话框说明第四十三页,共五十七页,2022年,8月28日第四十四页,共五十七页,2022年,8月28日第四十五页,共五十七页,2022年,8月28日第四十六页,共

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论