医学统计学b-spss上机回归与相关_第1页
医学统计学b-spss上机回归与相关_第2页
医学统计学b-spss上机回归与相关_第3页
医学统计学b-spss上机回归与相关_第4页
医学统计学b-spss上机回归与相关_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关与回归郑德强公共卫生学院

2017年6月

11.简单直线相关分析2.简单直线回归3.多重线性回归2目录掌握直线相关与回归的应用条件;掌握多重线性回归的应用条件;学会使用SPSS软件进行直线相关与回归分析;学会使用SPSS软件进行多重线性回归分析;正确解释输出结果。实习目的相关分析相关分析是指研究两变量之间关系的密切程度。Z(简单)直线相关分析研究的两变量是否存在直线相关关系,以及相关的方向和程度。简单直线相关用于两变量均为正态分布资料的相关统计研究。直线相关系数r(Pearson相关系数),没有量纲。

-1≤r≤1,r<0:负相关;r>0:正相关;r=0:无直线相关。相关种类简单直线相关分析注意事项要求两个变量都服从

,并且在作相关分析时,一般先作散点图,考虑是否有可能直线相关。相关系数需要做假设检验。如果变量X和Y不服从双变量正态分布,或均为多分类有序资料,可以用Spearman秩相关。正态分布1.简单直线相关分析例1.

20名高血脂病人年龄与胆固醇见例题1文件,问年龄与胆固醇有无直线相关关系?要求:计算Pearson相关系数,对相关系数进行双侧检验。建立数据库建立两个变量age和ch,其中age代表年龄,ch代表前胆固醇值正态性检验绘制散点图简单直线相关分析SPSS录入数据形式

Analyze——descriptivestatistics——explore——导入dependentlist——plots选项——Normalityplotswithtests——continue——OK.

正态性检验操作步骤SPSS输出正态性检验结果(1)Graphs—Scatter—Simple—Define,从源变量选择年龄变量为XAxis,胆固醇为YAxis,—Title,然后输入散点图的标题,—OK。在Output窗口中,双击散点图,在Graph窗口,可以进行修改,最好把标题移到图的下方。(2)横轴和纵轴:双击横轴或纵轴标目,出现XScaleAxis或YScaleAxis对话框,可以选择相应的功能键修改名称和位置以及其刻度大小和刻度范围。绘制散点图步骤(3)在散点图中绘制回归直线:双击选中散点图,在Graph窗口,单击—fitline中的

total,单击fitoption,选择linearregression—continue—Ok。绘制散点图步骤SPSS绘制散点图SPSS操作直线相关分析步骤(1).选择分析变量:Analyze—Correlate—Bivariate,将分析源变量移至Variables矩形框中。(2).选择相关系数计算方法:CorrelationCoefficients中选择Pearson。(3).选择单双侧检验:Two-tailed。(4).OK。相关系数r=0.849,双侧Pearson检验的概率为P<0.001,具有统计学意义,说明高血脂病人年龄和胆固醇含量呈正相关。SPSS输出直线相关分析结果教材第11章180页例11-1、11-2。课堂练习作业182.简单直线回归简单直线回归是研究应变量Y对自变量X的数量依存关系。用直线方程来描述两变量间的回归关系。用回归分析的方法,从预测的角度来描述应变量(Y)如何随自变量(X)的变化而变化的规律性。应变量为正态变量、自变量为连续变量,则可以建立因变量关于自变量的一元线性回归方程。2.简单直线回归例2.

利用例题1数据建立年龄(age)和胆固醇(ch)的直线回归方程。要求:(1)写出回归方程。(2)对回归系数进行假设检验。(3)输出年龄与胆固醇的均数、标准差和相关系数。SPSS操作直线回归步骤(1).选择分析变量:Analyze—Regression—Linear,年龄进入Independent(s)框作为自变量,选择胆固醇进入Dependent框作为因变量。(2).单击Statistics—Descriptives—Continue。(3).OK。SPSS输出直线回归结果变量进入的模式是所有的自变量同时进入分析相关系数调整后的R2估计的标准误决定系数反映模型的拟合优度情况回归方程:Ŷ=2.659+0.141X对回归系数进行检验截距:t=2.659,P=0.006;回归系数:t=0.141,P<0.001,二者均有统计学意义。显示直线回归方程中的系数F为检验统计量,F=46.432,P<0.001,即回归方程有统计学意义。用方差分析进行回归方程系数显著性检验教材第11章183页例11-4。课堂练习作业28一个应变量与多个自变量间的关系儿童身高与年龄、性别的关系肺活量与年龄、性别、身高、体重以及胸围的呼吸差等因素的关系多重线性回归如构成线性依存关系3.多重线性回归1.多重线性回归模型其中b0为截距,b1,b2…bp称为回归系数。2.多重线性回归任务多重线性回归数学模型估计系数bi,建立回归模型;采用F检验对回归方程整体进行假设检验;采用t检验对方程中的每个系数bi进行假设检验;找出对应变量y有影响的因素,结合专业给出合理解释。1.筛选变量的方法(主要有3种)向前法(forward)后退法(backward)逐步回归法(stepwise)2.如何选择这几种方法?拟合的回归方程整体上有显著性意义;各回归参数的估计值的假设检验结果都有显著性意义;各回归参数估计值的正负号与其后的变量在专业上的含义相吻合;根据回归方程计算出应变量所有预测值在专业上有意义。例3.数据在例题2文件中,有29名儿童血液中血红蛋白(Y)与钙、镁、铁、锰和铜的含量的数据,用多重回归方法筛选对血红蛋白(Y)有影响的微量因素。要求:(1)写出回归方程(2)对回归系数进行假设检验(3)输出决定系数、调整决定系数。(4)输出X与Y的相关系数,X与Y的均数及标准差。(5)比较对血红蛋白有影响的因素的作用大小。3.多重线性回归操作步骤1.选择分析变量:Analyze—Regression—Linear,选择Y进入Dependent框作为因变量,选择变量X1~X5进入Independent(s)框作为自变量。2.选择筛选自变量的方法:在method:框中可选择Backward。3.单击Statistics—Descriptives—Continue。4.OK。回归方程系数估计结果复相关系数R=0.919,决定系数R2=0.845,调整决定系数R2adj=0.833表示在因变量y的总变异中可由回归方程所解释部分的比例越接近于1,说明回归方程效果越好。回归方程假设检验27名糖尿病人的血清总胆固醇、甘油三酯、空腹胰岛素、糖化血红蛋白(X1-X4)、空腹血糖的测量值(y),试建立血糖与其他几项指标关系的多元线性回归方程。并且对显著的自变量与血糖作简单直线回归。数据文件见练习题-多重线性回归。课堂练习作业39直线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论