相关与回归分析课件_第1页
相关与回归分析课件_第2页
相关与回归分析课件_第3页
相关与回归分析课件_第4页
相关与回归分析课件_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

*1相关与回归分析*2相关与回归分析双变量相关分析线性回归曲线估计两条回归直线的比较*3第一节双变量相关分析一、Pearson相关分析二、Spearman等级相关*4例1表1为一项关于儿童健康和发展的研究中10名学龄儿童的身高和体重资料。表110名学龄儿童的身高和体重一、Pearson相关分析

*5建立数据文件:身高体重的相关分析.sav.定义变量*6建立数据文件:身高体重的相关分析.sav.定义变量输入数据*7建立数据文件:身高体重的相关分析.sav.定义变量输入数据开始分析:绘制散点图:Graphs→Scatter→SimpleScatter→Define定义变量:身高→YAxis,体重→XAxis*8建立数据文件:身高体重的相关分析.sav.定义变量输入数据开始分析绘制散点图假定满足双变量正态分布:analyze→Correlate→Bivariate定义变量:身高,体重→Variables*9建立数据文件:身高体重的相关分析.sav.定义变量输入数据开始分析绘制散点图假定满足双变量正态分布:analyze→Correlate→Bivariate定义变量:身高,体重→Variables选择统计量:CorrelationCoefficients→Pearson*10主要结果——散点图*11主要结果总体相关系数=0的假设检验的P值Pearson相关系数*12练习1某医生测得10名正常成年男性的血浆清蛋白含量(g/L)及血红蛋白含量(g/L)数据如下,试问两者有无相关关系?*13例2某研究者研究10例6个月~7岁的贫血患儿的血红蛋白含量与贫血体征之间的相关性,结果见表3,请问贫血患儿的血红蛋白含量与贫血体征之间是否相关?二、Spearman等级相关

*14建立数据文件:血红蛋白的等级相关分析.sav.定义变量*15建立数据文件:血红蛋白的等级相关分析.sav.定义变量输入数据*16建立数据文件:血红蛋白的等级相关分析.sav.定义变量输入数据开始分析analyze→Correlate→Bivariate定义变量:血红蛋白,贫血体征→Variables*17建立数据文件:血红蛋白的等级相关分析.sav.定义变量输入数据开始分析analyze→Correlate→Bivariate定义变量:血红蛋白,贫血体征→Variables选择统计量:CorrelationCoefficients→Spearman*18主要结果总体相关系数=0的假设检验的P值Spearman相关系数*19练习2将例2的数据进行秩变换,对变换后的变量进行Pearson相关分析。*20练习3某医院用复方猪胆胶囊治疗219例慢性支气管炎,结果见下表。问患者疗效与年龄间有无关联?*21第二节线性回归分析一、简单线性回归分析二、多重线性回归分析*22例3表1为一项关于儿童健康和发展的研究中10名学龄儿童的身高和体重资料。表110名学龄儿童的身高和体重一、简单线性回归分析

*23建立数据文件:身高与体重的回归分析.sav.定义变量*24建立数据文件:身高与体重的回归分析.sav.定义变量输入数据*25建立数据文件:身高与体重的回归分析.sav.定义变量输入数据开始分析:绘制散点图:Graphs→Scatter→SimpleScatter→Define定义变量:体重→YAxis,身高→XAxis*26建立数据文件:身高与体重的回归分析.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:体重→Dependent,身高→Independent(s)*27建立数据文件:身高与体重的回归分析.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:体重→Dependent,身高→Independent(s)选择统计量:Statistics→Estimates,Confidenceintervals,Modelfit,Descriptives*28建立数据文件:身高与体重的回归分析.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:体重→Dependent,身高→Independent(s)选择统计量:Statistics→Estimates,Confidenceintervals,Modelfit,Descriptives绘制残差图:Plots→DEPENDNT→X:,*ZRESID(标准化残差)→Y:*29建立数据文件:身高与体重的回归分析.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:体重→Dependent,身高→Independent(s)选择统计量:绘制残差图:计算总体均数的估计值和预测值:Save→→PredictedValues→Unstandardize,→PredictionIntervals→Mean,Individual*30建立数据文件:身高与体重的回归分析.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:体重→Dependent,身高→Independent(s)选择统计量:绘制残差图:计算总体均数的估计值和预测值:在散点图中添加置信带和预测带:双击散点图进行添加,Element→FitLineattotal*31建立数据文件:身高与体重的回归分析.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:体重→Dependent,身高→Independent(s)选择统计量:绘制残差图:计算总体均数的估计值和预测值:在散点图中添加置信带和预测带:双击散点图进行添加,Element→FitLineattotal→ConfidenceIntervals→Mean(Individual)*32主要结果——散点图*33主要结果*34主要结果*35主要结果确定系数调整确定系数*36主要结果对总体回归模型检验的F值对总体回归模型检验的P值*37主要结果回归系数(第一行为截距,第二行为斜率)总体回归系数=0的假设检验的t值回归系数的标准误标准化回归系数总体回归系数=0的假设检验的P值总体回归系数的95%置信区间*38主要结果残差图*39*40练习4某研究者测量了16名成年男子的体重和臀围数据,如下表所示。(1)请判断是否可以用线性回归来表达臀围和体重的关系,若可以,请用该数据建立用体重预测臀围的线性回归模型。(2)今有2名成年男子的体重分别为62kg和88kg,是否可以利用上述回归模型估计二人的臀围数据?若可以,请计算臀围总体均数的95%置信区间和臀围的95%预测区间。*41练习5FrankAnscombe(1973)给出了下列四组双变量X和Y的样本数据,其中Y1、Y2、Y3共用X,如下表所示。请对这四组数据分别进行线性回归分析,并加以讨论。*42例4为了研究有关糖尿病患者体内脂联素水平的影响因素,某医师测定了30名患者的体重指数BMI(kg/m2)、病程DY(年)、瘦素LEP(ng/mL)、空腹血糖FPG(mmol/L)及脂联素ADI(ng/mL)水平,数据如表6所示,能否用多重线性回归表达他们的关系,若可以,建立多重线性回归方程。二、多重线性回归分析

*43*44建立数据文件:脂联素水平数据.sav.定义变量*45建立数据文件:脂联素水平数据.sav.定义变量输入数据*46建立数据文件:脂联素水平数据.sav.定义变量输入数据开始分析:绘制散点图:Graphs→Scatter→MatrixScatter→Define定义变量:体重指数、病程、瘦素、孔府血糖、脂联素→MatrixVariables*47建立数据文件:脂联素水平数据.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:脂联素→Dependent,

体重指数、病程、瘦素、空腹血糖→Independent(s)*48建立数据文件:脂联素水平数据.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:脂联素→Dependent,

体重指数、病程、瘦素、空腹血糖→Independent(s)选择统计量:Statistics→Estimates,Confidenceintervals,Modelfit,Descriptives*49建立数据文件:脂联素水平数据.sav.定义变量输入数据开始分析绘制散点图Analyze→Regression→Linear定义变量:脂联素→Dependent,

体重指数、病程、瘦素、空腹血糖→Independent(s)选择统计量:Statistics→Estimates,Confidenceintervals,Modelfit,Descriptives绘制残差图:Plots→DEPENDNT→X:,*ZRESID(标准化残差)→Y:*50主要结果——散点图*51主要结果*52主要结果*53主要结果确定系数调整确定系数复相关系数*54主要结果对总体回归模型检验的F值对总体回归模型检验的P值*55主要结果偏回归系数总体偏回归系数=0的假设检验的t值偏回归系数的标准误标准化偏回归系数总体偏回归系数=0的假设检验的P值总体偏回归系数的95%置信区间*56主要结果残差图*57例5对例4的数据选择最优模型。*58Analyze→Regression→Linear定义变量:脂联素→Dependent,

体重指数、病程、瘦素、空腹血糖→Independent(s)*59Analyze→Regression→Linear定义变量:脂联素→Dependent,

体重指数、病程、瘦素、空腹血糖→Independent(s)选择筛选最优模型的方法Mehtod→Stepwise*60主要结果——引入的变量剔除的变量最优模型*61主要结果最优模型*62主要结果最优模型*63其他筛选最优模型的方法,大家自己练习。*64练习6考虑有四个与某疾病有关的因素与该病的患病率资料如下表所示,试用该数据进行多重回归分析。*65练习7下表是随机抽取的11名儿童的智力测试数据,试以IQ为因变量拟合多重线性回归模型。并讨论本例应用回归分析所存在的问题。*66第三节曲线估计*67例6某研究者测得某女童1~9月的身高数据,如下表所示。试用合适的回归模型描述该月龄段女童的身高随时间变化的规律。*68建立数据文件:女童身高数据.sav.定义变量*69建立数据文件:女童身高数据.sav.定义变量输入数据*70建立数据文件:女童身高数据.sav.定义变量输入数据开始分析绘制散点图:Graphs→Scatter→SimpleScatter→Define定义变量:身高→YAxis,时间→XAxis*71观察身高与时间的趋势关系—近似对数曲线关系*72建立数据文件:女童身高数据.sav.定义变量输入数据开始分析绘制散点图:Graphs→Scatter→SimpleScatter→Define定义变量:身高→YAxis,时间→XAxisanalyze→Regression→CurveEstimation定义变量:身高→Dependent(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论