医学统计学直线相关与回归实习.ppt_第1页
医学统计学直线相关与回归实习.ppt_第2页
医学统计学直线相关与回归实习.ppt_第3页
医学统计学直线相关与回归实习.ppt_第4页
医学统计学直线相关与回归实习.ppt_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关和回归,主讲教师 张俊辉,目的和要求:,熟悉相关和回归的SPSS操作过程 掌握结果的分析和解释,内容,双变量关联性分析 直线相关(重点) 秩相关(适用条件) 分类变量的关联性分析 直线回归(重点),SPSS软件中:,双变量关联性分析 Analyze Correlate Bivariate 直线回归 Analyze Regression Linear,直线相关Linear correlation,直线相关的定义,统计学上两个随机变量之间呈直线趋势的关系被称为直线相关,又称简单相关。 直线相关系数(linear correlation coefficient ):定量描述两变量间直线关系的方向

2、和密切程度的指标。又称Pearson 积矩相关系数(Pearson product moment coefficient) 总体相关系数,样本相关系数r,直线相关的具体步骤,1. 考察数据的分布,即分析变量x和y的正态性。 2. 绘制散点图,看有无线性趋势。 3. 计算样本相关系数。 4. 总体相关系数的假设检验t检验和查表法。,例13.1 某医师测量了15名正常成年人的体重(kg)与CT双肾体积(ml)大小,如下表。据此回答两变量是否有关联?其方向与密切程度如何?,第一步:数据录入,设置两个变量: x体重( ) y 肾总体积(mL),1.正态性检验,Analyze Descriptive S

3、tatistics Explore Dependent list: x y Plots: Normality plots with tests,正态性检验,第二步:统计分析,正态性检验结果,P0.10,服从正态分布,第二步:统计分析,2.绘制散点图 Graphs Scatter Simple,Graphs Scatter Simple,简单散点图,Simple Scatterplot 对话框,应变量y,自变量x,从图中可见,体重和肾总体积有比较明显的直线相关趋势,也没有发现影响过强的异常点,可以进行相关分析。,3.相关性分析:AnalyzeCorrelateBivariate,Bivariat

4、e 对话框,默认,x和y的相关系数 r=0.875 对r假设检验的 P0.001,秩相关的适用条件,不服从双变量正态分布 用等级资料表示的原始资料 总体分布未知或边界不确定的资料,秩相关(练习),教材 例13.4,数据录入与Pearson相关完全相同, 只是分析时的选项要选择Spearman相关,1、数据录入:设置x和y两个变量,设置两个变量: x舒张压 y 夜间最低血氧 含量分级,2、秩相关操作,x y同时选入,选择Spearman,3、秩相关结果,x和y的相关系数 rs=0.897 对r假设检验的 P0.001,分类变量的关联性分析,教材 例13.7,Descriptive Statist

5、ics Crosstabs Chi-square 是否有关联 Contingency coeficient列联系数,计算列联系数,列联系数=0.355, P0.001,直线回归Linear Regression,直线回归含义,用直线回归方程描述成对观测数据中两变量间的数量依存关系,直线回归方程: x为自变量(independent variable),也称为解释变量(explanatory variable) y为因变量(dependent variable) ,也称为应变量(response variable),直线回归方程,直线回归方程: 为当 x取某一值时应变量y的平均估计值 a为截距(

6、intercept),即当 x = 0 时y的平均估计值 b为回归系数(regression coefficient),即直线的斜率,表示x改变一个单位时y的平均改变量。,直线回归方程,直线回归分析目的在于找出一条最能代表这些数据关系的直线,用直线方程来描述两变量的回归关系。 最小二乘法原理:实测点到直线的纵向距离平方之和达到最小。,直线回归的统计推断,对的两种假设检验方法包括: t检验 方差分析,H0:=0 ,即无直线关系 H1:0 ,即有直线关系,方差分析的基本思想,将全部数据的离均差平方和SS总分解成若干部分,其自由度也做相应的分解。,方差分析法的原理: 对应变量y的离均差平方和进行分解

7、,直线回归的统计推断,P(x,y),0,残差,回归,总变异,因变量y的离均差平方和分解示意图,Y的均值,实测值y,估计值,的分解,上述三段的数学表达式为: 将等式两端平方后再求和,最后得到: 即SS总(lYY ) = SS回 + SS残,:总离均差平方和 ,即不考虑y与x回归关系的y的总 变异 :回归平方和,即y的总变异中可以用y与x的回归关 系所解释的部分。值越大,说明回归效果越好。 :残差平方和,即y的总变异中无法用y与x的回归关 系解释的部分,反映随机误差。在散点图中,各实 测点离回归直线越近,SS残 越小,说明直线回归 的估计误差越小。,自由度的分解,构造F统计量,方差分析表,本例,1

8、.建立检验假设,确定检验水准,2.计算检验统计量,3.确定P值,作出统计推断,P0.01,按照0.05检验水准拒绝H0。回归方程有统计学意义,可以认为腹腔内脂肪面积与腰围之间有直线回归关系。,直线回归的步骤:,1.考察数据的分布,即分析y变量的正态性。 2.作散点图,确定有无线性趋势。 3.建立直线回归方程。 4.对方程及其参数进行估计与假设检验。 5.绘制回归直线。,例14.1 某研究欲探讨男性腰围与腹腔内脂肪面积的关系,对20名男性志愿受试者测量其腰围(cm),并采用磁共振成像法测量其腹腔内脂肪面积(cm2),结果如表14.1所示。试建立腹腔内脂肪面积( y )和腰围( x )的直线回归方

9、程。,第一步:数据录入,设置两个变量: x腰围 (cm) y 腹腔内脂肪面积(cm2 ),与直线相关相同,注意区分x和y,第二步:统计分析,1.绘制散点图 Graphs Scatter Simple Y Axis框: y X Axis框: x,从图中可见,腰围和腹腔内脂肪面积有比较明显的线性趋势,也没有发现影响过强的异常点,可以进行回归分析。,2.直线回归分析:AnalyzeRegression Linear,应变量y,自变量x,点击,Statistics对话框,默认,计算相关系数、决定系数等,要勾选,计算回归系数的置信区间,默认,计算回归系数及假设检验,第三步:结果解释,介绍了模型拟合优度的

10、情况: 相关系数r=0.762 决定系数R2=SS回/SS总=0.581 剩余标准差(残差标准差)Syx=13.0353,模型总结,决定系数(coefficient of determination),反映了回归贡献的相对程度,即在因变量y的总变异中用y与x回归关系所能解释的比例。在实际应用中,常用决定系数来反映回归的实际效果。值越大,说明方程拟合的效果越好。 本例决定系数为0.581 ,说明男性的腰围信息可以解释其腹腔内脂肪面积变异的58.1%,还有剩余的41.9%的信息需要通过腰围以外的其它因素来加以解释。,F =24.924 P 0.001 按0.05的检验水准拒绝H0接受H1,回归方程有统计学意义,可以认为腹腔内脂肪面积与腰围之间有直线回归关系。,结果解释,回归方程的方差分析,1. 截距a=-96.392,回归系数b=2.111 2. tb=4.992, P0.001,结论同前(F检验)。 3. 写出直线回归方程:,回归系数的假设检验等价于相关系数的结果,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论