版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1 Department of Health Statistics, School of Public Health, LZMC 相关和回归相关和回归 主讲教师主讲教师 张俊辉张俊辉 2 Department of Health Statistics, School of Public Health, LZMC 目的和要求:目的和要求: p熟习相关和回归的熟习相关和回归的SPSSSPSS操作过程操作过程 p掌握结果的分析和解释掌握结果的分析和解释 3 Department of Health Statistics, School of Public Health, LZMC 内容内容 p双变量
2、关联性分析双变量关联性分析 p 直线相关重点直线相关重点 p 秩相关适用条件秩相关适用条件 p 分类变量的关联性分析分类变量的关联性分析 p直线回归重点直线回归重点 4 Department of Health Statistics, School of Public Health, LZMC SPSS软件中:软件中: p双变量关联性分析双变量关联性分析 pAnalyze Correlate Bivariate p直线回归直线回归 pAnalyze Regression Linear p 5 Department of Health Statistics, School of Public H
3、ealth, LZMC 直线相关直线相关 Linear correlation 6 Department of Health Statistics, School of Public Health, LZMC 直线相关的定义直线相关的定义 p统计学上两个随机变量之间呈直线趋势的关系被 称为直线相关,又称简单相关。 p直线相关系数(linear correlation coefficient ):定量描画两变量间直线关系的方 向和亲密程度的目的。又称Pearson 积矩相关系 数(Pearson product moment coefficient p总体相关系数,样本相关系数r 7 Depar
4、tment of Health Statistics, School of Public Health, LZMC 1. 调查数据的分布,即分析变量调查数据的分布,即分析变量x和和y的正的正 态性。态性。 2. 绘制散点图,看有无线性趋势。绘制散点图,看有无线性趋势。 3. 计算样本相关系数。计算样本相关系数。 4. 总体相关系数的假设检验总体相关系数的假设检验t检验和查检验和查 表法。表法。 8 Department of Health Statistics, School of Public Health, LZMC 例例13.1 某医师丈量了某医师丈量了15名正常成年人的体重名正常成年人
5、的体重(kg)与与CT双双 肾体积肾体积(ml)大小大小,如下表。据此回答两变量能否有关联?如下表。据此回答两变量能否有关联? 其方向与亲密程度如何?其方向与亲密程度如何? 9 Department of Health Statistics, School of Public Health, LZMC 第一步第一步: :数据录入数据录入 设置两个变量:设置两个变量: xx体重体重( ( ) ) y y 肾总体积肾总体积(mL)(mL) 10 Department of Health Statistics, School of Public Health, LZMC Analyze Descri
6、ptive Statistics Explore Dependent list: x y Plots: Normality plots with tests 正态性检验正态性检验 第二步第二步: :统计分析统计分析 11 Department of Health Statistics, School of Public Health, LZMC Tests of Normality .14515.200*.97015.865 .12815.200*.95015.528 体 重 肾 总 体 积 StatisticdfSig.StatisticdfSig. Kolmogorov-Smirnov a
7、 Shapiro-Wilk This is a lower bound of the true significance. *. Lilliefors Significance Correction a. P0.10,服从正态分布,服从正态分布 12 Department of Health Statistics, School of Public Health, LZMC 第二步第二步: :统计分析统计分析 2.2.绘制散点图绘制散点图 Graphs Graphs Scatter Scatter Simple Simple 13 Department of Health Statistics
8、, School of Public Health, LZMC Graphs Scatter Simple 简单散点图简单散点图 14 Department of Health Statistics, School of Public Health, LZMC Simple Scatterplot 对话框对话框 应变量应变量y 自变量自变量x 15 Department of Health Statistics, School of Public Health, LZMC 从图中可见,从图中可见, 体重和肾总体体重和肾总体 积有比较明显积有比较明显 的直线相关趋的直线相关趋 势,也没有发势,也
9、没有发 现影响过强的现影响过强的 异常点,可以异常点,可以 进展相关分析。进展相关分析。 16 Department of Health Statistics, School of Public Health, LZMC 3.相关性分析:相关性分析: AnalyzeCorrelateBivariate 17 Department of Health Statistics, School of Public Health, LZMC Bivariate 对话框对话框 x y同时选入同时选入默许默许 18 Department of Health Statistics, School of Pub
10、lic Health, LZMC x和和y的相关系数的相关系数 r=0.875 对对r假设检验的假设检验的 P0.001 Correlations 1.875* .000 1515 .875*1 .000 1515 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 体重 肾总体积 体重肾总体积 Correlation is significant at the 0.01 level (2-tailed). *. 19 Department of Health Statistics, Schoo
11、l of Public Health, LZMC 20 Department of Health Statistics, School of Public Health, LZMC 秩相关练习秩相关练习 教材教材 例例13.413.4 数据录入与数据录入与Pearson相关完全一样,相关完全一样, 只是分析时的选项要选择只是分析时的选项要选择Spearman相关相关 21 Department of Health Statistics, School of Public Health, LZMC 表表 1 15 例例成年男子的舒张压与夜间最低血氧含量分级测量值成年男子的舒张压与夜间最低血氧含量
12、分级测量值 编号编号 舒张压舒张压 x 夜间夜间最低血氧最低血氧 含量分级含量分级 y (1) (2) (4) 1 75 1 2 80 1 3 80 2 4 90 1 5 90 2 6 90 2 7 90 3 8 95 2 9 95 3 10 100 3 11 100 3 12 110 4 13 115 4 14 120 4 15 125 4 合计合计 22 Department of Health Statistics, School of Public Health, LZMC 1、数据录入:设置、数据录入:设置x和和y两个变量两个变量 设置两个变量:设置两个变量: xx舒张压舒张压 y
13、y 夜间最低血氧夜间最低血氧 含量分级含量分级 23 Department of Health Statistics, School of Public Health, LZMC 2、秩相关操作、秩相关操作 x y同时选入同时选入 选择选择Spearman 24 Department of Health Statistics, School of Public Health, LZMC 3、秩相关结果、秩相关结果 x和和y的相关系数的相关系数 rs=0.897 对对r假设检验的假设检验的 P0.001 25 Department of Health Statistics, School of
14、Public Health, LZMC 分类变量的关联性分析分类变量的关联性分析 教材教材 例例13.713.7 26 Department of Health Statistics, School of Public Health, LZMC 计算列联络数计算列联络数 27 Department of Health Statistics, School of Public Health, LZMC S Sy ym mm me et tr ri ic c M Me ea as su ur re es s .355.000 238 Contingency CoefficientNominal b
15、y Nominal N of Valid Cases ValueApprox. Sig. Not assuming the null hypothesis. a. Using the asymptotic standard error assuming the null hypothesis. b. Chi-Square TestsChi-Square Tests 34.213a3.000 35.1093.000 28.0151.000 238 Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid
16、 Cases Valuedf Asymp. Sig. (2-sided) 0 cells (.0%) have expected count less than 5. The minimum expected count is 18.03. a. 列联络数列联络数=0.355, P0.001 28 Department of Health Statistics, School of Public Health, LZMC 直线回归直线回归 Linear Regression 29 Department of Health Statistics, School of Public Health,
17、 LZMC 直线回归含义 p用直线回归方程描画成对观测数用直线回归方程描画成对观测数 据中两变量间的数量依存关系据中两变量间的数量依存关系 30 Department of Health Statistics, School of Public Health, LZMC v直线回归方程:直线回归方程: vx为自变量为自变量(independent variable),也称为解释变也称为解释变 量量(explanatory variable) vy为因变量为因变量(dependent variable) ,也称为应变量也称为应变量 (response variable) y abx 直线回归方程
18、 31 Department of Health Statistics, School of Public Health, LZMC y abx y 32 Department of Health Statistics, School of Public Health, LZMC 直线回归方程直线回归方程 p直线回归分析目的在于找出一条最能代表这些数直线回归分析目的在于找出一条最能代表这些数 据关系的直线,用直线方程来描画两变量的回归据关系的直线,用直线方程来描画两变量的回归 关系。关系。 p最小二乘法原理:实测点到直线的纵向间隔平方最小二乘法原理:实测点到直线的纵向间隔平方 之和到达最小。之
19、和到达最小。 y ab x 33 Department of Health Statistics, School of Public Health, LZMC 直线回归的统计推断直线回归的统计推断 对的两种假设检验方法包括: t检验 方差分析 H0:=0 ,即无直线关系 H1:0 ,即有直线关系 34 Department of Health Statistics, School of Public Health, LZMC 方差分析的根本思想方差分析的根本思想 将全部数据的离均差平方和将全部数据的离均差平方和SS总分解成假总分解成假 设干部分,其自在度也做相应的分解。设干部分,其自在度也做相
20、应的分解。 35 Department of Health Statistics, School of Public Health, LZMC 36 Department of Health Statistics, School of Public Health, LZMC p方差分析法的原理:方差分析法的原理: p 对应变量对应变量y的离均差平方和进的离均差平方和进 展分解展分解 直线回归的统计推断直线回归的统计推断 37 Department of Health Statistics, School of Public Health, LZMC P(x,y) yy yy y y y x y
21、 ( , )x y 0 残差残差 回归回归 总变异总变异 因变量因变量y的离均差平方和分解表示图的离均差平方和分解表示图 Y的均值的均值 实测值实测值y 估计值估计值 38 Department of Health Statistics, School of Public Health, LZMC 的分解的分解 p上述三段的数学表达式为:上述三段的数学表达式为: p将等式两端平方后再求和,最后得到:将等式两端平方后再求和,最后得到: p 即即SS总总(lYY ) = SS回回 + SS残残 YY l ) () (YYYYYY 222 ) () ()(YYYYYY 39 Department o
22、f Health Statistics, School of Public Health, LZMC :总离均差平方和:总离均差平方和 ,即不思索,即不思索y与与x回归关系的回归关系的y的总的总 变异变异 :回归平方和,即:回归平方和,即y的总变异中可以用的总变异中可以用y与与x的回归关的回归关 系所解释的部分。值越大,阐明回归效果越好。系所解释的部分。值越大,阐明回归效果越好。 :残差平方和,即:残差平方和,即y的总变异中无法用的总变异中无法用y与与x的回归关的回归关 系解释的部分,反映随机误差。在散点图中,各实系解释的部分,反映随机误差。在散点图中,各实 测点离回归直线越近,测点离回归直线
23、越近,SS残残 越小,阐明直线回归越小,阐明直线回归 的估计误差越小。的估计误差越小。 SS总 SS回 SS残 40 Department of Health Statistics, School of Public Health, LZMC 自在度的分解自在度的分解 41 Department of Health Statistics, School of Public Health, LZMC 构造构造F统计量统计量 / / MSSS F MSSS 回回回 残残残 42 Department of Health Statistics, School of Public Health, LZ
24、MC 方差分析表方差分析表 变异变异 来源来源 离均差离均差 平方和平方和SS 自在度自在度均方均方MS统计量统计量F 总总 总总=n-1 回归回归 回回=1 MS回回=SS回回 /1 MS回回/MS 残残 残差残差 残残=n- 2 MS残残=SS残残/(n- 2) 2 yySS 总 2 (y y)SS 回 2 SS(yy) 残 43 Department of Health Statistics, School of Public Health, LZMC 本例本例 1.建立检验假设,确定检验水准 =0.05 44 Department of Health Statistics, Schoo
25、l of Public Health, LZMC 2.计算检验统计量计算检验统计量 45 Department of Health Statistics, School of Public Health, LZMC 3.确定确定P值,作出统计推断值,作出统计推断 P0.01,按照0.05检验水准回绝H0。回归方程有 统计学意义,可以以为腹腔内脂肪面积与腰围之间有 直线回归关系。 46 Department of Health Statistics, School of Public Health, LZMC 1.1.调查数据的分布调查数据的分布, ,即分析即分析y y变量的正态性。变量的正态性
26、。 2.2.作散点图作散点图, ,确定有无线性趋势。确定有无线性趋势。 3.3.建立直线回归方程。建立直线回归方程。 4.4.对方程及其参数进展估计与假设检验。对方程及其参数进展估计与假设检验。 5.5.绘制回归直线。绘制回归直线。 47 Department of Health Statistics, School of Public Health, LZMC 例例14.1 14.1 某研讨欲讨论男性腰围与腹腔内脂某研讨欲讨论男性腰围与腹腔内脂 肪面积的关系,对肪面积的关系,对2020名男性志愿受试者丈名男性志愿受试者丈 量其腰围量其腰围(cm)(cm),并采用磁共振成像法丈量,并采用磁共振
27、成像法丈量 其腹腔内脂肪面积其腹腔内脂肪面积(cm2)(cm2),结果如表,结果如表14.114.1所所 示。试建立腹腔内脂肪面积示。试建立腹腔内脂肪面积( y )( y )和腰围和腰围( x )( x ) 的直线回归方程。的直线回归方程。 48 Department of Health Statistics, School of Public Health, LZMC 第一步第一步: :数据录入数据录入 设置两个变量:设置两个变量: xx腰围腰围 (cm) (cm) y y 腹腔内脂肪面积腹腔内脂肪面积(cm2 ) (cm2 ) 与直线相关一样与直线相关一样 留意区分留意区分x和和y 49
28、Department of Health Statistics, School of Public Health, LZMC 第二步第二步: :统计分析统计分析 1.1.绘制散点图绘制散点图 Graphs Scatter Graphs Scatter SimpleSimple Y AxisY Axis框框: y: y X AxisX Axis框框: x: x 50 Department of Health Statistics, School of Public Health, LZMC 从图中可见,腰从图中可见,腰 围和腹腔内脂肪围和腹腔内脂肪 面积有比较明显面积有比较明显 的线性趋势,也的
29、线性趋势,也 没有发现影响过没有发现影响过 强的异常点,可强的异常点,可 以进展回归分析。以进展回归分析。 51 Department of Health Statistics, School of Public Health, LZMC 2.直线回归分析:直线回归分析: AnalyzeRegression Linear 52 Department of Health Statistics, School of Public Health, LZMC 应变量应变量y 自变量自变量x 点击点击 53 Department of Health Statistics, School of Publi
30、c Health, LZMC Statistics对话框对话框 默许,计算相关系默许,计算相关系 数、决议系数等数、决议系数等 要勾选,计算回归要勾选,计算回归 系数的置信区间系数的置信区间 默许,计算回归系默许,计算回归系 数及假设检验数及假设检验 54 Department of Health Statistics, School of Public Health, LZMC 第三步:结果解释第三步:结果解释 引见了模型拟合优度的情况:引见了模型拟合优度的情况: 相关系数相关系数r=0.762r=0.762 决议系数决议系数R2=SSR2=SS回回/SS/SS总总=0.581=0.581
31、剩余规范差残差规范差剩余规范差残差规范差Syx=13.0353Syx=13.0353 Model Summary .762a.581.55713.0353 Model 1 RR Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), 腰围(cm) a. 模型总结模型总结 55 Department of Health Statistics, School of Public Health, LZMC 决议系数决议系数(coefficient of determination) 2 SS R SS 回
32、 总 反映了回归奉献的相对程度,即在因变量y的总变 异中用y与x回归关系所能解释的比例。在实践运用中, 常用决议系数来反映回归的实践效果。值越大,阐明 方程拟合的效果越好。 本例决议系数为0.581 ,阐明男性的腰围信息可以解 释其腹腔内脂肪面积变异的58.1%,还有剩余的 41.9%的信息需求经过腰围以外的其它要素来加以解 释。 2 R 56 Department of Health Statistics, School of Public Health, LZMC ANOVAb 4235.10014235.10024.924.000a 3058.54918169.919 7293.65019 Regression Residual Total Model 1 Sum of SquaresdfMean SquareFSig. Predictors: (Constant), 腰 围 (cm) a. Dependent Variable: 腹 腔 内 脂 肪 面 积 (cm2) b. F =24.924 P 0.001 F =24.924 P 0.001 按按0.050.05的检验水准回绝的检验水准回绝H0H0接受接受H1H1,回归方,回归方 程有统计学意义,可以以为腹腔内脂肪面程有统计学意义,可以以为腹腔内脂肪面 积与腰围之间有直线回归关系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年教育环境下《马钧传》教案设计
- 互联网工程专家之路:2024培训课程
- 2023年中级注册安全工程师之安全生产管理综合检测试卷A卷含答案
- 专题02 可数名词的复数变化形式精讲课件初中英语语法课件
- 2024年教育技术展望:基于AI的《六国论》课件革新
- 2024年教育创新:《母鸡》互动游戏设计
- 《晚春》教案设计新趋势与2024教学策略预测
- 2023年度淄博市职业技能大赛竞赛方案(网站设计与开发)
- 2024年OBD远程培训与技术交流
- 2024新趋势:Photoshop去水印技能全面解析
- 腹腔镜手术操作技巧
- 品牌矿泉水物质表
- 2024年中国移动重庆分公司招聘笔试参考题库含答案解析
- 污水源热泵方案
- QCT 1037-2016 道路车辆用高压电缆
- 现代交换原理与通信网技
- 全科医生临床常见病门急诊病历模板(范例)
- GH/T 1421-2023野生食用菌保育促繁技术规程块菌(松露)
- 商业综合体停车收费管理详细规定
- 健康管理专业职业生涯规划书
- 滑膜炎的知识宣教
评论
0/150
提交评论