




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章线性相关与线性回归分析1.相关分析原理2.Bivariate过程3.回归分析原理4.Regression过程5.1一元相关与回归5.2多元回归方程例
测某地10名三岁儿童的体重X(kg)与体表面积Y(10-1m2),体重11.011.812.012.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411判断X和Y是否是线性相关的。5.1相关分析原理1.直线相关:(1)两个变量均服从正态分布
总体相关系数:样本相关系数:r绝对值愈接近1,两个变量间的线性相关越密切r绝对值越接近0,两个变量间的线性相关越不密切性质:Pearson简单相关分析相关系数的检验原假设则:()×(2)如果不服从正态分布,则应考虑变量变换,或采用等级相关来分析。Spearman等级相关Kendall等级相关注:列联表可用“Crosstabs过程”中的“ContingencyCoefficient”
计算Pearson列联相关系数2.曲线相关:两变量存在相关趋势,但非线性,而是呈某种可能的曲线趋势。一般都先将变量变换,再将趋势变换为直线来分析,或者采用曲线回归方法来分析。5.2Bivariate过程例
某次体检中抽取12名学生的体重和血压,现通过相关分析过程来观测学生的体重与血压是否相关?体重68485660835662597758血压95988796110155135128113168目的:检验问题:两变量数据是否服从正态分布?(需提前进行)是Pearson相关分析否数据转换或进行等级相关分析
实现步骤:1.将数据录入SPSS并整理加工定义变量输入数据保存weight:体重;pressure:血压;保存为:“体重与血压.sav”2.正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)可以认为体重值、血压值服从正态分布。【Variables框】用于选入需要进行相关分析的变量,至少需要选入两个。【CorrelationCoefficients
复选框组】用于选择需要计算的相关分析指标。【Flagsignificantcorrelations】用于确定是否在结果中用星号标记有统计学意义的相关系数,一般选中。此时P<0.05的系数值旁会标记一个星号,P<0.01的则标记两个星号。将“体重[weight]”、“血压[pressure]”点入“Variables”框,点击“Options”按钮。
3.相关分析过程菜单“Analyze”|“Correlate
”|“Bivariate”命令【Options钮】弹出Options对话框,选择需要计算的描述统计量和统计分析:选择“Meansandstandarddeviations”,点击“Continue”返回上一层对话框。点击“OK”按钮
结果输出和讨论:分析:左图给出了体重和血压的平均值、标准差和样本数目。分析:Pearson相关系数r为-0.112,即两者是微弱相关的,但P=0.728>0.05,所以不能认为二者相关。即不存在直线相关关系。(反映了观测值总的分散程度)(回归平方和
)反映了回归值的分散程度(由于线性影响引起的离散性)(剩余平方和)反映了观测值偏离回归直线的程度(由于随机误差引起的离散性)5.3回归分析原理F检验:
H0:β=0()当时:或决定系数R2=SS回/SS总=1-SS剩/SS总
0≤R2≤1,越接近于1,回归效果越好。临床:R2≥0.7就认为回归效果不错高精度医药实验研究:R2>0.9R2=r2一元线性回归方程中:越接近于1,回归效果越好。校正决定系数1-MS剩/MS总例
测某地10名三岁儿童的体重X(kg)与体表面积Y(10-1m2),体重11.011.812.012.313.113.714.414.915.216.0体表5.2835.2995.3585.6025.2926.0145.8306.1026.0756.411做体表Y关于体重X的回归方程。做散点图建立回归方程并检验
实现步骤:保存为:“体重与体表.sav”x:体重;y:体表;1.将数据录入SPSS并整理加工定义变量输入数据保存2.利用Scatter/Dot命令做散点图菜单“Graphs”|“Legacy
Dialogs”|“Scatter/Dot”点击“simple
scatter”命令,点击“Define”按钮。将“体重[x]”变量选入“XAxis”框,将“体表[y]”选入“YAxis”框中,点击“OK”按钮输出结果。(2)正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)3.Regression过程菜单“Analyze”|“Regression
”|“linear”命令将“体表[y]”选入【Dependent框】;将“体重[x]”选入【Independent(s)框】中,点击“Statistics”按钮Enter
强迫进入Stepwise
逐步回归Remove
只出不进Backward
向后剔除,只出不进Forward
向前选择,只进不出【Modelfit】输出复相关系数R,其平方,校正决定系数和标准差,以及方差分析表。选择“Estimates”、“Confidenceinterval”、“Modelfit”、“Descriptives”,点击“continue”返回。【Estimates】
输出有关回归系数和相关测量【Confidenceinterval】输出回归系数95%的置信区间【Descriptives】描述性统计量点击“OK”按钮输出结果分析:给出了体表和体重的均数和标准差情况。分析:此表给出了体重和体表的相关系数阵和P值。
结果输出和讨论:分析:R=0.918(即相关系数r),决定系数校正的决定系数为0.823,估计值的标准误差为0.17434分析:可见回归平方和为1.301,剩余平方和为0.243,F=42.798,P=0.000<0.05,拒绝原假设,认为是线性相关的,即回归方程有意义。分析:非标准化系数,t统计量分别为5.616和6.542,其P值分别为0.001和0.000,均小于0.005,有显著性意义。其回归方程为
多元线性回归分析
研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,在计算上更为复杂,一般需借助计算机来完成。是偏回归系数编号载脂蛋白AI(mg/dl)载脂蛋白B(mg/dl)载脂蛋白E
(mg/dl)载脂蛋白C(mg/dl)胆固醇含量(mg/dl)11731067.014.76221391326.417.84331981126.916.78141181387.115.7395139948.613.651617516012.120.365713115411.221.54081581419.729.642有研究认为血清中高密度脂蛋白降低是引起动脉硬化的一个重要原因,现测量了30名被怀疑患有动脉硬化的就诊患者的载脂蛋白AⅠ、载脂蛋白B、载脂蛋白E、载脂蛋白C和高密度脂蛋白中的胆固醇含量,资料见表,分析四种载脂蛋白对高密度脂蛋白中胆固醇含量的影响。91581377.418.256101321517.517.237111621106.015.9701214411310.142.841131621377.220.756141691298.516.758151291386.310.1471616614811.533.449171851186.017.569181551216.120.457191751114.127.274201361109.426.039211531338.516.965221101499.524.74023160865.310.857241121238.016.634251471108.518.454262041226.121.072271311026.613.451281701278.424.762291731238.719.0853013213113.829.238
实现步骤:x1:载脂蛋白AI;X2:载脂蛋白B;X3:载脂蛋白EX4:载脂蛋白C;y:胆固醇含量。1.将数据录入SPSS并整理加工定义变量输入数据保存2.正态性检验:Analyze|DescriptiveStatistics|Explore(探索性)3.Regression过程菜单“Analyze”|“Regression
”|“linear”命令将“y”选入【Dependent框】;将“x1、x2、x3、x4选入【Independent(s)框】中在methods中选择“stepwise”。点击“Statistics”按钮选择“Estimates”、“Confideceinterval”、“Modelfit”、“Descriptives”,点击“continue”返回。【Options钮】选择进入或排除变量的显著水平此处因为是stepwise(逐步回归),所以entry填0.10Removal填0.15.点击continue回到主对话框。点击“OK”按钮
结果输出和讨论:其回归方程为分析:非标准化系数,标准化回归方程为小结
一元线性回归只涉及一个自变量的回归问题;
多元线性回归用于解决两个或两个以上自变量对一个因变量的数量变化关系问题;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 创业项目产品展示
- 骨干企业用日语怎说课
- 黄金卷03(广东专用)-备战2025年中考地理模拟卷(解析版)
- 幼儿园管理层述职报告
- 医药销售行业年度总结
- 准备万全的CFA考试试题及答案
- 市场心理学与投资策略试题及答案
- 中学防性防侵害安全教育
- 投资市场趋势分析试题及答案
- 创新创业中的失败案例
- JJF 1952-2021X射线荧光测硫仪校准规范
- JJF 1445-2014落锤式冲击试验机校准规范
- TTAAA 002-2022 天津市事故机动车贬损价值评估标准
- 师德师风暗查暗访督查记录表
- 上市后的药品变更管理(2020)课件
- 铁缺乏症和缺铁性贫血诊治和预防的多学科专家共识(2022年版)
- CATIA-V5零件操作教程-清华课件
- 砂(碎石)垫层施工作业指导书
- 公安局设备采购清单
- 黑红色简约风《白夜行》名著导读好书推荐PPT模板
- 吉春亚神奇的汉字-完整版PPT
评论
0/150
提交评论