




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章第五章 线性相关与线性回归分析线性相关与线性回归分析1. 相关分析原理相关分析原理2. Bivariate过程过程 3. 回归分析原理回归分析原理4. Regression过程过程 5.1 一元相关与回归一元相关与回归5.2 多元回归方程多元回归方程例例 测某地测某地10名三岁儿童的体重名三岁儿童的体重X(kg)与体表面积)与体表面积Y (101m2),),体重11.011.812.012.313.113.714.414.915.216.0体表5.283 5.299 5.358 5.602 5.292 6.014 5.830 6.102 6.0756.411判断判断X和和Y是否是线性相关
2、的。是否是线性相关的。5.1 相关分析原理相关分析原理1.直线相关:直线相关:(1)两个变量均服从正态分布)两个变量均服从正态分布 ()()E XEX YEYDX DY总体相关系数总体相关系数:样本相关系数样本相关系数:12211()()()()niiinniiiixxyyrxxyy11r r绝对值愈接近绝对值愈接近1,两个变量间的线性相关越密切,两个变量间的线性相关越密切r绝对值越接近绝对值越接近0,两个变量间的线性相关越不密切,两个变量间的线性相关越不密切性质:性质:Pearson简单相关分析简单相关分析22(2)1r ntt nr原假设原假设 0:0H则则:0H( )2(2)ttnP(2
3、)如果不服从正态分布,则应考虑变量变换,或采用)如果不服从正态分布,则应考虑变量变换,或采用 等级相关来分析。等级相关来分析。 Spearman等级相关等级相关 Kendall 等级相关等级相关注:列联表可用注:列联表可用“Crosstabs 过程过程 ”中的中的“Contingency Coefficient” 计算计算Pearson列联相关系数列联相关系数2.曲线相关:两变量存在相关趋势,但非线性,而是呈某种可能的曲线相关:两变量存在相关趋势,但非线性,而是呈某种可能的 曲线趋势。一般都先将变量变换,再将趋势变换为直曲线趋势。一般都先将变量变换,再将趋势变换为直 线来分析,或者采用曲线回归
4、方法来分析。线来分析,或者采用曲线回归方法来分析。5.2 Bivariate过程过程 例例 某医生在不同保存时间(天)的条件下,测得白蛋白与某医生在不同保存时间(天)的条件下,测得白蛋白与白球蛋白的比值,判断保存时间与白球蛋白比值是否相关?白球蛋白的比值,判断保存时间与白球蛋白比值是否相关?目的目的:检验:检验问题:问题:两变量数据是否服从正态分布两变量数据是否服从正态分布? (需提前进行需提前进行)是是Pearson相关分析相关分析否否数据转换或进行等级相关分析数据转换或进行等级相关分析0:0H 实现步骤:实现步骤:1. 将数据录入将数据录入SPSS并整理加工并整理加工定义变量定义变量 输入
5、数据输入数据保存保存保存为:保存为:“时间与比值时间与比值.sav”2.正态性检验正态性检验:Analyze | Descriptive Statistics | Explore(探索性)探索性)可以认为保存时间、白球蛋白比值服从正态分布。可以认为保存时间、白球蛋白比值服从正态分布。【Variables框】用于选框】用于选入需要进行相关分析的入需要进行相关分析的变量,至少需要选入两个。变量,至少需要选入两个。将将“保存时间保存时间”、“白球蛋白白球蛋白比值比值”点入点入“Variables”框。框。【Correlation Coefficients 复选框组】用于选择需要复选框组】用于选择需要
6、 计算的相关分析指标。计算的相关分析指标。【Flag significant correlations】用于确定是否在结果中用星号】用于确定是否在结果中用星号 标记有统计学意义的相关系数,一般选中。此时标记有统计学意义的相关系数,一般选中。此时P0.05的系数的系数 值旁会标记一个星号,值旁会标记一个星号,P0.01的则标记两个星号。的则标记两个星号。点击点击“Options”按钮。按钮。 3.相关分析过程相关分析过程菜单 “Analyze” | “Correlate ” | “Bivariate ”命令【Options钮】弹出钮】弹出Options对话框,选择需对话框,选择需要计算的描述统计
7、量和要计算的描述统计量和统计分析统计分析 选择选择“Means and standard deviations”,点击,点击“Continue”返回上一层对话框。返回上一层对话框。 点击点击“OK”按钮按钮 结果输出和讨论:结果输出和讨论:分析:左图给出了均值、分析:左图给出了均值、标准差和样本数目。标准差和样本数目。分析:分析:Pearson相关系数相关系数r为为0.995,P=0.0000.9R2 r2一元线性回归方程中:一元线性回归方程中:越接近于越接近于1,回归效果越好。,回归效果越好。校正决定系数校正决定系数2CR 1MS剩剩/MS总总2SS(nm1)n111(1R )SS/1)nm
8、1=n 剩剩总总/ /(例例 测某地测某地10名三岁儿童的体重名三岁儿童的体重X(kg)与体表面)与体表面积积Y(101m2),),体重11.011.812.012.313.113.714.414.915.216.0体表5.283 5.299 5.358 5.602 5.292 6.014 5.830 6.102 6.0756.411做体表关于体重的回归方程。做体表关于体重的回归方程。做散点图做散点图建立回归方程并检验建立回归方程并检验 实现步骤:实现步骤:保存为:保存为:“体重与体表体重与体表.sav”体重体重; 体表;体表;1. 将数据录入将数据录入SPSS并整理加工并整理加工定义变量定义
9、变量 输入数据输入数据保存保存2.利用利用Scatter/Dot命令做散点图菜单“Graphs”|“Legacy Dialogs”|“Scatter/Dot”点击 “simple scatter” 命令,点击命令,点击“Define”按钮。按钮。将将“体重体重”变量变量选入选入“X Axis”框,框,将将“体表体表”选入选入“YAxis”框中,点击框中,点击“OK”按钮输出结果。按钮输出结果。(2)正态性检验正态性检验:Analyze | Descriptive Statistics | Explore(探索性)探索性)Tests of NormalityTests of Normality.
10、21310.200*.88610.153体表StatisticdfSig.StatisticdfSig.Kolmogorov-SmirnovaShapiro-WilkThis is a lower bound of the true significance.*. Lilliefors Significance Correctiona. 3.Regression过程过程菜单 “Analyze” | “Regression ” | “linear ”命令将将“体表体表y”选入选入【Dependent框】;框】;将将“体重体重x”选入选入【Independent(s)框】中框】中, 点击点击“St
11、atistics”按按钮钮【Model fit】输出复相关系数】输出复相关系数R,其平方其平方 ,校正决定系数,校正决定系数 和标准差,以及方差分析表。和标准差,以及方差分析表。2cR2R选择选择“Estimates”、“Model fit”、 “Descriptives” ,点击,点击“continue”返回。点击返回。点击“OK”按钮输出结果。按钮输出结果。【Estimates】 输出有关回归输出有关回归系数和相关测量系数和相关测量【Confidence interval】输】输出回归系数出回归系数95%的置信区间的置信区间【Descriptives】描述性统计量描述性统计量Descrip
12、tive StatisticsDescriptive Statistics5.7266.414181013.44001.6634610体表体重MeanStd.DeviationN分析:给出了体表和体重的均数和标准差情况。分析:给出了体表和体重的均数和标准差情况。CorrelationsCorrelations1.000.918.9181.000.000.000.10101010体表体重体表体重体表体重Pearson CorrelationSig. (1-tailed)N体表体重分析:此表给出了体重和体表的相关系数阵和分析:此表给出了体重和体表的相关系数阵和P值。值。 结果输出和讨论:结果输出和
13、讨论:分析:分析:R=0.918(即相关系数即相关系数r),决定系数,决定系数20.843R 校正的决定系数为校正的决定系数为0.823,估计值的标准误差为,估计值的标准误差为0.17434Variables Entered/RemovedVariables Entered/Removedb b体重a.EnterModel1VariablesEnteredVariablesRemovedMethodAll requested variables entered.a. Dependent Variable: 体表b. Model SummaryModel Summaryb b.918a.843.
14、823.17434Model1RR SquareAdjusted RSquareStd. Error ofthe EstimatePredictors: (Constant), 体重a. Dependent Variable: 体表b. 分析:可见回归平方和分析:可见回归平方和 为为1.301,剩余平方和,剩余平方和SS回为为0.243,F=42.798,P=0.0000.001, 拒绝原假设,认拒绝原假设,认为回归方程有统计学意义。为回归方程有统计学意义。SS剩剩A AN NO OV VA Ab b1.30111.30142.798.000a.2438.0301.5449Regression
15、ResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 体重a. Dependent Variable: 体表b. 分析:非标准化系数分析:非标准化系数 ,2.6550.229bt统计量分别为统计量分别为5.616和和6.542,其,其P值分别为值分别为0.001和和0.000,均小于,均小于0.05,有显著性意义。,有显著性意义。C Co oe ef ff fi ic ci ie en nt ts sa a2.655.4735.616.0011.5653.745.229.035.9186.542.00
16、0.148.309(Constant)体重Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95% Confidence Intervalfor BDependent Variable: 体表a. 2.655 0.229yx其回归方程为其回归方程为 多元线性回归分析多元线性回归分析 研究在线性相关条件下,两个或两个以上自研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线变量对一个因变量的数量变化关系,称为多元线性回归分析
17、。性回归分析。 多元线性回归模型是一元线性回归模型的扩展,多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,在计算上其基本原理与一元线性回归模型类似,在计算上更为复杂,一般需借助计算机来完成。更为复杂,一般需借助计算机来完成。01kb ,b ,b是偏回归系数是偏回归系数01122kk ybb xb xb x编号载脂蛋白AI (mg/dl)载脂蛋白B (mg/dl) 载脂蛋白E (mg/dl) 载脂蛋白C (mg/dl) 胆固醇含量(mg/dl)11731067.014.76221391326.417.84331981126.916.78141181387.115.73
18、95139948.613.651617516012.120.365713115411.221.54081581419.729.642有研究认为血清中高密度脂蛋白降低是引起动脉硬化的一个重要原因,现测量了30名被怀疑患有动脉硬化的就诊患者的载脂蛋白A、载脂蛋白B、载脂蛋白E、载脂蛋白C和高密度脂蛋白中的胆固醇含量,资料见表,分析四种载脂蛋白对高密度脂蛋白中胆固醇含量的影响。 91581377.418.256101321517.517.237111621106.015.9701214411310.142.841131621377.220.756141691298.516.758151291386.
19、310.1471616614811.533.449171851186.017.569181551216.120.457191751114.127.274201361109.426.039211531338.516.965221101499.524.74023160865.310.857241121238.016.634251471108.518.454262041226.121.072271311026.613.451281701278.424.762291731238.719.0853013213113.829.238 实现步骤:实现步骤:x1:载脂蛋白载脂蛋白AI; X2:载脂蛋白:载脂蛋白B;X3:载脂蛋白:载脂蛋白EX4:载脂蛋白:载脂蛋白C;y:胆固醇含量。胆固醇含量。1. 将数据录入将数据录入SPSS并整理加工并整理加工定义变量定义变量 输入数据输入数据保存保存2.正态性检验:正态性检验:Analyze | Descriptive Statistics | Explore(探索性)探索性)Tests of NormalityTests of Normality.12830.200*.95130.183胆固醇含量StatisticdfSig.StatisticdfSig.Kolmogorov-Smi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小草教育资源网
- 2025年春国开电大《形势与政策》形考任务专题测试1-5及大作业
- 思想工作总结范例
- 律师执业情况总结
- 2025新款民间借贷抵押借款合同范本
- 阳光棚制作合同范本
- 大量移动脚手架租赁合同
- 小学生爱国教育
- 梅毒防控培训课件
- 买房公寓合同标准文本
- 山东省汽车维修工时定额(T-SDAMTIA 0001-2023)
- 《铜产业链》课件
- 临床疗效总评量表(CGI)
- 寺庙开发运营项目融资计划书
- 2023年上海市杨浦区社区工作者招聘考试真题
- 《凤仙花开花了》参考课件
- 风湿免疫科类风湿关节炎一病一品优质护理汇报课件
- 2022-2023学年重庆市重庆市两江新区部编版四年级下册期末考试语文试卷答案
- 2022年火力发电厂焊接技术规程-电力焊接规程
- JCT2156-2012 纤维玻璃原料及配合料COD值的测定
- (完整版)庭审笔录(刑事普通程序)
评论
0/150
提交评论