相关与回归分析过程课件_第1页
相关与回归分析过程课件_第2页
相关与回归分析过程课件_第3页
相关与回归分析过程课件_第4页
相关与回归分析过程课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关与回归相关分析简介

在医学科学研究中,常常要分析两个变量之间的关系,例如身高和体重、年龄和血压、体温和脉搏、药物剂量和疗效等问题,因此涉及到研究两个变量的相互关系。这时就涉及到两个变量之间的相关与回归。积差相关系数,又称Pearson相关系数:定量描述线性相关程度好坏的常用指标,只适用于两变量呈线性相关时。特点:

相关系数r

是一个无单位的量值,且-1<r<1;

r>0为正相关,r<0为负相关;

r越接近于1,说明相关性越好;越接近于0,相关性越差。Spearman等级相关系数:当数据不满足条件双变量正态时。相关分析简介

连续变量的相关指标(最常见)列联系数:基于2值得出PhiandCramer‘sV:也是基于2值得出Lambda系数:用于反映自变量对因变量的预测效果不确定系数相关分析简介

名义变量的相关指标EtaKappa值OR、RR等相关分析简介

其他相关指标相关分析简介

实际上,在Freq过程中measures选择项提供了非常整齐的相关分析指标体系,如上图。

除了Freq过程的measures选择项外,SAS还提供了其他更专业的相关分析过程:PROCCORR过程:线性相关、秩相关和偏相关分析PROCCANCORR过程:典型相关分析(略)相关分析简介

例1

某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重增量间的关系的原始数据如下,试分析两者有无直线相关关系。动物编号12345678910进食量feed820780720867690787934679639820体重增量weight165158130180134167186145120158进食量和体重增量的数据简单相关分析Datacorr_1;Inputxy@@;Cards;165780158720130867180690134787167934186679145639120820158;Proccorrspearman;Varxy;Run;pearson相关系数和p值Spearman相关系数和P值指定计算spearman秩相关系数,默认时只计算pearson相关系数。

前面介绍的相关分析是分析两个计量资料间的关系,在计算积差相关系数、Spearman相关系数时候,都没有考虑第三方的影响,这就导致可能对事物的解释出现偏差。下面以一个例子对此作进一步的说明。偏相关分析表132例40岁以上男性的BMI指数、年龄、吸烟与收缩压实测值

编号(ID)收缩压(Y)年龄(X1)吸烟(X2)体重指数(X3)11354502.87621224103.25131304903.10041585203.76851465412.97961294712.79071626013.66881575413.61291444412.368101806414.637111665913.877续表一

编号(ID)收缩压(Y)年龄(X1)吸烟(X2)体重指数(X3)121385114.032131526404.116141385603.673151405413.562161345012.998171454913.360181424613.024191355703.171201425603.401211505613.628221445803.751续表二

编号(ID)收缩压(Y)年龄(X1)吸烟(X2)体重指数(X3)231375303.296241325003.210251495413.301261324813.017271204302.789281264312.956291616303.80301706314.132311526203.962321646504.010Datacorr_2;Inputyx1-x3@@;Cards;135 45 0 2.876122 41 0 3.251130 49 0 3.100158 52 0 3.768146 54 1 2.979129 47 1 2.790162 60 1 3.668157 54 1 3.612144 44 1 2.368180 64 1 4.637166 59 1 3.877……;Proccorrdata=corr_2;Varyx2x3;Partialx1;Run;控制x1影响后的结果绘制散点图如下:简单回归分析①两变量间存在线性相关趋势②没有发现明显的异常值回归分析过程功能:拟合线性回归模型格式:Procreg<选择项>;Model因变量=自变量</选择项>;Freq频数变量;Plot<y*x><=符号>…</选择项>;…Run;Reg过程的选择项较多,用法也比较复杂,但常用的选择项不多也容易掌握,说明如下:1、reg后的选择项主要是对data的一些操作,比如:data=数据集。2、model语句后的选择项主要进行自变量的筛选,比如:selection=stepwise等。3、freq语句后频数变量。4、plot语句可以输出各类散点图,符号和选择项采用默认的设置。5、一个reg过程最多可以使用9个model语句(一次同时拟合9个模型)。多元回归分析

直线回归与相关是分析一个应变量Y与一个自变量X之间的关系。但通常是一个应变量受到许多因素的影响,例如一个人的收缩压受到年龄、饮食、锻炼及遗传等许多因素的影响。因此,必须把直线回归与相关的分析方法推广为多个自变量的分析方法,从而起到更有效的预报、控制及识别影响因素的作用。多元线性回归方程的建立多元线性回归模型为:

式中βj是Xj(j=1,2,…,p)对Y的偏回归系数(Partialregressioncoefficient),它表示在其它自变量固定不变的情况下,Xj每改变一个测量单位时所引起的应变量Y的平均改变量,p为自变量的个数,ε为残差,独立服从N(0,σ2)分布。拟寻求参数β0,β1,…βp的适宜估计值b0,b1,bp,使观察值Yi和回归预测值

之间残差平方和最小,即:实例分析

例3为研究男性高血压患者血压与年龄体重等变量的关系,随机测量了32名40岁以上男性的血压(mmHg)、年龄(岁)、身高、体重、以及吸烟史。其中体重指数BMI=100(体重/身高2);吸烟:0为不吸,1为过去或现在吸烟。(见表1)

程序如下:procregdata=corr_2;Modely=x1-x3/selection=stepwisestb;Run;Quit;逐步回归法筛选自变量标准化偏回归系数最后一步的结果自变量进出的描述检验整个模型分别检验每个自变量用stepwise时自变量进入或剔除的检验水准默认时为0.15Procregdata=corr_2;Modely=x1-x3/selection=stepwisestbSle=0.1sls=0.1;Run;Quit;将检验水准改为0.1X3不能进入模型。问题:X1(年龄)与x2(吸烟)哪个变量对SBP的影响大?一元完全随机设计资料的协方差分析

下列数据是研究镉作业工人暴露于烟尘的年数与肺活量的关系。按暴露年数将工人分为两组:甲组暴露≥10年,乙组暴露<10年。两组工人年龄未经控制。问该两组暴露于镉作业工人平均肺活量是否相同?

甲组(暴露≥10年)

乙组(暴露<10年)x1(年龄)y1(肺活量,L)x2(年龄)y2(肺活量,L)394.62405.29415.52413.71454.02495.09522.70474.31612.70653.03582.73593.67434.61394.73384.58425.12433.89434.62374.30502.70503.50453.06484.06514.51464.66582.88383.64385.09不考虑年龄对肺活量的关系,直接用t检验比较二组工人的平均肺活量Datacoanova;dogroup=0,1;inputn;doi=1ton;inputxy@@;output;end;end;Cards;12394.62405.29415.25413.71454.02495.09522.70474.31612.7653.03582.73593.6716434.61394.73384.58425.12433.89434.62374.30502.70503.50453.06484.06514.51464.66582.88383.64385.09;Procttest;Classgroup;Vary;Run;不同暴露年限的工人平均肺活量有差异??

协方差分析需调用SAS的GLM过程来分析。程序如下:procglmdata=coanova;classgroup;modely=xgroup/solution;lsmeansgroup/stderrpdiff;run;选择项solution是要输出回归方程中各参数的估计值,Lsmeans语句(leastsquaremeans)是要输出各组(group)修正均数,标准误(stderr)及均值之间差异比较的概率(pdiff)。将年龄对肺活量的线性影响消除后,再比较二组工人的平均肺活量。控制了年龄协变量后二组修正均数间无差异。协方差分析对数据的要求:正态分布两条回归线平行肺活量(Y)与年龄(X)均呈线性关系且回归线必须平行如何检验回归线是否平行?先做回归分析,求得回归系数,然后再比较二个回归系数是否有差异(比较麻烦!)用多元线性回

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论