单因素线性相关医学_第1页
单因素线性相关医学_第2页
单因素线性相关医学_第3页
单因素线性相关医学_第4页
单因素线性相关医学_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、单因素线性相关医学第1页,共65页,2022年,5月20日,2点19分,星期二 现实世界中许多事物与事物之间存在着联系,统计方法的一个重要目的是探讨事物的数量规律,通过对不同性质的事物进行大量观察,发现某些表面关系不大的事物之间存在的依存关系,并度量这种关系的紧密程度。 然而,多数情况是两事物间虽存在着联系,但其方式不是“决定”,统计学中把这种现象之间在数量上非确定性的对应关系叫做“相关关系” 。 第2页,共65页,2022年,5月20日,2点19分,星期二 人们发现这种不太明确的规律以后,为了验证、利用这些规律,人们会进一步试验,筛选出最主要的变量,再进行理论论证,直至形成一种比较稳定的、可

2、控的操作模式。 统计学上,如果发现了某两个变量之间的相关关系,会对这两个变量的一系列观测值进行有效的统计技术处理(回归分析),形成具有一定概率的统计规律。 第3页,共65页,2022年,5月20日,2点19分,星期二相关关系的种类: 按相关的方向不同可以分为正相关和负相关 按相关的形式不同可以分为线性相关和非线 性相关 按影响因素的数量不同分为单相关、复相关 和偏相关 按照变量关联的密切程度可分为完全相关、 不完全相关和完全不相关(无关) 第4页,共65页,2022年,5月20日,2点19分,星期二 简单线性相关 当一个变量X由小到大,另一个变量Y亦相应地由小到大(或由大到小),两变量的散点图

3、呈直线趋势,那么这两个变量之间有线性关系。分析这种线性关系的理论和方法,统称为直线相关或线性相关。 两变量直线相关的性质和密切程度,用直线相关系数r来描述。 第5页,共65页,2022年,5月20日,2点19分,星期二 相关系数:又称为积差相关系数或积矩相关系数,它表示两个变量之间直线关系的密切程度和相关方向的统计指标。 总体相关系数用符号表示,随机样本相关系数用符号r表示。 r取值范围:-1r1,没有单位。相关系数的计算及意义:第6页,共65页,2022年,5月20日,2点19分,星期二相关性质与r值的关系: 第7页,共65页,2022年,5月20日,2点19分,星期二 习惯上,相关系数的绝

4、对值|r|在: 0.3以下,称为微弱线性相关; ,称为低度线性相关; ,称为显著线性相关; 0.8以上,称为高度线性相关。 第8页,共65页,2022年,5月20日,2点19分,星期二r计算公式: (y的离均差平方和) (x的离均差平方和)(x与y的离均差积和) 第9页,共65页,2022年,5月20日,2点19分,星期二相关系数假设检验: ,=n-2 从样本计算的r值,是总体相关系数的估计值,从=0(无直线相关)的总体抽出的样本,其r不一定为0,因此得到r后必须检验r是否来自=0的总体,以判断两变量间是否存在直线相关关系。可用t检验或直接查r界值表实现。 第10页,共65页,2022年,5月

5、20日,2点19分,星期二实例讲解实例110名20岁男青年身高与前臂长的数据见表1。 计算相关系数并对=0进行假设检验;表1 10名20岁男青年身高与前臂长 第11页,共65页,2022年,5月20日,2点19分,星期二实例讲解1由原始数据及散点图进行初步分析(图1)第12页,共65页,2022年,5月20日,2点19分,星期二实例讲解2、计算相关系数第13页,共65页,2022年,5月20日,2点19分,星期二实例讲解 H0:=0,即身高与前臂长间无直线相关关系 H1:0,即身高与前臂长间有直线相关关系=0.05 ,查t界值表,得0.002P r2,就判断r1比r2相关更密切。因为查表,若按

6、同一检验水准0.05,则前者认为无相关而后者有相关,可见正确推断有无相关必须经过假设检验。4. 积差相关分析只适用于双变量正态分布资料。第23页,共65页,2022年,5月20日,2点19分,星期二 不服从双变量正态分布而不宜作积差相关分析。 总体分布类型未知。 用等级表示的原始数据。秩相关:又叫等级相关(rank correlation),即斯皮尔曼(Spearman)等级相关。是用双变量数量等级顺序作直线相关分析。适用于以下资料:第24页,共65页,2022年,5月20日,2点19分,星期二实例讲解 某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如下:实

7、例2试检验两者有无相关?第25页,共65页,2022年,5月20日,2点19分,星期二实例讲解 本题资料不服从双变量正态分布,宜计算等级相关系数。计算过程见下表。 第26页,共65页,2022年,5月20日,2点19分,星期二rs = 1- n:总例数 d:每一对值的等级差rs= 16288(821)=0.6667 H0:s0,即肺癌标化死亡率和大气中苯并(a)芘无相关关系H1:s0,即肺癌标化死亡率和大气中苯并(a)芘有相关关系0.05查rs界值表,得0.10P0.05,按0.05水准,不拒绝H0,尚不能认为肺癌标化死亡率和大气中的苯并(a)芘有相关关系。 实例讲解第27页,共65页,202

8、2年,5月20日,2点19分,星期二SPSS软件分析结果:第28页,共65页,2022年,5月20日,2点19分,星期二直线回归 线性回归分析是基于最小二乘法原理产生古典统计假设下的最优线性无偏估计。 直线回归是回归分析中最基本、最简单的一种,是处理两变量(其中至少一个是随机变量)间线性依存关系的一种统计方法,即自变量只有一个的情况,故又称简单回归(simple regression),所得方程叫直线回归方程。 若引入回归分析的自变量有两个以上,那么就是多重线性回归分析或多元线性回归分析,所得方程叫多重线性回归方程。“回归”一词的来历。 第29页,共65页,2022年,5月20日,2点19分,

9、星期二两变量之间存在直线关系时,通过计算回归方程来描述这两个变量相互依存的数量关系。根据直线回归方程由已知(或易测)变量值,估计未知(或难测)变量值。对总体回归直线作出估计,评价样本回归直线的可信程度。估计正常值范围。 用途:第30页,共65页,2022年,5月20日,2点19分,星期二简单线性回归方程: = a + bx 第31页,共65页,2022年,5月20日,2点19分,星期二第32页,共65页,2022年,5月20日,2点19分,星期二最小二乘法原理,此时估计误差平方和 最小。第33页,共65页,2022年,5月20日,2点19分,星期二直线回归方程的假设检验 样本回归系数b的假设检

10、验(1)方差分析;(2)t检验。第34页,共65页,2022年,5月20日,2点19分,星期二决定系数:第35页,共65页,2022年,5月20日,2点19分,星期二 习惯上写成 ,称为确定系数(或决定系数),数值上等于自变量对因变量的贡献率,即用自变量能解释因变量变化的百分之多少。 越接近于1,回归拟合分析的效果越好,即价值越大。 注意:如果X与Y有回归关系,则一定存在相关关系,但是若存在相关关系,则不一定存在回归关系。 第36页,共65页,2022年,5月20日,2点19分,星期二作直线回归分析时的注意事项: 1)两变量间的关系必须有实际意义。2)计算直线回归的两变量,若X为选定的,则对应

11、于每个X值的Y值必须服从正态分布,其即Y的均数;若X、Y都是随机变量,则要求X、Y服从双变量正态分布。否则先经变量变换,使资料符合要求后再进行回归分析。第37页,共65页,2022年,5月20日,2点19分,星期二3)用同一资料计算X推算Y,和由Y推算X的两个回归方程,结果不同。因此,要正确选定自变量。若两变量之间有因果关系,应以“因”为X;无法确定时,则以较易测定者或变异较小者为X。4)观察值必须是同质的。如果有两个不同的子群,可能产生实际上不存在的回归,也可能忽视了确实存在的回归关系。5)回归方程一般只适用于自变量X的原观察数据范围,而且实验条件也应与取得原观察数据的实验条件一致,不能任意

12、外推。第38页,共65页,2022年,5月20日,2点19分,星期二实例讲解实例3某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量和增加体重的数据见表2。 表2 8只大白鼠的进食量和体重增加量求直线回归方程并对回归系数作假设检验。 第39页,共65页,2022年,5月20日,2点19分,星期二实例讲解1、由原始数据绘制散点图并初步分析(图2)图2 大白鼠的进食量与增加体重散点图 第40页,共65页,2022年,5月20日,2点19分,星期二实例讲解X=6328,X2=5048814,Y=1273,Y2=206619, ,XY=1018263 2、计算回归系数b和截距a,求回归方程回

13、归方程: = -47.326 + 0.261x第41页,共65页,2022年,5月20日,2点19分,星期二3、回归系数假设检验: H0:0,即进食量与增重之间无直线关系H1:0,即进食量与增重之间有直线关系0.05方差分析表实例讲解查F界值表,得P0.01,按0.05水准,拒绝H0,接受H1,可认为大白鼠的进食量与增加体重间有直线关系。 第42页,共65页,2022年,5月20日,2点19分,星期二实例讲解t检验: 按=6,查t界值表,得0.01P0.05,按0.05水准,拒绝H0,接受H1,结论同上。 本题 故可用直线回归方程 来描述大白鼠的进食量与增加体重的关系。第43页,共65页,20

14、22年,5月20日,2点19分,星期二实例讲解4、计算总体回归系数的95%可信区间 上限= 0.2612.44713.5107 =0.1022下限= 0.2612.44713.5107 =0.4198总体回归系数的95%可信区间:(bt0.05(n2) Sb,bt0.05(n2) Sb)第44页,共65页,2022年,5月20日,2点19分,星期二SPSS软件操作过程:1、建立数据库2、分析操作:2.1 绘散点图 Graphs Scatter Simple Define: Y Axis: 增重 X Axis: 食量 OK第45页,共65页,2022年,5月20日,2点19分,星期二第46页,共

15、65页,2022年,5月20日,2点19分,星期二2.2 分析界面操作: Analyze Regression Linear Dependent: 增重 Independent: 食量 OK第47页,共65页,2022年,5月20日,2点19分,星期二第48页,共65页,2022年,5月20日,2点19分,星期二第49页,共65页,2022年,5月20日,2点19分,星期二回归系数模拟的拟合参数残差统计量第50页,共65页,2022年,5月20日,2点19分,星期二因变量标准化预测值第51页,共65页,2022年,5月20日,2点19分,星期二预测值预测区间影响统计量第52页,共65页,202

16、2年,5月20日,2点19分,星期二实例讲解5、绘制回归直线图3 大白鼠的进食量与增加体重回归直线 第53页,共65页,2022年,5月20日,2点19分,星期二第54页,共65页,2022年,5月20日,2点19分,星期二第55页,共65页,2022年,5月20日,2点19分,星期二第56页,共65页,2022年,5月20日,2点19分,星期二第57页,共65页,2022年,5月20日,2点19分,星期二第58页,共65页,2022年,5月20日,2点19分,星期二第59页,共65页,2022年,5月20日,2点19分,星期二第60页,共65页,2022年,5月20日,2点19分,星期二第61页,共65页,2022年,5月20日,2点19分,星期二直线相关与回归分析的区别与联系 第62页,共65页,2022年,5月20日,2点19分,星期二1、区别分析目的及意义:相关分析反映相互关系,而回归反映两变量依存变化的数量关系。资料要求:相关分析是要求两定量变量都是随机变量,分布服从正态分布;而回归分析是要求作为因变量的变量必须是随机变量,自变量可以是随机变量,也可以是一般变量。统计量的量纲:相关系数r是无量纲的统计量;而斜率b却是有量纲的统计量,其量纲为“因变量的量纲/自变量的量纲”,截距a的量纲与因变量的量纲相同。第63页,共65页,2022年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论