版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章
两变量关联性分析
本章内容
第一节线性相关
第二节秩相关第三节分类变量的关联性分析
第一节线性相关
一线性相关的概念线性相关(linearcorrelation)又称简单相关(simplecorrelation),用于双变量正态分布(bivariatenormaldistribution)资料。其性质可由图11-2散点图直观的说明。目的:研究两个变量X,Y数量上的依存(或相关)关系。特点:统计关系图10-1两变量散点图二、相关系数的意义与计算意义:相关(correlationcoefficient)又称Pearson积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。2.计算:样本相关系数的计算公式为例1例10-1在某地一项膳食调查中,随机抽取了14名40~60岁的健康妇女,测得每人40~60岁的健康妇女,测得每人的基础代谢(kj/d)与体重(kg)数据,见表10-1。据此数据如何判断这两项指标间有无关联?表10-1
14名健康妇女的基础代谢率与体重编号基础代谢(kJ/d)体重(kg)编号基础代谢(kJ/d)体重(kg)14175.650.783970.648.624435.053.793983.244.633460.237.1105050.158.644020.851.7115355.571.053987.447.8124560.659.764970.662.8134874.462.175359.767.3145029.261.5图10-214例中年健康妇女基础代谢与体重的散点图相关系数的特点1.相关系数r是一个无量纲的数值,且-1<r<1;2.r>0为正相关,r<0为负相关;3./r/越接近于1,说明相关性越好./r/越接近于0,说明相关性越差.相关系数的统计推断(一)相关系数的假设检验
例10-2继例10-2中算得r=0.964后,试检验相关是否具有统计学意义检验步骤
本例
n=14,r=0.964,计算t值10215(二)总体相关系数的可信区间
10216具体步骤如下10217
例10-3对例10-1所得r值,估计总体相关系数的95%可信区间。
再按公式(10-22)将z作反变换,得到基础代谢与体重的总体相关系数95%可信区间为(0.8872,0.9888)。
线性相关中应注意的问题1.样本的相关系数接近零并不意味着两变量间一定无相关性.2.一个变量的数值人为选定时莫作相关.3.出现异常值时甚用相关.4.相关未必真有内在联系.5.分层资料盲目合并易出假象.6.线性相关分析双变量是随机且服从正态分布第二节秩相关适用条件:①资料不服从双变量正态分布而不宜作积差相关分析;②总体分布型未知,一端或两端是不确定数值(如<10岁,≥65岁)的资料;③原始数据用等级表示的资料。一、Spearman秩相关1.意义:等级相关系数rs用来说明两个变量间直线相关关系的密切程度与相关方向。2.计算公式例10-5某地研究2~7岁贫血病患儿的血红蛋白含量与出血症状程度之间的相关性,结果见表10-2,试用秩相关进行分析表10-2贫血患儿的血红蛋白含量(g/l)和出血症状病人编号血小板数秩次p2出血症状秩次q2pqXpYq(1)(2)(3)(4)(5)(6)(7)(8)=(3).(6)5.011+++10100105.824++864366.139+636187.3416-39128.8525++864409.1636++8644811.1749-392112.3864-392413.5981-392713.810100-3930合计—55385-55373266利用表10-2中的数据容易算得
秩相关系数为负,说明两变量间有负相关关系,同样由样本算得的秩相关系数是否有统计学意义,也应做检验秩相关系数的统计推断
检验步骤假设检验统计推断当时,可查书后的临界值表,
若秩相关系数超过临界值,则拒绝;当时,也可采用公式(10-5)或(10-6)式做检验例10-5对例1-4的秩相关系数作假设检验例10-4中算得查临界值表,,按的水准,拒绝,可以认为贫血病患儿的出血症状与血红蛋
白量之间呈负相关关系五、简单线性相关的样本量估算简单线性相关的样本量估算公式为:例10-4根据以往调查,某地某年大学生女大学生的体重(kg)与肺活量(L)的线性相关系数0.7165,若想在α=0.05,β=0.90水平下得到相关系数有统计学意义的结论,至少应调查多少人?据已知条件代入公式:第三节分类变量的关联性分析交叉分类2×2表的关联分析例10-7
为观察大学生专业与艾滋病知晓程度之间是否有关,某研究者调查了某一年级不同专业的500名学生,对每个个体分别观察专业与艾滋病知晓程度两种属性,2×2种结果分类记述如表10-3所示,试分析两种属性的关联性。适用条件对定性变量之间的联系通用的方法是根据两个定性变量交叉分类基数所得的频数资料(列联表)作关联性分析,即关于两种属性独立性的卡方检验计算公式表10-3专业与艾滋病知晓程度之间的关系大学生专业
艾滋病知晓程度合计
高低医学预科3191121其它19359合计50
450
500假设检验
:大学生专业与与艾滋病知晓程度之间相互独立
:大学生专业与与艾滋病知晓程度之间关联将表中各数据代入公式得拒绝原假设,说明大学生专业与与艾滋病知晓程度之间存在关联性.关于两分类变量之间的关联程度,可采用(phicoefficient)、GramerV系数、Gramer‘sVcoefficient)和Pearson列联系数(contingencycoefficient),三个系数愈近1说明关系愈密切,三个愈近0,说明两分类变量几乎没有关系。只适用于四格表资料,对于多行多列只能采用后两种.本列二2×2配对资料的关联性分析例10-8
有132食品标本,把每份标本一分为二,分别用两种检测方法作沙门菌检验,观察结果如表10-5,问两种检测方法的结果有无关联?表10-5两种检测方法结果甲法
乙法合计+-+8010
90-31
11
42合计111
21
132假设检验
:两种检测方法的结果之间互相独立
:两种检测方法的结果之间有关联将本例数据代入公式得有理由拒绝零假设,可以认为甲、乙两种方法检测方法之间存在关联性,进一步计算三R×C表分类资料的关联性分析例10-9
欲探讨职业类型与胃癌,得表10-6的资料。问职业类型与胃癌是否关联?表10-6310胃病患者按胃病类型与职业两种属性的交叉分类表职业
胃病合计浅表型慢性胃炎胃溃疡机关干部80
484
132工人52
62
12
126公交车司机20221052合设检验
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度演艺经纪合同:甲方培养乙方艺人共享收益
- 2024版沈阳市跨境电商平台建设与运营合同
- 2024年度废旧物资回收协议
- 二零二四年度工程设备租赁与技术支持服务合同
- 2024年度云计算服务合同concerning服务内容和的服务水平协议
- 2024至2030年高台豪华型半自动捆包机项目投资价值分析报告
- 二手房屋买卖合同(2024年度)
- 二零二四年度物流园区叉车安全操作合同
- 2024至2030年玻纤增强聚丙烯离心泵项目投资价值分析报告
- 2024至2030年水果榨汁器项目投资价值分析报告
- 喷涂设备订购合同范例
- 课件科比教学课件
- 幼儿园食材采购安全管理制度
- 2024年医学科研诚信与医学研究伦理考试题库
- 蚁群优化算法
- 2024精麻药品培训知识试题库及答案(完整版)
- MOOC 营销管理-电子科技大学 中国大学慕课答案
- 工程全过程造价咨询服务方案(技术方案)
- 三对三篮球赛记录表
- 剪刀式登高车施工方案
- 数学-九宫数独100题(附答案)
评论
0/150
提交评论