




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第九章 2检验2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,以2分布和拟和优度检验为理论依据,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。 (1) 分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,的一簇分布曲线 。 (2)为自由度,是 分布的唯一参数,由此决定 分布的图形形状。当2时,曲线呈L型。自由度越大,曲线越趋于对称;当自由度趋于无穷大时, 分布趋于正态分布。 第一节 四格表资料的2检验表1 两种疗法的心血管病病死率的比较疗法死亡生存
2、 合计病死率(%)盐酸苯乙双胍26 (a)178 (b) 204(a+b) 12.75安慰剂 2 (c) 62 (d) 64(c+d) 3.13合 计 28(a+c.) 240(b+d.) 268(a+b+c+d=n) 10.45一、 2检验基本思想表2 两独立样本率比较的四格表组别属性 合计Y1Y21a(T11)b(T12)a+b2c(T21)d(T22)c+d合计a+cb+dn表1 两种疗法的心血管病病死率的比较疗法死亡生存 合计病死率(%)盐酸苯乙双胍26 (a)178 (b) 204(a+b) 12.75安慰剂 2 (c) 62 (d) 64(c+d) 3.13合 计 28(a+c.)
3、 240(b+d.) 268(a+b+c+d=n) 10.45实际频数A (actual frequency) ( a、b、c、d)的理论频数T( theoretical frequency)(H0:1=2=)a的理论频数 nRnC/n =21.3b的理论频数 nRnC/n =182.7c的理论频数 nRnC/n =6.7d的理论频数 nRnC/n =57.32检验的基本公式 上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。由于每个格子的 0,格子越多, 2值也会越大,即2值的大小除了与A与T的差别大小
4、有关外,还与格子数有关。因而考虑2值大小的同时,应同时考虑格子数的多少,这样才能准确反应A与T的吻合程度。=(R-1)(C-1) 检验统计量 值反映了实际频数与理论频数的吻合程度。 若检验假设H0:1=2成立,实际频数A 与理论频数T 相差不应该很大,即统计量卡方值不应该很大。如果 值很大,即相对应的P 值很小,若 ,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即12 。 各种情形下,理论与实际偏离的总和即为卡方值(chi-square value),它服从自由度为的卡方分布。二、四格表资料的2检验 为了不计算理论频数T, 可由
5、基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:二、四格表专用公式 为了不计算理论频数T, 可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:应用条件:n 40,所有T5时疗法死亡生存 合计病死率(%)盐酸苯乙双胍26 (a)178 (b) 204(a+b) 12.75安慰剂 2 (c) 62 (d) 64(c+d) 3.13合 计 28(a+c.) 240(b+d.) 268(a+b+c+d=n) 10.45表1 两种疗法的心血管病病死率的比较检验步骤1、立假设与确定检验水准 H0 1 2 ,两种药物治疗心血管的病死率相同 H1 1 2,
6、两种药物治疗心血管的病死率不同 0.052、计算2值和自由度 ( 行1 )( 列1 ) ( 21 )( 21 ) 13、确定 P 值,做出统计推断 以 1查 2 界值表 判断结果 按 水准,将P 与 比较,作出判断。(三)连续性校正公式 2分布是一连续型分布,而行列表资料属离散型分布,对其进行校正称为连续性校正(correction for continuity),又称Yates校正(Yates correction)。当n40,而1T5时,用连续性校正公式当n40或T1时,用Fisher精确检验校正公式:因为1T5,且n40时,所以应用连续性校正2检验 对于四格表资料的2检验,应特别注意资料
7、的总例数n与理论数T 的大小一般2 检验 n40,而T5时校正2 检验 n 40 1T5四格表确切概率法 n40或T1例1:某医师研究洛赛克治疗消化性溃疡的疗效,以泰胃美作对照,其观察结果见下表。 两种药物治疗溃疡病的疗效药物例数有效数有效率(%)泰胃美603660.0洛赛克605490.0交叉分类2*2列联表的关联性分析例4 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机调查了消化不良的婴儿82例,对每个个体分别观察腹泻与否和喂养方式两种属性,结果见表4,试分析两种属性的关联性。表4 婴儿腹泻与喂养方式的关系喂养方式腹泻合计有无人工301040母乳172542合计473582一份随机样本同
8、时按两种属性进行分类。如果一种属性的概率分布与另一种属性的概率分布无关,则称这两种属性相互独立,否则称两种属性之间存在关联性。(1)建立检验假设,确定检验水准 H0:两种属性互相独立 H1:两种属性之间有关联 =0.05 (2) 计算检验统计量 (3)确定P值,做出推断结论 P0.005,按=0.05的检验水准,拒绝H0,接受 H1,可认为婴儿腹泻与喂养方式之间存在关联 两个分类变量关联的程度,可用Pearson列联系数来描述与两个样本率比较的区别两样本率的比较是从两个总体中分别抽取样本,两样本有各自的频数分布,所检验的是两个总体分布的概率是否相同而分类变量的关联性,是从同一个总体中进行随机抽
9、样,对样本的每个个体,考察其两种属性的关系,要检验的是两个分类变量之间是否存在关联性或是否独立第二节 配对设计资料的2检验一、配对四格表资料的观察结果有无差异的检验 配对设计常用于两种检验 方法,培养方法,诊断方法的比较 特点:样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某二分类结果 表6 配对四格表资料表格 甲种属性 乙种属性 合计 + - + a b a+b - c d c+d 合计 a+c b+d n 由表6可知,甲的阳性率=(a+b)/n 乙的阳性率=(a+c)/n 甲乙的阳性率之差=(b-c)/n要比较两种属性的总体阳性率有无差异时,故只需比较甲+乙-的对子数b和甲-乙
10、+的对子数c之间的差别来反映两种属性的阳性率的差异。因此,无效假H0为B=C,即b、c代表的总体相等,差异性检验也称McNemar检验(McNemars test) 例 为比较两种检验方法(中和法与血凝法)检测关节痛病人之抗 “O”结果,观测105例关节痛患者,结果如下表。问:其检验结果有无差别?两种检验方法有无相关? 表 中和法与血凝法检验结果的比较 中和法 血 凝 法 合计 54 8 62 4 39 43 合计 58 47 105解:1、建立检验假设,确定检验水准 H0: B=C,即在对关节痛病人之抗 “O”检测时血凝法与中和法检结果相同; H1: BC,即在对关节痛病人之抗 “O”检测时
11、血凝法与中和法检结果不同; =0.05 。 2、计算统计量2 值 因为b+c=8+4=120.05 按=0.05的水准不拒绝H0 ,差异无统计学意义。所以不能认为在对关节痛病人之抗 “O”检测时血凝法与中和法检验结果不同。 二、配对资料的关联性分析(1)建立检验假设,确定检验水准 H0:两种方法互相独立 H1:两种方法 之间有关联 =0.05 (2) 计算检验统计量 (3)确定P值,做出推断结论 P0.05,按=0.05的检验水准,拒绝H0,接受 H1,可认为两种方法之间存在关联,r=0.97(1)成组(四格表)资料的2检验n40,T 5时+-合计甲aba+b乙cdc+d合计a+cb+dn=a
12、+b+c+dn40,1T5时n40或T3年6612根据不同研究目的,选择不同分析方法(1)关心不同月经来潮时间的女性青少年髂软骨组织学之间的差别是否有统计学意义时,按单向有序资料处理(2)当考察月经来潮时间与组织学分级之间是否有相关性时,选用Sperman 秩相关(3)当考察月经来潮时间与组织学分级之间是否有直线关系时,可选用线性趋势检验5 双向有序且属性相同某两位医生对200名棉屑沉着病可疑患者进行诊断,并进行统计分析,试分析两位医生的诊断是否一致。 (Kappa一致性检验)甲医生诊断乙医生诊断正常I期II期正常7850I期65613II期01032行*列的分割多个实验组两两比较重复多次假设
13、检验,将使第I类错误扩大,因此必须重新规定检验水准,作为拒绝H0的根据例5 某医院用3种方案治疗急性无黄疸型病毒性肝炎254例,观察结果如表8-3所示,试比较3种疗法的有效率是否一样组别有效无效合计有效率西药组514910051.00中药组35458043.75中西药结合组59157479.73合09 3. 查卡方界值表,确定P值,做出推断结论1、H0:3种治疗方案有效率相同 H1:3种治疗方案有效率不同或不全相同2、计算统计量卡方值组别有效无效合计有效率西药组514910051.00中药组35458043.75合计869418047.78 3. 查卡方界值表,确定P
14、值,做出推断结论1、H0:西药与中药组的有效率相同 H1:西药与中药组有效率不同2、计算统计量卡方值确切概率法分析实例注意:确切概率法不属于2检验的范畴,但常作为2检验应用上的补充。分析实例1建立检验假设和确立检验水准H0:新药组与对照组疗效相等,即 1 = 2H1:新药组与对照组疗效不等,即 1 22计算概率和确定P值本例n = 36 40,不满足2检验的应用条件,宜采用四格表确切概率法。方法原理在四格表周边合计不变的条件下,在相应的总体中进行抽样,四格表中出现各种排列组合情况的概率本例即28、8、22、14保持不变的条件下,若H0成立,计算出现各种四格表的概率方法原理然后将其中小于等于现有样本概率的概率值相加,即为P值:本例中P值=P(0)+ P(6)+P(7)+P(8)=0.03610.05一点补充确切概率法的原理具有通用性,对于四格表以外的情况也适用,如行乘列表、配对、配伍表格均可对于较大的行乘列表,确切概率法的计算量将变得十分惊人,有可能超出硬件系统可以支持的范围此时可以采用计算统计学中的其他抽样技术加以解决,如Bootstrap方法等(1)成组(四格表)资料的2检验n40,T 5时+-合计甲aba+b乙
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年广东惠州仲恺高新区招聘中学教师笔试真题
- 学生心理健康状况调查及干预措施研究
- 危险品储存与运输安全管理
- 深圳市青少年宫spike机器人课程 第十课 平衡车-教学设计
- 财务风险管理从理论到实践的转化
- 七年级地理上册 2.3地图的应用教学实录 (新版)商务星球版
- 河北省邯郸市七年级道德与法治下册 第一单元 青春时光 第二课 青春的心弦 第2框 青春萌动教学实录 新人教版
- 全国粤教版信息技术七年级上册第二单元第五课《计算机的资源管理》教学设计
- 八年级生物下册 第七单元 生物圈中生命的延续和发展 第二章 生物的遗传和变异 第3节 基因的显性和隐性教学实录 (新版)新人教版
- 婴幼儿智力测评与教育规划
- 2025年月度工作日历含农历节假日电子表格版
- 中国近现代史纲要心得体会
- 竣工结算审计服务投标方案(2024修订版)(技术方案)
- 2025年中考语文复习课件 模块三 语言综合运用
- 《年产2000吨果汁型茶饮料的生产工艺设计》4600字(论文)
- 中建落地式脚手架施工方案
- 基因检测销售培训
- 小学的数学课件
- 倪海厦天纪学习笔记以及讲义
- 第三章-思想政治教育的地位和功能
- 医疗安全不良事件报告制度培训
评论
0/150
提交评论