医学统计学课件--第七章 卡方检验.ppt_第1页
医学统计学课件--第七章 卡方检验.ppt_第2页
医学统计学课件--第七章 卡方检验.ppt_第3页
医学统计学课件--第七章 卡方检验.ppt_第4页
医学统计学课件--第七章 卡方检验.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020 2 8 医学统计学 1 第七章检验 chi squaretest 上海第二军医大学卫生统计学教研室孟虹 分类数据组间比较的假设检验计数资料组间的比较 2020 2 8 医学统计学 2 第七章检验内容 计数资料组间的比较 第一节四格表资料的 2检验 第二节配对四格表资料的 2检验 第三节Fisher确切概率检验第四节行 列表资料的 2检验 第五节多个样本率比较的 2分割法第六节有序分组资料的线性趋势检验第七节频数分布的拟合优度检验 为重点掌握 2020 2 8 医学统计学 3 概念回顾 在总体率为 的二项分布总体中做n1和n2抽样 样本率p1和p2与 的差别 称为率抽样误差 在总体率为 1和 2的不同总体中抽样 得p1和p2 在n 5 可通过率的u检验推断是否 1 2 二项分布的两个样本率的检验同样可用 2检验 2020 2 8 医学统计学 4 第一节 四格表资料的检验 一 2检验的基本思想 2020 2 8 医学统计学 5 1 2分布 1875年F Helmet提出 2统计量 设Xi为来自正态总体的连续性变量 2分布是一个连续型变量的分布 分布的参数为自由度 2020 2 8 医学统计学 6 3 84 7 81 12 59 P 0 05的临界值 2分布的概率密度函数曲线 2020 2 8 医学统计学 7 不同 2分布的界值 附表8 823页 在 1 2020 2 8 医学统计学 8 K Pearson的 2统计量 1900年K Pearson提出下述公式 在n 40时下式值与 2分布近似 在理论数 5 近似程度较好 上述公式实际应用于检验计数资料组间率 构成比一致程度的公式 2020 2 8 医学统计学 9 Pearson检验的用途 1 用于检验计数资料的两组 多组 样本率差别有无统计意义 如二项分布数据 binomialproportions 2 检验两个事物的分类是否独立列连表数据 ContingencyTable 2020 2 8 医学统计学 10 2 2检验的基本思想 例7 1 某院比较异梨醇 试验组 和氢氯塞嗪 对照组 降低颅内压的疗效 将200名患者随机分为两组 试验组104例中有效的99例 对照组96例中有效的78例 问两种药物对降低颅内压疗效有无差别 数据整理为四格表形式 二维交叉表 2020 2 8 医学统计学 11 表100例高血压患者治疗后临床记录 编号年龄性别治疗组舒张压体温疗效X1X2X3X4X5X6137男A11 2737 5有效245女B12 5337 0有效343男A10 9336 5有效459女B14 6737 8无效10054男B16 8037 6无效 2020 2 8 医学统计学 12 计数资料数据检验的列连表两组或多组比较数据的交叉表 行 Row 列 Column 表行分类列分类 Y 合计数 X 阳性数阴性数甲组A11A12n1乙组A21A22n2合计A11 A21A12 A22nA 表示某组某分类的例数 频数 2020 2 8 医学统计学 13 表7 1两组降低颅内压有效率比较 疗法有效人数无效数合计有效率 试验组99 A11 5 A12 10495 20对照组75 A21 21 A22 9678 13合计1742620087 00问 两组有效率差别是否是抽样误差或是不同药物的作用 9957521 四格表的数字 组别 甲乙 2020 2 8 医学统计学 14 Pearson检验的基本公式 式中符号含义 A 实际频数 表中实际发生的阳性或阴性频数T 理论频数 按某H0假设计算理论上的阳性或阴性频数 公式7 1 公式7 3 2020 2 8 医学统计学 15 表7 1两组疗法降低颅内压有效率 疗法有效人数无效人数合计有效率试验组99 90 48 5 13 52 10495 2对照组75 83 52 21 12 48 9678 1合计1742620087 0注 括号内为理论数 T 假设 H0 1 2 c 87 00 两组总体有效率相等 H1 1 2 两组总体有效率不等 假定两组有效率均为174 200 87 2020 2 8 医学统计学 16 ClassnHypothesizedObservedExpected T试验组104有效概率 0 879990 48试验组无效概率 1 0 13513 52对照组96有效概率 0 877583 52对照组无效概率 1 0 132112 48 T n 2020 2 8 医学统计学 17 假定两组总体率相等的理论数与实际数 组别死亡人数生存数合计死亡率 抗凝血组20 20 80 80 10020 0对照组20 20 80 80 10020 0合计4016020020 0 2检验是考察实际频数与假设理论频数是否一致的统计量 2020 2 8 医学统计学 18 Pearson检验计算与步骤 1 建立假设 H0 1 2 c 两组总体率相等 H1 1 2 两组总体率不等 2 0 053 计算统计量4 确定概率 P 和自由度 自由度 行数 1 列数 1 本例 2 1 2 1 1 2020 2 8 医学统计学 19 与比较 得到p值5 结论 在 0 05水准上 p 0 01 拒绝H0 两样本率差别有统计意义 具本例可认为试验组对降低颅内压有效率高于对照组 本例 2020 2 8 医学统计学 20 二 四格表资料检验 两组样本率间差别检验 两组样本率比较的设计分类 1 两组 独立 样本率的比较组间数据是相互独立 非配对设计 2 配对设计两组样本率的比较组间数据是相关的 2020 2 8 医学统计学 21 两组 不配对 样本率的比较 1 四格表形式组别阳性数阴性数合计率 甲组aba b n1a n1乙组cdc d n2c n2合计a cb dN2 四格表不配对资料检验的专用公式 公式7 4 二者结果等价 各组样本例数是固定的 2020 2 8 医学统计学 22 表7 1两组降低颅内压有效率比较 疗法有效人数无效数合计试验组99 a 5 b 104 a b 对照组75 c 21 d 96 c d 合计174 a c 26 b d 200 N 2020 2 8 医学统计学 23 三 四格表 2检验的校正公式 两组不配对资料 1 校正公式的条件 1 T 5 同时N 40 用校正公式计算 2 连续校正 continuitycorrection 公式 公式7 5 公式7 6 3 当T 1 或N 40 用Fisher确切概率法 2020 2 8 医学统计学 24 表7 2两药物治疗脑血管病有效率比较 组别有效数无效数合计有效率 甲药4665288 46乙药188 4 67 2669 23合计64147882 05校正公式不校正 2 4 35p 0 05 P 0 05 2020 2 8 医学统计学 25 表7 2数据用SPSS统计软件计算结果 2020 2 8 医学统计学 26 第二节 配对设计两个样本率的 2检验 McNemer检验 用途常用于比较两种检验方法或两种培养基的阳性率是否有差别 特点 对同一观察对象分别用两种方法处理 观察其阳性与阴性结果 资料整理为配对四格表形式 2020 2 8 医学统计学 27 例7 3 某实验室采用两种方法对58名可疑红斑狼疮患者的血清抗体进行测定 问 两方法测定结果阳性检出率是否有差别 测定结果为 阳性 阴性 共116标本 58对 方法 X 乳胶凝集法免疫荧光法对子例数 11 33 2 12 58对 结果 2020 2 8 医学统计学 28 配对设计资料的四格表及公式 例表7 3两种方法的检测结果免疫乳胶凝集法荧光法 合计 11 a 12 b 23 a b 2 c 33 d 35 c d 合计13 a c 45 b d 58 N 公式7 8 b c 40用 2020 2 8 医学统计学 29 例 配对计数资料的比较 1 建立检验的假设H0 b c 12 2 2 7 两法总体阳性率相等 H1 b c 两方法总体阳性率不等 2 0 053 计算 2统计量 McNemer检验 2020 2 8 医学统计学 30 4 确定自由度 和 2值的概率P 行数 1 列数 1 本例 1本例 2 5 79 3 84 P 0 055 结论 在 0 05水准 拒绝H0 P 0 05认为两方法的检测率不同 乳胶凝集法的阳性检测率22 41 低于免疫检测率39 66 2020 2 8 医学统计学 31 第三节 四格表的Fisher确切概率法 条件 T 1 或n 40用 例 表7 4两组新生儿HBV感染率的比较组别阳性阴性合计感染率 预防组4182218 18非预防组5 3 61145 45合计9243327 27了解方法 计算不要求 2020 2 8 医学统计学 32 公式7 9是四格表边际合计数固定时 出现表中频数为a b c d的概率 本例为双侧检验 计算p p1 p2 p3 p4 p5 p10 0 1210 0 05结论 p 0 05 还不能认为预防注射和非预防注射组的HBV感染率不同 公式7 9 2020 2 8 医学统计学 33 1 2 3 4 5 6 7 8 9 10 单侧检验H1 1 2 计算累计p值 p 1 p 2 p 3 p 4 p 5 双侧检验H1 1 2 计算累计p值 p 1 p 2 p 3 p 4 p 5 p 10 Fisher确切概率法计算累计概率 p ad bc D 66 ad bc 99 ad bc 132 ad bc 66 ad bc 99 2020 2 8 医学统计学 34 1 2 2020 2 8 医学统计学 35 SPSS统计软件计算结果 2020 2 8 医学统计学 36 第四节行 列表的 2检验 当比较组行或列分类数 2 称为行 列表 研究者感兴趣的问题有 也为 2检验的目的 1 多组 独立样本 样本率差别有无统计意义 2 两组 独立样本 的构成比 分布 有无统计意义 3 两个分类变量分布是否独立 有关联 2020 2 8 医学统计学 37 行 列表的 2检验公式 自由度 行数 1 列数 1 公式7 10 等价 2020 2 8 医学统计学 38 表7 8三组疗法有效率的比较 疗法有效无效合计有效率 物理组199 186 2 720696 6药物组1641818290 1外用组1182614481 9合计4815153290 4 一 多组样本率的比较 H0 1 2 3 90 4 三组总体有效率相等 H1 三组总体率不等或不全等 2020 2 8 医学统计学 39 表7 8三组疗法有效率的计算 A为表中的实际频数 自由度 行数 1 列数 1 3 1 2 1 2 2020 2 8 医学统计学 40 表7 8资料SPSS软件计算结果 结论 在 0 05水准 拒绝H0 P 0 01 认为三组疗法有效率不等或不全等 注意 此结果不能得到各两两组比较的结论 2020 2 8 医学统计学 41 二 两组和多组构成比的比较 表7 9两组 型糖尿病患者ACE基因分布比较ACE基因类型糖尿病DDIDII合计有肾病42 37 8 48 43 3 21 18 9 111无肾病30 21 7 75 52 2 36 26 1 138合计72 28 9 120 48 2 57 22 9 249括号内为行的构成比问 两组糖尿病人在ACE基因类型分布上有无差别 H0 两组总体各基因构成相等 均等于合计构成比H1 两组总体构成分布不相等 2020 2 8 医学统计学 42 表7 9资料SPSS软件计算结果 结论 在 0 05水准 拒绝H0 P 0 019 认为两组糖尿病病人在ACE基因类型分布上有差别 有肾病糖尿病者DD基因比例多于无肾病 2020 2 8 医学统计学 43 三 两个分类变量的独立性检验 目的 检验两事物分类 行分类和列分类 是否独立 从而说明两事物分类是否有关系 检验公式 两个事物之间有无关系 关系的密切程度 Contingencycoefficient列连系数 2020 2 8 医学统计学 44 两事物定性资料的独立性 相关 检验 数据类型 1 双向无序分类数据 表7 10 2 双向有序分类数据 表7 13 统计分析 1 回答两事物的分类是否独立 有关系 用Pearson 2检验2 如有关 关系密切程度如何 度量指标 1 列连系数 Contingencycoefficient 无序分类用 2 相关系数 spearmancorrelation 双向有序分类用 见讲义148页 在0 1 近于1 关系愈密切 2020 2 8 医学统计学 45 双向有序分类的R C表表7 13年龄与冠状动脉硬化的关系 问 年龄与冠状动脉硬化有无相关关系 2020 2 8 医学统计学 46 两分类变量独立与有关 高血压病年龄 A 年龄 A B 60岁 60岁 60岁 60岁有50 50 50 50 0 50 100 50 无50 50 50 50 100 50 0 50 合计100100100100 内为理论数两事物独立假定成立 即行或列各分类的构成比相同 或在A事物不同水平下 B事物不同分类的作用 构成 相等 2020 2 8 医学统计学 47 双向无序分类关联性研究 表7 10某地5810人按二种方式对血型的分类ABOMN血型血型MNMN合计O431 23 6 490 26 8 902 49 5 1823A388 24 3 410 25 7 800 50 0 1598B495 24 4 587 28 9 950 46 8 2032AB137 39 4 179 51 4 32 9 2 348合计1451 25 0 1666 28 7 2684 46 3 5801 括号内为行构成比 问二种血型分类系统有无关系 2020 2 8 医学统计学 48 检验步骤 1 建立检验的假设H0 两种血型系统分类无关联 即行或列构成比相等 H1 两种血型系统分类有关联 即行或列构成比不等 2 0 053 计算 2统计量 结论 两种血型系统分类有关联 列连系数为0 1883 AB型的人出现MN血型比例少于其他血型 系数波动0 1 2020 2 8 医学统计学 49 2020 2 8 医学统计学 50 双向有序分类的R C表表7 13年龄与冠状动脉硬化的关系 问 年龄与冠状动脉硬化有无相关关系 线性趋势 2020 2 8 医学统计学 51 ad bc 99 2020 2 8 医学统计学 52 SPSS软件检验结果 2020 2 8 医学统计学 53 四 R C表数据的注意事项 1 多个样本率比较的 2检验 当拒绝H0时 不能得出任何两组间都有差别 目前尚无公认的两两比较的方法 可考虑采用减小检验水准 见讲义第五节 2 R C表有1 5以上格子的理论数小于5时 不宜直接计算 2检验 可采用合并组的方法 或增加例数 增大理论数 2020 2 8 医学统计学 54 多组样本率的两两比较的 2分割 当比较组k 3时 2值有统计意义 可分解多个四格表了解各样本率两两间的差别 方法 见149 151页 1 检验水准 的分割2 两两比较四格表的 2值与 讲义第五节 K为比较的组数 2020 2 8 医学统计学 55 表7 11 1时的 2界值表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论