医学论文中统计分析错误辨析与释疑 定性资料统计分析方法的合理选择(2).pdf_第1页
医学论文中统计分析错误辨析与释疑 定性资料统计分析方法的合理选择(2).pdf_第2页
医学论文中统计分析错误辨析与释疑 定性资料统计分析方法的合理选择(2).pdf_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学杂志2 0 0 4年1 月l 旦 箜 鲞笙 塑 丛 塑 医学论文中统计分析错误辨析与释疑 定性资料统计分析方法的合理选择 2 刘惠刚 胡良平 一 误用 x 检验回答相关性问题 例 1 很多医学期刊论著中都采用 x 检验处理 类似表 1的资料 其 目的是希望 回答表中 两个有 序变量之间是否呈相关关系 表 1 不同期次矽肺患者肺门密度级别的人数分布 例数 矽肺期次 肺门密度级别 合计 合计 5 0 3 0 1 1 4 1 4 9 2 原文用 x 检验处理表 1 资料 得 x 1 6 3 0 1 P 0 0 0 5 结论为 可认为肺门密度与矽肺期次有 关 结合本资料可见肺门密度有随矽肺期次增高而 增加的趋势 问 处理此资料所用的统计分析方法 以及所得出的结论有何不妥之处 对差错的辨析 因表 1 资料叫做 双向有序且 属性不同的二维列联表资料 对于这种资料的处 理有3个不同的目的 因此 也就对应着3 套不同的 统计分析方法 原文作者分析此资料的目的是 希 望考察表中两个有序变量之间是否呈相关关系 而 x 检验是检验 表中两个定性变量之间是否互相 独立 当检验的结果为拒绝 独立性 假设时 其对 立的假设不是 相关 而应当是 各矽肺期次的患 者在 3 种肺门密度级别上 的人数分布是不同的 原作者误认为用 x 检验拒绝了 独立性 假设后 其对立的假设一定是 相关 事实上 从 x 检验 的计算公式上不难看出 它与表中两个有序变量本 身毫无关系 若将表中任何两行上的频数互换或将 任何两列上的频数互换 它们所对应的x 检验统计 量的数值 本例为 x 1 6 3 0 1 是不会变化的 显 然 变换后的数据已预示其结论要发生变化 而 x 检验的结果却隐含着结论是不变的 这充分说明x 作者单位 1 0 0 0 3 6首都医科大学继续教育学院 刘惠刚 军事 医学科学院生物医学统计咨询中心 胡良平 争 鸣 与 教 育 检验用于处理由有序变量形成的二维列联表资料是 不合适的 释疑 结合表 1的标题可知 若一定要根据 x 检验的结果作出结论的话 其结论应当是针对各行 上的 频数分布 是否相同来作出明确的回答 而绝 对不应当针对表中两个有序变量之间是否呈 相关 关系 要想对后者作出明确回答需要选用分析定 性资料的相关分析方法 如 S p e a r m a n秩相关分析 K e n d a l l 秩相关分析或典型相关分析 就例 1 而言 若采用 S p e a r m a n 秩相关分析 得 r s 0 5 3 2 1 5 P 0 0 0 0 1 结论为 表中两个有序变量之间呈正相关关 系 即随着矽肺期次的增加肺门密度级别也逐渐增 大 两者之间的相关关系具有统计学意义 有人可能提出质疑 x 检验的结果不也得出了 P 0 0 0 5的统计学结论吗 若再具体计算其概率 很可能也会有 P 0 0 0 0 1的统计学结论 因为本例 x 1 6 3 0 1 相当大 一点不错 若根据 x 检验的 结果 本例也的确可以得出 P 0 0 0 0 1的统计学结 论 但这纯粹是一种 巧合 无论其概率多么小 其 专业结论也只能回答表中各行上频数分布是否相 同 而不能回答表中两个有序变量之间是否呈相关 关系 若将表 1 资料换成表2资料 两种计算方法 之间的差别一下就显现出来了 表 2 不同期次矽肺患者肺门密度级别的人数分布 例数 假设数据 矽肺期次 肺门密度级别 合计 若统计分析的目的是考察表2中两个有序变量 之间的相关关系是否具有统计学意义 则 其一 若采用错误的统计分析方法 即 x 检 验 得 x 5 0 3 7 7 6 P 0 0 0 0 1 错误的专业结论 为 矽肺期次与肺门密度级另 之间的相关关系有统 维普资讯 2 0 0 4年 1 月 1 7日第 8 4卷第2期N a d M e d J Ch i n J 垦 n u a Q 计学意义 与该检验方法对应的正确的专业结论为 表 2中各行上肺门密度级别的人数分布不同 具体 地说 矽肺 I 期的患者多数肺门密度级别为 级 矽肺 期的患者多数肺门密度级别为 级 和 级 而矽肺 期的患者多数肺门密度级 别为 级和 级 其 二 若 选 用 正 确 的 统 计 分 析 方 法 如 S p e a r m a n秩 相 关 分 析 得 0 0 0 0 5 9 P 0 9 8 5 6 正确的专业结论为 表2中两个有序变量之 间的相关关系没有统计学意义 例 2 文献和很多医学期刊论著中都套用 x 检 验处理类似表 3的资料 计算所得的x 2 4 6 3 9 P 0 0 0 5 得出的专业结论为 依沙酰胺治疗皮肤真 菌的疗效与病程有关 的专业结论 试问 这样做 错在哪 正确的统计分析方法和专业结论是什么 表 3 依沙酰胺治疗皮肤真菌的病程与疗效的关系 例数 对差错的辨析 表 3 看上去好象与表 1 不同 但 本质是相同的 即也是双向有序且属性不同的二维 列联表资料 若希望考察表 3中两个有序变量之间 的相关关系是否具有统计学意义 用 x 检验是错误 的 宜选用定性资料的相关分析方法 释疑 若用 S p e a r m a n秩相关分析 得 0 2 1 4 7 9 P 0 0 0 0 1 专业结论为 依沙酰胺治疗皮 肤真菌的病程与疗效之间有负相关关系 即病程越 长疗效越差 表 3中两个有序变量之间的相关关系 有统计学意义 对于表 3资料 若希望考察不同病 程的患者疗效之间的差别是否具有统计学意义 也 是值得回答的问题 此时 就应将此表视为结果变 量 即疗效 为有序变量的单向有序的二维列联表 了 这实际上是不考虑原因变量 即病程 的有序 性 而特别强调结果变量 即疗效 的有序性 为了 实现此分析 目的 可供选用的统计分析方法有 秩和 检验 R i d i t 分析和有序变量的 L o g i s t i c 回归分析 较 复杂 一般不选用此法 本例若选用秩和检验 得 2 3 1 4 4 P 0 0 0 0 1 专业结论为 各病程组 患者的疗效之间的差别具有统计学意义 将各组秩 和的平均值代入近似的t 检验 进行两两比较 得结 果为 设 1 组为不满 1 个月 2组为 1至3个月 3组 为 3 个月至5年 4组为5年以上 则 对 比组 1组 V S 2组 1 组 V S 3组 1组 V S 4组 2组 V S 3组 2组 V S 4组 3组 V S 4组 t 值 0 0 4 4 3 6 5 5 3 O 9 3 2 5 3 5 2 43 4 0 3 9 5 O O l O O l O Ol 0 3 4 7 由于表 3中的疗效由 痊愈到无效 且计算时 痊愈 档打分低 无效 档打分高 故各病程组的 平均秩小者疗效较好 由此可知 病程不满 1 个月与 1 至 3月的患者的疗效之间的差异无统计学意义 病程3个月至5年与 5年以上的患者的疗效之间的 差异无统计学意义 其他任何两种病程的患者的疗 效之间的差异都有统计学意义 且病程短者疗效好 二 误用秩和检验取代 X 检验或 F i s h e r 精确检 验 例3 某研究者在其论文中运用秩和检验处理 表 4资料 选此方法处理该资料是错误的 这是为什 么 分析此资料的正确统计分析方法是什么呢 表 4 C A M 一 1 和 C D 4 4 s 的表达与食管癌 T N M 分期的关系 对差错的辨析 原作者将表 4资料视为结果变 量为有序变量的单向有序的二维列联表资料 因而 错误地选用了秩和检验 事实上 食管癌 T N M分期 这个有序变量是 原因变量 不是 结果变量 不 适合选用秩和检验处理此资料 释疑 那么 正确处理表 4资料的统计分析方法 究竟是什么呢 先将表 4变成表 5的形式 便可很 容易认出它是一个什么样的二维列联表资料 因而 合理选用统计分析方法就显得是十分简单的事了 此时 不难看出 表 5资料为结果变量为二值变 量 即阳性 阴性 的二维列联表资料 虽然原因变 量 即T N M分期 是有序的 但其本质与双向无序 的二维列联表资料是一样 的 故当表5 中记录6 个 雅一 0 0 5 I1 b与 的阳性率之间的差 异无统计学意义 P 0 0 5 I1 a 与 的阳性率之间 的差异有统计学意义 P 0 0 5 l U 期表达的阳性 率明显高于 II a 期表达的阳性率 注 总例数和各组 例数都较少 结论的可信度较低 三 定性资料等级相关分析的相关方向错误 例4 某研究者对表 6 资料进行了 S p e a r m a n秩 相关分析 得到的结果为 0 6 0 1 P 5 合计 2 3 4 5 合计 5 8 6 1 9 7 1 4 l 0 3l 对差错的辨析 虽然原作者所选用的统计分析 方法是正确的 但计算结果却是错误的 两个有序变 量之间的相关方向也是错误的 因而得出了错误的 结论 释疑 正确的计算结果为 一 0 0 9 2 3 6 P 0 6 2 1 2 正确的专业结论为 环氧合酶 C O X 2 含量 与诱导型一氧化氮合酶 i N O S 含量之间不存在具 有统计学意义的相关关系 在对两有序变量之间进 行秩相关分析时 务必要注意给定性变量各等级赋 值的顺序 本例若将 C O X 2 按由上到下分别赋为 1 2 3 的值 将 i N O S 按从左至右分别赋为 1 2 3 的值 则计算结果就是正确的 即 r s 一 0 0 9 2 3 6 P 0 6 2 1 2 若将这两个有序变量中的一个赋值方 向弄反了 则计算结果为 0 0 9 2 3 6 P 0 6 2 1 2 若将这两个有序变量的赋值方向全部与前述第一种 方向相反 那也没有关系 不会影响结论的正确性 收稿日期 2 0 0 3 1 2 0 8 供稿编辑 李群 全国肺功能和I 临床呼吸生理学术研讨会暨学习班征文通知 由中华结核和呼吸杂志编委会主办 内蒙古医学院第三 附属医院承办的 全国肺功能和临床呼吸生理学术研讨会 暨学习班 定于 2 0 0 4年 8月在包头市召开 欢迎有关医疗 技术 护理和医学工程等专业人员踊跃投稿并参加学术交 流 届时也将邀请国内外知名专家举办专题报告 征文范围 1 肺功能测定方法 技术及临床应用 2 危重患者的呼吸功能与血气监测 3 各种疾病相关呼吸病 理生理的基础与临床研究 4 肺功能测定新技术相关生物 工程方面的研究与实践 5 其他与呼吸生理暨病理生理 肺功能有关的基础与临床工作总结 征文要求 1 4 0 0 0字左右全文 1 份 并附 1 0 0 0字左 右中文摘要 来稿请用 4号字 1 5倍行距

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论