沃登编辑:医学论文中统计分析错误辨析与释疑_1.doc_第1页
沃登编辑:医学论文中统计分析错误辨析与释疑_1.doc_第2页
沃登编辑:医学论文中统计分析错误辨析与释疑_1.doc_第3页
沃登编辑:医学论文中统计分析错误辨析与释疑_1.doc_第4页
沃登编辑:医学论文中统计分析错误辨析与释疑_1.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学论文中统计分析错误辨析与释疑患者例数药物种类疗效治愈未治愈A 药30 10 B 药11 49 表2 三种药物治疗某病的疗效的观察结果患者例数药物种类疗效治愈显效好转无效A 药15 49 31 5 B 药4 9 50 22 C 药1 15 45 24 表3 两所医院用三种药物治疗某病的疗效的观察结果患者例数医院名称药物种类疗效治愈显效好转无效甲A 药15 49 31 5 B 药4 9 50 22 C 药1 15 45 24 乙A 药36 115 184 47 B 药4 18 44 35 C 药1 925 4 频数只有两行两列,故简称为2 2 表或四格表;而表2 中的原始频数占3 行4 列,故简称为3 4 表, 一般被简称为R C 表;表3 中含有3 个定性变量(医院名称、药物种类、疗效),故被称为三维列联表, 当列联表中定性变量的个数大于等于3 时,一般被统称为高维列联表。二、定性资料统计分析方法概述124 11 关于2 2 表资料的统计分析方法的合理选择:2 2 表资料的统计分析方法取决于其设计类型,即横断面研究设计、队列研究设计、病例2对照研究设计和配对设计四种类型,每种类型又需考虑一些具体情况,方可选择较为合适的统计分析方法处理资料。常用的方法有: 一般2 检验、校正2 检验、Fisher 的精确检验;计算相对危险度( RR) 、计算比数比( OR) 、检验总体RR (或OR) 与1 之间的差别是否具有统计学意义的2MH 检验;配对设计定性资料的McNemar2 检验。21 关于R C 表资料的统计分析方法的合理选择:R C 表资料的统计分析方法取决于表中两定性变量的性质和分析目的,按性质可将此类列联表分为以下四类:即“双向无序的R C 表”、“结果变量为有序变量的单向有序的R C 表”、“双向有序且属性不同的R C 表”和“双向有序且属性相同的R C 表”。对于这些R C 表资料,还需结合资料所具备的条件或分析目的,选用合适的统计分析方法,他们是: 一般2 检验、Fisher 的精确检验; 秩和检验、Ridit 分析、有序变量的Logistic 回归分析; 秩相关分析或典型相关分析;线性趋势检验;一致性(或叫Kappa) 检验或特殊模型分析。31 关于高维表资料的统计分析方法的合理选择:高维表资料的统计分析方法取决于表中定性变量是否能分出“原因和结果变量”,若分不出原因和结果变量,一般需要选用对数线性模型分析法;若分得出原因和结果变量,则可分为以下3 种情形:即结组动物的发病率的比较。对差错的辨析与释疑:从实验设计角度看,各小组之间不仅在动物数目上缺乏可比性(有些组有10 只,有些组只有2 只),而且在重要的非处理因素(如中毒的时间) 上不具有可比性,故这些均使得出的结论缺乏说服力。在实验结果的表达中,使用的多为定性的描述,在统计分析部分虽交代采用了t 检验和2 检验,但在给出统计分析结果时未给出检验统计量的具体值,直接就写B 、C 二组与A 、C 二组比较差异无显著意义( P 0105) ,使人不能不对其P 值的可靠性提出质疑。样本较小的定性资料的统计分析,一般不宜采用2 检验,而应选用Fisher 的精确检验来处理。31 由于多方面的错误导致统计分析方法的误用。例3 某作者对TRT 组与对照组疗效进行比较,结论为TRT 组疗效显著地优于对照组的疗效, 资料见表5 。对差错的辨析与释疑:其一,原作者在收集和整理资料时违背了实验设计的要求,将原本属于“重复观测”的多因素定性资料错误地按“独立重复试验”方式进行收集和整理。因为两组患者中的每一位都在“第2 、6 、12 个月”被重复观察了3 次,而且每次都按完全适应、基本适应、部分适应、未适应来给出疗效的评定,此时的“疗效”是“多值有序变量”;其二, 原作者将一个三维列联表资料简单地拆分成三个独立的二维列联表资料,割裂了整体设计,无法正确反映原因与结果之间的真正联系; 其三,对结果变量(疗效) 的有序性不予理睬,简单地将其分为适应与不适应两档(因为分析的是总适应率),采用无法利用结果变量有序性信息的2 检验进行资料处理,其结论的可靠性大大降低(注:表中2619% 为原文漏项) 。果变量为二值变量的高维表、结果变量为多值有序变量的高维表和结果变量为多值名义变量的高维表。对于这些高维表资料,其统计分析方法有:多元Logistic 回归分析、对数线性模型;有序变量的多元Logistic 回归分析;扩展的多元Logistic 回归分析。三、定性资料统计分析错误辨析与释疑11 资料整理过失及误差和对资料类型判断错子宫8 孕周腹部手术史组别总例数年龄百分率百分率(岁) 例数( %) 例数( %) TVH 78 45.2 68 87.2 6 7.7 LAVH102 44. 0 92 90.2 22 21.5 CISH 208 42. 7 188 90. 4 46 20.2 TAHP200 46.1 112 91. 0 44 22.0 注:TVH: 阴道全子宫切除术;LAVH: 腹腔镜辅助阴道子宫切除术;CISH: 腹腔镜鞘内宫颈上子宫切除术; TAHP: 剖腹子宫切除术; 与TVH 组比较2=0.310 4, P =0.433 1; 与TVH 组比较2= 01407 2, P = 0. 521 4 ;LAVH 组间比较2=0.949 6, P = 0. 813 4 对差错的辨析与释疑:根据原作者在文字叙述部分介绍可知,CISH 组总病例数应为228 例,其中子宫8 孕周病例数应为208 例,而表4 中将总病例数写成208 例,将子宫8 孕周病例数写成188 例;将TAH 写成TAHP , 且该组中子宫8 孕周病例数应为182 例,而表4 中却写成112 例。如此多的过失误差出现在同一张表格中,是不应该的。在该表格中记录的年龄这个变量,对于每一个研究对象而言,都可以得到一个精确量化的数值,应该是一个定量资料,若以组来概括表达,年龄应该用“x s”的形式表达,不应仅写一个数据;更为不妥的是:误用2 检验来分析表中后3 组的年龄与第1 组(即TVH 组) 的年龄之间的差别是否具有统计学意义。另外,在表4 中,就子宫大小、腹部手术史的比较而言,原作者的用意让人感到困惑。因为该试验的目的是比较微创手术TVH 、LAVH 、CISH 较常规剖腹手术TAH 优越,对于基本情况的比较应该是试图说明各组间在重要非处理因素方面均衡性好, 组间的差异无统计学意义;而将各组与同为微创手术的TVH 组比较,并不能说明微创手术组患者的78 中华医学杂志2004 年1 月2 日第84 卷第1 期Natl Med J China , January 2 ,2004 ,Vol 84 , No. 1 本例最妥当的做法是严格按重复测量设计收集资料,并采用重复测量设计定性资料的统计分析方法进行统计分析;若一定要在错误收集资料的情况(表5) 下处理资料,应将其视为结果变量为多值有序变量的三维列联表资料,可选用有序变量的多元Logistic 回归分析方法处理之。表5 两组患者在2 、6 、12 个月时的疗效(例数) 部分总适应率适应未适应( %) 2 值P 值对照组1080 0 6 个月TRT 组11721 12 82.1 69.30 0.01 对照组1083 9 17 79 26.9 12 个月TRT 组11773 23 7 14 88.0 53.64 0.01 对照组10811 13 21 63 41. 7 注:原作者在论文中未提及使用的统计学方法,但根据给出的检验统计量的符号推测,此处采用的是目前常用的一般2 检验例41 原作者展示了实验动物的切口愈合情况和感染情况,其中一部分实验结果列在表6 中,其中甲、乙、丙分别代表切口愈合的等级,从甲到丙表示由优到劣。表6 实验动物的切口愈合和感染情况实验组切口对照组切口细菌愈合情况感染率愈合情况感染率浓度鼠数甲乙丙( %) 鼠数甲乙丙( %) 100 30 23 2 5 23.33 30 28 0 26.60 102 27 17 3 7 37.04 30 26 1 313.33 105 30 15 5 10 50.00 29 22 3 424.14 108 30 11 4 15 63.33 30 19 2 936.67 注:除100 浓度外,102 、105 和108 浓度组差异均有显著性意义(2 分别为4. 31 、4. 22 和4.27 , P 0. 05) 对差错的辨析与释疑:原作者在文章中虽未明确提及所使用的统计分析方法,但从统计表底部的注释中我们可以看到,原作者采用的是在固定细菌浓度的条件下,比较实验组与对照组切口感染率之间的差别是否具有统计学意义,采用的是一般2 检验。对于“感染与否”这个二值的结果变量来说,它表7 实验动物的切口愈合情况(例) 切口愈合情况实验分组细菌浓度甲级乙级丙级实验组100 23 25 102 17 37 105 15 510 108 11 415 对照组100 28 02 102 26 13 105 22 34 108 19 29 四、定性资料统计分析方法合理选择的要领我们认为对于定性资料的统计分析,可以遵循这样的思路:明确实验研究的专业目的;辨清实验中存在的影响因素和观测结果;要注意资料的收集方式与实验设计是否吻合,要注意实验设计的四个基本原则(随机、对照、重复、均衡) 是否严格遵守;要注意列联表资料所对应的设计类型、资料所具备的前提条件、结果变量的性质和分析目的,在系统、全面地学习和掌握了常见的定性资料的统计分析方法之后,方可合理选用统计分析方法处理定性资料,最后还应注意检查结果解释和专业结论是否同时满足专业及统计学要求,千万不要将2 检验视为处理定性资料的“万能工具”,千万不要作出含糊其词的解释和专业结论。沃登编辑网:/沃登论文编辑团队由生物医学各领域专家组成,涵括70多个细分领域。无论您的文章是中文还是英文,分属临床医学、基础医学或生物学,沃登将为您选派对口的专业编辑,为您提供最优质、高效的服务。沃登编辑团队可分为两类: 一、华人编辑:母语为汉语,长期在国外留学工作,均在母语为英语国家知名学府获得MD或Ph.D学位,至少发表20篇以上SCI论文,经过沃登生物严格选拔培训最终成为沃登生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论