版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 1一月二月三月产品名称数量金额利润产品名称数量金额利润产品名称数量金额利润合计合计合计四月五月六月产品名称数量金额利润产品名称数量金额利润产品名称数量金额利润合计合计合计·沃登编辑·医学论文中统计分析错误辨析与释疑定性资料统计分析方法的合理选择(2) 一、误用2 检验回答相关性问题例1 :很多医学期刊论著中都采用2 检验处理类似表1 的资料,其目的是希望回答表中“两个有序变量之间是否呈相关关系”。表1 不同期次矽肺患者肺门密度级别的人数分布(例数) 矽肺期次肺门密度级别+ + + + + + 合计43 188 14 1 96 合计492 原文用2 检验处理表1 资料,得:
2、2 = 163101 , P <01005 , 结论为:可认为肺门密度与矽肺期次有关,结合本资料可见肺门密度有随矽肺期次增高而增加的趋势。问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处? 对差错的辨析:因表1 资料叫做“双向有序且属性不同的二维列联表资料”,对于这种资料的处理有3 个不同的目的,因此,也就对应着3 套不同的统计分析方法。原文作者分析此资料的目的是“希望考察表中两个有序变量之间是否呈相关关系”,而2 检验是检验“表中两个定性变量之间是否互相独立”,当检验的结果为拒绝“独立性”假设时,其对立的假设不是“相关”,而应当是“各矽肺期次的患者在3 种肺门密度级别上的人
3、数分布是不同的”。原作者误认为用2 检验拒绝了“独立性”假设后,其对立的假设一定是“相关”。事实上,从2 检验的计算公式上不难看出,它与表中两个有序变量本身毫无关系,若将表中任何两行上的频数互换或将任何两列上的频数互换,它们所对应的2 检验统计量的数值(本例为2 = 163101) 是不会变化的。显然,变换后的数据已预示其结论要发生变化,而2 检验的结果作者单位:100036 首都医科大学继续教育学院(刘惠刚);军事医学科学院生物医学统计咨询中心(胡良平) 却隐含着结论是不变的,这充分说明2 检验用于处理由有序变量形成的二维列联表资料是不合适的。释疑:结合表1 的标题可知,若一定要根据2 检验
4、的结果作出结论的话,其结论应当是针对各行上的“频数分布”是否相同来作出明确的回答,而绝对不应当针对表中两个有序变量之间是否呈“相关。要想对后者作出明确回答需要选用分析定性资料的相关分析方法,如:Spearman 秩相关分析, Kendall 秩相关分析或典型相关分析。就例1 而言, 若采用Spearman 秩相关分析,得: rs =0153215 , P <010001 , 结论为:表中两个有序变量之间呈正相关关系,即随着矽肺期次的增加肺门密度级别也逐渐增大,两者之间的相关关系具有统计学意义。2有人可能提出质疑,检验的结果不也得出了P <01005 的统计学结论吗? 若再具体计算其
5、概率, 很可能也会有P <010001 的统计学结论,因为本例2 = 163101 相当大。一点不错,若根据2 检验的结果,本例也的确可以得出P <010001 的统计学结论,但这纯粹是一种“巧合”,无论其概率多么小,其专业结论也只能回答表中各行上频数分布是否相同,而不能回答表中两个有序变量之间是否呈相关关系。若将表1 资料换成表2 资料,两种计算方法之间的差别一下就显现出来了。表2 不同期次矽肺患者肺门密度级别的人数分布(例数) (假设数据) 矽肺期次肺门密度级别+ + + 合计215 67 8 290 9 89 131 229 248 168 4 420 合计472 324 1
6、43 939 若统计分析的目的是考察表2 中两个有序变量之间的相关关系是否具有统计学意义,则: 其一, 若采用错误的统计分析方法(即2 检验),得:2 = 5031776 , P <010001 , 错误的专业结论为:矽肺期次与肺门密度级别之间的相关关系有统计学意义;与该检验方法对应的正确的专业结论为: 表2 中各行上肺门密度级别的人数分布不同,具体地说:矽肺期的患者多数肺门密度级别为“+ ”级、矽肺期的患者多数肺门密度级别为“+ ”级和“+ ”级,而矽肺期的患者多数肺门密度级别为“+ ”级和“+ ”级。其二, 若选用正确的统计分析方法( 如Spearman 秩相关分析), 得: rs
7、=0100059 , P = 019856 , 正确的专业结论为:表2 中两个有序变量之间的相关关系没有统计学意义。例2 :文献和很多医学期刊论著中都套用2 检验处理类似表3 的资料,计算所得的2 =241639 , P <01005 , 得出的专业结论为“依沙酰胺治疗皮肤真菌的疗效与病程有关”的专业结论。试问:这样做错在哪? 正确的统计分析方法和专业结论是什么? 不满1 月8 111 1 至3 月合计240 146 49 435 对差错的辨析:表3 看上去好象与表1 不同,但本质是相同的,即也是双向有序且属性不同的二维列联表资料,若希望考察表3 中两个有序变量之间的相关关系是否具有统计
8、学意义,用2 检验是错误的,宜选用定性资料的相关分析方法。释疑:若用Spearman 秩相关分析, 得: rs =-0121479 , P <010001 , 专业结论为:依沙酰胺治疗皮肤真菌的病程与疗效之间有负相关关系,即病程越长疗效越差,表3 中两个有序变量之间的相关关系有统计学意义。对于表3 资料,若希望考察不同病程的患者疗效之间的差别是否具有统计学意义,也是值得回答的问题。此时,就应将此表视为结果变量(即疗效) 为有序变量的单向有序的二维列联表了,这实际上是不考虑原因变量(即病程) 的有序性, 而特别强调结果变量(即疗效) 的有序性。为了实现此分析目的,可供选用的统计分析方法有:
9、 秩和检验、Ridit 分析和有序变量的Logistic 回归分析(较复杂,一般不选用此法) 。本例若选用秩和检验,得: Hc = 231144 , P <010001 , 专业结论为:各病程组患者的疗效之间的差别具有统计学意义,将各组秩和的平均值代入近似的t 检验,进行两两比较,得结果为: 设:1 组为不满1 个月、2 组为1 至3 个月、3 组为3 个月至5 年、4 组为5 年以上,则: 对比组平均秩之差t 值P 值1 组VS 2 组-01958 01044 01483 1 组VS 3 组-521375 31655 <0101 1 组VS 4 组-591226 31093 &l
10、t;0101 2 组VS 3 组-511417 21535 <0101 2 组VS 4 组-581267 21434 <0101 3 组VS 4 组-61850 01395 01347 由于表3 中的疗效由“痊愈到无效”,且计算时“痊愈” “档打分高,故各病程组的平档打分低,无效”均秩小者疗效较好,由此可知:病程不满1 个月与1 至3 月的患者的疗效之间的差异无统计学意义;病程3 个月至5 年与5 年以上的患者的疗效之间的差异无统计学意义;其他任何两种病程的患者的疗效之间的差异都有统计学意义,且病程短者疗效好。二、误用秩和检验取代2 检验或Fisher 精确检验例3 :某研究者在其
11、论文中运用秩和检验处理表4 资料,选此方法处理该资料是错误的,这是为什么? 分析此资料的正确统计分析方法是什么呢? 表4 CAM21 和CD44s 的表达与食管癌TNM 分期的关系TNM 分期n X/ n HP a 7 3/ 7 b 10 8/ 10 611191 010134 23 21/ 23 对差错的辨析:原作者将表4 资料视为结果变量为有序变量的单向有序的二维列联表资料,因而错误地选用了秩和检验。事实上,食管癌TNM 分期这个有序变量是“原因变量”,不是“结果变量”,不适合选用秩和检验处理此资料。释疑:那么,正确处理表4 资料的统计分析方法究竟是什么呢? 先将表4 变成表5 的形式,便
12、可很容易认出它是一个什么样的二维列联表资料,因而, 合理选用统计分析方法就显得是十分简单的事了。此时,不难看出:表5 资料为结果变量为二值变量(即阳性、阴性) 的二维列联表资料,虽然原因变量(即TNM 分期) 是有序的, 但其本质与双向无序的二维列联表资料是一样的,故当表5中记录6个表5 CAM21 和CD44s 的表达与食管癌TNM 分期的关系(表4 变形后的结果)( 例数) 食管癌TNM 分期阳性阴性合计a347b 8 21021 2 23合计32 8 40 观察频数的位置上小于5 的理论频数的个数不超过总格子数的1/5 (6/5 = 112) 时,可以选用一般2 检验处理此资料;反之,需
13、要选用Fisher 的精确检验法计算概率。本例“阴性”列3 个格内的理论频数都小于5(占总格子数的1/2) ,故宜选用Fisher 的精确检验处理此定性资料。本例Fisher 精确检验的结果为: P =010172 , 专业结论为:TNM 的3 种分期的样有统计学意义,这个计算结果和结论对吗? 表6 子宫内膜癌样品中COX22 与iNOS 之间的关系(例数) COX22 的分级iNOS 分级: 2 34 > 5 合计2 1 1 5 7 34 4 2 8 14 > 5 3 1 6 10 合计8 4 19 31 值的顺序,本例若将“COX22”按由上到下分别赋为“1 、2 、3”的值,
14、将“iNOS”按从左至右分别赋为“1 、2 、3”的值, 则计算结果就是正确的, 即rs =-0109236 , P =016212 ; 若将这两个有序变量中的一个赋值方向弄反了,则计算结果为: rs =0109236 , P =016212 ; 若将这两个有序变量的赋值方向全部与前述第一种方向相反,那也没有关系,不会影响结论的正确性。(收稿日期:2003212208) (供稿编辑:李群) 明显高于a 期表达的阳性率(注:总例数和各组例数都较少,结论的可信度较低) 。三、定性资料等级相关分析的相关方向错误例4: 某研究者对表6 资料进行了Spearman 秩相关分析,得到的结果为: rs =0
15、1601 , P <0105 , 得到的专业结论为:环氧合酶(COX22) 含量与诱导型一氧化氮合酶(iNOS) 含量之间存在的相关关系具全国肺功能和临床呼吸生理学术研讨会暨学习班征文通知由中华结核和呼吸杂志编委会主办、内蒙古医学院第三附属医院承办的“全国肺功能和临床呼吸生理学术研讨会暨学习班”定于2004 年8 月在包头市召开,欢迎有关医疗、技术、护理和医学工程等专业人员踊跃投稿并参加学术交流。届时也将邀请国内外知名专家举办专题报告。征文范围: (1) 肺功能测定方法、技术及临床应用; (2) 危重患者的呼吸功能与血气监测; (3) 各种疾病相关呼吸病理生理的基础与临床研究; (4) 肺功能测定新技术相关生物工程方面的研究与实践; (5) 其他与呼吸生理暨病理生理、肺功能有关的基础与临床工作总结。征文要求: (1) 4 000 字左右全文1 份,并附1 000 字左右中文摘要,来稿请用4 号字、1. 5 倍行距打印,同时附软盘;也可从网上投稿, 注明“呼吸生理会议投稿”,E2mail : shangn
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高考语文复习知识清单第2章文学类文本阅读(一)小说专题07写小说文学短评(学生版+解析)
- 各种培训课件教学课件
- 二年级数学计算题专项练习1000题汇编集锦
- 肉鸭采购合同(2篇)
- 望庐山课件教学课件
- 南京工业大学浦江学院《实验艺术》2021-2022学年第一学期期末试卷
- 钢结构施工组织设计【超完美版】
- 多细胞生物体说课稿
- 《长方形的面积》说课稿
- 《小数的加减法》说课稿
- 光伏电站生产准备大纲全套
- 轮对(车辆构造与检修课件)
- 情侣分手经济纠纷起诉书模板
- 单人心肺复苏操作评分标准
- 前庭康复-医学课件
- 智能林业装备与技术
- 安徽省芜湖市2023-2024学年七年级上学期期中数学试卷
- 企业周边环境风险分析
- 怎样写科研项目申请书(PPT)
- 矿产资源-三率-指标要求+第13部分:粘土矿产
- 语文大单元教学设计+作业设计:六上八单元跨学科主题活动
评论
0/150
提交评论