版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学论文中
常用统计分析方法误用辨析
讲座内容现代统计学的新观念面对现实中复杂的问题怎样处理?医学统计学的地位医学文章中统计分析的应用现状中国医学杂志的调查结果中华系列医学期刊的调查结果国外权威医学期刊调查结果国内外调查结果显示误用统计分析方法的原因医学论文中常用的统计分析方法误用辨析减少医学论文中统计学错误的对策现代统计学的观念“科学试验做完后再找统计学家分析数据,如同病人死了找医生进行尸体解剖,医生会告诉你病人死的原因。同样,统计学家会告诉你试验失败的原因。”
---英国RonaldFisher(1890-1962)统计学是“对令人困惑费解的问题做出数字设想的艺术。”
---DavidFreedman
“在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。”
《统计与真理——怎样运用偶然性》——C.R.劳先生统计学是处理复杂问题的工具FrancisGalton(1822.2.16~1911.1.17)
“当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道”。
---英国著名遗传学家Galton面对现实中复杂的问题怎样处理?医学统计学如今是热门科学。美国食物和药品管理局(FoodandDrugAdministration,FDA)和欧盟法规要求实验研究、临床研究、药物开发、医学杂志审稿、流行病学探索,以及政府制定有关政策的民意调查、数据分析、决策预测等都需要统计学家的直接参与。由统计学家指导研究设计、数据分析乃至准备呈递给FDA的报告。在我国,医学统计学也越来越受到学术界和有识之士的重视。医学统计学的地位医学统计学的地位据调查,柳叶刀(TheLancet)、新英格兰医学杂志(NewEnglandJ.Medical)、美国医学杂志(JAMA)、英国医学杂志(British
J.Medical)等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。“统计学是现代医学大厦的一个重要支柱”。---美国医学会杂志(JAMA)主编统计学能使数据变成信息。
数据≠信息datainformation对统计学的一知半解常常会造成一些不必要的上当受骗对统计学的一概排斥往往会造成某些不必要的愚昧无知---《统计与真理》医学论文中统计分析的应用现状在医学事业迅速发展的今天,医学研究论文已成为主要的交流方式。但医学论文中尚存在各种统计分析方法应用上的问题,统计学缺陷涉及面:国外约50%,国内80%以上。主要有:研究设计不合理(设计水平低下);
分析方法选用不得当(方法使用错误);应用条件不遵循;样本含量不满足统计学要求;结果解释不合理(推断过于肯定);统计报告(报告项目不全)。由于计算机应用的普及和统计分析软件的发展,统计分析的过程和步骤主要由统计软件实现,随之普遍出现乱用计算机统计软件现象。①不管统计分析方法的前提条件是否満足,将数据直接代入计算机软件中,使得出的结果与实际相差甚远。②现有的统计软件使用不太方便,造成用户的误用。作为医学学术刊物的主要读者一定要正确地评价、参考和利用这些发表的医学论著。医学论文中统计分析的应用现状中国医学杂志近800种,其中代表医学最高水平的中华、中国系列杂志近百种。据统计:中华系列医学杂志发表的论文中有统计问题或错误的达到70%。国际著名医学杂志有统计问题或错误也达50%。
----<医学统计学基础与典型错误辨析>(胡良平主编军事医科院出版2003年)中国医学杂志的调查结果国外权威医学期刊调查结果Glantz调查了1977年《CirculationResearch》和《Circulation》杂志中发表的文章,在使用统计学方法的文章中具有统计学问题或错误的分别有61%和44%。Kanter等调查了1992年至1993年《Transfusion》杂志发表的文章,发现75%的文章至少存在一处统计问题或错误。国内外调查结果显示30年前,美国医学杂志(JAMA)一位编审曾说:“医学论文作者统计知识和统计水平低下”。近30年来,临床医学论著中统计应用缺陷没有发生根本改善,误用率仍很高。统计学中特别强调,有缺陷的数据得不出明确的结论!
——皮尔逊(英国统计学家,1895--1980)误用统计分析方法的原因1.对统计学的作用重视不够、统计教育的普及不够。我国很多企业投入上千万资金进行计算机数据平台建设,但投入数据统计分析方面很少。其结果是获得的只是一些简单的报表,有价值的信息很少。
------中科院张永光教授要提高统计信息的科学和真实性,必须在人力、资金财力、法律上对统计切实加以重视,不只是口头上,以统计P值来做装饰。2.统计学教学观念和方法落后教学与实际应用结合少;教学中结合软件授课少;教学人员较少参与医学研究设计、质控、数据管理和分析等;教学难以紧跟上统计分析方法与统计软件的发展速度。误用统计分析方法的原因3.计算机统计软件应用问题“计算机软件给统计学带来了革命性的变化”,但对于同一份数据资料,统计学可提供多种不同的分析方法,应用各种分析方法都有一定的前提条件,采用不同方法所得到的结果不完全相同。对于研究者来说,重要的是明确研究设计的类型、判别数据资料的分类、选择恰当的统计分析方法、遵循统计分析方法的应用条件、应用软件实现统计分析、对分析结果的正确解释和表达,则完全依赖于应用者所掌握的统计知识。误用统计分析方法的原因不少研究者曾多次学习《医学统计学》课程,但仍然对统计学知识理解很模糊。有的学生《医学统计学》成绩很好,但是遇到很简单的实际问题也不会解决。误用统计分析方法的原因4.《医学统计学》的学习和应用能力有待提高医学论文中常用的统计分析方法误用辨析一、实验设计存在的典型错误二、计量资料分析常见的统计问题三、计数资料分析常见的统计问题四、直线相关与回归分析常见统计错误五、统计分析方法表述问题六、统计表与统计图方面的问题七、多元回归分析1.1没有遵循随机原则1.2缺乏对照组1.3对照不全1.4实验分组不合理1.5没有按设计类型进行实验和收集数据1.6组间基线资料的均衡性检验1.7用“重复取样”替代“独立重复实验”1.8样本含量过少一、实验设计存在的典型错误1.1没有遵循随机原则问题:
某研究者人为地选择发病在5d以内的病人进入治疗组,而对照组则没此限制。辨析:根据常识,早期治疗对疾病的预后具有重要影响,往往具有较高的治愈率和较低的病死率。治疗组和对照组由于人为因素的干扰和影响,在“病程”这一重要的非实验因素上并没有达到均衡,不具有可比性。在制定实验设计方案时,应将重要的非实验因素考虑在内,用随机化法使各组病人在重要的非处理因素方面尽量达到均衡一致,以便提高组间的可比性。正确的做法:对病程不做限制或均选择发病在5d之内的病人,在实验分组时遵循随机的原则,减少人为因素的影响,使入选的任何一个病人有相同的机会进人治疗组和对照组。1.2缺乏对照组问题:某作者对64例银屑病患者进行血型观察,其中O型血30例,A型血17例,B型血17例,AB型血0例。没有进行统计分析,仅凭数字大小,认为银屑病的发病与血型有明显的关系,同时也证实了遗传致病的决定意义。辨析:
正常人群中的血型构成存在较大差异,AB型的比例为最少,作者没有对正常人群的血型分布情况进行调查,仅根据自己调查的银屑病人血型构成相差悬殊的情况,并不能说明银屑病人与正常人群在血型构成上存在差异,作出结论也是没有说服力的。正确的做法:
应设正常对照组,调查正常人群的血型分布情况,并与银屑病人的血型分布情况对照不全进行比较,如果存在差异,则为银屑病的发病因素提供了某种线索,如果没有差异,则可以认为银屑病发病与血型构成没有关系。1.3对照不全文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。设计:3个实验分组:
1.模型组加入50μg/L重组人表皮生长因子(rhEGF);
2.姜黄素(Cur)组加入终浓度为10μg/L的Cur和50μg/LrhEGF;
3.空白对照组加入等体积硝酸盐缓冲液。请问:此设计正确吗?辨析:本实验实际上涉及了“rhEGF用否”、“Cur用否”两个实验因素。正确的实验设计应是这两个实验因素的全面组合,所以应设4个组(2×2析因设计)。作者仅设立3个组,缺了1个单用10μg/LCur的实验组,犯了“对照不全”的错误。1.4实验分组不合理文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。问题:作者选取2002年12月~2004年5月住院治疗的恶性肿瘤患者86例,其中男46例,女40例;年龄26~69岁,平均53岁;其中肺癌26例,大肠癌22例,鼻咽癌16例,乳腺癌12例,卵巢癌6例,恶性淋巴瘤4例。采用随机交叉试验设计,将86例患者随机等分成A、B两组。请问:此设计正确吗?辨析:作者所选取的恶性肿瘤患者在病种方面差异较大,各病种的样本含量相差较大,且年龄跨度较大,不能认为他们来自于同一个总体。把他们随机分入试验组和对照组参加试验,两组之间的可比性可能很差,其结论的可信度很低。正确的做法:按6种疾病分层随机化,同时考虑年龄、性别、病情等非处理因素的组间均衡性,尽可能使组间非处理因素达到比较高均衡性。1.4实验分组不合理文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。作者采用交叉实验设计,获得的实验数据见表1。
请问:这样做正确吗?1.5没有按设计类型进行实验和收集数据辨析:作者没有按照交叉实验设计的要求收集数据。没有将各组两阶段的数据分列出来,而是简单地将试验组第1周期的数据和对照组第2周期的数据合并成试验周期(A为:参芪扶正注射液联合化疗所得的数据),将试验组第2周期的数据和对照组第1周期的数据合并成对照周期(B为:单纯化疗所得的数据),并按照化疗后的5个时间点将数据列表。这种列表方式掩盖了交叉设计中不同试验顺序和不同阶段各自总体间可能存在的差异,也就达不到交叉设计的目的。事实上,该文中的试验设计类型更像重复测量设计。1.5没有按设计类型进行实验和收集数据1.6组间基线资料的均衡性检验文题:止痛如神汤对慢性非特异性溃疡性直肠炎的临床疗效组间均衡性检验:破盲后经比较试验前两组间性别、年龄、病程、病情、临床类型构成等,认为两组基线特征均衡性好,具有可比性,见表2。请问:下表是否有不妥之处?
辨析:1.年龄和病程资料为数值变量资料,作者将数值变量资料转化为等级资料,这个转化过程损失样本信息。可直接根据资料是否满足参数检验的条件,可用参数检验,如不满足则用非参数检验。2.没有提供假设检验的统计量和P值。3.本资料按照性别、年龄、病程、病情、临床类型等分层后,各个格子中的实际数较小,样本是否具有代表性?应根据本研究的主要指标估算样本量,以满足统计学要求。4.当样本较少的成组设计资料比较时,若检验结果为P>0.05时,可能是由于样本量不满足统计学的要求,而导致检验效能低下。最好的办法是增加样本量。1.6组间基线资料的均衡性检验1.7用“重复取样”替代“独立重复实验”文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:此设计正确吗?辨析:文章中没有描述实验采集了多少只健康小牛。如果作者取1只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成了3组所用的处理液,每份处理液再等分成6份,则犯了用“重复取样”替代“独立重复实验”的错误;同样,若作者取3只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成3组所用的处理液,每份处理液再等分成6份,亦属重复取样。只有当作者取自18只健康小牛眼晶状体的混合消化液,进行相关培养后,随机分配至3组中,进行有关实验处理,才是正确运用了重复原则。1.7用“重复取样”替代“独立重复实验”1.8样本含量过少文题:芪众颗粒预防老年人上呼吸道感染临床研究问题:三组之间证型分布比较,经R×C卡方检验,无统计学意义,具有可比性(χ2=0.809,P>0.05),排前三位的证型依次为:脾肺气虚(62.42%),脾肾阳虚(17.45%),心脾两虚(6.71%),见表3。组别例数脾肺气虚脾肾阳虚心脾两虚肺肾阴虚心肾阳虚肝肾阴虚芪众颗粒组(A)504331111玉屏风颗粒组(B)493255331空白对照组(C)5032101331(0.98)合计149107187773%62.4217.456.716.045.372.01表3三组证型之间比较辨析:本资料中有一个格子的理论数小于1,说明本资料不可以做R×C卡方检验,而应该做R×C的fisher’s确切概率法。本资料很多格子的实际数小于5,应增加样本量。作者设空白对照组(即观察期间忌服任何预防药物或采用任何预防方法),这是临床试验疗效评价的医学伦理学不应许的!国家临床试验规范中要求,临床疗效研究的对照组一般采用目前公认的有效治疗法或有效的常规治疗法。对于确定新药疗效评价可以用安慰剂对照。假设检验做等效性检验、非劣效性检验或优效性检验。设置空白对照组只有在动物研究中。1.8样本含量过少二、计量资料分析常见的统计问题2.1忽视t检验的前提条件2.2误用成组设计资料的t检验分析配对设计资料2.3忽视方差分析的前提条件2.4误用t检验分析等级资料2.5误用t检验处理重复测量的两因素试验设计2.6误用配对设计资料的t检验处理单因素k(k>3)水平设计的资料2.7多因素非平衡组合设计的统计错误2.8正确处理析因设计或嵌套设计定量资料2.1忽视t检验的前提条件
文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?辨析:
1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。
正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验,否则,采用非参数检验。
2.给出确切的统计量和P值。2.2误用成组设计资料的t检验分析配对设计资料辩析:1.考虑到对数据进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。但本研究是配对设计,如果采用成组t检验,会降低检验效率。应该采用配对t检验进行分析。注意配对t检验的条件:要对每对数据的差值(d)进行正态性检验。如果不满足,改用Wilcoxon符号秩检验。2.应给出确切的统计量和P值。2.2误用成组设计资料的t检验分析配对设计资料2.3忽视方差分析的前提条件确切的统计量和P值文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:采用方差分析正确吗?均数±标准差??辨析:此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P<0.05,则进行多组均数间的多重比较。给出确切的统计量和P值。2.3忽视方差分析的前提条件2.4误用t检验分析等级资料文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验表4两组临床主要症状和结肠镜肠粘膜病变评分()症状G1组(n=60)G2组(n=60)治疗前治疗后治疗前治疗后腹痛2.01+0.68※0.85+0.56△▲1.98+0.721.29+0.69△腹泻2.09+0.82※1.26+0.75△▲2.11+0.731.56+0.68△脓血便1.82+0.42※0.51+0.32△▲1.91+0.411.02+0.39△下坠感2.22+0.57※1.41+0.65△▲2.29+0.621.67+0.59△充血、水肿1.89+0.37※1.11+0.41△▲1.92+0.421.59+0.38△粘膜糜烂1.58+0.60※0.50+0.49△▲1.62+0.621.01+0.48△粘膜溃疡1.81+0.62※0.59+0.56△▲1.79+0.591.21+0.60△总评分15.76+3.11※6.87+3.08△▲15.98+2.988.87+3.21△※:与对照组(G2)比较,P>0.05,组间差异无统计学意义;△:与治疗前比较,P<0.05,组内差异有统计学意义;▲:与对照组(G2)比较,P<0.05,组间差异有统计学意义;
2.4误用t检验分析等级资料症状中医证候计分0分1分(+)2分(++)3分(+++)腹痛发作次数持续时间疼痛程度腹泻脓血便下坠感充血、水肿粘膜糜烂粘膜溃疡辨析:对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。与对照组(G2)比较,P>0.05,组间差异无统计学意义,不必在备注中表示。应写出确切的统计量和P值。2.4误用t检验分析等级资料2.5误用t检验处理重复测量的两因素试验设计1文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。
辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次/d,10d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。请问:统计分析方法选用t检验正确吗?2.5误用t检验处理重复测量的两因素试验设计2确切的统计量和P值。辨析:1.统计分析错误本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。2.5误用t检验处理重复测量的两因素试验设计2原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml/kg鼠重分别灌服25%、50%、100%莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。剂量(g/kg)峰面积(mW·ms)持续时间(s)爆发波个数0142.65±34.643.50±1.320.54±0.102.5337.74±250.918.82±2.781.06±0.345.0449.50±154.459.82±2.891.42±0.477.5651.08±98.2013.07±1.881.40±0.25表莪术水煎剂对大鼠子宫肌电活动的影响(均数±标准差)2.6误用t检验处理单因素k(k>3)设计的资料辨析:没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnettt检验或LSD检验。如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。2.6误用配对设计资料的t检验
处理单因素k(k>3)水平设计的资料2.7多因素非平衡组合设计的统计错误1文题:某研究者研究A药对高脂血症性脂肪肝大鼠的作用设计:建立高脂血症性脂肪肝大鼠模型,以高、中、低剂量去脂胶囊进行干预,通过血液生化检查,观察其对脂肪肝大鼠血脂的影响。结果:去脂胶囊能明显降低脂肪肝大鼠血脂,与对照组比较差异有显著性意义(P<0.05)。结论:去脂胶囊对大鼠脂肪肝有肯定治疗作用。表1各组大鼠血清脂质比较(均数±标准差)mmol·L-1组别TCTGHDL-C自然恢复2.10±0.152.32±0.310.933±0.070A药低剂量2.01±0.102.12±0.180.979±0.070A药中剂量1.82±0.171.82±0.131.040±0.080A药高剂量1.68±0.181.72±0.211.065±0.067甲硫氨酸片1.95±0.132.06±0.160.963±0.072与自然恢复组比较,★P<0.01,☆
P<0.05,与甲硫氨酸片组比较,●P<0.01,○P<0.05;n=10本设计方案,研究者将A药高、中、低3个剂量组与甲硫氨酸片组和自然恢复组按多因素一水平的统计方法进行方差分析。其各处理组间关系的实质是两个因素:A药治疗与甲硫氨酸片治疗,而A药高、中、低3个剂量组是A药的3个水平,而不是与甲硫氨酸片平等的3个因素。2.7多因素非平衡组合设计的统计错误1辨析1:统计学上所讲的“因素”是指“同质的实验条件”,“水平”则是在“量”上有一些差异。将水平与因素混合进行分析是完全错误的。注意:在进行多重比较时,由于比较的组数不同,SNK-q检验的q值、卡方检验的χ2值、秩和检验的u值会得到不同的结果。尤其是χ2检验和秩和检验,其多重比较的检验水准α′的取值为α′=α/K(K为比较的次数),将水平与因素混合进行分析必然会增多比较的次数,α′取值过小,导致本来有统计学意义的两组比较则可能会没有统计学意义。本实验设计是一个不标准的设计类型。但是,不标准的设计类型并不是不科学的设计方案,经过梳理,可以进行适当的重新组合,进行统计分析。当然,按照统计学的要求,这种组合设计应该确立在实验的设计阶段,而不是在实验数据得出之后。2.7多因素非平衡组合设计的统计错误1辨析2:如果研究者的目的是为了考察A药高、中、低3个剂量组是否有效,及确定最佳治疗剂量。实验设计仍按上述方案分为5组,而统计设计可按如下组合进行分析:组合1:A药低剂量组、甲硫氨酸片组、自然恢复组组合2:A药中剂量组、甲硫氨酸片组、自然恢复组组合3:A药高剂量组、甲硫氨酸片组、自然恢复组组合4:A药低剂量组、A药中剂量组、A药高剂量组组合1、2、3的目的是观察A药高、中、低3个剂量组是否有效,及其与甲硫氨酸片组阳性对照组的相对疗效。组合4的目的是通过A药高、中、低3个剂量组之间的疗效差异比较,考察是否可以筛选出最佳治疗剂量。2.7多因素非平衡组合设计的统计错误1某研究者欲研究乳宁方及其拆方药物血清对体外细胞侵袭能力的影响,选用SD大鼠24只,等分成6组:正常对照组、乳宁方治疗组(可拆解为温肾方+疏肝活血方)、温肾方治疗组、疏肝活血方治疗组、三苯氧胺治疗组、环磷酰胺治疗组,分别接受相应药物的灌胃或注射,然后在末次给药后进行主动脉采血,制成相应药物的血清。进行体外MDA-MB-435细胞侵袭能力试验,见表6。若采用单因素六水平定量资料方差分析处理此资料正确吗?2.7多因素非平衡组合设计的统计错误2辨析1:表6中“组别”看上去像一个试验因素,共有6个水平,其实是错误的。因为乳宁方可拆解为温肾方+疏肝活血方,所以试验涉及到“温肾方用否”、“疏肝活血方用否”、“三苯氧胺用否”、“环磷酰胺用否”这样4个试验因素,而表6中的6个组并非是这4个试验因素的全面组合。本资料应为多因素非平衡组合试验下的定量资料,直接使用单因素多水平设计定量资料方差分析对其进行处理是错误的,应根据专业知识和统计知识对“组别”进行合理拆分。2.7多因素非平衡组合设计的统计错误2辨析2:本资料可拆分为:
组合1:正常对照组、乳宁方治疗组、温肾方治疗组、疏肝活血方治疗组;
组合2:正常对照组、乳宁方治疗组、三苯氧胺治疗组、环磷酰胺治疗组。组合1为2×2析因设计,可根据资料是否满足方差分析的前提条件选用两因素析因设计定量资料方差分析或对原始定量资料进行变量变换或直接采用两因素析因设计定量资料秩和检验。组合2为单因素同水平设计,可根据资料是否满足方差分析的前提条件,选用单因素同水平设计定量资料方差分析处理或对原始定量资料进行变量变换或直接采用单因素同水平设计定量资料秩和检验。2.7多因素非平衡组合设计的统计错误2文题:开胃理脾口服液对脾虚小鼠肠功能的影响。实验设计:70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理盐水,其余各组用大黄水造成脾虚模型。停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第3~5组给含10%炭末的不同剂量的开胃理脾口服液,第6组给含10%炭末的开胃理脾丸剂,第7组给含有10%炭末的儿康宁。给药30min后处死小鼠,测量并计算炭末在小肠内的推进百分率。具体剂量和推进率见下表。2.7多因素非平衡组合设计的统计错误3辨析:(1)实验设计各对比组间混乱。各剂量组、儿康宁组与空白组是否具有可比性?不同剂量的口服液、丸剂和儿康宁之间是否具有可比性?(2)分析方法误用。多次重复进行t检验,增大假阳性错误的概率。(3)确切的统计量和P值。原作者对各组数据采取成组t检验处理。开胃理脾口服液低、中、高剂量与模型组比较差异有统计学意义,提示本品具有促进小鼠小肠运动功能的作用,其作用强度较丸剂好。2.7多因素非平衡组合设计的统计错误3改进措施:(1)在分析时将实验拆分为:组合1:空白组与模型组[说明造模成功]组合2:模型组+低剂量组+中剂量组+高剂量组[各剂量口服液都和模型组有差别,说明各剂量都有效;剂量之间也可进行比较]组合3:模型组+低剂量组+丸剂组+(同剂量的)儿康宁[在相同剂量的情况下,口服液比丸剂和儿康宁都好](2)第一组采用成组t检验分析。其它组采用方差分析,如果方差分析各组间的差别具有统计学意义,再采用LSD-t(或Dunnett-t、SNK-q检验)进行专业上有意义的组间比较。2.7多因素非平衡组合设计的统计错误32.8正确处理析因设计或嵌套设计定量资料文题:丹参对骨骼肌缺血再灌注损伤低氧诱导因子一lmRNA表达和血液流变学的影响设计:研究者将66只SD大鼠随机抽取6只作为正常组,对照组(即模型组)和丹参组各30只,此两组造模后分别取l0、20、40、60、90min5个时点进行观测,每个时点上6只,处死后测量相应的指标,丹参对骨骼肌缺血再灌注损伤肌肉肿胀系数的影响见表8。n=30,各时点ni=6辨析:对照组和丹参组在每个时间点上分别处死6只大鼠,所以在5个时间点上测量的数据没有内在关联,此资料不是重复测量设计定量资料。表8是两个试验因素(“是否用丹参”和“处死时间”)各水平的全面组合。若无专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素析因设计定量资料。在资料满足方差分析的条件时,可采用两因素析因设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。若有专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素嵌套设计定量资料。在资料满足方差分析的条件时,可采用两因素嵌套设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。2.8正确处理析因设计或嵌套设计定量资料3.1计算相对数时分母太小3.2误用χ2检验分析结果变量为有序变量的资料3.3误用χ2检验回答相关性问题3.4多值有序变量的高维列联表资料3.5不满足连续性χ2检验条件时未做校正3.6十一种形式的列联表3.7误用χ2检验取代Fisher精确检验(未举例说明)3.8对R×C表直接分割进行两两比较(未举例说明)三、计数资料分析方法的常见问题文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何不妥之处?3.1计算相对数时分母太小辨析:计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例数就可以。确切的统计量和P值。3.2误用χ2检验分析结果变量为有序变量的资料某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经R×C表χ2检验,χ2=53.33,P<0.01,认为两组疗效之间的差异有统计学意义。辨析:本资料属于单项有序的R×C表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用R×C的χ2检验,R×C表χ2
检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,χ2值仍为53.33,不会有改变。确切的统计量P值。3.3误用χ2检验回答相关性问题上述资料用χ2检验得:χ2=163.01,P<0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?年龄冠状动脉硬化等级正常轻度中度高度50~431881424560~1967216970~6175578合计50301141492表不同年龄冠状动脉粥样硬化程度的分布辨析1:本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析两者间是否存在线性变化趋势则应用线性趋势检验。作者欲考察“两个有序变量之间是否呈相关关系”,而χ2检验结果是P<0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的χ2检验的统计量数值是不会变化的,说明χ2检验用于处理有序变量形成的二维列联表资料是不合适的。3.3误用χ2检验回答相关性问题辨析2:欲考察“两个有序变量之间是否呈相关关系”,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。本例采用Spearman秩相关分析,得:rs=0.53215,P<0.0001。结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计学意义。3.3误用χ2检验回答相关性问题3.4多值有序变量的高维列联表资料“创伤性上颈椎损伤早期漏诊原因分析”中对1994年至2003年治疗的58例上颈椎患者进行回顾性分析,男35例,女23例,接受手术治疗或非手术治疗,假设两治疗组患者在年龄、性别、损伤类型构成无统计学差异。治疗结果见表l1。请问:能否以“损伤类型”为依据,将此资料切割成多个二维列联表,一一采用秩和检验进行分析?或者通过求和,将“损伤类型”这个变量合并掉,采用秩和检验进行分析?该资料原因变量有两个,分别为“损伤类型”和“治疗方式”,均为名义变量,结果变量为“疗效”,因此该资料属于结果变量为多值有序变量的三维列联表资料。以“损伤类型”为依据,人为地将此资料切割成多个二维列联表,一一采用秩和检验进行分析,这是用单因素分析法来处理同时受多个因素影响的定性资料,割裂了多因素之间的相互联系,易得出错误的结论。通过求和,将“损伤类型”这个变量合并掉,采用秩和检验进行分析,这是对高维列联表的“压缩”。但这种“压缩”不是总可套用的,仅当被合并掉的那个变量与保留下来的变量之间都是相互独立的关系时,才不会得出错误的结论。正确做法:本资料应采用CMH校正的秩和检验,此法通过加权的方法消除掉一个原因变量,着重研究另一个原因变量取不同水平条件下有序结果之间的差别是否具有统计学意义;若希望将两个原因变量对有序结果变量的影响都明确地显示出来,建议选用有序变量的多重logistic回归分析。3.4多值有序变量的高维列联表资料辨析:3.5不满足连续性χ2检验条件时未做校正会得出完全相反的结论11种形式的列联表2×2表有序(配对)无序(成组)2×C表有序无序R×2表有序无序多维列联表单向有序R×C表有序无序双向有序属性相同属性不同分组变量有序指标变量有序四、直线相关与回归分析常见错误(1)脱离专业知识,盲目进行直线相关与回归分析;(2)对资料中因“过失误差”造成的错误视而不见,盲目进行统计计算得出违背专业知识的结论;(3)将数据直接录入计算机,调用统计软件快速得出计算结果,作出结论;(4)对于仅在统计学上有意义的计算结果,盲目给出专业上的“肯定结论”,但结论经不起实践的检验。五、统计分析方法表述问题1辨析:从该表述中只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号;更未体现出文中资料所对应的实验设计类型和所采用的具体统计分析方法。在统计学方法中注明“采用SPSS软件进行统计学处理”。此表述正确吗?辨析:从该表述中只能得知作者处理定量资料用了方差分析,至于这些统计分析方法的选用是否正确,则不得而知。通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的t检验有3种,方差分析有10种之多,他们之间的本质区别体现在定量资料所对应的“实验设计类型”上。在表述统计学方法时,应将所用方法写完整,即在统计分析方法前冠以实验设计名称,如配对设计定量资料的t检验、成组(或单因素两水平)设计定量资料的t检验或两因素析因设计定量资料的方差分析。五、统计分析方法表述问题2在统计学方法中注明“计量资料采用方差分析”。请问:此表述正确吗?辨析:事实上,定性资料通常可以编制成11种形式的列联表。在进行统计分析时,应针对不同形式的列联表、统计分析目的和资料实际具备的前提条件,选用相应的统计分析方法,不可随意盲目选用,更不应将χ2检验视为处理定性资料的万能工具。五、统计分析方法表述问题3定性资料一律采用χ2检验,对吗?原文题目:补肾中药对去势后大鼠雌激素受体作用的实验研究。
设计与分析:作者将45只4月龄雌性SD大鼠随机分成正常对照组、模型组和补肾中药组,每组15只,观察补肾中药对血脂和雌二醇水平的影响,作者对同一组计量资料用均数±标准差表达其分布,在未说明资料是否满足方差分析的情况下,直接用Wilcoxon检验作两组间比较,用Kruskal-wallis检验作多组间比较。请问:这样做正确吗?五、统计分析方法表述问题4辨析:原实验资料属单因素三水平设计定量资料,如资料符合方差分析的3个前提条件“独立性”、“正态性”和“方差齐性”,可采用单因素三水平设计定量资料的方差分析进行处理。如果3个条件不全满足,可采用非参数检验方法进行统计分析。在资料符合方差分析3个条件时,一般不用非参数检验方法,因为可能会丢失很多有用的信息。原作者没有说明资料是否符合方差分析的3个条件,就直接用Wilcoxon检验和Kruskal-Wallis检验等非参数方法,且在资料表达上,分布趋势用“均数±标准差”形式表示,前后不吻合。若资料不符合方差分析的3个条件,需采用非参数检验方法时,则在资料表达上,最好应采用“中位数(四分位间距)”的方式,保持资料表达与统计分析方法的一致。五、统计分析方法表述问题4许多论文中,当统计数据经假设检验后,P值仅仅列出P>0.05或P<0.05、P<0.01便称结果无显著差异,或结果非常显著。五、统计分析方法表述问题5假设检验结果正确的表达方法是:应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统计量,如χ2、t、u、F值等)、P值;然后根据P值大小作出统计学推断,并作出相应的医学专业结论。五、统计分析方法表述问题6北京血液中心XXX主任介绍:香港医务人员用已康复者血浆治疗20例非典病人无一例死亡,而其对照组20例中,有3人死亡。这表明用康复病人血浆治疗非典病人是有效的。
---摘自<北京日报>2003.5.28用康复病人血浆治疗非典病人真有效吗?五、统计分析方法表述问题7六、统计表与统计图方面的问题6.1统计表存在的问题6.2统计图存在的问题文题:电针对大鼠不稳定膀胱逼尿肌及膀胱颈氮能神经递质的影响。实验数据见表2。这张统计表编制得正确吗?统计表纵横标目设置不正确6.1统计表存在的问题1确切的统计量和P值。文题:原发性肝癌患者和健康人“正常舌象”的对比研究。原作者对原发性肝癌组和健康人组“正常舌象”舌苔脱落细胞进行比较,研究结果见表3。这张统计表编制正确吗?6.1统计表存在的问题2确切的统计量和P值。辨析:表中角化前细胞、角化细胞和超角化细胞的含义似乎应为其各自的细胞数占每个个体脱落细胞染片中细胞总数的百分比,原表题目应改为:原发性肝癌组和健康人组“正常舌象”舌苔脱落细胞的构成及成熟指数的比较,这样才能使表中数据的具体含义看起来清晰明了。原表在3种细胞后加上%,似乎想告诉读者下面的数据含义是个比,实际上不但没有起到辅助说明数据含义的目的,反而“画蛇添足”,让人更加不理解。因为各细胞所占的百分比合计应为100%,而原表中原发性肝癌组和健康人组中各细胞的均数之和确实为1,但原作者在3个细胞变量之后加上%,反而使各细胞所占的百分比都成了实际的1%,可去掉上面变量之后的%或将表中3个细胞变量下的数据同乘100。6.1统计表存在的问题26.2统计图存在的问题辨析:1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信息技术课标的心得体会(8篇)
- 俄语专业生求职信
- 企业停电停水的应急预案范文(7篇)
- 中秋佳节致辞(8篇)
- 设计课件网站教学课件
- 谚语讲解课件教学课件
- 盲目从众课件教学课件
- 天桃实验学校八年级上学期语文1月月考试卷
- 环境应急预案的编写要点
- 自建房屋建筑施工合同(2篇)
- GB/T 625-2024化学试剂硫酸
- 综合办公楼装修改造工程施工组织设计方案
- 三人直播带货协议书范文模板
- 北京邮电大学《云计算》2023-2024学年期末试卷
- 中央空调年度维保方案
- 尊重学术道德遵守学术规范学习通超星期末考试答案章节答案2024年
- GB/T 44693.2-2024危险化学品企业工艺平稳性第2部分:控制回路性能评估与优化技术规范
- 2024年新华社招聘笔试参考题库附带答案详解
- 肺癌(肺恶性肿瘤)中医临床路径
- 天津市2023-2024学年高一上学期语文期中考试试卷(含答案)
- 证券投资学期末考试卷及答案2套
评论
0/150
提交评论