




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学论文中常见的统计学问题及其1第一页,共九十四页,编辑于2023年,星期五
前言医学统计学在科研工作中日益发挥着重要和必要的作用。广大医务工作者一般都能正确地运用科研设计的基本原理和统计学方法进行科研工作,并把实践经验上升到理论、撰写出较好的医学论文。但是,必须清醒地看到有少数作者的论文中误用、错用和滥用统计学的问题十分严重,其直接不良后果是导致医学论文质量不高或者结论错误而发生误导。第二页,共九十四页,编辑于2023年,星期五
为此,近20年来,针对“医学论文中的统计学问题”这一主题,引发了许多学者纷纷扬扬的撰文。英国ClantA报道“生物医学文献评论者发现约半数的文章所用的统计学方法是不正确的;《英国医学杂志》1976年三个月内的42%的文章至少有一处统计学的问题。”(ClantzA(张志慈译).怎样发现、纠正和防止医学文献中的错误[J].国外医学心血管病分册,1981,1:38)北京医科大学王绍贤教授对中华医学会1984年编辑出版的医学、内科、外科、妇产科和儿科等五种杂志中刊出的595篇论著,逐篇阅读后指出“统计学的问题为11.2~15.9%…。”第三页,共九十四页,编辑于2023年,星期五
北京医科大学凌瑞珠教授撰文指出“《中华医学检验杂志》50~70%的论著中有统计学的问题。”(凌瑞珠.临床科研中常见的统计误用问题[J].中国卫生统计,1985,2(2):57)撰写同类评述文章的教授学者还有:石河子医学院庞树桂,新疆医科大学赵福祥、姜明、徐秦,北京军事医学科学院胡良平,上海医科大学詹绍康,第四军医大学徐勇勇,中山医科大学方积乾等。第四页,共九十四页,编辑于2023年,星期五
医学论文中的统计学问题形形色色、五花八门,粗略罗列出来的有40~50种,合并之后为科研设计,统计学方法,相对数和统计图表这四大类问题。以下通过实例进行分析和评述。第五页,共九十四页,编辑于2023年,星期五一、科研设计例1《不同量锌补充对缺锌运动小鼠体内自由基生成与清除的影响》(中国运动医学杂志,1992,1:11)一文“采用离乳小鼠64只,按性别、体重随机分成缺锌、缺锌后补锌5ppm、缺锌后补锌50ppm及缺锌后补锌500ppm4大组。每大组又分成运动和不运动两组,各组均有小鼠8只。开始时所有小鼠均进食缺锌饲料,6周后继续缺锌组小鼠继续进食缺锌饲料,其余各组分别进食5、50、500ppm的补锌饲料。又3周后,把所有小鼠均处死并测定血、肝的锌、铜、MDA、SOD、GSH—Px。结果揭示:补锌50ppm对运动及不运动缺锌小鼠各项指标的恢复有良好作用,补锌5ppm对运动小鼠非最佳剂量,补锌500ppm无论对运动小鼠还是不运动小鼠均有害”。第六页,共九十四页,编辑于2023年,星期五
评述1:
主要缺陷是对照不足,应增设正常锌饲料组。锌的剂量从5~500ppm,跨度太大,应通过文献确定合适的锌剂量。最好选择配伍组设计,表头设计如下:表1不同锌剂量、不同运动状态小鼠体内自由基测定No缺锌正常锌锌剂1锌剂2锌剂3动静动静动静动静动静12.……6第七页,共九十四页,编辑于2023年,星期五例2《剖腹产同时放置宫内节育器735例初步观察》(中华妇产科杂志,1985.20;49)原文提要:作者将施行剖腹产手术1562例中的735例作为实验组,在剖腹产的同时放置节育器,规定其适应症是:破膜和总产程都不超过24小时,无感染(无阳性体征、血常规正常)以及第—胎产后本人同意者;另将筛选剩下的827例作为对照组,单纯作剖腹产。实验后比较两组对象的术后出血、恶露干净时间和术后副反应等指标,其中除一项指标外,其它的差异均无显著性(P>0.05)。作者据此肯定了本实验作为产后避孕方法的价值。第八页,共九十四页,编辑于2023年,星期五
评述2:两组除了是否放置节育器不同外,受试对象的其他诸多条件并不齐同,实验组条件较好而对照组较差,即组间干扰因素不均衡,在此基础上观察放置节育器的效应缺乏可比性。因为无法排除干扰因素对实验效应的影响,所以本结果难以说明放置节育器对产后出血等指标有无影响。应该把适合放置节育器者按照随机化的原则分为实验组和对照组后再观察放置节育器后的效应。第九页,共九十四页,编辑于2023年,星期五例3《缺铁性贫血防治方法研究》(中华儿科杂志1985年送审稿)原文提要:作者选择七个工厂托儿所6个月至7岁的1174名儿童,按托幼单位分为四组:①铁剂组524人;②维生素C组237人;③维生素C+铁剂组360人;④单用加铁食盐组33人。经不同处理后,2~3个月后复查血色素,结果发现维生素C+铁剂组比其他三个组要好。第十页,共九十四页,编辑于2023年,星期五
评述3:①缺铁性贫血与饮食营养有极大的关系。6个月的婴儿以吃奶为主,7岁的儿童以吃饭为主,半托还是全托、星期天接回家与否都会影响实验结果。饮食营养不同,其防治贫血的效果必有差异,这是不言自明的道理。②儿童生长发育时期,血象的生理变化随年龄的增长而异,2个月后与3个月后测定血色素,就可能不同。文中只说2~3个月后测定,最迟几个月后测定没有交待清楚。由于观察效果的时间不一致,未做到标准化,所以组间的可比性就差。③较好的设计是把每个托幼单位的儿童分层随机分组进行比较。第十一页,共九十四页,编辑于2023年,星期五例4《联合抗凝治疗晚期狼疮肾炎的疗效观察》(北京医学院学报,1984,16:31)原文提要:把26例晚期狼疮肾炎的患者分为激素组、环磷酰胺组和联合抗凝三个组。作者在讨论中说:“联合抗凝组的疗效优于其他两种疗法”。第十二页,共九十四页,编辑于2023年,星期五
评述4:联合抗凝组在用新抗凝片以前采用了预备疗法(血清锌低者口服1%硫酸锌),而其它两组未介绍作预备治疗。红斑狼疮是一种自身免疫性疾病,而锌与机体免疫力密切相关。因此,组间缺乏均衡可比性。第十三页,共九十四页,编辑于2023年,星期五例5《中药肺炎合剂治疗小儿肺炎400例临床观察》(军垦科技,1973,11:19)原文提要:用肺炎合剂治疗小儿肺炎400例,平均住院天数为5.2天。与同期单用西药治疗的平均住院天数9.4天相比,缩短了4~5天,与往年同期肺炎平均住院天11.68天相比,缩短了6天。结论是服用中药的同时可根据病情适当选用1~2种抗菌素配合治疗,其疗效比单用西药好。第十四页,共九十四页,编辑于2023年,星期五
评述5:文中未介绍单用西药的两组治疗的例数和患儿一般情况,也未交待实验组与对照组中使用西药的种类、剂型、剂量和使用天数是否齐同可比。文中所举两个典型病例,在入院前都曾使用了多种抗菌素。入院后除用中药外,一例加用了青霉素,一例加用了四环素。由于设计与实验方法都存在问题,就不仅使实验组与对照组的非处理因素不均衡,而且两组的处理因素也混淆不清。因此无法得出明确的结论。为保证组间均衡一致,观察组与对照组在时间上应同时平行进行。因为在时间上的差异,可导致受试对象的条件和实验条件的失控。第十五页,共九十四页,编辑于2023年,星期五
例6《小儿腹部术后并发症中西医结合治疗的探讨》(中华小儿外科杂志,1980,4:22)原文摘要:小儿腹部术后并发症147例。作者将1974~1977年的69例用中西医结合治疗,1970~1973年的78例用西药治疗,两组相比,结论是前者取得较好的效果。第十六页,共九十四页,编辑于2023年,星期五
评述6:术后并发症的治疗效果与术后感染程度、医疗质量、医护人员的服务态度以及患儿的体质等都有关系。时间的不同,上述各项因素是很难加以控制的,从而使组间比较失去了均衡性。一般说历史对照或回顾对照,是一种非均衡对照。除少数非处理因素影响不大的疾病外,一般不宜采用。第十七页,共九十四页,编辑于2023年,星期五
例7
硫酸镁不同剂量、途径对重度妊娠中毒症治疗的初步观察》(新医学,1984,2:64)原文提要:采用两组相互对照的实验设计:1975年6月至1979年12月,甲组91例,使用硫酸镁5克与冬眠灵一号合剂半量交替肌注;1980年1月至1982年6月,乙组66例,改用硫酸镁静脉滴注加肌注。经显著性检验后,得出乙组疗效高于甲组的结论。第十八页,共九十四页,编辑于2023年,星期五
评述7:这也是回顾对照的案例,因此组间的均衡性差,结论的可靠性值得怀疑。第十九页,共九十四页,编辑于2023年,星期五
例8《新疆北疆垦区白血病临床发病统计报告》(石医资料,1976,4:57)原文提要:石河子医学院附属医院1965~1974年10年内共收治白血病141例,约占同期内、儿科住院总数的0.42%,和1963年乌鲁木齐统计的0.075%相比有明显增高。第二十页,共九十四页,编辑于2023年,星期五
评述8:也属于历史对照或文献对照。同时错误地把石河子一所医院10年的资料与乌市的所有医院1年资料相比较,这是事先无设计,事后乱比较的典型案例。第二十一页,共九十四页,编辑于2023年,星期五例9《酒精擦浴和非冰袋物理降温效果探讨》(实用护理杂志,1985,10:27)一文指出“对39℃以上的高热病人,不论性别、年龄、病因,入院后无选择性采用四种方法进行降温”有效率分别为82.1%、92.0%、57.1%、53.5%,……以第2组效果为最好。当降温处理120分钟时,又以第l组为最好。这可能与降温前的体温和应用降温解热剂有关……”。第二十二页,共九十四页,编辑于2023年,星期五
评述9:①实验前4个组的条件不一致,缺乏可比性,这一点作者自己已察觉。因此结论可能有误。最好能对实验前的年龄、用药情况、疾病种类等因素进行一致性检验后再进行实验。②作者首先肯定第2组降温效果好,继而又肯定第1组降温效果好。这样的结论使读者不得要领。应当事先确定一个时间界限,或按时间动态观察。③体温是容易获得计量资料的指标,而作者用的是有效率.这样就损失了不少信息,而且何谓“有效”呢?更主要的是没有进行“假设检验”就得出优劣顺序是不妥的。第二十三页,共九十四页,编辑于2023年,星期五
例10《乳癌根治术后皮瓣加压包扎与负压引流的疗效观察》(实用护理杂志,1986,2(10):20)一文,作者为了比较两种方法的疗效,从1979年1月至1981年12月乳癌根治术后采用加压包扎的病例中随意抽取100例,与从1982年1月至1984年12月术后用负压引流病例中随意抽取的100例,分别就其皮瓣成活率、伤口感染率以及肺部并发症的发生率等进行对比。第二十四页,共九十四页,编辑于2023年,星期五评述10:①未能遵循随机化抽样原则,随意不等于随机。②文中对比属于非同时期进行的一种非均衡对照。因为不同时期的医疗、护理条件很难齐同,故可比性差。第二十五页,共九十四页,编辑于2023年,星期五
例11《泼尼松、环磷酰胺治疗肾病综合症》(中华内科杂志,1973,15:101)原文提要:把患者分为两组,一组(1965~1970年)用泼尼松治疗(P组);另一组(1971~1975年)用泼尼松与环磷酰胺治疗(P+C组)。两组各取资料完整者15例进行比较,详见表2。结论是P+C组比P组疗效高。第二十六页,共九十四页,编辑于2023年,星期五评述11:
可看出,两组在性别、病程、肾功损害等因素上均衡性差,尤其是病程,P组比P+C组长,病程长或短显然会影响疗效。因此,在两组缺乏均衡可比的情况下,得出P+C组的疗效高的结论就欠妥。表2两组病例临床资料对比组别性别年龄病程肾功损害男女(平均岁)(平均月)例数P7833146P+C13229511第二十七页,共九十四页,编辑于2023年,星期五
例12《长效避孕药治疗银屑病的初步报告》(中华皮肤科杂志,1980,13:67)原文摘要:患者分为三组,第一组40例,用复方炔雌醚治疗,其中6例女性患者为已婚妇女,要求避孕,无急、慢性肾疾病等,另有男性患者34例;第二组32例,用长效避孕药三合一片治疗,其中男性患者19例,女性患者13例,未交待病人条件;第三组共22例,其中女性患者15例,均为绝经后妇女,用氯地孕酮治疗。作者对三个组的显效率作了卡方检验,差异有统计学意义,得出一组疗效最佳、三组次之、二组较差的结论。第二十八页,共九十四页,编辑于2023年,星期五
评述12:三个组男女患者的条件不相同.第三组女性患者为绝经后的妇女,男性患者是否齐同也未交待。同时病期长短差别很大(7月~40多年)未交待是否已控制病期这个因素。因此,三组间的疗效可比性很差,其疗效的差异不能肯定是否因药物不同所致。第二十九页,共九十四页,编辑于2023年,星期五
例13
在《肿瘤患者体外淋巴细胞转化率检查及其评价》(山东医药,1980,10:12)一文中,研究对象为67例恶性肿瘤病人,均是临床上已明确诊断的住院及门诊病人,其中44例为肿瘤患者(消化道癌23例,肺癌19例,其它癌肿8例),男39例,女5例,年龄36~73岁;23例为白血病患者(急淋7例,急粒8例,慢粒8例),男18例,女5例,年龄16~54岁。正常对照:33例正常人,均为健康献血员,年龄21~33岁,男20例,女3例。通过观察作者得出肿瘤组和白血病组平均淋转率与正常组相比有显著差异(P<0.001)的结论。说明肿瘤与白血病病人细胞免疫功能均有明显降低。第三十页,共九十四页,编辑于2023年,星期五评述13:假设检验中,特别强调组间的均衡性和资料的可比性。本资料实验组和对照组年龄相差较大,而年龄与细胞免疫功能有关。即年龄较大的细胞免疫功能低下;反之,年龄较轻的细胞免疫功能高,本资料年龄是混杂因素。作者所认为的肿瘤与白血病病人细胞免疫功能均有明显降低,不能排除与年龄有关。因此,两组之间缺乏可比性,所作出的推断结论理由不充分。对照组若能从该院住院或门诊非肿瘤病人中选择年龄、性别等条件与实验组相似者,所作出的推断结论就比较有说服力。第三十一页,共九十四页,编辑于2023年,星期五
例14
某作者在研究大网膜蒂瓣小肠延长后氨基酸吸收功能影响时,选用幼犬4只,雌雄各2只,分为实验组和对照组,每组2只,据每组这么少的数据进行统计学处理后便得出结论,显然结论值得考虑。(施利国,张安年,赵桂华.医学论文常见统计问题分析.滨州医学院学报,2000,23(1):88.)第三十二页,共九十四页,编辑于2023年,星期五
例15
某医师共检测18例正常人的抑制性细胞活性,其平均抑制率为42.25%,标准差为10.3%,制订抑制率的正常范围为22%~63%(42.25±2×10.3%)。测得急性肝炎22例,平均抑制率为30.9%,在正常范围内。第三十三页,共九十四页,编辑于2023年,星期五
评述15:确定正常值范围时,要求样本含量足够大,即通过对多个实验单位的观察,使总体内部的变异规律充分显示出来,缩小样本抽样误差;足够数量的重复,还可以抵消非实验因素所造成的干扰。对于制订临床生化指标的正常值范围,样本含量不少于300例。而该样本含量仅为18例,远远小于要求的数量,不能充分显示事物的本质规律。第三十四页,共九十四页,编辑于2023年,星期五例16
某医师为研究食管癌与吃杂粮的关系,调查了200例食管癌病人,其中有199例(99.5%)常吃杂粮,因此认为吃杂粮与食管癌的发生有关。第三十五页,共九十四页,编辑于2023年,星期五例17
某医师为研究宫颈癌与职业的关系,调查了100例宫颈癌病人,发现其中95%的病人是体力劳动者,因此认为体力劳动与宫颈癌的发生有关。第三十六页,共九十四页,编辑于2023年,星期五
评述17:这2个例子都缺少对照组,并有“以比当率的问题”。例16也许当地居民都以杂粮为主,99.5%的食管癌病人常吃杂粮就很平常。如果在同一地区以同年龄同性别的健康人和不患食管癌者作为对照,也是基本上吃杂粮的占99.5%左右,这样就不能说明吃杂粮与食管癌的发生有关。而例17,可能这是一个农村地区,病人又都是老年妇女,因此95%的病人是体力劳动者也很平常。如果在同一地区以同年龄同性别的健康人或者是不患宫颈癌者作为对照组,若体力劳动为主的也占95%左右,就不能说明体力劳动与宫颈癌的发生有关。第三十七页,共九十四页,编辑于2023年,星期五
例18
消炎通脉冲剂治疗血栓静脉炎39例,经治疗后,治愈22例(57.2%),显效10例(25.8%),好转7例(17%)。该药用于此病是比较合适的,实践证明效果较好。第三十八页,共九十四页,编辑于2023年,星期五
评述18:在不设对照组的情况下所得到的结果,难以说明该药的疗效如何。因为除药物的作用外,还有其它非治疗因素如自愈倾向、心理、环境等因素的影响。更重要的是,没有作该药与其它治疗此病药物之间疗效的比较,就不能轻易做出该药用于此病治疗是合适的结论。第三十九页,共九十四页,编辑于2023年,星期五例19
(1)400名畸胎儿的父亲,有95%在新婚时喝酒;(2)100名90岁的长寿老人,20岁以前每个月吃肉不超过0.25kg;(3)某省调查200名长寿老人,有80%长期居住生活在山区和农村;(4)300例高血压病人每周吃肉3次以上。(詹绍康.合理设立对照.中国实用外科杂志,1999,19(9):563)第四十页,共九十四页,编辑于2023年,星期五
评述19:上述4个数据都不能说明所述的原因与结果有什么联系,都未设立合理的对照。正确的做法是:(1)调查400名(也可以不是400名,以下类同)正常儿的父亲,有百分之几在新婚时喝酒;(2)同时出生的100名短寿的人,与多少20岁以前每个月吃肉不超过0.25kg,这个调查难以进行,因为同时出生的100名短寿的人早已死亡,几乎无法调查;(3)200名短寿者,有多少长期居住生活在山区和农村;(4)300例非高血压病人,有多少每周吃肉3次以上。第四十一页,共九十四页,编辑于2023年,星期五例20
有5件标本Ⅰ,Ⅱ,Ⅲ,Ⅳ和Ⅴ,每一件均匀分成4份后随机分配给4种处理A、B、C和D,试比较4种处理间的差别,详见表3。表3随机区组设下的实验结果
BlockTreatmentABCDⅠ0.800.360.170.28Ⅱ0.740.360.170.36Ⅲ0.310.200.380.25Ⅳ0.480.180.440.22Ⅴ0.760.260.280.13第四十二页,共九十四页,编辑于2023年,星期五
评述20:(1)不恰当做法:视纵向4列为4组数据,进行4组间比较。①多次t检验:分别对A与B,A与C,A与D,B与C,B与D,C与D作两组比较的t检验,得P值依次为0.02,0.03,0.01,0.37,0.63和0.19,据此认为B,C,D与A之间的差异具有统计学意义,但B与C,B与D,C与D的差异均无统计学意义。②单因素方差分析:同时比较A,B,C,D4个处理组均数间的差异,得F=0.55,P=0.59;据此认为4个处理组均数的差异无统计学意义。(2)理由:①此资料为随机区组设计,同一件标本为一个区组,同一区组内4种处理有较好的可比性;无视区组的存在,则组内误差较大,识别组间差异的能力降低;②不能翻来覆去比较:如果规定每次t检验犯第一灯错误的概率为0.05,则粗略估计,6次t检验犯第一类错误的概率=1-(1-0.05)6=0.27。(3)正确作法:随机区组资料的方差分析:将处理组间的差别与扣除区组间变异后的随机误差进行比较,则识别组间差异的能力提高。本例,处理组间的F=8.23,P=0.003,组间差别有统计学意义;区组间,F=1.21,P=0.36,区组间差别无统计学意义。第四十三页,共九十四页,编辑于2023年,星期五例21
有人欲分析蛇毒因子(CVF)剂量对血液白细胞噬菌率的影响,得表4的数据。表4蛇毒因子(CVF)剂量对血液白细胞噬菌率的影响GroupD(CVF)μg/kgnNeutrophilsbacteriophagicrate(%)(±s)14660.0±17.0040657.0±15.225654.0±16.61080651.0±17.236645.0±16.020160645.0±16.4第四十四页,共九十四页,编辑于2023年,星期五评述21:
(1)不恰当做法:①用单因素方差分析:F=0.701,P>0.5,认为不同剂量间差别无统计学意义;②作各组均数lg(剂量)的回归分析.回归方程为Y(噬菌率)=61.784-6.885lg(剂量+1),决定系数为R2=0.914.
(2)理由:①多个剂量组比较答非所问:由多个剂量组的比较只能得知得知均数间是否有差异,有差异不等于有剂量反应关系,也未必能概括出是否有趋势和有什么样的趋势;②以均数回归易出假象:回归方程是否有统计学意义与反应的变异状况有关,以诸个体反应值的均数作回归计算掩盖了反应的变异性。(3)正确作法:①利用个体资料作回归分析:回归方程为Y(噬菌率)=61.784-6.885lg(剂量+1),决定系数为R2=0.095;②适当变换:若反应和剂量间散点图呈曲线状,可对原数据作适当变换后作回归分析(图略)第四十五页,共九十四页,编辑于2023年,星期五二、统计学方法
例22
《巨细胞包涵体病的临床观察—附26例尿病毒分离》(新疆医学,1987,2:72)一文中:根据“男性15例,OWV分离阳性数10例;女性9例,OWV分离阳性数4例,经卡方检验得χ2=0.313,P>0.05”。第四十六页,共九十四页,编辑于2023年,星期五
评述22:该资料合计数不足40例,不能进行卡方检验,应使用直接概率法计算,现经10个四格表的概率相加得P=2.035×10-5,P<0.01,性别的差异有统计学意义。作者错误选择了统计学方法而得出相反的结论。另外要指出的是:即使可以使用卡方检验公式,也不应选择10、4、15、9这四个数字,而应取10、4、5、5这四个数字计算。第四十七页,共九十四页,编辑于2023年,星期五
例23
《中草药保留灌肠治疗婴儿腹泻》(实用护理杂志,1985,l:10)一文中报导“采用中草药保留灌肠法治疗70例,有效67例;采用抗生素治疗50例,有效42例。经统计学处理得P<0.01,两种方法疗效差异有极显著性意义”。第四十八页,共九十四页,编辑于2023年,星期五
评述23:任何假设检验的公式都有适用条件的,本例理论数中有小于5的:(50×11)/120=4.58,应当用四格表的校正卡方检验公式,经计算得χ2=3.523,P>0.05,结论应当是两种疗效差别无统计学意义。由于作者没有注意适用公式的前提条件错用公式并得出完全相反的结论。第四十九页,共九十四页,编辑于2023年,星期五
例24《628例坐式分娩助产方法及体会》(中华护理杂志,1989,5:281)一文,作者对初产妇单胎枕先露自然分娩,卧式与坐式各随机抽样628例进行观察,结果见表5。作者认为坐式分娩第二产程时间显著缩短…。第二产程的缩短减少了胎儿在产道内的挤压时间,故坐式分娩(系采用坐式综合产床分娩)胎儿窒息率比卧式分娩为低。表5两种分娩方式第二产程时间与发生胎儿窒息数比较分娩方式观察例数第二产程平均时间胎儿窒息人数例%坐式62841.6487.6卧式62862.7619.7第五十页,共九十四页,编辑于2023年,星期五评述24:首先,作者遵循随机化原则是应当肯定的。但是抽样研究不可避免地会产生抽样误差,两个样本窒息率不同,作者不进行任何统计检验仅根据表面数据就下结论是不妥的。所以必须进行假设检验才能作出推断结论。本例χ2=1.698,P>0.05,与原作者结论相反。本资料不支持作者的观点。第五十一页,共九十四页,编辑于2023年,星期五例25《关于血压正常值的探讨》(实用护理杂志,1985,3:封四)一文,作者通过50例18~22岁女性学生左右臂血压对比(资料见表6),提出了与全国中等卫生学校试用教材《基础护理学》中提到的血压生理性变化“一般右上肢高于左上肢”相反的结论。表650例18~22岁女学生左右臂血压对比年龄血压合计左高于右左右相等右高于左1881110191341229207721224合计3051520第五十二页,共九十四页,编辑于2023年,星期五评述25:①没有进行假设检验就下结论,研究者应根据资料的性质,选用合理的统计分析方法,才能获得正确的结论;②例数偏少,总数才50例,分组后更少了,对于血压这种变异大的指标来讲是不妥当的;③“高”的界限是什么?均值高不高?表6难以提供这种信息。第五十三页,共九十四页,编辑于2023年,星期五例26
《乌恰县柯尔克孜等民族心脏病人群患病率调查报告》(新疆医学,1986,16(2):97)一文见表7表7各类心脏病不同民族相对患病率(%)(原表)病名民族病患率标准误显著性(卡方检验结果)柯族与维族柯族与汉族维族与汉族合计柯维汉31.2319.0328.16
3.094.445.24
X2=3.9280.05>p>0.25
X2=0.2390.75>p>0.5
X2=1.7490.25>p>0.1
缺血性心脏病柯维汉10.096.347.04
1.782.582.65
X2=1.1210.05>p>0.25
X2=0.7560.05>p>0.25
X2=0.0360.05>p>0.25
…………………………………第五十四页,共九十四页,编辑于2023年,星期五评述26:
从表7可知,原作者在比较柯尔克孜族、维吾尔族、汉族等三个民族的患病率时,采用的是四格表资料的χ2检验。而本文实属三个样本率的比较,故应选用R×C表的χ2检验,查χ2界值表,确定P值,本资料得P>0.05,没必要作“两两比较”。另外,表7的绘制也存在着不少问题。第五十五页,共九十四页,编辑于2023年,星期五
例27
在《七年来苯酚胶浆剂闭塞输卵管绝育临床观察》(中华妇产科杂志,1979;14(2):79)一文中,经复查者共431例,其中哺乳期者156例,成功者142例,成功率为91.03%;非哺乳期者275例,成功者261例,成功率为94.91%。据此,作者得出“哺乳期妇女闭塞成功率较低”的结论。第五十六页,共九十四页,编辑于2023年,星期五评述27:
哺乳期和非哺乳期妇女闭塞输卵管成功率从表面数字上看不相等,但两个总体率是否也不相等须通过假设检验才能作出判断,而该文作者未经假设检验就得出“哺乳期妇女闭塞成功率较低”的结论,显然是不妥当的。经统计学处理χ2=2.47,P>0.05,所得结论恰好与作者相反。第五十七页,共九十四页,编辑于2023年,星期五例28
在《针刺麻醉对细胞免疫功能和皮质醇的影响》(上海针灸杂志,1984;(3):26)一文中,作者选择了疡病胃大部切除的患者,用同位素技术——外周血氚化胸腺嘧啶核苷(3H—TdR)参入法,观察针刺麻醉、针药复合麻醉及硬膜外麻醉的术后机体细胞免疫功能的变化(详见表8)。第五十八页,共九十四页,编辑于2023年,星期五表8三种不同麻醉方法不同时间外周血SH—TdR参入率(原表)组别例数平均值(cpm×104/106淋巴细胞)X±SD术前一天~术后第一天t检验术前一天术后一天术后三天*术后五天*针麻98.75±5.12.13±1.47.84±4.98.27±3.8p<0.01硬膜外106.41±3.101.93±1.008.62±6.58.24±5.4p<0.01针药复合56.60±2.253.00±1.917.50±2.896.86±1.97p<0.05第五十九页,共九十四页,编辑于2023年,星期五
作者认为:针麻、硬膜外麻醉和针药复合麻醉三组病员手术后第一天的H--TdR参入率的淋巴细胞数均显著低于手术前,表示术后第一天病员的细胞免疫功能降低。但值得提出的是针麻与硬膜外麻醉的降低P<0.01,比针药复合麻醉P<0.05,更显著。第六十页,共九十四页,编辑于2023年,星期五评述28:
医学论文中涉及统计学结论的问题为数不少,本例就很典型。对于假设检验而言,P值越小越有理由认为有差别,换句话说,在P<0.01时所下有差别的结论,比在P<0.05时更为可靠,而并不表示前者的差别加大。统计上的“P<0.01”与“P<0.05”,说明不了实际差别的大小。因此,针麻与硬膜外麻醉的降低(P<0.01),比针药复合麻醉(P<0.05)更显著的提法不妥。第六十一页,共九十四页,编辑于2023年,星期五例29
某医师对36例心衰患儿治疗前后血浆内皮素浓度进行了比较,见表9。(李舒梅,敖慧斌.吴剑波.医学研究论文应注意的统计学问题.赣南医学院学报,1999,19(3):241)表936例心衰患儿治疗前后血浆内皮素浓度比较(x±s)
nET(ng/L)P治疗前3673.25±11.54<0.01治疗后3645.60±13.12第六十二页,共九十四页,编辑于2023年,星期五
评述29:
本文目的是推断治疗前后患者血浆内皮素有无变化,属自身对照设计的资料,其实验数据是一一对应的,统计分析时应将治疗前后的每一对数据按统一方向相减,用所得差值作为变量值,然后计算均数、t值等,即采用配对t检验作统计分析。而作者却将上述配对设计资料分为2个独立的组,分别计算2组各自的均数、标准差,并按完全随机设计(成组设计)资料作t检验,这样把原来只有差值之间的差异扩大为两个样本之间的差异,增大了实验误差,降低了实验精确度。如采用配对设计,各对子间常存在明显的正相关关系,检验效能优于成组t检验。第六十三页,共九十四页,编辑于2023年,星期五例30
某文报道了不同生长时间肝内肿瘤直径的比较,见表10。(陈捷.医学论文中常见数理统计应用错误剖析.中国卫生统计,1997,14(4):53-55)表10不同生长时间肝内肿瘤直径的比较(x±s)
生长时间(周)N肿瘤直径(cm)1180.68±0.132181.30±0.17*3181.60±0.15*注:与l周比较,*P<0.001第六十四页,共九十四页,编辑于2023年,星期五评述30:
本例实际上是检验3个相互独立样本均数间有无显著性差异的问题,属于单因素试验的方差分析资料,而作者采用了t检验对该资料进行了1周与2周、1周与3周的肿瘤直径有无差别的假设性检验,漏掉了2周与3周的比较,本资料应采用方差分析,得出F=20.82,P<0.01,再进行组间两两比较,例如q检验。第六十五页,共九十四页,编辑于2023年,星期五例31
某文中报道了急性脑卒中患者血浆DD的含量,见表11表11急性脑卒中患者血浆DD含量(x±s)
分组N血浆DD正常对照组150.52±0.17腔隙性脑梗塞142.01±0.92大面积脑梗塞154.54±2.45高血压脑出血121.23±0.60注:各患者组与对照组比较,P<0.001第六十六页,共九十四页,编辑于2023年,星期五评述31:
本例是一个检验4个相互独立的样本均数间差异有无统计学意义的问题,属完全随机设计的方差分析资料。研究者却将腔隙性脑梗塞组、大面积脑梗塞组、高血压脑出血组分别与正常对照组作t检验进行比较。这样就和原来的多组整体设计分裂、与原设计思想不符、同时损失了一部分信息(各试验组之间未进行比较)。应选用单因素完全随机设计的方差分析,先进行F检验,在有差异的基础上再对各均数作两两比较。第六十七页,共九十四页,编辑于2023年,星期五例32
用某药治疗脑梗塞患者70例,观察治疗前后构音障碍。治疗前42例有构音障碍,治疗后减少到32例,问治疗前后的差别有无统计学意义。本例把它当成一般的四格表资料把观测结果整理成表12。按四格表χ2检验公式计算χ2=2。87,得P>0.05,得出在a=0.05的检验水准上治疗前后构音障碍无明显改变。
第六十八页,共九十四页,编辑于2023年,星期五表12某药治疗脑梗塞患者构音障碍改变情况(原表)分组有构音障碍无构音障碍合计治疗前422870治疗后323870合计7466140第六十九页,共九十四页,编辑于2023年,星期五评述32:
本例为治疗前后自身配对设计,应把观测结果整理成表13。按配对χ2检验方法计算χ2值,χ2
=4.50,得P<0.05,因此正确的结论是在α=0.05的检验水准上,治疗前后构音障碍的改变有统计学意义。表13
用某药治疗脑梗塞患者构音障碍改变情况
治疗后治疗前合计有构音障碍无构音障碍有构音障碍28432无构音障碍142438合计422870第七十页,共九十四页,编辑于2023年,星期五例33
方积乾;凌莉;张敏瑞.近期医学论文中常见统计错误及其纠正.中山医科大学学报,1999;20(4):314~318一文中:收集甲状腺术中正常甲状腺组织作成16份标本,随机分为4个处理组。将处理后的标本分别行免疫组织化学染色,作单位面积HLA-Ⅱ抗原阳性细胞计数。得数据如下(详见表14):第一组(经体积分数为95%空气和5%CO2培养7d):2.5,2.4,2.6,2.5。第2组(经体积分数为95%空气和5%CO2培养14d):1.8,1.9,1.7,1.8。第3组(经体积分数为95%O2和5%CO2培养7d):2.2,2.3,2.1,2.2。第4组(经体积分数为95%O2和5%CO2培养14d):1.9,1.8,1.7,1.9。作者采用单因素方差分析方法,直接比较4组资料间的差别,得F=60。00,P=0。00,因此认为4组间差别有统计学意义。第七十一页,共九十四页,编辑于2023年,星期五表14析因设计下的实验结果因素B因素AФ[95%的空气和5%(CO2)]Ф(95%O2和5%CO2)7天2.5(组1)2.2(组3)14天1.8(组2)1.9(组4)第七十二页,共九十四页,编辑于2023年,星期五评述33:
这是典型的2因素2水平的析因设计,将数据整理,其中纵向和横向2列均有可比性,如用单因素方差分析,不能扣除各因素的效应而得到单纯有误差引起的变异,4组间比较不敏感。应采用2因素2水平析因设计的方差分析,除讨论4组资料间的差别外,还可进一步分析处理主效应和交互效应。主效应:指某一因素各水平间的平均差别。本例A因素的主效应=(2.2+1.9)/2-(2.5+1.8)/2=-0.1;B因素的主效应=(1.8+1.9)/2-(2.5+2.2)/2=-0.5。交互效应:若某因素的单独效应随另一因素水平的变化而有较大变化,则称这2个因素存在交互效应。本例AB的交互效应=[(1.9-1.8)-(2.2-2.5)]/2=0.2。经检验:A因素的主效应,F=1.37,P=0.26;B因素的主效应,F=47.13,P<0.01;A与B交互效应:F=0.03,P=0.87。可见,只有B因素的效应具有统计学意义。第七十三页,共九十四页,编辑于2023年,星期五例34
有人用已确诊的患者和非患者各93名的资料来考核一种新诊断方法,结果如表15(方积乾;凌莉;张敏瑞.近期医学论文中常见统计错误及其纠正.中山医科大学学报,1999;20(4):314-318)。表15诊断效果考核资料
SitaionofDiseaseDiagnostictestTotalT+T-D+92193D-642993Tutal15630186第七十四页,共九十四页,编辑于2023年,星期五
评述34:
(1)不恰当做法:①用灵敏度和特异度评价诊断效果,灵敏度=P(T+/
D+)=92/93=0.989,特异度=P(T_/D_)=29/93=0.312,因灵敏度较高而认为该方法可用于发现病人;②计算阳性预测价值和阴性预测价值:阳性预测价值=92/156=0.590,阴性预测价值=29/30=0.967,因阴性预测价值较高而认为该方法可用于排除非病人。第七十五页,共九十四页,编辑于2023年,星期五
(2)理由:①灵敏度和特异度不反映诊断效果:灵敏度是已肯定为患者的前提下该方法呈现阳性的概率,特异度是已肯定为非患者的该方法呈现阴性的概率。二者不能直接说明该方法可否用于诊断实践;②欲反映诊断效果需采用阳性预测价值和阴性预测价值:阳性预测价值是某方法呈现阳性的前提下确系患者的概率,阴性预测价值是某方法呈现阴性的前提下确系非患者的概率。二者可直接说明该方法可否用于诊断实践;③本例资料不能用来计算阳性预测价值和阴性预测价值:本例中156名诊断结论为阳性者,30名诊断结论为阴性者均不是相应总体中的随机样本。欲评价诊断效果,最好分别从诊断结论为阳性和阴性的总体中抽取随机样本,据此计算阳性预测价值和阴性预测价值;④灵敏度、特异度和患病率三结合:若上述随机样本不易获得,而只能从病人和非病人2个总体中抽样,则必须了解目标人群中所论疾病的患病率(P0),将3者结合才能算出阳性预测价值和阴性预测价值。第七十六页,共九十四页,编辑于2023年,星期五三、相对数的应用
例35
《体外循环术后消化道出血的观察及护理》(实用护理杂志,1992,5:25)一文中的临床资料叙述:“消化道出血共13例,男性9例,女性4例....死亡3例,死亡率23%....”评述35:
文中所说的死亡率,实际上是病死率。原作者在分析资料时,将死亡率与病死率相混淆。第七十七页,共九十四页,编辑于2023年,星期五
例36
《脑出血病人的护理体会》(实用护理杂志,1985,10:15)一文中:“本组33例脑出血病人,男性19例,占56.7%;女性42.4%,……,其年龄组,30岁以下的5例,占15.2%;60岁以下的12例,占36.4%;70岁以下的9例,占27.3%;70岁以上的7例,占21.2%。……以上提示,年龄组大者脑出血的发病率高,而40岁以上者脑出血发病率低……”。第七十八页,共九十四页,编辑于2023年,星期五评述36:
上述相对数都是构成比指标而不是率的指标,作者犯有“以比当率”的错误。发病率表示一定时期(年、季、月等)内某人群中新发生某种病例的频率,在医院内是无法得到发病率的。上述资料只能反映33例脑出血患者中不同性别、不同年龄的比重。第七十九页,共九十四页,编辑于2023年,星期五例37
《使用保留针头取血方法的探讨》(实用护理杂志.1985,1:22)一文中报导,5种不同情况进行肝素头皮针注射,观察头皮针堵塞时间并计算了成功率。按第1种情况进行4例,成功3例,成功率75%;按第2种情况进行6例,成功4例,成功率66.7%……。第八十页,共九十四页,编辑于2023年,星期五评述37:成功率75%的含义应当是:平均100次实验,成功75次。显然要求计算成功率的分母不能太小。上述资料实验次数仅几例就计算成功率,结论似不可令人信服。须知,当分母较小时不宜计算相对数,只报告绝对数即可。第八十一页,共九十四页,编辑于2023年,星期五例38
在《35例多器官衰竭患者的监护》(实用护理杂志.1986,2(1):11)一文中报道,累及脏器数与死亡率:2个器官20例,死亡8例,死亡率40%,3个器官10例,死亡9例,死亡率90%,四个器官5例,死亡5例,死亡率100%。第八十二页,共九十四页,编辑于2023年,星期五
评述38:
文中的“死亡率”,实际上是“病死率”。病死率与死亡率虽然都是反映疾病严重程度的指标,但病死率是反映某种疾病患者中的死亡数,以百分率表示,而死亡率则反映社会人群中每1,000人中的死亡数,常以千分率表示。二者不能混淆。第八十三页,共九十四页,编辑于2023年,星期五例39
在《3019例溃疡病发病情况调查分析》(山东医药.1980,10:52)一文中,作者从本厂两个分厂共选择30
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 记账实操-合同履约保证金协议模板
- 2025企业制造工人劳动合同模板
- 2025园林绿化工程合同协议书模板
- 2025工程咨询居间合同
- 2025教育机构劳动合同协议样本
- 2025最正规的合同范本:保证合同示例
- 2025企业销售代表劳动合同
- 2025木材购销合同协议范本
- 8.1薪火相传的传统美德同步课件 2024-2025学年统编版道德与法治七年级下册
- 《术后常见并发症解析》课件
- 无人机法律法规知识考核试题及答案
- 2024年广东省梅州市中考一模历史试题(无答案)
- 2024年北京铁路局集团招聘笔试参考题库含答案解析
- 前列腺癌2024治疗指南
- (正式版)YST 1682-2024 镁冶炼行业绿色工厂评价要求
- 2024-2029年中国形象设计行业发展分析及发展前景与投资研究报告
- 2024中国绿色甲醇产业研究与前景展望-云道资本
- 1500万吨-年炼化一体化项目环评
- 500字作文标准稿纸A4打印模板-直接打印
- 儿童康复家庭指导培训课件
- 单元2-任务3 水利工程年运行费及年费用计算
评论
0/150
提交评论