中医药论文中常见统计学分析方法应用错误辨析_第1页
中医药论文中常见统计学分析方法应用错误辨析_第2页
中医药论文中常见统计学分析方法应用错误辨析_第3页
中医药论文中常见统计学分析方法应用错误辨析_第4页
中医药论文中常见统计学分析方法应用错误辨析_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学论文中常用统计分析方法误用辨析医学统计学的地位医学统计学如今是热门科学。美国食物和药品管理局(Food and Drug Administration, FDA 和欧盟法规要求实验研究、临床研究、药物开发、医学杂志审稿、流行病学探索,以及政府制定有关政策的民意调查、数据分析、决策预测等都需要统计学家的直接参与。由统计学家指导研究设计、数据分析乃至准备呈递给FDA的报告。在我国,医学统计学也越来越受到学术界和有识之士的重视。医学统计学的地位医学论文中统计分析的应用现状在医学事业迅速发展的今天,医学研究论文已成为主要的交流方式。但医学论文中尚存在各种统计分析方法应用上的问题,统计学缺陷涉及面:

2、国外约50%,国内80%以上。主要有:研究设计不合理(设计水平低下;分析方法选用不得当(方法使用错误;应用条件不遵循;样本含量不满足统计学要求;结果解释不合理(推断过于肯定;统计报告(报告项目不全。由于计算机应用的普及和统计分析软件的发展,统计分析的过程和步骤主要由统计软件实现,随之普遍出现乱用计算机统计软件现象。不管统计分析方法的前提条件是否満足,将数据直接代入计算机软件中,使得出的结果与实际相差甚远。现有的统计软件使用不太方便,造成用户的误用。作为医学学术刊物的主要读者一定要正确地评价、参考和利用这些发表的医学论著。中国医学杂志的调查结果中国医学杂志近800种,其中代表医学最高水平的中华、

3、中国系列杂志近百种。据统计:中华系列医学杂志发表的论文中有统计问题或错误的达到70%。国际著名医学杂志有统计问题或错误也达50%。-<医学统计学基础与典型错误辨析>(胡良平主编军事医科院出版2003年国外权威医学期刊调查结果Glantz调查了1977年Circulation Research和Circulation杂志中发表的文章,在使用统计学方法的文章中具有统计学问题或错误的分别有61%和44%。Kanter等调查了1992年至1993年Transfusion杂志发表的文章,发现75%的文章至少存在一处统计问题或错误。国内外调查结果显示30年前,美国医学杂志(JAMA一位编审曾说

4、:¡°医学论文作者统计知识和统计水平低下¡±。近30年来,临床医学论著中统计应用缺陷没有发生根本改善,误用率仍很高。误用统计分析方法的原因我国很多企业投入上千万资金进行计算机数据平台建设,但投入数据统计分析方面很少。其结果是获得的只是一些简单的报表,有价值的信息很少。-中科院张永光教授2. 统计学教学观念和方法落后教学与实际应用结合少;教学中结合软件授课少;教学人员较少参与医学研究设计、质控、数据管理和分析等;教学难以紧跟上统计分析方法与统计软件的发展速度。3.计算机统计软件应用问题“计算机软件给统计学带来了革命性的变化”,但对于同一份数据资料,统计学可

5、提供多种不同的分析方法,应用各种分析方法都有一定的前提条件,采用不同方法所得到的结果不完全相同。对于研究者来说,重要的是明确研究设计的类型、判别数据资料的分类、选择恰当的统计分析方法、遵循统计分析方法的应用条件、应用软件实现统计分析、对分析结果的正确解释和表达,则完全依赖于应用者所掌握的统计知识。误用统计分析方法的原因不少研究者曾多次学习医学统计学课程,但仍然对统计学知识理解很模糊。 有的学生医学统计学成绩很好,但是遇到很简单的实际问题也不会解决。医学论文中常用的统计分析方法误用辨析一、实验设计存在的典型错误二、计量资料分析常见的统计问题三、计数资料分析常见的统计问题四、直线相关与回归分析常见

6、统计错误五、统计分析方法表述问题六、统计表与统计图方面的问题七、多元回归分析一、实验设计存在的典型错误1.1 没有遵循随机原则1.2 缺乏对照组1.3 对照不全1.4 实验分组不合理1.5 没有按设计类型进行实验和收集数据1.6 组间基线资料的均衡性检验1.7 用¡°重复取样¡±替代¡°独立重复实验¡±1.8 样本含量过少1.1没有遵循随机原则1.2 缺乏对照组1.3 对照不全文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。设计:3个实验分组:1.模型组加入50g/L重组人表皮生长因子(rhEGF;2.姜黄素(C

7、ur组加入终浓度为10g/L的Cur和50g/LrhEGF;3.空白对照组加入等体积硝酸盐缓冲液。请问:此设计正确吗?1.4 实验分组不合理文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。问题:作者选取2002年12月2004年5月住院治疗的恶性肿瘤患者86例,其中男46例,女40例;年龄2669岁,平均53岁;其中肺癌26例,大肠癌22例,鼻咽癌16例,乳腺癌12例,卵巢癌6例,恶性淋巴瘤4例。采用随机交叉试验设计,将86例患者随机等分成A、B两组。请问:此设计正确吗?辨析:作者所选取的恶性肿瘤患者在病种方面差异较大,各病种的样本含量相差较大,且年龄跨度较大,不能认为他们来自于同一个

8、总体。把他们随机分入试验组和对照组参加试验,两组之间的可比性可能很差,其结论的可信度很低。正确的做法:按6种疾病分层随机化,同时考虑年龄、性别、病情等非处理因素的组间均衡性,尽可能使组间非处理因素达到比较高均衡性。文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。作者采用交叉实验设计,获得的实验数据见表1。请问:这样做正确吗?辨析:作者没有按照交叉实验设计的要求收集数据。没有将各组两阶段的数据分列出来,而是简单地将试验组第1周期的数据和对照组第2周期的数据合并成试验周期(A 为:参芪扶正注射液联合化疗所得的数据,将试验组第2周期的数据和对照组第1周期的数据合并成对照周期(B为:单纯化疗所

9、得的数据,并按照化疗后的5个时间点将数据列表。这种列表方式掩盖了交叉设计中不同试验顺序和不同阶段各自总体间可能存在的差异,也就达不到交叉设计的目的。事实上,该文中的试验设计类型更像重复测量设计。1.6 组间基线资料的均衡性检验文题:止痛如神汤对慢性非特异性溃疡性直肠炎的临床疗效组间均衡性检验:破盲后经比较试验前两组间性别、年龄、病程、病情、临床类型构成等,认为两组基线特征均衡性好,具有可比性,见表2。请问:下表是否有不妥之处?辨析:1.年龄和病程资料为数值变量资料,作者将数值变量资料转化为等级资料,这个转化过程损失样本信息。可直接根据资料是否满足参数检验的条件,可用参数检验,如不满足则用非参数

10、检验。2.没有提供假设检验的统计量和P值。3.本资料按照性别、年龄、病程、病情、临床类型等分层后,各个格子中的实际数较小,样本是否具有代表性?应根据本研究的主要指标估算样本量,以满足统计学要求。4.当样本较少的成组设计资料比较时,若检验结果为P>0.05时,可能是由于样本量不满足统计学的要求,而导致检验效能低下。最好的办法是增加样本量。1.7用¡°重复取样¡±替代¡°独立重复实验¡±文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三

11、代细胞进行实验。实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。请问:此设计正确吗?辨析:文章中没有描述实验采集了多少只健康小牛。如果作者取1只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成了3组所用的处理液,每份处理液再等分成6份,则犯了用¡°重复取样¡±替代¡°独立重复实验¡±的错误;同样,若作者取3只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成3组所用的处理液,每份处理液再等分成6份,亦属重复取样。只有当作者取自18只健康小牛眼晶状体的混合消化液,进行相关培养后,随机分配至3组

12、中,进行有关实验处理,才是正确运用了重复原则。1.8 样本含量过少文题:芪众颗粒预防老年人上呼吸道感染临床研究问题:三组之间证型分布比较,经R×C卡方检验,无统计学意义,具有可比性(2=0.809,P>0.05,排前三位的证型依次为:脾肺气虚(62.42%,脾肾阳虚(17.45%,心脾两虚(6.71%,见表3。1.8 样本含量过少辨析:本资料中有一个格子的理论数小于1,说明本资料不可以做R×C卡方检验,而应该做R×C的fisher¡¯s确切概率法。本资料很多格子的实际数小于5,应增加样本量。作者设空白对照组(即观察期间忌服任何预防药物或采

13、用任何预防方法,这是临床试验疗效评价的医学伦理学不应许的!国家临床试验规范中要求,临床疗效研究的对照组一般采用目前公认的有效治疗法或有效的常规治疗法。对于确定新药疗效评价可以用安慰剂对照。假设检验做等效性检验、非劣效性检验或优效性检验。设置空白对照组只有在动物研究中。二、计量资料分析常见的统计问题2.1 忽视t检验的前提条件2.2 误用成组设计资料的t检验分析配对设计资料2.3 忽视方差分析的前提条件2.4 误用t检验分析等级资料2.5 误用t检验处理重复测量的两因素试验设计2.6 误用配对设计资料的t检验处理单因素k(k>3水平设计的资料2.7 多因素非平衡组合设计的统计错误2.8 正

14、确处理析因设计或嵌套设计定量资料2.1 忽视t检验的前提条件文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?2.3 忽视方差分析的前提条件辨析:此实验分3组,应为单因素三水平设计定量资料,应首先进行¡°独立性¡±、¡°正态性¡±和¡°方差齐性¡±检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P<0.05,则进行多组均数间的多重比较。给出确切的统计量和P值。2.4

15、误用t检验分析等级资料文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验2.4 误用t检验分析等级资料2.4 误用t检验分析等级资料辨析:对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。 分析¡°总评分¡±时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。与对照组(G2比较,P>0.05,组间差异无统计学意义,不必在备注中表示。应写出确切的统计量和P值。2

16、.5 误用t检验处理重复测量的两因素试验设计1文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。 设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次/d,10d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。请问:统计分析方法选用t检验正确吗?辨析:1.统计分析错误本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试

17、验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。原文题目:¡°莪术对大鼠在体子宫肌电活动的影响及其机制研究¡±,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml/kg鼠重分别灌服25%、50%、100%莪术水煎液分成3组。观察

18、每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。辨析:没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnett t检验或LSD检验。如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。2.7多因素非平衡组合设计的统计错误1文题:某研究者研究A药对高脂血症性脂肪肝

19、大鼠的作用设计:建立高脂血症性脂肪肝大鼠模型,以高、中、低剂量去脂胶囊进行干预,通过血液生化检查,观察其对脂肪肝大鼠血脂的影响。结果:去脂胶囊能明显降低脂肪肝大鼠血脂,与对照组比较差异有显著性意义(P<0.05。结论:去脂胶囊对大鼠脂肪肝有肯定治疗作用。2.7多因素非平衡组合设计的统计错误1表1 各组大鼠血清脂质比较(均数±标准差 mmol¡¤L-1辨析1:统计学上所讲的¡°因素¡±是指¡°同质的实验条件¡±,¡°水平¡±则是在¡

20、°量¡±上有一些差异。将水平与因素混合进行分析是完全错误的。注意:在进行多重比较时,由于比较的组数不同,SNK-q检验的q值、卡方检验的2值、秩和检验的u值会得到不同的结果。尤其是2检验和秩和检验,其多重比较的检验水准的取值为=/K(K为比较的次数,将水平与因素混合进行分析必然会增多比较的次数,取值过小,导致本来有统计学意义的两组比较则可能会没有统计学意义。本实验设计是一个不标准的设计类型。但是,不标准的设计类型并不是不科学的设计方案,经过梳理,可以进行适当的重新组合,进行统计分析。当然,按照统计学的要求,这种组合设计应该确立在实验的设计阶段,而不是在实验数据得出

21、之后。辨析2:如果研究者的目的是为了考察A药高、中、低3个剂量组是否有效,及确定最佳治疗剂量。实验设计仍按上述方案分为5组,而统计设计可按如下组合进行分析:组合1:A药低剂量组、甲硫氨酸片组、自然恢复组组合2:A药中剂量组、甲硫氨酸片组、自然恢复组组合3:A药高剂量组、甲硫氨酸片组、自然恢复组组合4:A药低剂量组、A药中剂量组、A药高剂量组组合1、2、3的目的是观察A药高、中、低3个剂量组是否有效,及其与甲硫氨酸片组阳性对照组的相对疗效。组合4的目的是通过A药高、中、低3个剂量组之间的疗效差异比较,考察是否可以筛选出最佳治疗剂量。2.7多因素非平衡组合设计的统计错误2某研究者欲研究乳宁方及其拆

22、方药物血清对体外细胞侵袭能力的影响,选用SD大鼠24只,等分成6组:正常对照组、乳宁方治疗组(可拆解为温肾方+疏肝活血方、温肾方治疗组、疏肝活血方治疗组、三苯氧胺治疗组、环磷酰胺治疗组,分别接受相应药物的灌胃或注射,然后在末次给药后进行主动脉采血,制成相应药物的血清。进行体外MDA-MB-435细胞侵袭能力试验,见表6。若采用单因素六水平定量资料方差分析处理此资料正确吗?2.7多因素非平衡组合设计的统计错误2辨析1:表6中¡°组别¡±看上去像一个试验因素,共有6个水平,其实是错误的。因为乳宁方可拆解为温肾方+疏肝活血方,所以试验涉及到¡

23、6;温肾方用否¡±、¡°疏肝活血方用否¡±、¡°三苯氧胺用否¡±、¡°环磷酰胺用否¡±这样4个试验因素,而表6中的6个组并非是这4个试验因素的全面组合。本资料应为多因素非平衡组合试验下的定量资料,直接使用单因素多水平设计定量资料方差分析对其进行处理是错误的,应根据专业知识和统计知识对¡°组别¡±进行合理拆分。2.7多因素非平衡组合设计的统计错误2辨析2:本资料可拆分为:组合1:正常对照组、乳宁方治疗组、温肾方治疗组、

24、疏肝活血方治疗组;组合2:正常对照组、乳宁方治疗组、三苯氧胺治疗组、环磷酰胺治疗组。组合1为2×2析因设计,可根据资料是否满足方差分析的前提条件选用两因素析因设计定量资料方差分析或对原始定量资料进行变量变换或直接采用两因素析因设计定量资料秩和检验。组合2为单因素同水平设计,可根据资料是否满足方差分析的前提条件,选用单因素同水平设计定量资料方差分析处理或对原始定量资料进行变量变换或直接采用单因素同水平设计定量资料秩和检验。2.7多因素非平衡组合设计的统计错误3文题:开胃理脾口服液对脾虚小鼠肠功能的影响。实验设计:70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理盐水,其余

25、各组用大黄水造成脾虚模型。停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第35组给含10%炭末的不同剂量的开胃理脾口服液,第6 组给含10%炭末的开胃理脾丸剂,第7 组给含有10%炭末的儿康宁。给药30min 后处死小鼠,测量并计算炭末在小肠内的推进百分率。具体剂量和推进率见下表。2.8 正确处理析因设计或嵌套设计定量资料文题:丹参对骨骼肌缺血再灌注损伤低氧诱导因子一lmRNA表达和血液流变学的影响设计:研究者将66只SD大鼠随机抽取6只作为正常组,对照组(即模型组和丹参组各30只,此两组造模后分别取l0、20、40、60、90 min 5个时点进行观测,每个时点上6只,处死后测量相

26、应的指标,丹参对骨骼肌缺血再灌注损伤肌肉肿胀系数的影响见表8。2.8 正确处理析因设计或嵌套设计定量资料辨析:对照组和丹参组在每个时间点上分别处死6只大鼠,所以在5个时间点上测量的数据没有内在关联,此资料不是重复测量设计定量资料。表8是两个试验因素(¡°是否用丹参¡±和¡°处死时间¡±各水平的全面组合。 若无专业依据认为两个试验因素对观测指标¡°肌肉肿胀系数¡±的影响存在主次之分,则此资料应为两因素析因设计定量资料。在资料满足方差分析的条件时,可采用两因素析因设计的方差分析;

27、当资料不满足方差分析时,可进行变量变换或采用秩和检验。若有专业依据认为两个试验因素对观测指标¡°肌肉肿胀系数¡±的影响存在主次之分,则此资料应为两因素嵌套设计定量资料。在资料满足方差分析的条件时,可采用两因素嵌套设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。三、计数资料分析方法的常见问题3.1 计算相对数时分母太小3.2 误用 2 检验分析结果变量为有序变量的资料3.3 误用2检验回答相关性问题3.4 多值有序变量的高维列联表资料3.5 不满足连续性2检验条件时未做校正3.6 十一种形式的列联表3.7 误用2检验取代Fisher精

28、确检验(未举例说明3.8 对R×C表直接分割进行两两比较(未举例说明3.1 计算相对数时分母太小文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何不妥之处?3.2 误用 2 检验分析结果变量为有序变量的资料某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经R×C表2检验,2=53.33 ,P <0.01 ,认为两组疗效之间的差异有统计学意义。3.3 误用2检验回答相关性问题上述资料用2检验得:2 =163.01,P<0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可

29、见冠状动脉硬化等级有随年龄增高而增加的趋势。问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?辨析1:本资料为¡°双向有序且属性不同的二维列联表资料¡±,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。分析两者间是否存在线性变化趋势则应用线性趋势检验。作者欲考察¡°两个有序变量之间是否呈相关关系¡±,而2检验结果是P<0.05,说明冠状动脉硬化患者在不同

30、年龄组的人数分布是不同的。事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的2检验的统计量数值是不会变化的,说明2检验用于处理有序变量形成的二维列联表资料是不合适的。辨析2:欲考察¡°两个有序变量之间是否呈相关关系¡±,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。本例采用Spearman秩相关分析,得:r s=0.53215,P<0.0001。结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计学意义。3.4 多值

31、有序变量的高维列联表资料¡°创伤性上颈椎损伤早期漏诊原因分析¡±中对1994年至2003年治疗的58例上颈椎患者进行回顾性分析,男35例,女23例,接受手术治疗或非手术治疗,假设两治疗组患者在年龄、性别、损伤类型构成无统计学差异。治疗结果见表l1。请问:能否以¡°损伤类型¡±为依据,将此资料切割成多个二维列联表,一一采用秩和检验进行分析?或者通过求和,将¡°损伤类型¡±这个变量合并掉,采用秩和检验进行分析?3.4 多值有序变量的高维列联表资料该资料原因变量有两个,分别为

32、61;°损伤类型¡±和¡°治疗方式¡±,均为名义变量,结果变量为¡°疗效¡±,因此该资料属于结果变量为多值有序变量的三维列联表资料。以¡°损伤类型¡±为依据,人为地将此资料切割成多个二维列联表,一一采用秩和检验进行分析,这是用单因素分析法来处理同时受多个因素影响的定性资料,割裂了多因素之间的相互联系,易得出错误的结论。通过求和,将¡°损伤类型¡±这个变量合并掉,采用秩和检验进行分析,这是对高维列联表的

33、61;°压缩¡±。但这种¡°压缩¡±不是总可套用的,仅当被合并掉的那个变量与保留下来的变量之间都是相互独立的关系时,才不会得出错误的结论。正确做法:本资料应采用CMH校正的秩和检验,此法通过加权的方法消除掉一个原因变量,着重研究另一个原因变量取不同水平条件下有序结果之间的差别是否具有统计学意义;若希望将两个原因变量对有序结果变量的影响都明确地显示出来,建议选用有序变量的多重logistic回归分析。3.5 不满足连续性2检验条件时未做校正11种形式的列联表四、直线相关与回归分析常见错误(1脱离专业知识,盲目进行直线相关与回归

34、分析;(2对资料中因¡°过失误差¡±造成的错误视而不见,盲目进行统计计算得出违背专业知识的结论;(3将数据直接录入计算机,调用统计软件快速得出计算结果,作出结论;(4对于仅在统计学上有意义的计算结果,盲目给出专业上的¡°肯定结论¡±,但结论经不起实践的检验。五、统计分析方法表述问题1辨析:从该表述中只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号;更未体现出文中资料所对应的实验设计类型和所采用的具体统计分析方法。辨析:从该表述中只能得知作者处理定量资料用了方差分析,至于这些统计分析方法的

35、选用是否正确,则不得而知。通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的t检验有3种,方差分析有10种之多,他们之间的本质区别体现在定量资料所对应的¡°实验设计类型¡±上。在表述统计学方法时,应将所用方法写完整,即在统计分析方法前冠以实验设计文题:电针对大鼠不稳定膀胱逼尿肌及膀胱颈氮能神经递质的影响。实验数据见表 2 。这张统计表编制得正确吗? 文题:原发性肝癌患者和健康人¡°正常舌象¡±的对比研究。原作者对原发性 肝癌组和健康人组¡°正常舌象¡±舌苔脱落

36、细胞进行比较,研究结果见表 3。这张 统计表编制正确吗? 辨析: 表中角化前细胞、角化细胞和超角化细胞的含义似乎应为其各自的细胞数占每个 个体脱落细胞染片中细胞总数的百分比,原表题目应改为:原发性肝癌组和健康人 组¡°正常舌象¡±舌苔脱落细胞的构成及成熟指数的比较,这样才能使表中数据的 具体含义看起来清晰明了。 原表在 3 种细胞后加上%,似乎想告诉读者下面的数据含义是个比,实际上不但没 有起到辅助说明数据含义的目的,反而¡°画蛇添足¡±,让人更加不理解。因为各 细胞所占的百分比合计应为 100%, 而原表中原发性

37、肝癌组和健康人组中各细胞的均 数之和确实为 1,但原作者在 3 个细胞变量之后加上%,反而使各细胞所占的百分比 都成了实际的 1%, 可去掉上面变量之后的%或将表中 3 个细胞变量下的数据同乘 100。 6.2 统计图存在的问题 七、多元回归分析 Y在疾病预后因素的研究中,往往涉及到多个因素。结局的产生不是孤立的,各因 素之间往往相互影响,可以相互协同或拮抗。通常需要进行单因素的分析,从许多 的临床指标中筛选出若干个真正与预后相关的因素。 Y预后因素的研究,如果只用单因素分析,往往会产生混杂偏倚。所以应该采用多 因素分析的方法,以校正各因素之间的相互混杂。 2 Y不少发表的论文,只用 检验进行

38、单因素分析,虽然没有犯原则性的错误,但如 果能用多因素分析的方法进行筛选,校正混杂因素的影响,结果将会可靠得多。 Y由于多因素之间的相互混杂,在单因素分析中,一些有意义的因素可能无统计学 意义,而另一些没有意义的因素却有统计学意义。 Logistic 回归与 COX 比例回归模型 _如果时间因素不重要时,可以建立 Logistic 回归模型。 _COX 回归与 Logistic 回归的主要区别: COX 回归与时间有关, Logistic 回归与时间无关 COX 回归计算 RR 值, Logistic 回归计算 OR 值 在建立回归模型时: ²要先对各个研究因素进行单因素分析。初步筛

39、选出可能与预后有关的因素; 去除那些根本不可能相关的因素,以减少建立多元回归模型时自变量的个数。 ²对于连续性的数值变量和有明确等级关系的有序分类变量,可以直接进行回归分 析; ²无序分类变量和等级关系不太明确的有序分类变量,则须采用分层回归分析的方 法。 ²在建立多元回归方程时,结合专业知识将可能有关的因素,均可作为自变量引入 回归方程中筛选。待选变量的标准应该放宽一些,以免遗漏那些由于混杂的影响, 导致在单因素分析中无统计学意义的有意义因素。 分析协同时: ²分析某两个或多个因素对结局的影响有无协同。可以将两个变量相乘合并为一个 变量,与原来的两个变量一起放入回归方程中去筛选,如果方程能接受这个新的变 量,则提示这两个变量具有协同作用。 回归系数、标准偏回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论