课件:医学论文中常用统计分析方法错误大全副本.ppt_第1页
课件:医学论文中常用统计分析方法错误大全副本.ppt_第2页
课件:医学论文中常用统计分析方法错误大全副本.ppt_第3页
课件:医学论文中常用统计分析方法错误大全副本.ppt_第4页
课件:医学论文中常用统计分析方法错误大全副本.ppt_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学论文中常用的统计分析方法误用辨析,一、实验设计存在的典型错误 二、计量资料分析常见的统计问题 三、计数资料分析常见的统计问题 四、直线相关与回归分析常见统计错误 五、统计分析方法表述问题 六、统计表与统计图方面的问题 七、多元回归分析,1.1 没有遵循随机原则 1.2 缺乏对照组 1.3 对照不全 1.4 实验分组不合理 1.5 没有按设计类型进行实验和收集数据 1.6 组间基线资料的均衡性检验 1.7 用“重复取样”替代“独立重复实验” 1.8 样本含量过少,一、实验设计存在的典型错误,1.1没有遵循随机原则,问题: 某研究者人为地选择发病在5d以内的病人进入治疗组,而对照组则没此限制。,辨析: 根据常识,早期治疗对疾病的预后具有重要影响,往往具有较高的治愈率和较低的病死率。治疗组和对照组由于人为因素的干扰和影响,在“病程”这一重要的非实验因素上并没有达到均衡,不具有可比性。 在制定实验设计方案时,应将重要的非实验因素考虑在内,用随机化法使各组病人在重要的非处理因素方面尽量达到均衡一致,以便提高组间的可比性。 正确的做法:对病程不做限制或均选择发病在5d之内的病人,在实验分组时遵循随机的原则,减少人为因素的影响,使入选的任何一个病人有相同的机会进人治疗组和对照组。,1.2 缺乏对照组,问题: 某作者对64例银屑病患者进行血型观察,其中O型血30例,A型血17例,B型血17例,AB型血0例。没有进行统计分析,仅凭数字大小,认为银屑病的发病与血型有明显的关系,同时也证实了遗传致病的决定意义。,辨析: 正常人群中的血型构成存在较大差异,AB型的比例为最少,作者没有对正常人群的血型分布情况进行调查,仅根据自己调查的银屑病人血型构成相差悬殊的情况,并不能说明银屑病人与正常人群在血型构成上存在差异,作出结论也是没有说服力的。 正确的做法: 应设正常对照组,调查正常人群的血型分布情况,并与银屑病人的血型分布情况对照不全进行比较,如果存在差异,则为银屑病的发病因素提供了某种线索,如果没有差异,则可以认为银屑病发病与血型构成没有关系。,1.3 对照不全,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。 设计:3个实验分组: 1.模型组加入50gL重组人表皮生长因子(rhEGF); 2.姜黄素(Cur)组加入终浓度为10gL的Cur和50gLrhEGF; 3.空白对照组加入等体积硝酸盐缓冲液。 请问:此设计正确吗?,辨析: 本实验实际上涉及了“rhEGF用否”、“Cur用否”两个实验因素。正确的实验设计应是这两个实验因素的全面组合,所以应设4个组(22析因设计)。 作者仅设立3个组,缺了1个单用10gLCur的实验组,犯了“对照不全”的错误。,1.4 实验分组不合理,文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。 问题:作者选取2002年12月2004年5月住院治疗的恶性肿瘤患者86例,其中男46例,女40例;年龄2669岁,平均53岁;其中肺癌26例,大肠癌22例,鼻咽癌16例,乳腺癌12例,卵巢癌6例,恶性淋巴瘤4例。采用随机交叉试验设计,将86例患者随机等分成A、B两组。 请问:此设计正确吗?,辨析: 作者所选取的恶性肿瘤患者在病种方面差异较大,各病种的样本含量相差较大,且年龄跨度较大,不能认为他们来自于同一个总体。 把他们随机分入试验组和对照组参加试验,两组之间的可比性可能很差,其结论的可信度很低。 正确的做法:按6种疾病分层随机化,同时考虑年龄、性别、病情等非处理因素的组间均衡性,尽可能使组间非处理因素达到比较高均衡性。,1.4 实验分组不合理,文题:参芪扶正注射液联合化疗治疗恶性肿瘤86例临床观察。作者采用交叉实验设计,获得的实验数据见表1。 请问:这样做正确吗?,1.5 没有按设计类型进行实验和收集数据,辨析: 作者没有按照交叉实验设计的要求收集数据。没有将各组两阶段的数据分列出来,而是简单地将试验组第1周期的数据和对照组第2周期的数据合并成试验周期(A为:参芪扶正注射液联合化疗所得的数据),将试验组第2周期的数据和对照组第1周期的数据合并成对照周期(B为:单纯化疗所得的数据),并按照化疗后的5个时间点将数据列表。 这种列表方式掩盖了交叉设计中不同试验顺序和不同阶段各自总体间可能存在的差异,也就达不到交叉设计的目的。 事实上,该文中的试验设计类型更像重复测量设计。,1.5 没有按设计类型进行实验和收集数据,1.6 组间基线资料的均衡性检验,文题:止痛如神汤对慢性非特异性溃疡性直肠炎的临床疗效 组间均衡性检验:破盲后经比较试验前两组间性别、年龄、病程、病情、临床类型构成等,认为两组基线特征均衡性好,具有可比性,见表2。 请问:下表是否有不妥之处?,辨析: 1.年龄和病程资料为数值变量资料,作者将数值变量资料转化为等级资料,这个转化过程损失样本信息。可直接根据资料是否满足参数检验的条件,可用参数检验,如不满足则用非参数检验。 2.没有提供假设检验的统计量和P值。 3.本资料按照性别、年龄、病程、病情、临床类型等分层后,各个格子中的实际数较小,样本是否具有代表性?应根据本研究的主要指标估算样本量,以满足统计学要求。 4.当样本较少的成组设计资料比较时,若检验结果为P0.05时,可能是由于样本量不满足统计学的要求,而导致检验效能低下。最好的办法是增加样本量。,1.6 组间基线资料的均衡性检验,1.7用“重复取样”替代“独立重复实验”,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。 问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。 实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。 请问:此设计正确吗?,辨析: 文章中没有描述实验采集了多少只健康小牛。 如果作者取1只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成了3组所用的处理液,每份处理液再等分成6份,则犯了用“重复取样”替代“独立重复实验”的错误;同样,若作者取3只健康小牛晶状体的混合消化液消化后培养,加入不同药物,制成3组所用的处理液,每份处理液再等分成6份,亦属重复取样。 只有当作者取自18只健康小牛眼晶状体的混合消化液,进行相关培养后,随机分配至3组中,进行有关实验处理,才是正确运用了重复原则。,1.7 用“重复取样”替代“独立重复实验”,1.8 样本含量过少,文题:芪众颗粒预防老年人上呼吸道感染临床研究 问题:三组之间证型分布比较,经RC卡方检验,无统计学意义,具有可比性(20.809,P0.05),排前三位的证型依次为:脾肺气虚(62.42%),脾肾阳虚(17.45%),心脾两虚(6.71%),见表3。,表3 三组证型之间比较,辨析: 本资料中有一个格子的理论数小于1,说明本资料不可以做RC卡方检验,而应该做RC的fishers确切概率法。本资料很多格子的实际数小于5,应增加样本量。 作者设空白对照组(即观察期间忌服任何预防药物或采用任何预防方法),这是临床试验疗效评价的医学伦理学不应许的!国家临床试验规范中要求,临床疗效研究的对照组一般采用目前公认的有效治疗法或有效的常规治疗法。对于确定新药疗效评价可以用安慰剂对照。假设检验做等效性检验、非劣效性检验或优效性检验。 设置空白对照组只有在动物研究中。,1.8 样本含量过少,二、计量资料分析常见的统计问题,2.1 忽视t检验的前提条件 2.2 误用成组设计资料的t检验分析配对设计资料 2.3 忽视方差分析的前提条件 2.4 误用t检验分析等级资料 2.5 误用t检验处理重复测量的两因素试验设计 2.6 误用配对设计资料的t检验处理单因素k(k3)水平设计的资料 2.7 多因素非平衡组合设计的统计错误 2.8 正确处理析因设计或嵌套设计定量资料,2.1 忽视t检验的前提条件,文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?,辨析: 1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。 正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验,否则,采用非参数检验。 2.给出确切的统计量和P值。,2.2 误用成组设计资料的t检验分析配对设计资料,辩析: 1.考虑到对数据进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。 但本研究是配对设计,如果采用成组t检验,会降低检验效率。应该采用配对t检验进行分析。注意配对t检验的条件:要对每对数据的差值(d)进行正态性检验。如果不满足,改用Wilcoxon符号秩检验。 2.应给出确切的统计量和P值。,2.2 误用成组设计资料的t检验分析配对设计资料,2.3 忽视方差分析的前提条件,确切的统计量和P值,文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。 问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。 实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。 请问:采用方差分析正确吗?,均数标准差?,辨析: 此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P0.05,则进行多组均数间的多重比较。 给出确切的统计量和P值。,2.3 忽视方差分析的前提条件,2.4 误用t检验分析等级资料,文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验,表4 两组临床主要症状和结肠镜肠粘膜病变评分( ),:与对照组(G2)比较,P0.05,组间差异无统计学意义;:与治疗前比较,P0.05,组内差异有统计学意义;:与对照组(G2)比较,P0.05,组间差异有统计学意义;,2.4 误用t检验分析等级资料,辨析: 对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。 分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。 与对照组(G2)比较,P0.05,组间差异无统计学意义,不必在备注中表示。 应写出确切的统计量和P值。,2.4 误用t检验分析等级资料,2.5 误用t检验处理重复测量的两因素试验设计1,文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成 统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。,辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。 在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。,文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。 设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次d,10d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。 请问:统计分析方法选用t检验正确吗?,2.5 误用t检验处理重复测量的两因素试验设计2,确切的统计量和P值。,辨析: 1.统计分析错误 本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。 正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。,2.5 误用t检验处理重复测量的两因素试验设计2,原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10mlkg鼠重灌服生理盐水,莪术组:按10mlkg鼠重分别灌服25 、50 、100莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。,表 莪术水煎剂对大鼠子宫肌电活动的影响(均数标准差),2.6 误用t检验处理单因素k(k3) 设计的资料,辨析: 没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。 本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。 措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnett t检验或LSD检验。 如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。,2.6 误用配对设计资料的t检验 处理单因素k(k3)水平设计的资料,2.7多因素非平衡组合设计的统计错误1,文题:某研究者研究A药对高脂血症性脂肪肝大鼠的作用 设计:建立高脂血症性脂肪肝大鼠模型,以高、中、低剂量去脂胶囊进行干预,通过血液生化检查,观察其对脂肪肝大鼠血脂的影响。 结果:去脂胶囊能明显降低脂肪肝大鼠血脂,与对照组比较差异有显著性意义(P0.05)。 结论:去脂胶囊对大鼠脂肪肝有肯定治疗作用。,表1 各组大鼠血清脂质比较(均数标准差) mmolL-1,与自然恢复组比较, P0.01, P0.05,与甲硫氨酸片组比较,P0.01 ,P 0.05;n=10,本设计方案,研究者将A药高、中、低3个剂量组与甲硫氨酸片组和自然恢复组按多因素一水平的统计方法进行方差分析。其各处理组间关系的实质是两个因素:A药治疗与甲硫氨酸片治疗,而A药高、中、低3个剂量组是A药的3个水平,而不是与甲硫氨酸片平等的3个因素。,2.7多因素非平衡组合设计的统计错误1,辨析1: 统计学上所讲的“因素” 是指“同质的实验条件”,“水平”则是在“量”上有一些差异。将水平与因素混合进行分析是完全错误的。 注意:在进行多重比较时,由于比较的组数不同,SNK-q检验的q值、卡方检验的2值、秩和检验的u值会得到不同的结果。尤其是2检验和秩和检验,其多重比较的检验水准的取值为 =K(K为比较的次数) ,将水平与因素混合进行分析必然会增多比较的次数,取值过小,导致本来有统计学意义的两组比较则可能会没有统计学意义。 本实验设计是一个不标准的设计类型。但是,不标准的设计类型并不是不科学的设计方案,经过梳理,可以进行适当的重新组合,进行统计分析。当然,按照统计学的要求,这种组合设计应该确立在实验的设计阶段,而不是在实验数据得出之后。,2.7多因素非平衡组合设计的统计错误1,辨析2: 如果研究者的目的是为了考察A药高、中、低3个剂量组是否有效,及确定最佳治疗剂量。实验设计仍按上述方案分为5组,而统计设计可按如下组合进行分析: 组合1:A药低剂量组、甲硫氨酸片组、自然恢复组 组合2:A药中剂量组、甲硫氨酸片组、自然恢复组 组合3:A药高剂量组、甲硫氨酸片组、自然恢复组 组合4:A药低剂量组、A药中剂量组、A药高剂量组 组合1、2、3的目的是观察A药高、中、低3个剂量组是否有效,及其与甲硫氨酸片组阳性对照组的相对疗效。 组合4的目的是通过A药高、中、低3个剂量组之间的疗效差异比较,考察是否可以筛选出最佳治疗剂量。,2.7多因素非平衡组合设计的统计错误1,某研究者欲研究乳宁方及其拆方药物血清对体外细胞侵袭能力的影响,选用SD大鼠24只,等分成6组:正常对照组、乳宁方治疗组(可拆解为温肾方+疏肝活血方)、温肾方治疗组、疏肝活血方治疗组、三苯氧胺治疗组、环磷酰胺治疗组,分别接受相应药物的灌胃或注射,然后在末次给药后进行主动脉采血,制成相应药物的血清。进行体外MDA-MB-435细胞侵袭能力试验,见表6。若采用单因素六水平定量资料方差分析处理此资料正确吗?,2.7多因素非平衡组合设计的统计错误2,辨析1: 表6中“组别”看上去像一个试验因素,共有6个水平,其实是错误的。 因为乳宁方可拆解为温肾方+疏肝活血方,所以试验涉及到“温肾方用否”、“疏肝活血方用否”、“三苯氧胺用否”、“环磷酰胺用否”这样4个试验因素,而表6中的6个组并非是这4个试验因素的全面组合。 本资料应为多因素非平衡组合试验下的定量资料,直接使用单因素多水平设计定量资料方差分析对其进行处理是错误的,应根据专业知识和统计知识对“组别”进行合理拆分。,2.7多因素非平衡组合设计的统计错误2,辨析2: 本资料可拆分为: 组合1:正常对照组、乳宁方治疗组、温肾方治疗组、疏肝活血方治疗组; 组合2:正常对照组、乳宁方治疗组、三苯氧胺治疗组、环磷酰胺治疗组。 组合1为22析因设计,可根据资料是否满足方差分析的前提条件选用两因素析因设计定量资料方差分析或对原始定量资料进行变量变换或直接采用两因素析因设计定量资料秩和检验。 组合2为单因素同水平设计,可根据资料是否满足方差分析的前提条件,选用单因素同水平设计定量资料方差分析处理或对原始定量资料进行变量变换或直接采用单因素同水平设计定量资料秩和检验。,2.7多因素非平衡组合设计的统计错误2,文题:开胃理脾口服液对脾虚小鼠肠功能的影响。 实验设计:70只小白鼠随机分为7组,每组10只,第1组为空白组,给等容生理盐水,其余各组用大黄水造成脾虚模型。 停食24h后,第1、2组静脉注射含有10%炭末的冷开水,第35组给含10%炭末的不同剂量的开胃理脾口服液,第6 组给含10%炭末的开胃理脾丸剂,第7 组给含有10%炭末的儿康宁。给药30min 后处死小鼠,测量并计算炭末在小肠内的推进百分率。具体剂量和推进率见下表。,2.7多因素非平衡组合设计的统计错误3,辨析: (1)实验设计各对比组间混乱。 各剂量组、儿康宁组与空白组是否具有可比性? 不同剂量的口服液、丸剂和儿康宁之间是否具有可比性? (2)分析方法误用。多次重复进行t检验,增大假阳性错误的概率。 (3)确切的统计量和P值。,原作者对各组数据采取成组t检验处理。开胃理脾口服液低、中、高剂量与模型组比较差异有统计学意义,提示本品具有促进小鼠小肠运动功能的作用,其作用强度较丸剂好。,2.7多因素非平衡组合设计的统计错误3,改进措施: (1)在分析时将实验拆分为: 组合1:空白组与模型组说明造模成功 组合2:模型组+低剂量组+中剂量组+高剂量组各剂量口服液都和模型组有差别,说明各剂量都有效;剂量之间也可进行比较 组合3:模型组+低剂量组+丸剂组+(同剂量的)儿康宁在相同剂量的情况下,口服液比丸剂和儿康宁都好 (2)第一组采用成组t检验分析。 其它组采用方差分析,如果方差分析各组间的差别具有统计学意义,再采用LSD-t(或Dunnett-t、SNK-q检验)进行专业上有意义的组间比较。,2.7多因素非平衡组合设计的统计错误3,2.8 正确处理析因设计或嵌套设计定量资料,文题:丹参对骨骼肌缺血再灌注损伤低氧诱导因子一lmRNA表达和血液流变学的影响 设计:研究者将66只SD大鼠随机抽取6只作为正常组,对照组(即模型组)和丹参组各30只,此两组造模后分别取l0、20、40、60、90 min 5个时点进行观测,每个时点上6只,处死后测量相应的指标,丹参对骨骼肌缺血再灌注损伤肌肉肿胀系数的影响见表8。,n=30,各时点ni=6,辨析: 对照组和丹参组在每个时间点上分别处死6只大鼠,所以在5个时间点上测量的数据没有内在关联,此资料不是重复测量设计定量资料。 表8是两个试验因素(“是否用丹参”和“处死时间”)各水平的全面组合。 若无专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素析因设计定量资料。在资料满足方差分析的条件时,可采用两因素析因设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。 若有专业依据认为两个试验因素对观测指标“肌肉肿胀系数”的影响存在主次之分,则此资料应为两因素嵌套设计定量资料。在资料满足方差分析的条件时,可采用两因素嵌套设计的方差分析;当资料不满足方差分析时,可进行变量变换或采用秩和检验。,2.8 正确处理析因设计或嵌套设计定量资料,3.1 计算相对数时分母太小 3.2 误用2 检验分析结果变量为有序变量的资料 3.3 误用2检验回答相关性问题 3.4 多值有序变量的高维列联表资料 3.5 不满足连续性2检验条件时未做校正 3.6 十一种形式的列联表 3.7 误用2检验取代Fisher精确检验(未举例说明) 3.8 对RC表直接分割进行两两比较(未举例说明),三、计数资料分析方法的常见问题,文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何不妥之处?,3.1 计算相对数时分母太小,辨析: 计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。 在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例数就可以。,确切的统计量和P值。,3.2 误用2 检验分析结果变量为有序变量的资料,某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经RC表2检验,2=53.33 ,P 0.01 ,认为两组疗效之间的差异有统计学意义。,辨析: 本资料属于单项有序的RC表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用RC的2检验,RC表2 检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,2值仍为53.33,不会有改变。,确切的统计量P值。,3.3 误用2检验回答相关性问题,上述资料用2检验得:2 =163.01,P0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。 问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?,表 不同年龄冠状动脉粥样硬化程度的分布,辨析1: 本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。 分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。 分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。 分析两者间是否存在线性变化趋势则应用线性趋势检验。 作者欲考察“两个有序变量之间是否呈相关关系”,而2检验结果是P0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。 事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的2检验的统计量数值是不会变化的,说明2检验用于处理有序变量形成的二维列联表资料是不合适的。,3.3 误用2检验回答相关性问题,辨析2: 欲考察“两个有序变量之间是否呈相关关系”,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。 本例采用Spearman秩相关分析,得:rs=0.53215,P0.0001。 结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计学意义。,3.3 误用2检验回答相关性问题,3.4 多值有序变量的高维列联表资料,“创伤性上颈椎损伤早期漏诊原因分析”中对1994年至2003年治疗的58例上颈椎患者进行回顾性分析,男35例,女23例,接受手术治疗或非手术治疗,假设两治疗组患者在年龄、性别、损伤类型构成无统计学差异。治疗结果见表l1。 请问:能否以“损伤类型”为依据,将此资料切割成多个二维列联表,一一采用秩和检验进行分析?或者通过求和,将“损伤类型”这个变量合并掉,采用秩和检验进行分析?,该资料原因变量有两个,分别为“损伤类型”和“治疗方式”,均为名义变量,结果变量为“疗效”,因此该资料属于结果变量为多值有序变量的三维列联表资料。 以“损伤类型”为依据,人为地将此资料切割成多个二维列联表,一一采用秩和检验进行分析,这是用单因素分析法来处理同时受多个因素影响的定性资料,割裂了多因素之间的相互联系,易得出错误的结论。通过求和,将“损伤类型”这个变量合并掉,采用秩和检验进行分析,这是对高维列联表的“压缩”。但这种“压缩”不是总可套用的,仅当被合并掉的那个变量与保留下来的变量之间都是相互独立的关系时,才不会得出错误的结论。 正确做法:本资料应采用CMH校正的秩和检验,此法通过加权的方法消除掉一个原因变量,着重研究另一个原因变量取不同水平条件下有序结果之间的差别是否具有统计学意义;若希望将两个原因变量对有序结果变量的影响都明确地显示出来,建议选用有序变量的多重logistic回归分析。,3.4 多值有序变量的高维列联表资料,辨析:,3.5 不满足连续性2检验条件时未做校正,11种形式的列联表,四、直线相关与回归分析常见错误,(1)脱离专业知识,盲目进行直线相关与回归分析; (2)对资料中因“过失误差”造成的错误视而不见,盲目进行统计计算得出违背专业知识的结论; (3)将数据直接录入计算机,调用统计软件快速得出计算结果,作出结论; (4)对于仅在统计学上有意义的计算结果,盲目给出专业上的“肯定结论”,但结论经不起实践的检验。,五、统计分析方法表述问题1,辨析: 从该表述中只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号;更未体现出文中资料所对应的实验设计类型和所采用的具体统计分析方法。,在统计学方法中注明“采用SPSS软件进行统计学处理”。此表述正确吗?,辨析: 从该表述中只能得知作者处理定量资料用了方差分析,至于这些统计分析方法的选用是否正确,则不得而知。 通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的t检验有3种,方差分析有10种之多,他们之间的本质区别体现在定量资料所对应的“实验设计类型”上。 在表述统计学方法时,应将所用方法写完整,即在统计分析方法前冠以实验设计名称,如配对设计定量资料的t检验、成组(或单因素两水平)设计定量资料的t检验或两因素析因设计定量资料的方差分析。,五、统计分析方法表述问题2,在统计学方法中注明“计量资料采用方差分析”。请问:此表述正确吗?,辨析: 事实上,定性资料通常可以编制成11种形式的列联表。在进行统计分析时,应针对不同形式的列联表、统计分析目的和资料实际具备的前提条件,选用相应的统计分析方法,不可随意盲目选用,更不应将2检验视为处理定性资料的万能工具。,五、统计分析方法表述问题3,定性资料一律采用2检验,对吗?,原文题目:补肾中药对去势后大鼠雌激素受体作用的实验研究。 设计与分析:作者将45只4月龄雌性SD大鼠随机分成正常对照组、模型组和补肾中药组,每组15只,观察补肾中药对血脂和雌二醇水平的影响,作者对同一组计量资料用均数标准差表达其分布,在未说明资料是否满足方差分析的情况下,直接用Wilcoxon检验作两组间比较,用Kruskal-wallis检验作多组间比较。 请问:这样做正确吗?,五、统计分析方法表述问题4,辨析:,原实验资料属单因素三水平设计定量资料,如资料符合方差分析的3个前提条件“独立性”、“正态性”和“方差齐性”,可采用单因素三水平设计定量资料的方差分析进行处理。如果3个条件不全满足,可采用非参数检验方法进行统计分析。 在资料符合方差分析3个条件时,一般不用非参数检验方法,因为可能会丢失很多有用的信息。 原作者没有说明资料是否符合方差分析的3个条件,就直接用Wilcoxon检验和Kruskal-Wallis检验等非参数方法,且在资料表达上,分布趋势用“均数标准差”形式表示,前后不吻合。 若资料不符合方差分析的3个条件,需采用非参数检验方法时,则在资料表达上,最好应采用“中位数(四分位间距)”的方式,保持资料表达与统计分析方法的一致。,五、统计分析方法表述问题4,许多论文中,当统计数据经假设检验后,P值仅仅列出P 0.05或P0.05 、P0.01便称结果无显著差异,或结果非常显著。,五、统计分析方法表述问题5,假设检验结果正确的表达方法是: 应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统计量,如2、t、u、F 值等)、P值;然后根据P值大小作出统计学推断,并作出相应的医学专业结论。,五、统计分析方法表述问题6,北京血液中心XXX主任介绍:香港医务人员用已康复者血浆治疗20例非典病人无一例死亡,而其对照组20例中,有3人死亡。这表明用康复病人血浆治疗非典病人是有效的。 -摘自2003.5.28 用康复病人血浆治疗非典病人真有效吗?,五、统计分析方法表述问题7,六、统计表与统计图方面的问题,6.1 统计表存在的问题 6.2 统计图存在的问题,文题:电针对大鼠不稳定膀胱逼尿肌及膀胱颈氮能神经递质的影响。实验数据见表2 。这张统计表编制得正确吗?,统计表纵横标目设置不正确,6.1 统计表存在的问题1,确切的统计量和P值。,文题:原发性肝癌患者和健康人“正常舌象”的对比研究。原作者对原发性肝癌组和健康人组“正常舌象”舌苔脱落细胞进行比较,研究结果见表3。这张统计表编制正确吗?,6.1 统计表存在的问题2,确切的统计量和P值。,辨析:,表中角化前细胞、角化细胞和超角化细胞的含义似乎应为其各自的细胞数占每个个体脱落细胞染片中细胞总数的百分比,原表题目应改为:原发性肝癌组和健康人组“正常舌象”舌苔脱落细胞的构成及成熟指数的比较,这样才能使表中数据的具体含义看起来清晰明了。 原表在3种细胞后加上%,似乎想告诉读者下面的数据含义是个比,实际上不但没有起到辅助说明数据含义的目的,反而“画蛇添足”,让人更加不理解。因为各细胞所占的百分比合计应为100%,而原表中原发性肝癌组和健康人组中各细胞的均数之和确实为1,但原作者在3个细胞变量之后加上%,反而使各细胞所占的百分比都成了实际的1%,可去掉上面变量之后的%或将表中3个细胞变量下的数据同乘100。,6.1 统计表存在的问题2,6.2 统计图存在的问题,辨析: 1.两幅统计图的纵轴刻度值并不是从“0”开始标刻度的,这违反了绘制统计图的数学原则。应改成图域或将纵轴从“0”开始标注。 2.原图中横轴的数字没有标注在刻度线正下方。 3.两图中纵横坐标轴上也有“用不等长的间隔表示相同的数据长度”的问题,不符合数学要求,曲线的变化趋势不正确。,七、多元回归分析,在疾病预后因素的研究中,往往涉及到多个因素。结局的产生不是孤立的,各因素之间往往相互影响,可以相互协同或拮抗。通常需要进行单因素的分析,从许多的临床指标中筛选出若干个真正与预后相关的因素。 预后因素的研究,如果只用单因素分析,往往会产生混杂偏倚。所以应该采用多因素分析的方法,以校正各因素之间的相互混杂。 不少发表的论文,只用2 检验进行单因素分析,虽然没有犯原则性的错误,但如果能用多因素分析的方法进行筛选,校正混杂因素的影响,结果将会可靠得多。 由于多因素之间的相互混杂,在单因素分析中,一些有意义的因素可能无统计学意义,而另一些没有意义的因素却有统计学意义。,Logistic回归与COX比例回归模型,如果时间因素不重要时,可以建立Logistic回归模型。 COX回归与Logistic回归的主要区别: COX回归与时间有关, Logistic回归与时间无关 COX回归计算RR值, Logistic回归计算OR值,七、多元回归分析,在建立回归模型时:,要先对各个研究因素进行单因素分析。初步筛选出可能与预后有关的因素;去除那些根本不可能相关的因素,以减少建立多元回归模型时自变量的个数。 对于连续性的数值变量和有明确等级关系的有序分类变量,可以直接进行回归分析; 无序分类变量和等级关系不太明确的有序分类变量,则须采用分层回归分析的方法。 在建立多元回归方程时,结合专业知识将可能有关的因素,均可作为自变量引入回归方程中筛选。待选变量的标准应该放宽一些,以免遗漏那些由于混杂的影响,导致在单因素分析中无统计学意义的有意义因素。,七、多元回归分析,分析协同时:,分析某两个或多个因素对结局的影响有无协同。可以将两个变量相乘合并为一个变量,与原来的两个变量一起放入回归方程中去筛选,如果方程能接受这个新的变量,则提示这两个变量具有协同作用。,七、多元回归分析,回归系数、标准偏回归系数、RR值和95%可信区间,建立COX回归模型后,应该将相关强度值写到研究论文中去。 回归系数表示控制其他因素条件下,各个因素对回归方程的独立贡献。根据回归系数写出COX回归模型。 根据标准偏回归系数相对值,可以比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论