版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学研究中的统计错误辨析第二军医大学卫生统计学教研室孟虹本次内容一、研究中统计设计问题二、统计方法应用的问题三、统计概念的复习
一、研究在设计上问题
血型O型A型B型AB型例数(%)30(46.9)17(26.5)17(26.5)0作者结论:银屑病发病与血型有明显关系,O型血型人容易患银屑病。问题:缺少对照组,应增加对照组人群血型分布,如有统计差别,仅提供病因线索。例164名银屑病发病与血型关系本研究为了解疾病与危险因素关系,应采用病例对照研究例2壮医目诊诊断消化性溃疡的观察有人对胃镜确诊的120名消化性溃疡患者进行目诊,目诊阳性的97例。作者结论:壮医目诊诊断消化性溃疡与胃镜诊断的符合率高达97/120=80.83%。该结论有无不妥?问题:认为目诊法符合率高达80.83%结论不妥。结论:壮医目诊诊断消化性溃疡的阳性检出率为80.83%。评价试验方法金标准方法合计患者非患者阳性真阳性A假阳性BR1阴性假阴性C真阴性DR2合计C1C2N
试验方法评价评价方法的指标灵敏度(真阳性率)=A/C1特异度(真阴性率)=D/C2符合率=(A+D)/N例4
用GC2MS法测定血苯白蛋白加合物,由于要采用昂贵的仪器和同位素内标物,一般的实验室不具备条件。本研究采用重量法测定,简单方便。同一标本用GC2MS法测3次,重量法测7次,
±s分别为(119±011)mg/ml和(210±011)mg/ml,经t检验平均值之间差异无显著性(P>0.05)。认为重量法可替代GC2MS法。本研究违背设计的什么原则?例5研究绝经后骨质疏松与血清IL-6和TNF-a浓度的关系。作者设计:研究组:30例临床绝经并确诊为骨质疏松患者,绝经最长10年,最短5年。最大59岁,最小52岁。平均56岁。对照组:30例临床无骨质疏松健康青年女性,最大33岁,最小28岁。平均30岁。测定两组人的血清IL-6和TNF-a浓度。
绝经组别是无合计骨质疏松组100100无骨质疏松组100100
血清IL-6分层高低绝经骨质疏松组8020100未绝经无骨质疏松组1090100选择偏倚:在设计阶段由于研究对象在某些特征有系统差别,将导致结果出现系统偏差。OR=80×90/20×10=36例6基于多项logit模型的绝经后骨质疏松症(PMOP)危险因素分析研究对象:年龄40~65岁女性;上海和北京市8家社区共1800人。调查方法和工具:采用现况调查发放《社区40岁~65岁妇女骨质疏松危险因素及证候调查问卷》排除:药物或其他疾病引起的继发性骨质疏松症;PMOP诊断标准:BMD检测T值为骨质疏松定性诊断标准,T值>M-1SD为骨量正常,M-1SD~-2.0SD为骨量减少,<M-2.0SD以上为骨质疏松症。统计方法:采用多分类logistic回归方法分析PMOP发生与各危险因素之间的定量关系,分析肉类膳食、鱼类膳食、饮用咖啡、每天锻炼时间、是否变矮、是否绝经、怀孕次数、生产次数、骨折次数等9个影响因素与BMD定性诊断正常(参照)、骨量减少、骨质疏松为因变量的关系。
问题:1.研究目的与研究对象不一致。2.调查对象范围过窄通过现况研究了解疾病与危险因素关系,疾病的患病率应较高。否则样本例数很大。
黄芪总苷和三七总皂苷配伍对小鼠脑缺血再灌注氧化应激的影响(作者实验安排)动物分组:C57BL/6小鼠随机分为8组,每组10只1.假手术组,2.模型对照组3.黄芪总苷(AST=110mg/kg)组4.三七总皂苷(PNS=115mg/kg)组5.AST220+PNS230mg/kg、6.AST110+PNS115mg/kg、7.AST55+PNS57.5mg/kg8.依达拉奉阳性对照组表各组脑组织氧化应激指标的比较
GroupDose(mg/kg)MDASham-Shamoperated0.88±0.25ModelModel1.94±0.35*
*Compatibility1AST220+PNS2301.10±0.26△△Compatibility2AST110+PNS1150.98±0.18△△Compatibility3AST55+PNS57.51.33±0.38△☆☆ASTAST1101.22±0.31△△PNSPNS1151.11±0.29△△Edaravone41.13±0.24△△多组间均数比较用单因素方差分析,组间两两比较方差齐者用LSD法检验。☆☆p<0.01,vsCompatibility2group
该实验设计不一定能得到两因素的最佳剂量组合。设计2:回答最优配伍剂量是否有交互作用
析因设计:假设前试验得到A3B3时的值为最优剂量安排:模型组ASTA3PNSB3最优配伍组A3B3统计方法:析因设计的方差分析设计3:回答最优配伍组是否优于阳性对照单因素设计:完全随机分组假手术组模型组最优配伍组阳性对照组统计方法:单因素方差分析二、统计学方法应用问题1.统计方法选择不当,方法的统计条件不满足。2.统计概念不清楚,结果解释不当。3.论文中“数据统计学方法”描述简单。例:计量资料以±s表示,组间比较采用方差分析,P<0.05时具有统计学意义,或P<0.01时具有显著统计学意义。
正确的描述为:检验水准α=0.05如方差分析的F值有统计意义,应报告组间两两比较的统计检验方法数据的统计学方法描述如设计为单因素设计,应写明统计检验方法名称(独立样本的t检验或单因素方差分析,及两两比较检验方法名称)。如果多因素设计(析因设计),或采用特殊统计方法:“协方差(消除协变量)、两因素方差分析(分析交互作用)、重复测量方差分析、多元回归方法(多个变量与研究指标的关系)”,要特别说明。
文章结果
报告组间基线的均衡性组别观察例数年龄病程男女合计均数±标准差均数±标准差正常对照15142959±10糖尿病A组10142462±84.4±3.2糖尿病B组1982767±76.8±3.9注:观察性研究应报告组间比较差别是否有统计学意义研究的结果
选择最能说明问题的统计描述指标文章报告研究的主要研究指标计量资料用均数和标准差描述(应根据分布选择)计数资料用率和构成比描述,例数少时直接用绝对数比较组体重下降值有效率%*实验组6.8±0.3185.59对照组0.48±2.67.84P值0.0010.001*体重下降原体重的5%为有效比较盐酸西布曲明治疗单纯肥胖的疗效组间比较单因素统计检验方法概述计量资料组间均数比较两组比较:t检验或非参数检验多组比较:单因素方差分析和均数多重比较(两两间),或非参数检验。计数资料组间率的比较两组或多组率的比较:χ2检验两组或多组的构成比比较:χ2检验两组高血压患者治疗前后舒张压(mmHg)比较治疗前治疗后比较组均数标准差均数标准差试验组126.27.1110.2*9.3对照组124.87.9120.69.8t值0.4172.44r=0.615p0.6810.025P=0.001(一)计量数据常见问题*表示与治疗前相比差别有统计意义治疗前后的相关关系为问题1.治疗后许多指标的变化与治疗前有相关关系,比较时未排除基线的影响,将会降低检验统计效率。两组高血压患者治疗前后舒张压(mmHg)比较治疗前治疗后差值比较组均数标准差均数标准差均数标准差试验组126.27.1110.29.316*3.127对照组124.87.9120.69.84.28.025t值0.4172.444.264.332.72p0.6810.025标准误0.001标准误计量数据组间比较的结果表达(表1数据)*表示与治疗前相比差别有统计意义
单因素的方差分析(one-way)
多组均数间差别的多重比较方差分析结果有统计学意义时,了解各处理组间情况,做均数间的多重比较(PostHocTests)。
研究者的目的常用多重比较方法1.组间两两比较①LSD-t检验②SNK-q检验③Bonferroni2.各试验组与对照组Dunnett-t检验
正确的统计检验方法:统计软件注意:多个组间均数的比较采用两组
t检验计算将增大犯1型误差的概率。
某次研究对三组数据比较,如用t检验两两比较比较次数检验水准整个实验犯1型误差概率A组与B组=0.05A组与C组=0.05B组与C组=0.05注:K=实验中比较的次数多重比较的统计检验:控制增大犯1型误差的概率Bonferroni法(Bonferroni调整)
Bonferroni提出进行m次比较,犯Ⅰ型错误(α)的累计概率不应超过m×α‘,即每次比较的检验水准α’=α/m。该法适合所有的组间(均数、率)两两比较的调整。例:某研究实验为4组均数比较,组间两两比较次数m=6,如每次按0.05水准,该实验总的犯假阳性概率为例4个比较组的两两比较对比组两均数差标准误tp1与20.0370.0221.850.1151与30.060.0222.780.0161与40.0710.0223.240.0062与30.0230.0220.930.2982与40.0340.0221.390.1343与40.0110.0220.460.612H0:两对比组的总体均数相等H1:两对比组的总体均数不相等检验水准α=0.10调整α’=α/m=0.1/6=0.0167三组均数的比较比较组NMeanS1108.0431.80807521012.7552.7900473109.2761.210787例9有人研究不同透明脂酸(HA)在不同皮肤组织创面愈合的表达和意义
组别HA含量①正常胎儿皮肤142.6±10.4②胎儿皮肤创伤后12h283.4±11.5*③胎儿皮肤创伤后1d314.8±12.3*④胎儿皮肤创伤后3d320.7±12.4*⑤正常成人皮肤51.4±4.2*⑥成人创伤后皮肤92.1±5.8*⑦成人增生瘢痕皮肤72.3±5.1
#*与①比较,p<0.01,#与⑤比较p<0.01各组比较采用t检验作者结论1.胎儿皮肤创伤后12h、1天、3天均与正常胎儿皮肤HA含量差别有统计意义,高于正常胎儿皮肤HA含量。2.正常成人皮肤HA含量低于正常胎儿。3.成人创伤后皮肤HA含量高于正常胎儿.4.成人增生瘢痕皮肤HA含量高于正常成人。问题:作者将成人和儿童两个人群皮肤HA含量放在一起做比较,不可比。例10MMP2mRNA相对转录量不同药物组比较比较组均数与标准差与模型对照p值健脾复方+5-Fu组1.1±0.10.0423
健脾复方组1.2±0.20.82685-Fu组1.1±0.10.0623模型对照组1.2±0.2塞来昔布组1.0±0.20.001经统计检验,不同组别MMP2mRNA相对转录量的差异有显著性,F=5.85,P=0.0002。经两两比较,健脾复方+5-Fu组与健脾复方组p=0.0367。结果提示健脾复方联合化疗可降低大肠癌肿瘤组织MMP2mRNA的表达,并有抑制肿瘤转移,包括肝转移的潜能。问题:两药是否有联合作用?塞来昔布组(阳性药)与模型组比较有统计意义。提示二个比较药的剂量可能不合适或其它问题。健脾复方组5-Fu组不用用差平均不用1.21.10.11.15用1.21.10.11.15差000平均1.21.10.5结论:健脾复方组用与不用比较,差别没有统计意义。5-Fu组用与不用比较,差别统计意义待检验?二药联合使用没有联合(交互)作用。
实例分析两药合用的效应(与不用相比)差值大于单独用药的效应之和(与不用相比),认为有交互作用。图21TGFβ1、bFGF、vEGF在不同心肌中的表达0102030405060对照组胚胎组二尖瓣狭窄组二尖瓣关闭不全组不同的组别TGFβ1bFGFvEGF表达强度(h/um2)例11研究风湿性心脏病人与正常人心肌各种细胞因子表达的差异.你认为下图表达正确吗?0102030405060TGFβ1bFGFvEGF各细胞因子对照组胚胎二尖瓣狭窄二尖瓣关闭不全表达强度(h/um2)图22各组心肌中TGFβ1、bFGF、vEGF表达强度修改后:计数资料常用Χ2检验,常见问题:
Χ2检验是单因素统计检验,多个因素数据也采用一般的Χ2检验不合适。多组率比较没有调整检验水准,每次都是Χ2水准为0.05。研究者对研究目的和检验假设不清楚,盲目做统计检验。
Χ2检验可以检验以下假设目的1:检验两组或多组率的差别H0:两组或多组率相等H1:不等或不全等目的2:检验两组或多组构成分布是否不同H0:两组或多组构成分布相等H1:不等或不全等目的3:检验二个有序变量有无关联关系H0:两个变量无关系;H1:有关系
多组率或多组构成比较有统计意义,做多重比较表三组疗法有效率的比较疗法有效无效合计有效率%物理组199(186.2)720696.6药物组1641818290.1外用组1182614481.9合计4815153290.4
单因素多组样本率的比较H0:1=2=3=90.4(三组总体有效率相等)H1:三组总体率不等或不全等如Χ2检验拒绝H0,调整检验水准,做两两组比较的Χ2检验。表7-11ν=1时的χ2界值表Χ2pχ2pχ2p6.240.012507.480.006258.210.004176.960.008337.880.00508.490.003587.240.007148.050.004558.730.00313
α’=0.0125表7-12计算比较组计算χ2χ2界值pH0物理与药物6.766.24p<0.0125拒绝物理与膏药21.328.73p<0.00313拒绝药物与膏药4.596.24p>0.0125不拒绝例12治疗后12月未孕患者输卵管的通畅情况组别输卵管(条)输卵管通畅度Ⅰ-Ⅲ度(%)Ⅳ-Ⅴ度(%)Ⅵ度(%)治疗组6411(17.2)23(35.9)30(46.9)对照组5718(31.6)35(61.4)4(7.0)作者结论:两组未孕患者输卵管的通畅度,与对照组比较,治疗组的Ⅰ-Ⅲ度(再度阻塞率)降低,且有统计差异,P<0.05;Ⅳ-Ⅴ度(通而不畅率)降低,有统计差异,P<0.01;Ⅵ度(完全通畅率)升高,有统计学差异,P<0.01。问题:两组构成比较,没有必要做两两构成比较。目的2:检验两组或多组构成分布是否不同例13病程与辩证分型
辨证分型病程<2年例数(%)2-5年例数(%)5-10年例数(%)>10年例数(%)气滞血瘀型17(26.98%)29(46.03%)11(17.46%)6(9.53%)湿热瘀阻型19(57.58%)8(24.24%)4(12.12%)2(6.06%)寒凝瘀滞型3(11.54%)7(26.92%)7(26.92%)9(34.62%)肾虚血瘀型)1(3.57%)5(17.86%)8(28.57%)14(50.00%)作者结论:病程<2年,湿热瘀阻型与其他各型比较有显著性差异P<0.05;病程2-5年,气滞血瘀型与其他各组比较有显著性差异P<0.05;病程5-10年,各型之间无统计学差异P>0.05;病程>10年,肾虚血瘀型与其他各型比较有显著性差异P<0.05。检验多组构成分布是否不同,如有统计意义,可两两组构成比较,并检验水准降解。双向有序分类的R×C表
例14年龄与冠状动脉硬化的关系问:年龄与冠状动脉硬化有无关系检验假设:二者是否有相关关系没有必要做两两构成的比较SPSS软件检验结果单向有序数据,结果(y)数据为等级时,秩和检验比较疗效检验效率高于χ2检验
例15 某病两组疗效的比较比较组
无效 有效显效痊愈合计试验组18(31.6)18(31.6)15(26.3)6(10.5) 57对照组21(46.7)15(33.3)8(17.8)1(2.2) 45合计39 33 23 7 102(括号内为构成比)计算χ2=4.81,p=0.186,p>0.05计算非参数检验两组秩和检验,u=2.64,p<0.01
例16伊布利特与胺碘酮转复冠状动脉旁路移植术后新发房颤的效能比较
100例冠状动脉旁路移植术病人随机化原则分别静脉给予伊布利特(组A)或胺碘酮(组B),试验的第一终点是在24小时内房颤的即时转复率。结果:组A(伊布利特组)的房颤即时转复率显著高于组B(胺碘酮组)(82%vs.58%,P<0.01)。结论:伊布利特和胺碘酮均可安全的应用于转复冠状动脉旁路移植术后的新发房颤,相比较而言,伊布利特效果更好,转复速度更快,效能更高。两组患者第一试验终点主要指标比较指标组A(50例)组B(50例)P值即时转复率(%)41(82%)29(58%)<0.01转复时间(min)61.4±23.8511.8±207.6<0.01采用t检验和χ2检验问题:1.本研究有两个终点指标,采用分别计算容易出现结果不一致情况。2.不同时间点复转的变化速度没有展示。最好采用生存分析方法的计算两组患者不同时间复转率的比较
kaplan-Meier的乘积极限法
(product-limitmethod,PL法)
伊布利特组中位复转时间=66分钟胺碘酮组中位复转时间=660分钟三多个变量间相关关系统计方法描述两变量关系密切程度指标两个变量为计量数据Pearson相关系数描述y变量(研究者关心变量)如何依赖x变量(与y变化有关因素)变化的数量关系指标。
回归系数(b)和回归方程
反映研究指标与多个影响因素统计方法2.根据反应变量数据类型:反应变量为计量数据,多元线性回归模型。反应变量为两分类数据,logistic回归模型。同时有分类和计量数据,生存时间和死亡事件,采用COX回归模型。相关与回归结论的问题统计学相关关系1.两个变量有相关关系,不一定为因果关系。2.两个变量的回归关系:Y=a+bxy指标(果)和x指标(因)人为选定。表示x的变化引起y的变化数量关系。3.回归系数(b)不为0,p<0.05,表示为两变量有回归关系,同也有相关关系。4.回归系数(b)不为0,p<0.001,表示两变量有回归关系,结论说错的概率很小。5.正确解释回归系数与相关系数的含义。变量相关关系的问题例17研究轻度认知障碍患者简易智能量表(MMSE)分值与ERP分值(听觉,视觉)的相关研究。MMSEERP听觉值r=-0.512,P<0.01ERP视觉值r=-0.547,P<0.01BHIr=0.306,P=0.008结论:MMSE与ERP值(听觉,视觉)有显著相关性;其中BHI(屏气指数)与MMSE分值的相关性最强。疾病与危险因素关系,仅采用单因素方法分析,结果未校正混杂因素影响?结论不一定正确。例18.某医师在研究宫颈癌的发病的危险因素,作了许多单因素的四格表分析,结果显示:年龄大的比年龄小的妇女宫颈癌患病率高文化程度低的比文化程度高的妇女宫颈癌患病率高初婚年龄小的比初婚年龄大的妇女宫颈癌患病率高子女多的比子女少妇女宫颈癌患病率高结婚次数多的比结婚次数少的妇女宫颈癌患病率高有宫颈糜烂的比没有宫颈糜烂的妇女宫颈癌患病率高因此认为这一些都是宫颈癌发生的危险因素。
“危险因素”之间是有相关文化程度低与年龄大的妇女有关系初婚年龄小与多子女有关结婚次数多和有宫颈糜烂有关由于危险因素之间往往相互有关系,造成表现所有的因素都与宫颈癌的发生有关。应需要在单因素分析的基础上,再进行多因素分析。例19某矿山工人胸片异常的logistic回归结果变量回归系数S.EWaldpOR性别17.481.5E+040.001.00
3.9E+07年龄1.140.3311.70.003.12工作年限0.610.353.050.081.84暴露年限-0.690.334.300.040.50粉尘暴露0.380.660.330.561.46其他暴露-18.428.32E+030.001.000.00变量间存在多重贡献性,造成结果不正确统计基本概念复习
是非题1.同一资料的标准差一定小于均数.2.同一资料的标准差一定小于标准误3.标准差反映是抽样误差的大小4.标准误反映的是个体变异的大小5.两样本均数比较,经t检验差别有统计意义,P越小,说明两总体均数差别越大。6.P<0.05表示比较均数差别有显著性,p<0.01表示差别有高度显著性。7.组间只要进行随机化分组,组间的影响因素就一定均衡。8.同一资料两样本均数的比较,检验水准为0.05,t检验与两均数差值的95%可信区间检验结果是一致的。9.总体均数的置信区间宽度越窄反映估计总体均数精确度越高。10.统计中假设检验的检验水准α=0.05,也表示统计检验允许犯假阳性错误的概率为0.05。11.两样本均数比较,经t检验,如p>0.05,可认为比较组两总体均数相等。12.在多组样本均数比较,最好用t检验做两两组比较。13.统计中的把握度(power)反映的是如比较的总体参数确实存在差别,统计检验能够检验出差别的概率。14.回归系数(b)越大,表示y与x关系越密切。15.如某抽样研究得到暴露因素与疾病的OR不等于1,就表示两者一定有关系。16.相关系数r的检验,p越小,表示两个变量关系越密切。17.决定系数(R2)越大,表示y对x的作用越大。18.在多元线性回归中,某变量的偏回归系数越大,表示该变量对因变量的作用越大。19.如暴露因素为两分类,疾病分(有,无)两类,描述二者有无关联的指标为关系系数(r)。20.对于两组疗效(等级数据)的比较最好的统计检验方法是X2检验。21.p<0.05也表示犯Ⅱ型误差的可能性<0.05.22.当样本例数增大时,以下说法几句是正确
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年环境保护项目建议书及资金申请协议3篇
- 医疗行业信息化升级合作合同
- 品牌加盟连锁合作协议
- 二零二五年度图书作品编剧签约合同范本3篇
- 2024淘宝合作运营服务合同范本:年度品牌合作2篇
- 2024年装饰装修工程项目合同
- 2024年第三方经销商销售合作协议版B版
- 五年级数学(小数乘除法)计算题专项练习及答案汇编
- 2024版合作供应商合同范本
- 云端数据服务处理合同协议
- 暖通工程合同
- 生产型企业规章管理制度(3篇)
- 钢结构之楼承板施工方案流程
- 2024年营销部工作人员安全生产责任制(2篇)
- ISO 56001-2024《创新管理体系-要求》专业解读与应用实践指导材料之3:4组织环境-4.1理解组织及其环境(雷泽佳编制-2025B0)
- 2024-2030年中国管道检测工程行业前景分析发展规划研究报告
- 新的护理交班模式
- 2024年安徽省高校分类对口招生考试数学试卷真题
- 2024电影数字节目管理中心招聘历年高频难、易错点练习500题附带答案详解
- 棋牌室消防应急预案
- 《ISO56001-2024创新管理体系 - 要求》之22:“8运行-8.2 创新行动”解读和应用指导材料(雷泽佳编制-2024)
评论
0/150
提交评论