统计方法抉择_第1页
统计方法抉择_第2页
统计方法抉择_第3页
统计方法抉择_第4页
统计方法抉择_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计方法抉择第1页,共79页,2023年,2月20日,星期二

统计学是处理数据变异的一门科学与艺术。以概率论为基础;以统计推断为主要内容的现代数理统计学(stemcell),20世纪才告成熟。广泛应用于教育、社会、经济、金融、农业、工业/工程技术、物理、管理、生物医学、心理学、信息。生物统计学应用于生物医学研究已有100余年主要用于研究结果真实性、适用性、重要性的定量描述、分析与评价。第2页,共79页,2023年,2月20日,星期二FrancisGaltonKarlPearson贡献:重要术语和方法SD、相关与回归、卡方检验等1890-1920RonaldFisher贡献:小样本统计推断方法、假设检验、确切概率法、方差分析(1915-33)JerzyNeymanEgonPearson贡献:I、II型错误;检验效能Power可信区间(置信)(1937-1949)AbrahamWald贡献:统计决策理论1950-第3页,共79页,2023年,2月20日,星期二生物统计学在临床研究中的应用1747年英国Lind医生对船员坏血病进行干预研究。1835年法国研究者Louis对“放血疗法”治疗肺炎进行研究,否定了该种疗法。1948年BradfordHill在BMJ发表了用链霉素治疗肺结核的随机对照试验报告,首次在临床试验中使用生物统计方法进行分析。将107例肺结核患者随机分为两组,分别接受链霉素和常规治疗,所得结果为链霉素优于常规治疗。1948年原四军大郭祖超教授编写出版了全国首部教材《医学与生物统计方法》第4页,共79页,2023年,2月20日,星期二临床统计学与临床流行病学临床流行病学:临床科研设计、测量与评价统计学内容要贯穿于临床研究中的全过程:资料搜集、整理、分析与结果解释。临床统计学:临床研究资料中变异性及其变化规律的一门

科学与艺术。第5页,共79页,2023年,2月20日,星期二临床统计学不是万能的:统计学无法消除临床研究结果的不确定性。若无良好的数据基础,统计学不能给出有意义的结果;脱离临床研究问题,统计学将无所作为:巧妇难为无米之炊。第6页,共79页,2023年,2月20日,星期二1964年英国著名统计学家Yates和Healy曾提醒:“非常痛心地看到,因为数据分析的缺陷和错误,那么好的生物研究工作面临着被葬送的危险。”据国外对20世纪60-80年代医学期刊上所发表论文的调查,有统计错误的论文的比率在20%~72%之间。第四军医大学1996年对4586篇医学论文的调查显示,统计分析误用率达55.7%.第7页,共79页,2023年,2月20日,星期二第一讲统计方法的抉择与应用第8页,共79页,2023年,2月20日,星期二一、统计在临床研究中的作用与价值临床测试指标(PICOST):量化、客观化、规范化、标准化过程中产生了大量的各式各样的数据。临床数据的收集、整理、处理与分析,需要借助有关统计学方法。第9页,共79页,2023年,2月20日,星期二设计阶段-D(根据研究目的与资料特点,确定临床指标,预设统计分析方法;同时需要估算样本含量)研究组织实施、资料收集与整理阶段-M:用相应统计方法:测试指标与测试时点评估质量控制效果;检查数据资料的完整性、失访/原因统计。检查极端值与离群值,分析原因与正确处理分析资料阶段-E:检查资料是否满足预设统计方法的应用条件,选用合适统计分析方法。第10页,共79页,2023年,2月20日,星期二二、临床研究中相关数据的采集与质量控制临床研究设计阶段有关统计学知识的运用,在临床科研设计已有介绍。这里不再赘述。重点介绍在DME中的具体运用。第11页,共79页,2023年,2月20日,星期二(一)、临床研究指标及测试时点的设置1、观察测试指标的设置及其主要类别(PICOST)临床/生物学指标:病死/复发/残疾、生化等。生存质量及类似指标:QOL、HRQL经济学相关指标:临床经济学评价成本:直接成本、间接成本等结局:效果、效益、效用第12页,共79页,2023年,2月20日,星期二2、观测指标的设置应全面和重点兼顾1)指标应全面客观:研究假设与研究目的利弊分析不良反应(副作用)指标费用(临床经济学)指标2)合理选用综合效应指标:QALYs第13页,共79页,2023年,2月20日,星期二质量调整寿命年10123450.60.80.50.40.3QALYs=2.80.2QALYs=1.0生存时间(Figure1)健康相关生存质量第14页,共79页,2023年,2月20日,星期二3)指标要有代表性:不能过多(对于大规模研究,指标过多往往不能保证质量)。若为临床试验,设置的主要结局指标一般1到2个;次要结局指标最好不超过10个。第15页,共79页,2023年,2月20日,星期二4)合理使用替代指标(中间指标)第16页,共79页,2023年,2月20日,星期二3、选择测定次数与确定测量时点基于文献复习或前期基础研究,确定临床研究中相关指标测量时间与次数:效应量变化特征曲线。(rightmethodtouserightmeasureattherighttime)效应量观测时点ABC干预研究对象第17页,共79页,2023年,2月20日,星期二观测时点以及手段、方法第18页,共79页,2023年,2月20日,星期二

质量控制应体现在数据收集、整理、数据清理等不同阶段。常用手段如:收集阶段:培训记录员与调查员,提高依从性盲法测量临床软指标(霍桑效应?)多个实验室标准样品平行试验/标准校验曲线整理与清理:双输法录入数据4、数据收集过程中的质量控制第19页,共79页,2023年,2月20日,星期二5、影响数据质量的相关因素与指标本身有关(临床硬指标、临床软指标)客观性、易量化灵敏度高精确性强与指标数量及测量难易有关:不宜过多指标与收集方式有关:实验室标准测试面对面访谈法;电话访谈;信访完美数据?第20页,共79页,2023年,2月20日,星期二三、统计分析的基本内容

统计描述:反映样本的基本特征统计图表(各类表格或图示)基本指标(均数/标准差;率、构成比)统计推断:样本统计量推断总体参数假设检验:差别(均数、率);估计总体参数(点估计及其可信区间)。第21页,共79页,2023年,2月20日,星期二资料基本分型与分析方法的选择数值变量资料(计量资料)统计描述方法统计推断方法分类变量资料(计数资料)统计描述方法统计推断方法第22页,共79页,2023年,2月20日,星期二(一)、计量资料的统计描述及结果表达统计图表:各类图表频数表、直方图、线图、箱图定量描述临床研究中对于服从正态分布者用均数±标准差;服从对数正态分布者改用几何均数;对于其它不服从以上分布者,用中位数和四分位间距(IQR)表达。第23页,共79页,2023年,2月20日,星期二正态性判断正态性检验:判断资料是否服从正态分布。偏度/峰度检验W检验、D检验其它判断方法:统计图表:eyeballtest(PP图/QQ图)均数与中位数差均数与标准差(均数1S或2S中样本例数)医学专业知识对资料的正态性进行估计。第24页,共79页,2023年,2月20日,星期二第25页,共79页,2023年,2月20日,星期二(二)、计数资料的统计描述统计图表:频数表、直条图、饼图定量描述:率、比直条图、饼图第26页,共79页,2023年,2月20日,星期二计数资料的统计描述:率与比指标名称计算公式意义率发生某现象的观察单位数/可能发生某现象的观察单位总数描述事件发生的强度和频率构成比A/(A+B+….)事物内部各组成部分所占的比重相对比A/BA指标为B指标的若干倍或百分之几第27页,共79页,2023年,2月20日,星期二分析时不能以比代率(proportion=rate?)

如某产院拟分析畸形儿与产妇分娩年龄的关系,检查新生儿4470例,畸形儿116例。

母亲年龄(岁)2123242526272829303133

畸形儿数:12141924181913311%0.861.71216211616112.60.860.86

结论:产妇年龄在24-29岁时,畸形儿最多,占总数的92.2%,符合一般规律。

计算率时要求分母不宜过小(<10)注:病死率mortality与死亡率deathrate不同第28页,共79页,2023年,2月20日,星期二(三)统计描述与临床效应量临床效应量(effectsize)常被定义为有临床意义或实际价值的干预效应或差值。MD、OR、RR、NNT第29页,共79页,2023年,2月20日,星期二1、计量资料的效应量描述效应量(effectsize)是指临床上有意义的均数差值(如均数差值是指试验组与对照组的均数之差)。应结合专业知识、指标特点综合判定差值的实际意义。第30页,共79页,2023年,2月20日,星期二6.57-4.48=2.09(MD)P<0.0000001第31页,共79页,2023年,2月20日,星期二2、计数资料的效应量表达用绝对指标表示:绝对危险降低率(absoluteriskreduction,ARR):对照组与试验组事件发生率之间的绝对差值%表示。此值意味着试验组临床事件发生率比对照组相同事件率的绝对差值,其值越大,临床效果的意义自然会越大。

公式:ARR=P-A(%)P=对照组的事件率,如病死率

A=试验组的事件率第32页,共79页,2023年,2月20日,星期二NNT:治疗多少病例数才使一例患者获益

(numberneededtotreat,NNT);NNHNNT=1/ARRNNT=5vsNNT=500意义不同第33页,共79页,2023年,2月20日,星期二

用相对指标表示相对危险降低率(relativeriskreduction,RRR):此值的大小表示试验组比对照组治疗后有关临床事件发生的相对危险度下降的水平。

公式:相对危险降低率(RRR)=((P-A)/P)×100P=对照组的事件率,如病死率

A=试验组的事件率RR/OR第34页,共79页,2023年,2月20日,星期二例2:乙型肝炎病毒与原发性肝癌病因学研究(BeasleyRP.etalLancet1981;11;1129)对象为台湾社会保险的员工。N22707Ne(?)E(HBsAg)3454E(HBsAg)192535年5年D40D3414D1D19252+-自然分组第35页,共79页,2023年,2月20日,星期二结果:肝癌有无HBsAg+403414-11925相对危险度(RR)=4040+3414/11+19252=223说明乙肝病毒在肝癌的病因学方面有重要作用第36页,共79页,2023年,2月20日,星期二效应量的临床/实际意义判定

结合疾病危害程度与疾病负担

医院内感染率降低1%与病死率减少1%

考虑相对值:如复发率

20%-10%降低绝对值为10%,相对值50%50%-40%降低绝对值为10%,相对值20%40%-50%升高10%,相对值25%

第37页,共79页,2023年,2月20日,星期二合理使用相对比正确使用相对数字(百分比):变化4%,上升的绝对值永远小于下降的绝对值。第38页,共79页,2023年,2月20日,星期二效应量的临床/实际意义判定

结合疾病危害程度与疾病负担

医院内感染率降低1%与病死率减少1%

考虑相对值:如复发率

20%-10%降低绝对值为10%,相对值50%50%-40%降低绝对值为10%,相对值20%40%-50%升高10%,相对值25%

考虑观察时间:NNT第39页,共79页,2023年,2月20日,星期二高血压患者药物预防心梗或死亡研究

观察期 NNT轻度高血压 5.5y 10重度高血压 1.5y 10

时间矫正(假设其每年发生率是一致的)NNT矫正=NNT观察时间X(观察时间/矫正时间)NNT1.5=10X(5.5/1.5)=37第40页,共79页,2023年,2月20日,星期二四、统计推断的方法抉择统计推断方式假设检验参数及其区间估计第41页,共79页,2023年,2月20日,星期二五、统计方法正确抉择基本要素统计方法的正确抉择至关重要。第42页,共79页,2023年,2月20日,星期二五、统计方法正确抉择基本要素资料类型设计方案样本含量数据结构特定条件第43页,共79页,2023年,2月20日,星期二计量资料的统计推断方法假设检验

t检验、u检验、方差分析、秩和检验、多元线性回归等均数差值的可信区间估计第44页,共79页,2023年,2月20日,星期二计数资料的统计推断方法率差值的可信区间估计

2

检验、logistic回归分析第45页,共79页,2023年,2月20日,星期二五、统计方法正确抉择基本要素资料类型设计方案样本含量数据结构特定条件第46页,共79页,2023年,2月20日,星期二假设检验方法与设计方案有关t检验:3种方差分析:13+

完全随机设计?随机区组?交叉设计?析因设计?重复测量资料ANOVA第47页,共79页,2023年,2月20日,星期二配对设计与成组设计配对t检验与成组t检验配对资料卡方检验(McNemar)与成组卡方检验两组比较与多组比较随机区组设计与重复测量设计假设检验方法与设计方案有关第48页,共79页,2023年,2月20日,星期二五、统计方法正确抉择基本要素资料类型设计方案样本含量数据结构特定条件第49页,共79页,2023年,2月20日,星期二样本量要求假设检验方法两组比较(成组设计)例数(n)较大,(任意分布)u检验例数(n)较小,来自正态且方差齐成组设计t检验

Wilcoxon秩和检验或成组设计的t’检验例数(n)较小/非正态/方差不齐

第50页,共79页,2023年,2月20日,星期二五、统计方法正确抉择基本要素资料类型设计方案样本含量数据结构特定条件第51页,共79页,2023年,2月20日,星期二统计方法与数据结构回归分析:Logistic、COX相关分析、对应分析、聚类分析第52页,共79页,2023年,2月20日,星期二五、统计方法正确抉择基本要素资料类型设计方案样本含量数据结构特定条件临床研究之分析提纲及框架图第53页,共79页,2023年,2月20日,星期二特定条件假设检验方法两组资料的比较例数(n)较大,(任意分布)u检验例数(n)较小,来自正态且方差齐成组设计t检验

Wilcoxon秩和检验或成组设计的t’检验例数较小,非正态或方差不齐第54页,共79页,2023年,2月20日,星期二六、统计结果的解释与注意事项第55页,共79页,2023年,2月20日,星期二(一)、统计推断结果的完整表达假设检验目的是根据P值与检验水准的比较,并得到两组总体均数是否有差异的推断结论。

P<:两组总体均数间差异有统计学意义;

P>:两组总体均数间差异无统计学意义;

(P值在附近时,下结论应慎重)。*不能表明“显著性”差别的程度以及有无实际意义(临床意义)第56页,共79页,2023年,2月20日,星期二何谓“显著”英语“significant”,它的正确意义应当是“有意义的、有重要性的”;日语“有意”;国内只有极个别的英汉词典把“significant”误译为“显著的”。正确的说法应是“差异有统计意义,P<0.05”或“差异有显著统计意义,P<0.001”。第57页,共79页,2023年,2月20日,星期二实例

“丙酸倍氯米松组患者吸入糖皮质激素后,其气道反应性有显著降低(P<0.05),而对照组治疗前后气道反应性无明显变化(P>0.05)。第58页,共79页,2023年,2月20日,星期二可信区间:95%可信区间。可信区间能:表明差别有无统计学意义,同时显示差别的程度及临床意义,

但CI不能提供确切概率。因此,统计结果的表达:P值与可信区间相结合,同时报告。第59页,共79页,2023年,2月20日,星期二(二)、正确解释与评价结果真实性重要性适用性第60页,共79页,2023年,2月20日,星期二1、真实性解释与评价统计推断具有概率性:要么有统计学意义,要么无统计学意义。但两类结果同样重要。*特别是当出现阴性结果时,更应该注意,应考察样本含量及检验效能。第61页,共79页,2023年,2月20日,星期二统计结果的概率性:统计结果不是绝对肯定或否定,可能犯I、II型错误

假设检验真实情况

H0不成立H0成立 拒绝H0

推断正确

不拒绝H0推断正确

P,I型错误;P,II型错误检验效能(power)=1-,敏感度第62页,共79页,2023年,2月20日,星期二II型错误与检验效能检验效能又称把握度、功效,用1-表示(

为II型错误概率):是指事实上当两总体确有差异,按检验水准所能发现该差异的能力。检验效能为0.8,指做100次假设检验,有80次能检验出有差别。第63页,共79页,2023年,2月20日,星期二

检测项目患者组(32)健康组(10)P值检验效能

LAT-EF57.2±13.359.6±9.2>0.050.10INF-EF76.8±15.282.0±14.3>0.050.17SEPTAL-EF37.4±12.646.9±13.4>0.050.52ESV29.3±8.527.3±7.3>0.05EDV62.1±16.063.6±9.6>0.05第64页,共79页,2023年,2月20日,星期二2、重要性评价:

综合临床意义与统计学意义第65页,共79页,2023年,2月20日,星期二临床意义统计学意义

abcd最小效应量第66页,共79页,2023年,2月20日,星期二3、评价统计结果的适用性

统计分析结果实际上是基于个体的平均水平。将平均水平结果应用到个体水平,忌生搬硬套。PROGRESS第67页,共79页,2023年,2月20日,星期二七、临床研究中常见统计问题

临床研究与统计方法的有机结合,两者不能相互脱节。第68页,共79页,2023年,2月20日,星期二常见的统计学问题:需做而未做统计分析统计分析方法不清,或未标明应用条件不满足错误选用统计方法:结果解释不合理:论文写作方面:结果表达不完整、不清楚。第69页,共79页,2023年,2月20日,星期二评价实例[CJIM;16(5)]假设检验频数频率(100%)t检验13062%方差分析3115%卡方检验2713%秩和检验178%生存分析10.5%直线回归/相关10.5%未做假设检验21%合计209100%

未见多元分析方法使用第70页,共79页,2023年,2月20日,星期二评价实例[CJIM;16(5)]假设检验频数正确率错误t检验13026%方法不当:重复测量方差分析\方差分析方差分析3194%数据类型混用、未考虑设计方案卡方检验2774%P、FISHER、生存分析、秩和检验、检验水准未校正秩和检验1712%重复测量生存分析11/1直线回归/相关10/1回归、相关混淆未做假设检验2合计209第71页,共79页,2023年,2月20日,星期二(一)、统计方法选择与其资料类型不符

表甲乙两种疗法的疗效比较(例)

疗效甲法乙法痊愈1020

显效3020

有效1030

无效2010

合计7080

资料特点:单

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论