临床科研中正确抉择统计学方法课件_第1页
临床科研中正确抉择统计学方法课件_第2页
临床科研中正确抉择统计学方法课件_第3页
临床科研中正确抉择统计学方法课件_第4页
临床科研中正确抉择统计学方法课件_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、临床科研中正确抉择统计学方法一、四个因素熟悉和掌握下述四个因素是正确进行统计分析的基础(一)分析目的统计描述统计指标、统计图或统计表均数、标准差、率、构成比统计推断(参数估计、假设检验)相关分析以相关系数来衡量各因素间的密切程度和方向回归分析研究某因素与另一因素的依存关系(二)资料类型数值变量资料计量资料无序分类变量资料计数资料 有序分类变量资料等级资料注意:不宜将定量资料转化为分类资料(三)设计方法每一种科研设计方法都有与之相适应的统计方法成组设计t检验配对t检验条件Logistic回归非条件Logistic回归二、数据资料的描述(一)数值变量资料的描述描述集中趋势的指标,用以反映一组数据的

2、平均水平描述离散程度的指标,用以反映一组数据的变异大小(两类指标的联合应用才能全面描述一组数值变量的基本特征)均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征最为常见的错误是不考虑这些指标的适用范围和条件的滥用(二)分类变量资料的描述以比代率,即误将构成比(proportion)当作率(rate)来描述某病发生的强度和频率把各种不同的率相混淆,如把患病率与发病率、死亡率与病死率等概念混同描述分类变量资料的常用指标指标名称计算公式意义率发生某现象的观察单位数可能发生某现象的观察单位数描述事件发生的强度和频率构成比A100

3、%AB.事物内部各组成部分所占的比重发病率Incidence一年内发生的某病新病例数同年平均人口数在一定时间(一般为1年)内,某人群中发生某种疾病的新病例频率。患病率(现患率)Prevalence某特定时间内某人群中发现有某种疾病者的比例。死亡率Mortality死亡率=一年内总死亡数同年平均人口数 在一定时间(一般为1年)内,某人群中死亡的频率。病死率Case fatality ra tio因某病死亡人数患该病的总数 患某病者中因该病死亡者占的比例。(一)假设检验的基本思想样本数据间的不同有两种原因所致样本来自同一总体,样本指标间的不同是由于抽样误差所引起样本分别来自不同的总体,其样本指标间

4、的不同是由于来源于不同的总体所致假设检验是反证法原理的统计应用假设两个样本均数可能来源于同一总体,然后计算出在此假设下的某个统计量的大小,当这个统计量在其分布中的概率较小时(如p0.05)我们就拒绝其假设,而接受其对立假设,认为两样本分别来自不同的总体。(三)假设检验的注意事项前提研究者需要通过样本的信息去推断总体的结论各样本资料对其总体应具有良好的代表性假设检验的概率大小与结论的关系当p 时,概率越小,越有理由拒绝H0假设(无差别的假设),即拒绝H0假设的可信程度就越大注意:当p 时,不能说“概率越小,组间的差别就越大”假设检验的结论不能绝对化在作出结论时,要避免使用绝对的或肯定的语句当p

5、时,只要p0,我们无法完全拒绝无差别的假设,即不能肯定各总体间有差别当p 时,只要p1,我们无法完全接受无差别的假设,即不能肯定各总体间无差别两组与多组比较两组比较:t检验、u检验、两组秩和检验、四格表和较正四格表的X2检验等多组比较:方差分析、多组秩和检验、行乘列X2检验等(也可用于两组比较)注意:错误使用两组比较的方法代替多组比较的情况并不少见,如,三个均数比较用三个t检验、四个t检验假设检验结论的两类错误当p 时,做出“拒绝其无差别的假设,可认为各总体间有差别”的结论时就有可能犯错误,这类错误称为第一类错误(type error)其犯错误的概率用 表示,若取0.05,此时犯型错误的概率0

6、.05,若假设检验的p值比0.05越小,犯第一类错误的概率就越小。当p 时,做出“不拒绝其无差别的假设,还不能认为各总体间有差别”的结论时就有可能犯第二类错误(type )其犯错误的概率用表示,通常为未知数,但假设检验p值越大,犯第二类错误的概率就越小注意:当认为干预有负影响时,应使用双侧检验法。除非你有非常可信的证据证明这种差异仅在一个方向存在,否则,你需要用双侧检验法。1、常用计量资料的假设检验比较目的应用条件统计方法样本与总体比较例数较大u检验例数较小t检验两组资料的比较(完全随机设计)例数较大u检验例数较小,来自正态分布且方差齐成组设计的t检验例数较小且非正态分布或方差不齐成组设计的秩

7、和检验中位数检验统计学处理方法的选择 单个自变量资料的统计学分析方法自变量 因变量 统计方法属性 属性 卡方 (2) 检验二分 (属性) 数值 t-检验多分 (属性) 数值 方差分析属性 数值 (有截缩) 寿命表法 / 积限法数值 数值 回归 (或相关) 分析1、常用计量资料的假设检验(续表)比较目的应用条件统计方法配对资料的比较例数较大(任意分布)配随设计u检验(配对设计)例数较小,差值来自正态配对设计的t检验例数较小,差值为非正态配对设计的秩和检验多组资料的比较各组均数来自正态分布且方差齐成组设计的方差分析(完全随机设计)各组为非正态分布且方差不齐成组设计的秩和检验配伍资料的比较各组均数来

8、自正态分布且方差齐配伍设计的方差分析(配伍设计)各组为非正态分布且方差不齐配伍设计的秩和检验2、常用计数资料假设检验方法比较目的应用条件统计方法样本率与总体率的比较n较小时二项分布的直接法np5且n(1-p)5二项分布的u检验两个率或构成比的比较(完全随机设计)np5且n(1-p)5二项分布的u检验n40且T5四格表的X2检验n40且1T5较正四格表的X2检验n40或T40配对X2检验np5且n(1-p)5较正配对X2检验多个率或构成比的比较(完全随机设计)全部格子T5或少于1/5的格子1T5列联表的X2检验若有T1或有多于1/5的格子1T280971988027911815133407913

9、264113928890合计230130360 象这样的行列表,我们可以将其分割成表3形式的四格表,分别计算各指标,计算的结果见表3。表3 各种界值的阳性率及假阳性率 由表3可见,灵敏度和假阳性率随界值的降低而生高,但特异度则随界值的降低而降低。根据这样的关系,我们可以用假阳性率为横坐标,灵敏度为纵坐标做ROC曲线,见下图。 指标(%)界值280802794079139敏感度429399100特异度9988680假阳性率101232100 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0(特异度) 1.0 灵 0.9- =40 0.8- 80- 敏 0.7-

10、0.6- 度 0.5- 0.4- 280 0.3- 0.2- 0.1 0曲线左上角灵敏度是1.0(100%),假阳性率是0,即所有的病人全部被确诊,所有无病者都不会误诊。距左上角距离越近的曲线实验效果越好;在ROC曲线上,靠坐上角距离最近的界点作为界值最好。(Q:为什么?)在左上角处(灵敏度+特异度)/2的值最大,可以根据此及实际工作的需要来确定具体诊断实验的界值。用ROC曲线可以比较不同诊断实验的优劣(Q:解释理由)。2. 似然比的临床应用似然比(likelihood ratio)是诊断试验综合评价的理想指标,它综合了敏感度与特异度的临床意义,而且可依据试验结果的阳性或阴性,计算患病的概率,

11、便于在诊断试验检测后,更确切地对患者作出诊断.真阳性率越高,则阳性似然比越大.表4 AMI患者CPK分层检测结果Q:某患者男性,40岁,活动后感胸前区疼痛,在医院查CPK为72u,问患AMI的可能性有多大?(0.5, 0.30, 0.23)CPK(u)AMI(+)AMI(-)+LRn比例n比例2809797/230=0.4211/130=0.010.42/0.01=4280279118118/230=0.511515/130=0.120.51/0.12=4.2040791313/230=0.062626/130=0.200.06/0.20=0.3013922/230=0.018888/130=

12、0.670.01/0.67=0.01合计230a/(a+c)130b/(b+d)第三节诊断性试验的评价原则1. 1981年确定的国际通用的评价原则2. 1997年Trisha Greenhalgh在BMJ上提出的证实诊断试验有效的10条问题3. 2000年Sackett在循证医学第二版提出的8条原则1. 1981年确定的国际通用的评价原则1.1 诊断性试验与金标准盲法比较和评价1.2 纳入研究病例的分析与评价1.3 病例的来源和研究工作的安排是否作了叙述1.4 诊断性试验的重复性及其临床意义是否明确1.5 诊断性试验所确定的正常值是否合理可靠1.6 在一系列试验中该诊断性试验是否最正确1.7

13、诊断性试验的方法及重复性分析1.8 诊断性试验的实用性如何2. 1997年Trisha Greenhalgh在BMJ上提出的证实诊断试验有效的10条问题Q1: Is this test potentially relevant to my practice? Q2: Has the test been compared with a true gold standard?Q3: Did this validation study include an appropriate spectrum of subjects?Q4: Has workup bias been avoided?Q5: Ha

14、s expectation bias been avoided?Q6: Was the test shown to be reproducible?Q7: What are the features of the test as derived from this validation study?Q8: Were confidence intervals given?Q9: Has a sensible normal range been derived?Q10: Has this test been placed in the context of other potential test

15、s in the diagnostic sequence?脑卒中患者生存质量的评定及研究现况 随着WHO健康新概念的提出以及医 学模式由生物医学模式逐渐向生物-心理-社会医学模式转变,传统的评价指标体系仅关注生命的保存与局部躯体功能改善,而既不能表达健康的全部内涵,也未能体现具有生物-心理和社会属性的人的整体性和全面性。 随着疾病谱的改变,医疗的主要目标由急性传染病转向癌症、心脑血管等慢性病。这些疾病较难治愈,很难用治愈率来评价治疗效果,用期望寿命、死亡率、生存时间等客观生命“量”的指标,由于成效递减规律,这些数量指标相对比较稳定,所以有必要寻求更敏感的指标来反映不断变化的健康状况。 QOL正

16、是鉴于以上深刻的社会背景于70年代成为医学领域的研究热潮,80年代后则重点转向特定肿瘤与心脑血管等慢性病测评,并研制出大量疾病专门化测定量表。一、QOL的概念 QOL至今仍无统一的定义,但大多数研究者认为它是多维的,包含机体、心理精神和社会三个广泛领域 Haan等通过五个脑卒中量表与残疾、残障和QOL的评定比较研究发现:一个人的残疾最直接地受残损的影响,残障被定义为残损和残疾所导致的社会性后果,而QOL被定义为疾病所致后果的更广泛的领域,包括残疾和残障的成分,还有病人所承受的健康状态和幸福感 按照近来WHO QOL的工作组定义,它是指不同文化和价值体系中的个体对与他们的目标、期望、标准和所关心

17、的事情有关的生活状况的体验。因此QOL是一个与个人身体健康情况、心理状态、独立水平、社会关系、个人信仰以及所在环境的特点有着明显关系的、内容复杂的概念。 QOL相应的中文翻译也较为混乱,诸如生活质量、生命质量、生存质量、生活质素等。但中国生物医学文献数据库(CBM)以“生活质量”作为主题词。 表1 生命质量(广义)的三个层次 低层中层高层参考译名生存质量生活质量(狭义)生命质量需求层次 生理(食、睡、性)维持生存 生理、安全、爱与隶属、尊重 生理、安全、爱与隶属尊重、自我实现 主要应用领域 医学 社会学 医学与社会学综合领域 二、脑卒中患者QOL与残损、残疾和残障的关系1980年WHO国际残疾

18、分类(ICIDH)10强调疾病后果应在残损(impairment)、残疾(disability)、残障(handicap)三个水平上进行,并在国际脑卒中康复的研究中逐步形成了比较统一的认识。目前对残损(功能障碍)和残疾(能力障碍)两个水平的评定已很少引起争议,筛选出了一批比较公认成熟的量表。按ICIDH定义,残障是指确定一个人由于残损或残疾而引起的限制或妨碍他在社会中达到正常角色的不利因素的程度,是由于作为社会存在的人的水平上一残疾。常见的残障量表是改良的Rankin量表(RS) 及其反复修订后的OHS,然而即便是多次修改,对两个量表的主要异议之一是它评定的是残疾而非残障。Haan等人对反复修

19、订的RS进行了效度研究发现,不应该把它看作纯残障评定方法,而应看作是具有残疾指症的全面的机能健康指数。因此,总的来说,在脑卒中的残障评定方面,还没有公认成熟的量表。发展QOL的评定量表似乎是一个方向,如主观取向的QOL和脑卒中专门化健康相关QOL评定已成为一个热点 三、QOL评估的必要性及重要性 现代医学正由传统的经验医学向循证医学转变,病人由客体(被动治疗)的地位转变为复合主体地位,共同参与临床诊断、治疗决策。治疗方案的选择、疗效的评定应兼顾生存的时间与生存质量,如乳腺癌治疗中的根治术,虽延长了患者生命,但由于失去乳房、胸部塌陷产生的自卑感也影响其正常社交生活,严重影响生活质量。因此国内外多

20、采用能同时提高生命量与质的保守性手术。若不进行QOL测量,一项治疗尽管其疗效被认为是完全成功的, 但心理社会功能可能很差,例如,根据Bathel指数评分,患者功能完全独立,但在就业、情感等方面却可能受限。而一项有利于心理社会状态改善的治疗却可能因未能改善机体功能而遭淘汰。近来溶栓治疗的开展和神经保护性治疗的开发,均急需改进对脑卒中结局的测量,包括QOL测量。 四、QOL量表选择评价标准 1998年英国国家健康服务(UK National Health Service, NHS)机构制定了健康技术评定(Health Techonology Assessment, HTA),推鉴在选择结局测量时应

21、考虑以下标准 (一)信度和效度 要使确信QOL测量的科学严谨性,信度(reliability)和效度(validity)的证据是关键。 1、信度是指量表在不同观察评定者、不同时期测量同一被试对象所得相同结果的可靠程度。信度分析是检测评估的随机误差。常用主要方法包括:(1)重测信度(test-retest reliability);(2)分半信度(split-half reliability):采用Spearman-Brown公式计算;(3)内部一致信度(internal consistent reliability):通过计算KR20或Cronbach 系数来评价;(4)评定者之间信度(int

22、er-tester reliability):计算Kappa值。2、效度是指工具测定它打算测定的内容的程度。即实际测量结果与理论值、真实值或“金标准”(gold standard)符合的程度。效度分析是检验测定中的系统误差。内容效度(content validity):是指量表项目反映所量全部内容的程度(即脑卒中患者的生活质量)。内容效度的评估主要通过专家组、病人及文献综述的推理判断来进行,是一种逻辑方法,而非数量化的统计方法。效标效度(criterion-related validity)又称准则关联效度,是指一个量表对处于特定情境中个体的行为进行预测的有效性,即量表结构与金标准的相关程度。

23、包括同时效度(concurrent validity)和预测效度(predictive validity结构效度(construct validity):又称构思(构念)效度。指测量在多大程度上正确地验证了编制量表时的理论构思。(二)敏感度(responsiveness) 即灵敏度、反应性。系指量表能反映QOL变化的能力(即便是很微小的变化),通过动态QOL测定,能够把具有不同疾病程度和/或干预性治疗程度的患者区别开来。在干预治疗研究中,若使用了虽然有适用性、具有信度和效度但却不敏感的量表,则不能发现一些细微的有临床意义的变化,常常造成误导。统计学处理包括均数比较(配对t检验)、标化效应大小(s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论