




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
绪论第一节卫生统计学的定义、内容与课程特点第二节卫生统计学在科研工作中的地位和作用第三节卫生统计中常用的几个基本概念
第一节医学统计学的定义、内容与课程特点
一、医学统计学的定义统计学(statistics):是运用概率论与数理统计的原理和方法,研究资料的搜集、整理和分析推断的一门学科。“Asciencedealingwiththecollection,analysis,interpretation
andpresentationofmassesofnumericaldata.”“Thescienceandartofdealingwithvariationindatathroughcollection,classification,andanalysisinsuchawayastoobtainreliableresults.”
卫生统计学/医学统计学卫生统计学(healthstatistics)是统计学与医学,特别是预防医学相结合的一门交叉学科。它主要研究预防医学、临床医学、卫生事业管理及医疗保险等领域数据的搜集、清理和分析,并以资料所提供的信息,指导我们更好地开展疾病控制与管理工作。二、卫生统计学的内容医学研究设计调查研究设计(观察性研究)实验研究设计(证实性研究)医学统计方法基本统计方法多元统计方法**医学统计软件应用**三、医学统计学的任务与作用结合专业知识和任务,有目的、有计划地进行研究课题设计;正确地选用统计方法;合理地分析和解释计算分析结果,揭示数据中蕴含的信息与规律。帮助研究者将统计思维和方法渗透到医学研究和卫生决策之中。四、医学统计学课程特点1.系统性、连贯性强,章节间联系紧密;2.公式符号多,适用条件严,逻辑推理严密;3.综合性、实用性强,学与做相结合。统计学既不是数学,也不是医学。第二节医学统计工作的基本步骤一、医学研究设计(design)是对整个研究过程的总设想或总按排,是最关键的一步,也是最重要的一步。搞好设计应具备以下条件1.具有丰富的专业知识和水平2.纵阅大量的参考文献3.选准研究课题4.组成多学科专家队伍从内容上讲设计分为专业设计:反映课题研究的深度与水平。
Why?
了解专业现状、学术前沿、研究动态、水平及发展方向和条件,提出课题(立项依据项目的研究意义和应用前景、国内外研究现状分析,附主要的参考文献等)
What?
主要解决的问题(研究目标,研究内容和拟解决的关键问题等,提出详尽的分析思路和技术路线,作好周密的考虑和安排
)
How?统计设计:与科研课题完成的质量有关设计方案应考虑分析目的研究对象分析指标、观察单位、检测内容和方法如何获取资料、怎样整理计算如何控制误差、组织实施等二.搜集资料(collectionofdata)
即按设计要求获取准确、可靠的、有用的数据。是最基础的一步。资料要求:完整性、准确性、及时性资料来源:统计报表经常性工作记录专题研究(如下图)外源资料商业性数据库、专业文献等科研工作程序提出问题——建立假说——结论
搜集资料搜集资料分析资料分析资料整理资料整理资料
线索观察性研究证实性研究(调查)依据(实验)三、清理资料(cleaningdata)
即按设计要求,将一些表现各自特征的原始数据系统化、条理化,从而揭示研究事物内部的规律。
(1)资料核查数字核对逻辑检查(2)数据结构与编码
观察单位观察对象变量分组变量协变量二维相关数据矩阵任何观察或实验研究获得的结果,都必须结合专业知识转变为数据后,才能进行分析。无论是文字型,还是数值型变量,均可用二维数据结构矩阵来表述。
数据编码设计编码过录检查编码录入编码设计分组:据资料的质量或数量特征进行归纳汇总。分组有质量分组据研究事物的性质数量分组按数量的大小归组方法手工汇总划记法分卡法计算机汇总4、分析资料(analysisofdata)
计算统计指标,概括数据特征,阐明事物内在联系与规律。统计分析:统计描述:以计算统计指标,以图表等反映数量特征及规律统计推断:用样本信息推论总体特征第三节统计学中常用的几个基本概念一、同质(homogeneity)与变异(variation)二、变量(variable)与统计资料类型变量:观察单位的研究特征。变量值:变量的观察结果。测量尺度:1.名义尺度(nominalscale)指变量的结果是按某事物属性分类来进行的测量。
2.顺序尺度(ordinalscale)指变量值不但可以分类,而且各类之间有某种特征程度上的不同,可用数学上大于或小于来表达它们之间的关系,如治疗结果中的无效、好转、有效、显效、痊愈。3.区间尺度(intervalscale)指用数量大小来度量某种特征,一般回答“多少”。它不仅表示顺序,而且可把两次测量值之间的相差表达出来。无论在何时、何种情况下再做测量,两次测量值不变。4.比数尺度(ratioscale)指以比值、比例等来度量某种特征,如中性粒细胞占白细胞数总数的百分比、体重指数等。根据变量的观察结果不同,分为定量变量、定性变量和顺序变量等。定量变量(quantitativevariable)定性变量(qualitativevariable)无序分类二项分类多项分类顺序变量(ordinalvariable)
由一组同质的定量变量值所组成的资料称为定量资料。按某事物属性分组,清点各组的观察单位数而得到的资料称为定性资料。按等级分组,清点各组观察单位数而得到的资料,称为等级资料(ordinaldata)或半定量资料。
举例
性别人数男20女18合计38——————————————
血型人数
—————————————A143B182AB98O102
—————————————
举例TFT例数—28±8+9++6+++4++++1举例15例儿童Hb含量108、111、96、114、113、88、79、117、98、76、82、95、102、101、92有贫血11无贫血4无贫血4轻度贫血7中度贫血2重度贫血2三、总体与样本总体(population)有限总体无限总体样本(sample)随机抽样(randomsampling)样本例数n样本含量(samplesize)
4、概率(probability)p随机事件可重复性:相同条件下可重复进行随机性:出现两种及两种以上结果偶然性:实验前不能肯定将出现那种结果医药研究是医学工作人员探求知识,不断推进医学发展的一个重要内容,医学研究设计是医学科学研究工作过程的第一步,也是最重要的一步。一个良好的考虑周密的研究设计,不仅可使研究者能更好地发挥天赋与才能,而且也是保证医学研究结果具有科学性,高效地完成研究工作的前提;反之,一个拙劣的设计,不仅可导致研究工作的失败,甚至也可能得出违背客观规律的、荒谬的解释。怎样才能以较少的人力、物力和财力,获取准确、可靠的科学结论,搞好医学研究设计是非常关键的内容。也是应用于基础医学、临床医学、预防医学及医药卫生事业管理中,高级医卫人才成长必不可少的一门学问。医学研究设计是指在研究工作开始之前对整个研究过程的一个总构思或总按排,要搞好研究课题设计起码应具备以下基本条件:
1、课题设计者应具有丰富的、扎实的专业理论和基础知识。
2、纵阅本专业(学科)、相邻专业(学科)及有关边缘专业(学科)与研究课题有关大量的参考文献。
3、选准新知识、新理论、新方法进行论证和探讨,提出课题。
4、组建一支学科理论知识渊博、专业技术过硬的多学科专家学术队伍。
从内容上讲医学研究设计分为专业设计和统计设计两个方面。
专业设计主要反映研究者对专业知识把握的能力,直接影响着科学研究工作的深度和水平;
统计设计主要反映研究者对统计知识正确应用的能力,它与科学研究的技术有关,直接影响着科研工作的质量。临床研究的类型
一、观察性研究
二、证实性研究医学研究的类型有哪些?
提出问题建立假设结论
分析
搜集分析搜集
整理整理
线索
观察性研究证实性研究
(调查)(实验)依据证实性(干预)研究:是指研究者据研究目的从研究总体中随机抽取部分观察单位,按要求随机分配受试对象,合理安排处理因素,以对比和分析处理因素施加于受试对象后所产生反应或效应间差别的一系列研究方法。
据受试对象不同
动物实验
干预研究临床试验
实验室研究
第一节
观察性研究设计的意义与特点观察性(调查)研究
对客观存在的研究因素加以研究分析;
不能用随机分配的方法来平衡混杂因素的影响。研究者只能被动地调查分析客观实际情况。两者在设计上不尽相同,但实际工作中又难以截然分开,且经常结合使用。观察性研究可为证实性研究提供线索,证实性研究又可为观察性研究提供科学依据。第二节
观察性研究常用的方法(一)据研究范围
观察性研究全面调查:普查
非全面调查:重点调查
典型调查
抽样调查
抽样调查概率抽样亦称随机抽样
非概率抽样碰巧抽样
配额抽样
滚雪球抽样
案例研究
(二)据研究时间
观察性研究断面调查
纵向研究回顾性调查
前瞻性队列研究
前瞻性调查历史性队列研究
双向性队列研究横断面调查(cross-sectionstudy):也称现况调查或基线调查,是在某一时点或相当短的时间内(如1天、1周或1月)对某一人群中有关疾病或临床事件的患病(或发生)状况及其影响因素进行调查分析,因此又称为现况研究或现患率研究(Prevalencestudy)。现况研究的目的是了解某一疾病或临床事件的发生状况及其影响(暴露)因素。
纵向研究(longitudinalstudy)随研究方向不同,分为:
回顾性调查:一般指由果推因的纵向研究。它指通过询问、检查或复查病史等方式获取该时点前与研究内容有关的暴露史,检查各组各因素暴露的比例,,经统计分析作出推断。主要用来探索事物现象间关系。如病因研究、病历总结、报表分析等。病因研究的方法常用的有病例对照研究。
病例对照研究(case-controlstudy)是一种用于分析暴露(exposure)和疾病(或临床事件)之间因果关系的分析性研究方法。它选择具有所研究疾病(或临床事件)的病例组和非该病的对照组,调查他们的暴露情况,比较两组的暴露率或暴露水平间是否有差别,来推论该暴露因素与疾病或事件间有否联系。病例对照研究设计的模式见下。
从研究模式可知病例对照研究有下列特点:
①研究对象分成病例和对照组并不是随机分配的,而是按有无被研究的疾病或临床事件来分组,因此病例组与对照组是自然已经形成的,并不是研究者能主观控制的;
②所调查的研究因素包括危险因素、预后因素及诊疗措施是研究者从现在对过去的回顾而获得的,因此属回顾性研究;
③它是由果推因的研究。
病例对照研究优点:
①病例对照研究所需的样本含量较小,因此适宜于少见疾病的研究,如恶性肿瘤的病因和危险因素研究;
②由于调查暴露情况是采用回顾方式,因此适用于长潜伏期疾病的研究,如化学因素致癌作用常需10~20年,造成科研周期过短,而病例对照研究则可以很快地出成果;
③病例对照研究允许同时调查许多因素和研究疾病的联系,并可以使用病史记录作为数据的来源;
④采用病例对照研究设计方案可以省人、省时、省钱,科研周期短,容易出成果。
病例对照研究设计方案的缺点:
①病例对照研究合理选择对照十分困难;对照组的选择系由研究者自行选择,难免产生较大偏倚;特别容易受到回忆性偏倚的影响,尤其是设计不规范的病例对照研究更易受到各种偏倚的影响,从而影响研究结果的正确性;
②论证强度不及队列研究和试验性研究;
③病例对照研究不能计算发病率,只能计算近似的相对危险度,用优势比来估计。
前瞻性调查
:
队列研究(cohortstudy)是据已掌握的与研究内容有关的信息,对不同暴露因素作用于研究对象后所产生效应进行分析比较的研究方法。常用来分析暴露与疾病或临床事件之间的因果关系,验证或检验假说是否成立。它将一群研究对象按是否暴露于某因素分成暴露组与非暴露组(对照组),随访适当长的时间,比较两组之间所研究疾病(或临床事件)的发生率(发病率或死亡率)的差异,以研究证实疾病与暴露之间的因果关系。
队列研究的特点①研究对象按暴露与否分组,其暴露与否在客观上已经存在,研究者是不能控制的,并且是暴露在前,疾病在后,属由因推果的研究;②研究需要有一段纵向的随访期,病例和对照在随访期内逐渐自然形成,未经选择.因此队列研究是一种前瞻性的研究或纵向的随访研究;③能直接计算两组的发病率、死亡率和相对危险度,并且可以调查一个暴露和多个结局(疾病或临床事件)间的关系。过去现在将来收集队列随访收集队列随访回顾性队列前瞻性队列回顾性和前瞻性队列研究示意图队列研究按研究时间不同分为:
①前瞻性队列研究(prospectivecohortstudy)历史性队列研究(historicalcohortstudy)是指在研究开始前,观察对象就已经进入研究起点,即观察对象是在过去某个时间进入队列的。其研究对象的确定和分组是据进入队列时暴露的状态进行的,研究结局是以前瞻性方向进行,但研究方法是回顾性的。
②回顾性队列研究(retrospectivecohortstudy),前瞻性队列研究(prospectivecohortstudy)也称随访研究(follow-upstudy),是据研究开始时的状态分组,随访一段时间,获取研究结局,它是队列研究的基本形式。一般前瞻性队列研究设计比较合理,收集的资料常正确可靠,而回顾性队列研究常采用过去为其他目的收集的资料,因此质量常受到影响。所谓“发病率研究(incidencestudy)”,即在无该病的易感人群中,随访观察到某一时点,统计新发病例数,获得发病率的资料,实质上也是队列研究的一种。
队列研究设计在临床研究中应用甚广,不论在病因和危险因素的研究、预后和预后因素的研究、防治效果远期疗效的考核等都可以应用,特别是在预后研究及病因危险因素研究中有重要的价值。
队列研究设计的优点:
①可设立前瞻性的同期对照,除了暴露因素接触与否外,各队列中纳入的观察对象、诊断标准和纳入/排除标准以及观察指标与项目等都可做到标准化,因此论证强度高,可靠性强。但暴露的接触与否是自然形成的,并不能由研究者控制,这是和试验性研究最大的区别;②由于设计方案是暴露在前,患病(结局)在后,因此确定暴露没有偏倚,因此获得的结论可靠性强;由于前瞻性随访观察,不易有回忆性偏倚;③可研究暴露因素和多个结局(疾病或临床事件)的关系;④可直接计算发病率和相对危险度,因果关系颇为明确。
队列研究设计的缺点:
①在发病率很低的疾病往往需要很大的样本数,并且有些暴露因此从接触到发病需要很长的潜伏期,因此费时、投入人力、物力、财力较大,不适用于罕见疾病的研究;②容易发生失访偏倚,因为样本数很大,又要经过长期的随访期,因此不免有失访,如失访率在10%以上就可能会影响研究结果;③由于随访时间较长,在此过程中会发生许多事件或因素,最后出现的结果很难判定。第三节观察性研究设计的内容一、调查计划的内容(一)明确调查目的和指标
1.了解样本信息来推论总体特征
2.掌握和探索变量间的相互关系
调查目的要明确、具体目的是确定调查指标的依据,调查指标又是调查目的的具体体现。
(二)确定调查对象和观察单位质量诊断标准纳入标准(inclusioncriteria)排除标准(exclusioncriteria)样本含量估计1.容许误差(δ)2.第一类错误α的大小3.变异指标的大小
(三)明确调查方法和调查方式
直接观察法面对面采访法自填追踪调查
(四)确定调查项目拟定调查表调查项目分析项目备考项目开放式封闭式半封闭式(五)拟定调查组织计划二、清理分析计划资料核查资料汇总设计统计分析表组织计划第四节几种常用的抽样方法及样本含量估计
单纯随机抽样系统抽样整群抽样分层抽样
频数(frequency)
频数表(frequencytable)第一节数值变量资料的频数表
X40404143424142-------------------------------------------
xf——————————————402412422431-------------------------------------------
一、频数表编制步骤:求极差(R)R=Xmax-Xmin确定组距(i)和组段[L,U)i=R/10列表划记
———————————————————————————组段例数2..30~12.60~32.90~63.20~83.50~173.80~204.10~174.40~124.70~95.00~55.30~25.60~5.901———————————————————————————
频数分布直方图二、频数表的用途:1.揭示频数分布的类型和特征;分布类型:对称分布(正态)偏态分布分布特征:中心位置分布范围对称性变动趋势2.便于进一步计算指标和分析处理;3.发现某些特大特小的可疑值;
4.进行正态性判定等。第二节集中位置的描述平均数(average)包括:算术均数/均数(mean)几何均数(geometricmean)中位数(median)一、均数
1.意义均数是平均数的一种。常用µ表示总体均数常用X表示样本均数2.计算方法
直接法加权法
3.均数的两个重要性质(X-X)=0(X-X)2〈=(X-a)2的运算性质X1+X2+……+Xn=
X(x+y+z)=x+y+zcX=cXc=nc
X12345
(X-X)-2-1012(X-X)241014(X-4)2-3-2-1014.均数的应用
二.几何均数(geometricmean)例如X10100100010000100000
X=22222log10X12345x=3X=103=1000
1.几何均数的意义表示一组近似服从对数正态分布(如等比级)资料的中心位置。2.计算方法
直接法加权法----------------------------------------------------抗体滴度人数滴度倒数1gX(1)(2)(3)(4)----------------------------------------------------1:4140.60211:8580.90311:166161.20411:322321.50511;647641.80621:128101282.10721:25642562.40821:51255122.709340
3、几何均数的应用实测值为零实测值有正有负
几何均数小于或等于均数G<=X
三、中位数与百分数
1.中位数的意义例如9、5、3、4、8
M=52.中位数的计算直接法
频数表法计算公式M=L+i/fM(nX%-
fL)---------------------------------------------------------------------浓度天数f累积频数累积频率%(1)(2)(3)(4)---------------------------------------------------------------------25~393910.850~6710629.475~6417047.1
100~6323364.5125~4527877.0150~3030885.3175~1732590.0200~933492.5225~734194.5250~634796.1275~535297.5300~335598.3325~6361100.0361几何意义Aa
ffMBbcC
fL
iLMU频数表法P50=M=L+i/fm(n/2-
fL)百分位数Px=L+i/fX(nX%
-
fL)举例中位数、四分位数与百分位数(percentile)
1
1
3424
12中位数与百分位数的应用中心位置分布情况参考值范围
MX生存分析(survivalanalysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。前言第一节生存分析基本概念一、生存时间(survivaltime,failuretime)终点事件与起始事件之间的时间间隔。终点事件指研究者所关心的特定结局。起始事件是反映研究对象生存过程的起始特征的事件。生存时间举例
起始事件终点事件服药痊愈手术切除死亡染毒死亡化疗缓解缓解复发终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。生存时间的类型1.完全数据(completedata)从起点至死亡(死于所研究疾病)所经历的时间。2.截尾数据(删失数据,censoreddata)从起点至截尾点所经历的时间。截尾原因:失访、死于其它疾病、观察结束时病人尚存活等。例如,某肿瘤医院调查了1991-1995年间经手术治疗的大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、Dure’S分期等。随访截止日期为2000年12月30日,随访记录见下表。
大肠癌患者的随访记录编号
性别
年龄…
手术日期
随访终止日期
随访结局
生存时间(天)1男
45…1991.05.201995.06.04死亡
1476
2男
50…1992.01.121998.08.25死亡
24173女
36…1991.10.241994.03.18失访
876+
4男
52…1994.11.022000.12.30存活
2250+
5女
56…1994.06.251995.03.17死亡
2656女
60…1993.12.051996.08.16死于其它
985+
…生存时间生存时间的度量单位可以是年、月、日、小时等。常用符号t表示,截尾数据在其右上角标记“+”。生存资料的主要特点:含有截尾数据。截尾数据的特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长。生存时间的分布一般不呈正态分布。
二、条件生存概率、生存率、生存曲线条件生存概率:(conditionalprobabilityofsurvival)表示某单位时段开始时存活的个体,到该时段结束时仍存活的可能性。年条件生存概率表示年初尚存人口存活满1年的可能性。生存率:(survivalrate,survivalfunction)指观察对象经历t个单位时段后仍存活的可能性。条件生存概率和生存率的计算例:手术治疗100例食管癌患者,术后1、2、3年的死亡数分别为10、20、30,若无截尾数据,试求各年条件生存概率及逐年生存率。生存率计算方法:直接法概率乘法定理由例子可看出,生存率与条件生存概率不同。条件生存概率是单个时段的结果,而生存率实质上是累积条件生存概率(cumulativeprobabilityofsurvival),是多个时段的累积结果。例如,3年生存率是第1年存活,第2年也存活,第3年还存活的可能性。生存曲线(survivalcurve)以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。平缓的生存曲线表示高生存率或较长生存期,陡峭的生存曲线表示低生存率或较短生存期。某医师收集20例脑瘤患者甲、乙两疗法治疗的生存时间(周)如下:甲疗法组13371015152330乙疗法组
57+1313233030+38424245+
三、中位生存期中位生存期(mediansurvivaltime)又称半数生存期,表示恰好有50%的个体尚存活的时间。中位生存期越长,表示疾病的预后越好;中位生存期越短,预后越差。估计中位生存期常用图解法或线性内插法。生存资料统计学处理方法(一)设计目的:专业目的:据专业知识确定。统计学目的:估计:根据样本生存资料估计总体生存率及其它有关指标(如中位生存期等),如根据脑瘤患者治疗后的生存时间资料,估计不同时间的生存率、生存曲线以及中位生存期等。比较:对不同处理组生存率进行比较,如比较不同疗法治疗脑瘤的生存率,以了解哪种治疗方案较优。影响因素分析:目的是为了探索和了解影响生存时间长短的因素,或平衡某些因素影响后,研究某个或某些因素对生存率的影响。如为改善脑瘤病人的预后,应了解影响病人预后的主要因素,包括病人的年龄、性别、病程、肿瘤分期、治疗方案等。预测:具有不同因素水平的个体生存预测,如根据脑瘤病人的年龄、性别、病程、肿瘤分期、治疗方案等预测该病人t年(月)生存率。方法:前瞻性队列研究回顾性队列研究确定起始事件、终点事件、随访终止日期、生存时间、截尾。确定可能的影响因素、水平以及量化方法。大肠癌影响因素量化表变量名因素量化值病例数构成比(%)
X1性别女=03248.5
男=13451.5X2年龄(岁)<40=11015.140-60=23756.1≥60=31928.8X3组织学分类乳头状腺癌=02030.3
管状腺癌=14669.7X4肿瘤大小(cm)≤6=02943.9
>6=13756.1X5细胞增殖抗原(PCNA)
<55%=02740.9≥55%=13959.1X6淋巴管浸润无=04466.7
有=12233.3X7血管浸润无=05887.9
有=1812.1Time手术到观察结束实际天数Event结束时是否死亡未死=02233.3
死亡=14466.7设计调查表:一览表:因素较少时。单一表:因素较多时。调查表中应包括可能的影响因素观察起点和终点(年、月、日)生存时间生存结局样本含量:非截尾例数至少是可能影响因素的10倍。三联体数据(二)搜集资料可能的影响因素:从病历获得。生存时间及结局:短期可观察到的结局可从病历获得;长期结局一般不能从病历直接获得,通过信访、电话等得到。(三)整理资料认真检查、核对原始数据,包括影响因素、生存时间和生存结局。尽量避免缺失值。建立数据库FoxBase、Foxpro、VirualFoxpro等专业数据库统计软件数据库(SAS、SPSS等)Office办公软件中的Excel、Access
大肠癌生存资料序号X1X2X3X4X5X6X7TimeEvent1021001028960202100109921312110002811040311010205215120100029750612111118561…6501111005841
生存资料基本要求样本由随机抽样方法获得,要有一定的数量。死亡例数不能太少。截尾比例不能太大。生存时间尽可能准确。因为常用的生存分析方法都在生存时间排序的基础上作统计处理,即使是小小的舍入误差,也可能改变生存时间顺序而影响结果。缺项应尽量补齐。(四)分析资料估计:Kaplan-Meier法,寿命表法比较:log-rank检验影响因素分析:Cox比例风险回归模型(Cox回归模型),是生存分析中最重要的模型之一。预测:Cox回归模型预测生存率。第二节生存率的估计与生存曲线一、小样本资料生存率及其标准误的计算生存率的计算:Kaplan-Meier法(K-M法、乘积极限法)Kaplan-Meier法由Kaplan和Meier于1958年提出,直接用概率乘法定理估计生存率,故称乘积极限法(product-limitmethod),是一种非参数法,适用于小样本和大样本。生存率的标准误的计算生存曲线二、大样本资料的生存分析生存率的计算寿命表法生存曲线第三节生存曲线的log-rank检验log-rank检验(对数秩检验、时序检验)该检验属非参数检验,用于比较两组或多组生存曲线或生存时间是否相同。检验统计量为卡方。自由度=组数-1。P≤0.05,两组或多组生存曲线不同。
P>0.05,两组或多组生存曲线差别无统计学意义。注意以上介绍的是log-rank检验的近似法,计算简便,但其结果较精确法(一般统计软件中输出精确法计算结果)保守。
近似法:(手工)精确法:(软件)此检验比较两组或多组生存曲线,实为一单因素分析。要求各组生存曲线不能交叉,如交叉提示存在混杂因素,应采用分层分析方法或多因素方法来校正混杂因素。当假设检验有统计意义时,可从以下几方面来评价各组效应大小:生存曲线图目测判断、中位生存期比较等。log-rank检验用于整条生存曲线的比较,若比较两组某时间点处的生存率,则按下式计算:
如比较多个时间点处生存率,检验水准应取Bonferroni校正,即,其中k为比较的次数,以保证总的I型错误概率不超过。
第四节Cox比例风险回归模型Cox比例风险回归模型(Cox’sproportionalhazardsregressionmodel),简称Cox回归模型。该模型由英国统计学家D.R.Cox于1972年提出,主要用于肿瘤和其它慢性病的预后分析,也可用于队列研究的病因探索。其优点:多因素分析方法不考虑生存时间分布利用截尾数据一、Cox模型的基本形式h(t,X)—t时刻风险函数、风险率或瞬时死亡率(hazardfunction)。h0(t)—基准风险函数,即所有变量都取0时t时刻风险函数。X1、X2、…、Xp—协变量、影响因素、预后因素。β1、β2、…、βp—回归系数。β>0,RR>1,说明变量X增加时,危险率增加,即X是危险因素。β<0,RR<1,说明变量X增加时,危险率下降,即X是保护因素。β=0,RR=1,说明变量X增加时,危险率不变,即X是危险无关因素。二、参数估计与假设检验(一)参数估计最大似然法(二)假设检验似然比检验(likelihoodratiotest)得分检验(scoretest)Wald检验(Waldtest)三、因素筛选与最优模型的建立变量筛选方法向前引入法(前进法)Forward向后剔除法(后退法)Backward逐步引入-剔除法(逐步法)Stepwise检验水准初步的、探索性的研究,或变量数较少时,可取0.10。设计严谨的、证实性的研究,或变量数较多时,可取0.05或0.01。检验水准包括引入的检验水准和剔除的检验水准。一般地,剔除α≥引入α。分析结果(结果解释)与生存相关的因素因素作用大小及方向:保护因素还是危险因素、相对危险度的大小。因素作用大小排序:标准化回归系数的绝对值。分析结果(结果解释)个体的预后指数及预后分组:预后指数(prognosticindex,PI)
=
预后指数越小,预后越好;预后指数越大,预后越差。分析结果(结果解释)例如:传统治疗方式,淋巴结转移,PI=2.6929
传统治疗方式,淋巴结无转移,PI=1.7616
新治疗方式,淋巴结转移,PI=0.9313
新治疗方式,淋巴结无转移,PI=0据PI的大小可将病人分为不同的危险组,常见分三组(即低危组、中危组、高危组)或五组。绘制分组的生存曲线,直观比较各危险组的生存情况,如中位生存期、t年生存率等。六、Cox模型的注意事项及应用范围(一)注意事项设计阶段应注意的问题模型配合时应注意的问题应用条件:除生存资料的基本要求外,还要求因素对生存时间的作用不随时间变化(比例风险假定)。如观察年限超过10年时,癌症手术后放疗的治疗作用可能逐渐消失,从而不满足这一要求。因素分析时应注意的问题筛选变量时,考虑该指标是否容易收集、是否费用较高等临床因素。对连续变量,看其分布,如服从偏态分布,一般进行对数变换后参与计算。选入模型的变量是统计学上的有关变量,不一定都与生存时间有因果关系。其中某些变量可能只是伴随关系而已,未选入模型的变量不一定全是无关变量,要考虑是否模型内的某些变量代替了它的作用,或因例数不够,或试验中对该变量进行了控制而引起。检查可能的交互作用项是否显著(方法:一次引入一个交互作用项,看其对应的回归系数是否为0)。模型拟合优度考察:据预后指数PI分组,比较各组基于Cox模型的生存曲线与基于kaplan-Meier法估计的生存曲线,如两组曲线吻合较好,表明Cox模型拟合较好。生存率分析:生存曲线不能随意延长,也不能轻易用于预测预报,经过大量研究所得的生存曲线才有可能推广应用。(二)适用范围因素分析logistic回归模型可以作多因素分析,并可进行相对危险度估计,但不考虑生存时间的长短,不能处理随访中常见的截尾数据。Cox比例风险回归模型具有logistic回归模型的所有优点;同时考虑生存结局和生存时间的长短,可处理截尾数据;且不考虑基准风险的分布。生存预测强调设计的重要性专业知识角度:选择疾病种类、终点事件、影响因素及结果的专业解释等。统计学角度:样本例数、因素的赋值、生存时间准确到天数、因素筛选方法、结果的统计学解释等。小结(论文报告中应写明)1.材料与方法病例来源、起始事件、终点事件、观察终止时间、截尾情况、随访结果的获得方法,样本含量、截尾例数及百分比(%)。建立数据库方法统计学处理方法
Kaplan-Meier法估计生存率
log-rank检验进行组间生存率比较
Cox模型进行多因素分析2.结果估计:Kaplan-Meier生存率及生存曲线。比较:log-rank检验卡方值及其P值。因素分析及预测:变量赋值(数量化方法)表变量统计描述:各组病例数和构成比(分类变量)均数和标准差(数值变量)变量筛选方法及检验水准Cox回归结果及统计解释Cox回归与多元线性回归、logistic回归的比较多元线性回归logistic回归Cox回归数据类型Y数值变量Y分类变量Y二分类变量+时间X数值变量、分类变量、等级变量模型结构变量筛选前进法;后退法;逐步法参数估计最小二乘法最大似然法最大似然法参数检验F-testt-test似然比检验Wald检验score检验似然比检验Wald检验score检验参数解释回归系数b优势比ORRR样本含量至少变量数的10倍至少变量数的20倍非截尾例数至少变量数的10倍应用因素分析预测预报Y因素分析预测、判别P(Y=1)因素分析生存预测S(t)案例分析某研究者观察了确诊后采取同样方案进行化疗的26例急性混合型白血病患者,欲了解某种不良染色体是否会影响患者病情的缓解,将治疗后120天内症状是否缓解作为结果变量(缓解=0;未缓解=1),有无不良染色体作为研究因素。整理资料见下表。
有无不良染色体与缓解的关系不良染色体缓解未缓解合计缓解率(%)有5131827.8
无35837.5
合计8182630.8考虑到例数较小,采用Fisher确切概率法,得到P=0.667,尚不能认为不良染色体影响病情的缓解。这种情况下的结果并不可靠,原因是两个比较组之间其它影响患者病情缓解的因素不一定均衡,因而需要考虑平衡其它可能的影响因素如年龄(岁)、骨髓原幼细胞分组(≥50%=1;<50%=0)、CD34表达(阳性=1;阴性=0)、性别(男=1;女=0)的作用。
多因素logistic回归分析结果因素回归系数Wald卡方POR染色体1.4571.1610.2814.29骨髓原幼2.9614.7780.02919.2细胞分组采用多因素logistic回归分析,经逐步法按0.10水准,平衡骨髓原幼细胞分组后,有无不良染色体不影响患者的缓解(P=0.281)。有一位临床医生指出,仅考虑是否缓解还不够,如果进一步利用缓解时间的长短来进行分析,信息利用得更充分。费了很大辛苦,幸好查到了所有患者的缓解时间,于是采用log-rank检验比较有无不良染色体两组病人的生存曲线,得卡方1.28,P=0.2579,仍然显示患者的缓解时间与不良染色体无关。141
医学研究的类型有哪些?
提出问题建立假设结论
搜集分析搜集分析
整理线索
整理
观察性研究证实性研究
(调查)(实验)依据142
实验研究设计一、实验设计的意义二、实验研究的定义与分类
143证实性(实验)研究指研究者据研究目的从研究总体中随机抽取部分观察单位,按要求随机分配受试对象,合理安排处理因素,以对比和分析处理因素施加于受试对象后所产生反应或效应间差别的一系列研究方法。144据受试对象不同
动物实验
证实性研究临床试验
实验室研究145
1.动物实验(animalexperiment):
指围绕研究目的,选择受试动物所进行的干预研究。也有人称其为模型实验(modelexperiment)或前期临床试验(pre-clinicaltrial)。146
2.临床试验(clinicaltrial):
指研究者据研究目的,以人为受试对象,对比一种或多种干预相对于对照组所产生效应的一种前瞻性研究方法。它必须以预先计划要求来进行。147
临床试验是否只在医院进行?
Clinicaltrialisaprospectivestudyconductedinhumanstocomparetheeffectandvalueofoneormoreinterventionsagainstacontrol.
设计时首先应考虑:1.安全问题;2.必须给参与者讲明潜在利益和危险;3.参加者可据任何理由在任何时刻自由退出。
148临床试验的分型与分期:
据施加于受试对象的承诺不同
治疗型临床试验
临床试验预防型临床试验
健康保护型临床试验149
治疗型临床试验:主指医院、社区医疗服务网点等与照料患者(incaringforthesick)有关的临床研究,它可以是药物试验,也可以是手术设施、方法、技术,不同治疗、护理以及地段防护与管理及诊断试验评价等方面的研究。150
预防型临床试验:
指研究者为做好疾病预防(inpreventionofdisease)对已知的危险因素进行深入研究的干预试验。如不同建筑装饰材料对人体健康影响的试验评价等。
151
健康保护型临床试验:是指为促进和保护健康(inmaintainofhealth)研究者对保健无治疗作用的有关因素所进行的干预研究。如:免疫接种效果评价、保健食品人群试验效应评价及避孕方法与措施效果监测等。
152
3、实验室研究(experimentalstudy):指研究者根据研究目的,收集来自动物或人体的组织、细胞、基因、分泌及代谢物等为受试样品所进行的各种研究。如基因实验、血清学实验、免疫学实验等。
153第一节实验研究的基本要素
处理因素(studyfactors,treatments)
受试对象(studysubjects)
实验效应(experimentaleffects)
154一、处理因素(treatments)
处理因素是指根据研究目的由外部施加于受试对象的某种(些)研究因素或干预。它可以是:
物理因素:温度、理疗、手术等;
化学因素:药物、营养素、激素等;
生物学因素:寄生虫、免疫制剂等;
心理因素:宣教、心理治疗等;
本身特征:年龄、性别、季节等。
155合理安排处理因素应注意:
(1)抓住主要的处理因素
(2)找出非处理因素,并加以控制
(3)处理因素的标准化156二、受试对象(studysubjects)
受试对象是指接受处理的动物、人和实验样品等。
157
(1)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 北京舞蹈学院《蒙古族古代文学史》2023-2024学年第二学期期末试卷
- 北京理工大学珠海学院《风景园林建筑设计》2023-2024学年第二学期期末试卷
- 2025年不良资产处置市场前景分析:行业格局与创新驱动研究报告
- (河北高考卷)2024年河北省普通高中学业水平选择性考试高考物化生+政史地真题试卷及答案
- 北京化工大学《山水临摹与写生》2023-2024学年第二学期期末试卷
- 《电子商务实务》课件任务一 商品详情页文案撰写的化技巧
- 北京电子科技职业学院《技术应用》2023-2024学年第二学期期末试卷
- 北方工业大学《美国社会与文化》2023-2024学年第二学期期末试卷
- 保定学院《汽车构造与原理》2023-2024学年第二学期期末试卷
- 包头轻工职业技术学院《文学与文化修养》2023-2024学年第二学期期末试卷
- 教育行业教师外派管理规定
- C919飞机首飞试飞机组培训-指示记录
- 《机器人驱动与运动控制》全套教学课件
- 人教版高中物理必修三期末综合试题(原卷版和解析版)
- 展览馆室内布展施工方案
- 济南大学《工程伦理与项目管理》2021-2022学年第一学期期末试卷
- 数据中心IDC机房运维工程师培训教材
- 气压传动课件 项目八任务二 钻床自动化流水线气动系统
- 正规个人租车合同模板
- 《篮球:防守无球队员》教案(两篇)
- 《地方导游基础知识》8.1 港澳台 地方导游基础知识-题库及答案
评论
0/150
提交评论