




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
临床科研数据的提取与管理数据的质量控制数据管理中的几个常见问题统计分析结果与表达主要内容2临床科研数据的提取与管理(一)研究设计(二)收集资料:完整、准确(三)整理资料:核查、清洗(四)分析资料统计工作的基本步骤
3临床科研数据的提取与管理数据的质量控制4临床科研数据的提取与管理(一)数据的来源与数据集观察性数据实验性数据科研数据5临床科研数据的提取与管理观察性数据(观察性研究):卫生工作报表,病例资料观察性研究:客观地观察、记录和描述事物规律或现象的认识活动。实验性数据(实验性研究):临床病例资料,动物实验记录实验性研究:人为控制实验条件或对研究对象施加一定干预措施所做的研究。多中心临床实验或大型调查研究:样本量大,变量数多6临床科研数据的提取与管理7临床科研数据的提取与管理编号性别年龄民族体重(kg)身高(cm)冠心病糖尿病1男72汉78.54169.0有无2女81汉33.50142.0无无3男90回65.83170.0无可疑4男72汉86.26181.0无无5女70其他69.46158.5无有……………………735男71汉88.08181.0无无某地2002年735例65岁以上老年人健康检查记录casevariable数据矩阵8临床科研数据的提取与管理编号性别年龄民族体重(kg)身高(cm)冠心病糖尿病1男72汉78.54169.0有无2女81汉33.50142.0无无3男90回65.83170.0无可疑4男72汉86.26181.0无无5女70其他69.46158.5无有……………………735男71汉88.08181.0无无某地2002年735例65岁以上老年人健康检查记录分析变量标识变量9临床科研数据的提取与管理编号性别年龄民族体重(kg)身高(cm)冠心病糖尿病1男72汉78.54169.0有无2女81汉33.50142.0无无3男90回65.83170.0无可疑4男72汉86.26181.0无无5女70其他69.46158.5无有……………………735男71汉88.08181.0无无某地2002年735例65岁以上老年人健康检查记录反应变量解释变量10临床科研数据的提取与管理解释变量:指示变量、分组变量、因素、协变量、预测变量等反应变量:表示试验效应或观测结果的指标。注意:变量名:英文、不超过8个字符,分类变量适当数量化处理。11临床科研数据的提取与管理(二)数据录入
数据录入是将研究收集到的各种信息转换为数据形式,输入到计算机进行保存、管理的过程。数据审核:对收集到的原始资料进行审查与核实的过程。
真实、准确、完整、标准制定数据编码表:使研究得到的信息数字化和标准化。
封闭性、开放性、缺失数据建立数据库:运用专业的数据库管理软件。
数据管理、查询、修改功能12临床科研数据的提取与管理13临床科研数据的提取与管理numbersexagenationalityweight(kg)height(cm)coronarydiabetes1172178.54169.0102081133.50142.0003190265.83170.0014172186.26181.0005070469.46158.502……………………735171188.08181.000原始数据录入格式14临床科研数据的提取与管理数据录入的原则
1、方便录入:将字符变量转换成数值变量;2、便于核查:一定要有标识变量,以方便数据的核对;3、易于转换:录入数据时要考虑不同软件的要求;4、利于分析:同一研究课题的结果最好录成一个数据库文件。同一资料进行双人重复录入方法,应用程序对两个数据库进行比对,核查错误。15临床科研数据的提取与管理16临床科研数据的提取与管理EpiData特点简单易学、实用性强对计算机硬件要求不高调查表设计便捷与调查表形式一致的可视数据录入界面数据核查功能强大且实现简便
EpiData
Analysis可用于一般的统计分析与制图
数据转换功能强大
17临床科研数据的提取与管理建立调查表文件创建数据库建立核查文件录入数据数据库管理输出数据
EpiData的基本流程18临床科研数据的提取与管理数据库的导出(Datain)SPSS文件SAS文件DBF文件
Stata文件REC文件19临床科研数据的提取与管理20临床科研数据的提取与管理二.
数据管理中的几个常见问题21临床科研数据的提取与管理(一)数据的质量控制1、输入信息的有效性,即幅度检查;2、输入信息相互之间的一致性,即逻辑检查;3、查漏:原始数据的编号与数据库的编号核对;4、运用统计软件观察频数分布是否异常;5、进行描述性统计,有无离群值和缺失值。22临床科研数据的提取与管理(二)变量的设置1、连续型变量的输入:直接录入;2、离散型变量的输入:数值化处理。变量的设置方式:资料类型、研究目的、变量的分布形式、统计方法的应用条件。23临床科研数据的提取与管理(三)缺失值处理缺失值主要来自资料收集中的漏报和漏填;缺失值应控制在数据记录总量的10%以内;注意将缺失值与“0”区分开来,缺失值一般用“.”表示;缺失比例很小时,可舍弃;缺失比例较大时,可进行插补(不得已,慎用)。24临床科研数据的提取与管理(四)离群数据的处理有无离群值?
频数表、箱式图或直方图可初步判断;线性回归方法判断。离群值(outlier)是指超出数据通常变化范围的特大值或特小值的观测值。出现离群值的处理
在离群值附近多次抽样,了解数据的真实结构;专业知识与统计方法结合。25临床科研数据的提取与管理(五)统计学方法的应用条件正态性检验方差齐性检验多重共线性判断26临床科研数据的提取与管理统计方法的正确选择27临床科研数据的提取与管理三.统计分析结果与表达28临床科研数据的提取与管理医学论著的基本结构
摘要引言1.
材料与方法2.
结果3.
讨论AbstractIntroductionMaterialsandMethodsResults
Discussion29临床科研数据的提取与管理30临床科研数据的提取与管理31临床科研数据的提取与管理32临床科研数据的提取与管理统计表33临床科研数据的提取与管理统计图34临床科研数据的提取与管理摘要
Abstract对处理组和对照组的主要统计结果进行概述:
均数(中位数、率),标准差(标准误),P值;
两组均数(率)之差或者OR值,95%可信区间(CI);
多个观察指标的相关系数及其P
值等.35临床科研数据的提取与管理36临床科研数据的提取与管理简要说明研究背景和研究目的。给出文献分析的综合复习结果:
如组间差别(DifferenceAmongGroups);
P值(P-value)等。采用循证医学的方法。引言Introduction37临床科研数据的提取与管理38临床科研数据的提取与管理材料与方法MaterialsandMethods统计表达
研究设计方案(DesignofResearchMethods)统计分析方法及软件(AnalysisMethodsandSoftware)目的:以使读者确认论文中所有统计分析结果的可靠性和研究结论的合理性。
39临床科研数据的提取与管理研究设计方案(DesignofResearchMethods)
研究对象的来源和选择方法,包括观察对象的基本情况
需要说明诊断标准病例入选标准、病例排除标准、病例剔除标准、疗效评价标准。有无失访(失访比例,不可超过20%)、有无“知情同意”评价疗效有无遮蔽(“单盲SingleBlind”、“双盲DoubleBlind”或“多盲MultipleBlind”)等均衡性分析结果:影响因素(如年龄、性别、病情)样本量估计的依据(SampleSize)40临床科研数据的提取与管理41临床科研数据的提取与管理常用统计方法简单说明:
如检验、t检验、单因素方差分析(ANOVA)等;特殊的统计方法给出相应的参考文献:
如聚类分析(Cluster)、生存分析(SurvivalAnalysis)等;一般统计计算软件给出名称如SPSS、SAS、STATA等,EXCEL不能作为处理软件特殊的计算软件要给出软件的过程名统计分析方法及软件(AnalysisMethodsandSoftware)42临床科研数据的提取与管理43临床科研数据的提取与管理统计表达
统计图表(StatisticalGraphs&Tables)结果ResultsP值的表达(SuitableExpressionofP)统计指标(StatisticalIndexes)数据精度(NumericalPrecision)44临床科研数据的提取与管理45临床科研数据的提取与管理统计表46临床科研数据的提取与管理统计图47临床科研数据的提取与管理讨论Discussion统计解释
P
值的解释(InterpretationofP)关联的解释(InterpretationofAssociation)因果的解释(InterpretationofCausation)r值的解释(Interpretationofr)48临床科研数据的提取与管理统计资料的分类Statisticalclassification49临床科研数据的提取与管理编号性别年龄民族体重(kg)身高(cm)冠心病糖尿病1男72汉78.54169.0有无2女81汉33.50142.0无无3男90回65.83170.0无可疑4男72汉86.26181.0无无5女70其他69.46158.5无有……………………735男71汉88.08181.0无无某地2002年735例65岁以上老年人健康检查记录计量计量计量计数计数计数等级50临床科研数据的提取与管理1.计量资料(或定量变量)
measurmentdata,quantitativedata定义:测定每个观察单位的某项指标量的大小,所得的资料称为计量资料。其变量值是定量的,一般带有度量衡或其它单位。
特点:每个观察单位的观察值之间有量的区别。
51临床科研数据的提取与管理
定义:将观察单位按某种属性或类别分组计数,分组汇总得到各组观察单位数称为计数资料。特点:计数排列是无序分组,同组各观察单位之间没有量的差别,但各组间有质的不同,各组互不相容。二项分类和多项分类2.计数资料(或无序分类变量)
enumerationdata,unorderedcategorydata52临床科研数据的提取与管理3.等级资料(或有序分类变量)
rankeddata,
ordinalcategorydata定义:将观察单位按某个指标量的大小分成等级或某种属性的不同程度分成等级后分组计数,分类汇总各组的观察单位数称为等级资料。特点:等级是有序分组。同计数资料的区别是:属性的分组有程度的差别,各组按一定顺序排列;与计量资料的区别是:每个观察单位未确切定量,所以又称为半定量资料。53临床科研数据的提取与管理54临床科研数据的提取与管理常用的统计指标AnalysisIndex55临床科研数据的提取与管理统计指标可用于描述性的统计分析,也是反映数据基本特征的统计分析方法。并可使人们准确、全面地了解数据资料所包涵的信息,以便于在此基础上完成资料的进一步统计分析。56临床科研数据的提取与管理
常用统计指标的特点及其应用场合指标特点应用场合精确,易受极端值影响均匀分布的小样本数据或近似正态分布数据稳定,不受特大或特小值的影响应用范围广,特别是大样本偏态分布资料粗糙,不受极端数值的影响小样本的探索性数据同一资料,几何均数<均数近似对数正态分布数据,等比级数资料标准差与均数的比值,无单位比较不同资料或同类资料均数相差悬殊时变异程度计量资料(数值资料)的指标57临床科研数据的提取与管理58临床科研数据的提取与管理常用相对数的算法和用途应用时需注意:分母一般不宜过小,不以构成比代替率,可比性。计数资料(分类资料)的指标59临床科研数据的提取与管理60临床科研数据的提取与管理统计表Statisticaltable61临床科研数据的提取与管理统计表的构造
表号标题(包括何时、何地、何事)横标目的总标目总标目总标目(单位)纵标目
纵标目…
纵标目纵标目…
横标目××××××××.××××.××┆×××××.×××.××┆┆┆┆┆┆┆┆┆┆合计××××××××.××××.××备注:表头标目线条数字备注表体标题合计62临床科研数据的提取与管理标题是统计表的总名称,位于表的上方;简明确切,与内容一致,通常需注明资料的时间和地点。若一篇论文中有两张以上的统计表,则每张统计表的标题前应加序号。
63临床科研数据的提取与管理表3-2狗损失3/4循环血液量以氧化聚白明胶补充后各段时间血浆中氧化聚白明胶的浓度和24小时内尿中氧化聚白明胶排出量的百分数狗号体重(Kg)注入氧化聚白明胶量(克)注射后血浆内氧化聚白明胶的浓度(克/每100毫升)24小时尿内排出氧化聚白明胶的百分数15-20分1小时6小时12小时24小时4011.015.01.250.780.300.270.10934114.517.90.970.640.280.150.09924211.017.00.970.670.210.140.0470436.815.01.540.930.390.210.10--64临床科研数据的提取与管理(修改)*:四只狗编号依次为40、41、42、43,体重分别为11.0、14.5、11.0、6.8公斤。表3-2氧化聚白明胶存留狗血液内各段时间的浓度和排出量*注入量(克)血浆内浓度(克/100毫升
)24小时内排出量的百分比(%)半小时内1小时6小时12小时24小时15.01.250.780.300.270.109317.90.970.640.280.150.099217.00.970.670.210.140.047015.01.540.930.390.210.10--65临床科研数据的提取与管理根据其位置与作用可分为横标目和纵标目。①横标目:位于表的左侧,向右说明各横行数字的涵义。②纵标目:位于表头右侧,向下说明各纵栏数字的涵义。必要时可在横标目或纵标目前冠以总标目。标目66临床科研数据的提取与管理治疗组患者例数治疗结果良好死亡西药组1367中西医结合组10100表3-3急性心肌梗塞并发休克患者疗效比较(修改表)并发症西药组中西医结合组例数结果例数结果良好死亡良好死亡休克136710100表3-3
两个治疗组对比(原表)67临床科研数据的提取与管理
通常用四条横线将统计表分割成表头、表体和合计三部分(即顶线、底线、纵标目下的横隔线及合计上的横隔线)。
线条正规印刷的统计表一般没有竖线和斜线,但标目间应有明显的间隔;68临床科研数据的提取与管理
分型分度及疗效单纯型慢性支气管炎喘息型慢性支气管炎分度度别重中轻重中轻例数1365431935633疗效指标治愈显效好转无效治愈显效好转无效例数6098511223836511小计%95%5%94.0%6.0%合计94.3%表3-4复方猪胆胶囊对403例不同类型老年慢性支气管炎病例近期疗效观察(原表)69临床科研数据的提取与管理疾病类型例数病情疗效重中轻治愈显效好转无效有效率(%)单纯型22113654316098511294.57喘息型1829356332383651193.96合计40322911064831811162394.29表3-4复方猪胆胶囊治疗老年慢性支气管炎的近期疗效70临床科研数据的提取与管理
数字是统计表的基本语言。主要内容为统计调查结果与计算结果,如均数、合计、率、百分比等;表内数据一律采用阿拉伯数字。要求:数字计算必须绝对准确;同一指标的小数位数应一致,位次要对齐;表内不应有空白项,数字为零时应写“0”,暂时没有数据时用“…”表示,不必合计时可用“—”表示。数字71临床科研数据的提取与管理
备注不是统计表的必须项目,需要时才用,并用“*”号标出,写在表的外面加以说明,如表3-2所示。备注72临床科研数据的提取与管理*:四只狗编号依次为40、41、42、43,体重分别为11.0、14.5、11.0、6.8公斤。表3-2氧化聚白明胶存留狗血液内各段时间的浓度和排出量*注入量(克)血浆内浓度(克/100毫升
)24小时内排出量的百分比(%)半小时内1小时6小时12小时24小时15.01.250.780.300.270.109317.90.970.640.280.150.099217.00.970.670.210.140.047015.01.540.930.390.210.10--73临床科研数据的提取与管理
从内容上看,每张统计表都有主语和宾语。
主语:是指被研究的事物,多位于表内左边。
宾语:指说明主语的统计指标,多位于表内右边。
将主语和宾语连接起来,应能读成一个完整的句子。内容74临床科研数据的提取与管理表3-4复方猪胆胶囊治疗老年慢性支气管炎的近期疗效疾病类型例数病情疗效重中轻治愈显效好转无效有效率(%)单纯型22113654316098511294.57喘息型1829356332383651193.96合计40322911064831811162394.2975临床科研数据的提取与管理统计表的内容要丰富:制表的目的是为了对统计结果进行对比分析,若指标过少,则不易凑统计表。1统计表要重点突出:一般一张统计表只表达一个中心内容,若包含内容过多,可分制成若干张统计表。
2统计表要有“自明性”
:即主谓分明,层次清楚。为此,标目的处理是决定统计表质量的关键。横标目常为第一主辞,纵标目为第二主辞,切忌位置混乱,互相混杂,使读者难以识别。3制表注意事项76临床科研数据的提取与管理分组切除组姑息手术组探查合计手术方式胰十二指肠切除术胆肠吻合术胃肠加胃肠吻合术胃肠吻合术胆道外引流术剖腹探查术例数手术死亡随访例数生存月数29*32613871171314112472538262.547538219224161△
生存半年率一年
%二年寿三年命五年表十年法21.04±3.8911.91±4.9956.56±9.564.11±2.012.39±2.3628.74±8.811.03±1.02024.63±8.450021.13±8.010012.08±7.8700*:其中2例是其他切除术;△:3例为淋巴结活检得到随访者。表3-5192例手术及效果(原表)77临床科研数据的提取与管理手术方式例数术后平均生存月数手术手术死亡随访胰十二指肠切除29*32613.0姑息性手术:
胆肠吻合8711713.0
胆肠+胃肠吻合141124.0
胃肠吻合7253.0
胆道外引流8262.5剖腹探查475382.0合计19224158—*:其中2例是其它切除术。表3-5192例壶腹癌不同手术方式的生存情况78临床科研数据的提取与管理随访时间(年)生存率(%)切除组姑息手术组探查组0.5…21.04±3.8911.91±4.99155.56±9.564.11±2.012.39±2.36228.74±8.811.03±1.020324.63±8.4500520.13±8.01001012.08±7.8700表3-5手术后各阶段生存率(寿命表法)79临床科研数据的提取与管理标题定义特点备注标目数字统计表线条内容丰富重点突出有自明性80临床科研数据的提取与管理统计图Statisticalgraph81临床科研数据的提取与管理
统计图(statisticalgraph)是指用几何图形(点、线段、直条等)显示统计指标的大小、对比关系或变化趋势。统计图的定义82临床科研数据的提取与管理图域纵标目刻度标题图例横标目统计图的构造83临床科研数据的提取与管理纵轴:表示统计指标,可以是绝对数、相对数或平均数。横轴:并排各相互比较的分组名称,一般省略横标目。
(一)条图(barchart):用等宽直条的长短表示统计指标数量的大小。用于比较彼此独立的若干组指标。常用统计图84临床科研数据的提取与管理按指标和分组因素的多少可分:
具有一个统计指标,一个分组因素。具有两个统计指标,一个分组因素,且两个统计指标必须有隶属关系。
具有一个统计指标,两个分组因素,
或一个分组因素,多个统计指标。单式条图:
复式条图:
分段条图:85临床科研数据的提取与管理条图图示(1)单式条图
图某石棉厂不同工作部门的石棉肺患病率(%)一个统计指标一个分组因素86临床科研数据的提取与管理(2)复式条图
图三个直辖市的人口密度比较一个统计指标两个分组因素87临床科研数据的提取与管理(3)分段条图
图某师1991年传染病与菌痢发病人数两个统计指标一个分组因素88临床科研数据的提取与管理(二)圆图(piechart):用圆的总面积表示事物的全部,用各个扇形的面积(圆心角的大小)表示各个部分。用于表达事物的内部结构。图10-5251例胃癌患者病理组织学类型的构成89临床科研数据的提取与管理2002年某医院1402例孕妇分娩结果分娩结果例数构成比(%)过期产21
1死产21
1早产212
15足月1148
83总计1402100圆图图示90临床科研数据的提取与管理(三)百分条图(percentagebarchart):用一个矩形条子的面积表示事物全部,而用其中各段表示各构成部分。也用于表达事物的内部结构,更适用于多组结构相对数的比较。纵轴:表示分组因素;横轴:表示累计百分比,由0开始,最大刻度为100。91临床科研数据的提取与管理百分条图图示图251例男女胃癌患者病理组织学类型的构成92临床科研数据的提取与管理(四)线图(linechart):用点和点之间的连线表示统计指标的变化趋势。适用于分组标志为连续型变量(如时间、年龄等)的资料。横轴:代表分组标志(为连续型变量);纵轴:表示统计指标(相对数、平均数等)。
93临床科研数据的提取与管理线图图示94临床科研数据的提取与管理线图示例95临床科研数据的提取与管理半对数线图
半对数线图:线图的一种特殊形式,适用于表示事物发展速度(相对比)。
其纵轴为对数尺度,横轴为算术尺度,使线图上的数量关系变为对数关系。
绘图时,应使用特制的半对数坐标纸,也可以将统计指标(率)取对数值后在方格坐标纸上作图。96临床科研数据的提取与管理表10-6某部历年普通感冒与支气管炎发病率(‰)图10-8某部队历年感冒与支气管炎发病率
图10-8某部队历年感冒与支气管炎发病率半对数线图图示97临床科研数据的提取与管理(五)直方图(histogram):用矩形面积表示某个连续型变量的频数(频率)分布。纵轴:表示频数或频率;横轴:连续型变量的组段。
98临床科研数据的提取与管理直方图图示99临床科研数据的提取与管理表10-7某市某年流行性乙型脑炎患者的年龄分布年岁0~1~2~3~4~5~6~7~8~9~10~20~30~40~50~合计人数33911232211148636131141175每岁患者人数3391123221114863.61.31.10.40.1—图10-10某年某市流行性乙型脑炎患者的年龄分布图10-10某年某市流行性乙型脑炎患者的年龄分布100临床科研数据的提取与管理(六)箱式图(box-whiskerplot):又叫箱-髯图,用于比较两个或多个样本分布的中心位置和散布范围。中心位置:用中位数(P50)表示;散布范围:用四分位数间距(P75-P25)和极差
(Xmax-Xmin)或P2.5和P97.5或P0.5和
P99.5表示。101临床科研数据的提取与管理血汞含量(umol/L)某市汞作业工人和居民血汞含量分布情况**00.10.20.30.40.50.6汞作业工人居民表10-8某市汞作业工人和居民血汞含量(μmol/L)的分布情况组别P0.5P25P50P75P99.5汞作业工人0.1020.1650.2000.2420.475居民0.0520.1050.1450.2100.405102临床科研数据的提取与管理(七)误差限图(error-barchart):是在用条图或线图表示均数的基础上,在图中附上标准差的范围,以反映数据的散布情况。
条的高度表示,条上的延长线表示+s。也可用来表示率±标准误或均数±标准误的范围,以说明率或均数的抽样误差大小。103临床科研数据的提取与管理表10-9不同地区入伍两年战士握力测定结果籍贯握力(kg)右手左手四川42.5±5.239.4±5.6贵州42.1±5.240.3±6.2云南41.8±6.039.2±5.4104临床科研数据的提取与管理表10-10某地儿童锡克氏试验结果年龄(岁)0.5~1~2~3~4~5~6~7~阳性率(%)44.645.433.424.821.717.916.711.01.96sP3.962.432.041.721.551.651.411.33105临床科研数据的提取与管理统计图的选择
图形资料性质分析目的条图相互独立(离散)多组资料某统计指标的比较百分条图构成比计数资料多个事物内部构成比较圆图构成比计数资料描述事物的内部构成线图连续型计量资料表示事物的动态变化趋势半对数线图连续型计量资料变化事物的动态变化直方图频数表资料表示某连续型变量的频数分布106临床科研数据的提取与管理假设检验的结果表达SuitableExpressionofP107临床科研数据的提取与管理P值的表达(SuitableExpressionofP)传统表达P>0.05记为“NS”,
P≤0.05记为“*”,
P≤0.01记为“**”提倡表达提倡报告精确
P值应给出检验统计量的实际值108临床科研数据的提取与管理相关系数保留2位小数;检验统计量,如Chi-square值、t值保留2位小数即可。计量资料的统计指标(均数、标准差、标准误、中位数、百分位数等)的保留小数位数,应该与原始数据的保留小数位数相同;计数资料的百分比保留1位小数,一般不超过2位小数;病死率、发病率按惯例选择比例基数,如1000‰,10000/万,10万/10万等,或自行选择合适的比例基数,使率的表达至少有1位整数;数据的精确度109临床科研数据的提取与管理
关于
应用条件:只有属于正态分布的数据才可以表示为,虽属于正态分布,但出现负数(即<s时,如血清出现负数)时不能用表示,此时宜用最大值、最小值、四分位间距和中位数。110临床科研数据的提取与管理其他常见的统计指标SuitableExpressionofP111临床科研数据的提取与管理可信区间(confidenceinterval,CI)区间估计即是按预先给予的概率,确定未知参数值的可能范围。此范围称为估计参数的可信区间或称置信区间(confidenceinterval),预先给定的概率称为可信度或置信水平(confidencelevel),符号为“1-”,常取95%或99%,按此确定的可信区间分别称之为95%或99%可信区间。112临床科研数据的提取与管理循证医学中常用的是率的可信区间、RR或OR的可信区间、均数的可信区间、两均数差值的可信区间。113临床科研数据的提取与管理114临床科研数据的提取与管理可信区间还可用于假设检验,尤其是试验组与对照组某指标差值或比值的可信区间,在循证医学中更为常用。试验组与对照组某指标差值或比值的95%可信区间与α为0.05的假设检验等价,99%可信区间与α为0.01的假设检验等价。可信区间还可用于假设检验115临床科研数据的提取与管理分类资料的指标在循证医学的研究与实践中,除了有效率、死亡率、患病率、发病率等常用率的指标外,相对危险度(RR)、比值比(OR)及由此导出的其他指标也是循证医学中富有特色的指标。目前,在循证医学中分类资料常用的描述指标主要有EER、CER、OR、RR、RRR、ARR、NNT、NNH等。116临床科研数据的提取与管理1、EER与CER循证医学中预防和治疗性试验中,率可细分为EER和CER两类。EER即试验组中某事件的发生率(experimentaleventrate,EER)如对某种暴露采用某些防治措施后该疾病的发生率。CER即对照组中某事件的发生率(controleventrate,EER)如对某种暴露不采取防治措施该疾病的发生率。117临床科研数据的提取与管理2、RD(率差)及可信区间两个发生率的差即为率差,也称危险差(ratedifference,riskdifference,RD),如试验组的发生率(EER)与对照组发生率(CER)的差,其大小可反映试验效应的大小。两率差的可信区间由下式计算:
|p1-p2|±uαSE(p1-p2)=(RD-uαSE(p1-p2),RD+uαSE(p1-p2))118临床科研数据的提取与管理两率差的标准误:因而两率差的可信区间不包含0(上下限均大于0或上下限均小于0),则两个率有差别;反之,两率差的可信区间包含0,则无统计学意义。119临床科研数据的提取与管理某医师研究了阿司匹林治疗心肌梗死的效果,资料见下表
该试验结果的EER和CER计算结果为:EER=a/n1=15/125=12%,CER=c/n2=30/120=25%
死亡未死亡例数治疗组15(a)110(b)125(n1)对照组30(c)90(d)120(n2
)合计45200225(n)120临床科研数据的提取与管理121临床科研数据的提取与管理该试验两率差(RD)的95%可信区间为:RD±uαSE(p1-p2)=(0.12-0.25)±1.96×0.049=-0.23~-0.03
该例两率差的可信区间为-0.23~-0.03,上下限均小于0(不包含0),两率有差别。可认为阿斯匹林可降低心肌梗死的病死率。122临床科研数据的提取与管理两率差别有统计学意义。可认为阿斯匹林可降低心肌梗死的病死率。123临床科研数据的提取与管理3、RR及可信区间相对危险度RR(relativerisk,RR)是前瞻性研究中较常用的指标,它是试验组某事件发生率P1与对照组某事件发生率P0之比,用于说明前者是后者的多少倍,常用来表示试验因素与疾病联系的强度及其在病因学上的意义大小。124临床科研数据的提取与管理RR计算的四格表:
组别发病未发病例数
试验组a(r1)bn1
对照组c(r2)dn2试验组的发生率为:p1=a/(a+b)=r1/n1对照组的发生率为:p0=c/(c+d)=r2/n2相对危险度按下式计算:RR=p1/p0=EER/CER125临床科研数据的提取与管理当RR=1时,可认为试验因素与疾病无关;当RR≠1时,可认为试验因素与疾病有关;当RR>1时,可认为试验组发生率大于对照组;当RR<1时,可认为试验组发生率小于对照组;126临床科研数据的提取与管理RR的可信区间,应采用自然对数进行计算,即应求RR的自然对数值ln(RR)和ln(RR)的标准误SE(lnRR),其计算公式如下:127临床科研数据的提取与管理ln(RR)的1-α可信区间为:
ln(RR)±uαSE(lnRR)RR的可信区间为:
Exp[ln(RR)±uαSE(lnRR)]由于RR=1时为试验因素与疾病无关,故其可信区间不包含1时为有统计学意义;反之,其可信区间包含1时为无统计学意义128临床科研数据的提取与管理阿斯匹林治疗组的病死率p1=15/125,对照组的病死率p0=30/120,其RR和可信区间为:Ln(RR)=ln0.48=-0.734=0.289129临床科研数据的提取与管理故RR的95%的可信区间为:
Exp[ln(RR)±1.96SE(lnRR)]=exp[-0.734±1.96×0.289]=[0.272,0.846]该例RR的95%的可信区间为0.272~0.846,使用阿斯匹林治疗的病人,其病死率小于对照组,可认为阿斯匹林可降低心肌梗死有效。130临床科研数据的提取与管理4、OR及其可信区间优势比OR又称比值比,指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。OR计算的四格表:组别暴露非暴露例数病例组aba+b
非病例组cdc+d
合计a+c
b+d
a+b+c+d131临床科研数据的提取与管理当所研究疾病的发病率较低时,即a和c均较小时,OR近似于RR,故在回顾性研究中可用OR估计RR;由于前瞻性研究中,OR的可信区间与RR的可信区间很相近,且OR的计算更为简便,因此,常用OR可信区间的计算来代替RR的可信区间的计算。OR值的解释与RR相同。132临床科研数据的提取与管理在临床随机对照试验(RCT)中,常用OR代替RR,但必须注意使用条件,即发病率较低。133临床科研数据的提取与管理OR的可信区间同样需要采用自然对数计算,其ln(OR)的标准误SE(lnOR)按下式计算:134临床科研数据的提取与管理OR计算的四格表:组别暴露非暴露例数病例组aba+b
非病例组cdc+d
合计a+cb+da+b+c+d阿斯匹林治疗心肌梗死的效果试估计其OR的95%可信区间:136临床科研数据的提取与管理OR的95%可信区间为:
Exp[ln(OR)±1.96SE(lnOR)]=exp[-0.894±1.96×0.347]=[0.207,0.807]该例OR的95%可信区间为0.207~0.807,可认为阿斯匹林治疗心肌梗死有效。137临床科研数据的提取与管理5.RRR及可信区间RRR为相对危险度减少率(relativeriskreduction),其计算公式为:RRR=|CER-EER|/CER=1-RRRRR的可信区间可由1-RR计算得到:
如前例RR=0.48,95%可信区间为0.272~0.846则其RRR=1-0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 5G技术下的电视传播创新-全面剖析
- 时尚产业可持续发展-第1篇-全面剖析
- 中药品牌与消费者行为分析-全面剖析
- 非营利组织规章制度制定的民主流程
- 品牌文化融合策略-全面剖析
- 搬运行业人力资源研究-全面剖析
- 国际港口竞争力分析-全面剖析
- 基于时间窗口的增量备份策略-全面剖析
- 新能源汽车产业链-全面剖析
- 文化传播中抵抗现象分析-全面剖析
- (自考)经济学原理中级(政经)课件 第一章 政治经济学导论
- 铁路劳动安全 课件 第三章 防洪抢险
- 2024年中考语文试题分类汇编:非连续性文本阅读(教师版)
- 【MOOC】数据库系统(上):模型与语言-哈尔滨工业大学 中国大学慕课MOOC答案
- 高教版2023年中职教科书《语文》(基础模块)下册教案全册
- 2024年10月自考00076国际金融试题及答案含评分参考
- 税务局个人所得税综合所得汇算清缴
- 2025新译林版英语七年级下单词默写单
- 污水处理设备安装施工方案
- 审批流程和权限管理制度
- 2024年中国心力衰竭诊断和治疗指南2024版
评论
0/150
提交评论