版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、临床统计学:研究临床研究资料中变异性及其变化规律的科学与艺术。统计学内容要贯穿于临床研究
中的资料搜集、整理、分析与结果解释等全过程。
2、计量资料的统计描述及结果表达:
统计图表:各类图表(频数表、直方图)
定量描述:临床研究中对于服从正态分布者用均数土标准差;服从对数正态分布者改用几何均数土标
准差;
对于其它不服从以上分布者,用中位数和四分位间距(IQR)表达。
3、计数资料的统计描述:率与比
率:发生某现象的观察单位数/可能发生某现象的观察单位总数。描述事件发生的强度和频率
构成比:A/(A+B+….)。事物内部各组成部分所占的比重
相对比:A/BoA指标为B指标的若干倍或百分之几。
计算率时要求分母不宜过小;分析时不能以构成比代率;病死率与死亡率不同。
4、临床效应量(effectsize)常被定义为有临床意义或实际价值的干预效应或差值。
5、效应量(effectsize):指临床上有意义的均数差值(均数差值是指试验组与对照组的均数之差)。必须
结合专业知识、指标特点综合判定差值的实际意义。
6、计数资料效应量:
绝对指标:
绝对危险降低率(absoluteriskreduction,ARR):对照组与试验组事件发生率之间的绝对差值%表示。此
值意味着试验组临床事件发生率比对照组相同事件率的绝对差值,其值越大,临床效果的意义自然会越大。
公式:ARR=P-A(%)P=对照组的事件率,如病死率人=试验组的事件率
相对指标:
相对危险降低率(relativeriskreduction,RRR):此值的大小表示试验组比对照组治疗后有关临床事件发
生的相对危险度下降的水平。公式:相对危险降低率(RRR)=((P-A)/P)X100
P=对照组的事件率,如病死率人=试验组的事件率RR/OR
7、统计方法正确抉择基本要素:资料类型、设计方案、样本含量、数据结构、特定条件
计量资料:假设检验、t检验、u检验、方差分析、秩和检验等
效应量可信区间(95%可信区间):准确度:95%、99%、90%
精度:为可信区间的宽度影响精度因素:准确度、标准差、样本量
计数资料:X2检验、logistic回归分析
率差值的可信区间估计说明两个率差以及有无临床价值。
8、统计结果的正确表达:
(1)假设检验目的是根据P值与检验水准的比较,并得到两组总体均数是否有差异的推断结论。
P值<a:两组总体均数间差异有统计学意义;
P值>a:两组总体均数间差异无统计学意义;
(P值在a附近时,下结论应慎重)。
不能表明“显著性”差别的程度以及有无实际意义(临床意义)
(2)可信区间:按照设计类型及相应的公式分别计算出组间均数差值95%可信区间。
可信区间能提供更多的信息:能表明差别有无统计学意义,同时能显示差别的程度及临床意义,
但CI不能提供确切概率。因此,统计结果的表达:P值与可信区间相结合,同时报告。
9、正确解释与评价结果:真实性、重要性、适用性
(1)真实性解释与评价:统计推断的结论具有概率性;只能有两种结果,有统计学意义,无统计
学意义。但两类结果同样重要。特别是当出现阴性结果时,更应该注意,因为可能有II型错
误的存在,阴性结果可能又包括两类:确实无统计学意义;或者出现假阴性。应重点考察样
本含量及检验效能。
预防出现假阴性结果:正确估算样本含量
样本含量应该足够,不能过大或过小,否则两者均可造成资源上的浪费。
样木含量的估算需要得到以下信息:以病死率为例:I型错误率(a):0.05拒绝了实际上正确
的H0,即弃真,假阳性(H0为阴性,H1为阳性),误诊。II型错误率(6):0.1-0.2不拒绝实际
上不成立的H0,即存伪,假阴性,漏诊。检验效能(1-B),•般要求>0.8。新方法达到的最
小效应量:1%,5%。传统基线病死率:
(2)重要性评价:综合临床意义与统计学意义
(3)评价统计结果的适用性:统计分析结果实际上是基于个体的平均水平。将平均水平结果应用到
个体水平,忌生搬硬套。
10、公开发表论文中常见的统计学问题:需做而未做统计分析;统计分析方法不清,或未标明;应用
条件不满足;错误选用统计方法;结果解释不合理;论文写作方面:结果表达不完整、不清楚。
统计方法选择不符合分析目的;分析方法选择未结合资料特点;未考虑混杂/偏倚对结果的影响
11、如何处理中等混杂或偏倚:对于能够准确测量的混杂因素:采用基线比较,必要时采用多元统计
分析方法。多个中心间基线资料比较:病人年龄构成,出血量、术后死亡比例是否相同。对于不能够
准确的混杂因素,可以采用严格的设计加以控制,如分层、配对或盲法及隐藏等。如在随访调查中,
可对调查者盲法,避免调查性偏倚(厚此薄彼)。
12、如何减少样本的抽样误差(s/n0.5):制定严格的研究对象纳入和排除标准:降低标准差
(对于大规模应用性研究,保证代表性,标准不能过严,在标准差不能有效降低的情况下,只有
采用下一步:)增大样本含量:大样本的临床试验等。
一、统计在临床研究中的作用与意义
・临床研究中需要测试PICOT指标,以描述
-临床与健康状态;
-反映研究/干预结果的形式;
•系列指标的定量测试,必然有各种数据:数据分析,临床研究的结果表达与评价(真实性/适用性、重要
性),均需要借助统计学知识。
临床统计学是:研究临床研究资料中变异性及其变化规律的科学与艺术。
・统计学内容要贯穿于临床研究中的资料搜集、整理、分析与结果解释等全过程。
•设计阶段(根据研究目的与资料特点,确定临床指标,预设统计分析方法;同时需要估算样本含量)
•研究组织实施、资料收集与整理阶段:
一用相应统计分析方法,评估质量控制效果;
一检查数据资料的完整性、失访/原因统计。
一检查极端值与异常值,分析原因与正确处理
•分析资料阶段:检查资料是否满足预设统计方法的应用条件,选用合适统计学方法。
二、临床研究中相关数据采集与质量控制
(一)、临床研究指标及时点的确定
1、观察测试指标的主要类别
•临床/生物学指标:病死/复发/残疾等。
•生存质量及其相关指标:HRQL、QALYs
质量调整寿命年
・经济学指标:
一成本:直接成本、间接成本等
一结局:效果、效益、效用
用于疾病负担以及成本效果分析(CEA)、成本效益分析(CBA)、成本效用分析(CUA)等。
2、指标设置应全面和重点兼顾
1)以临床试验常设指标为例:(安全、有效、价廉)
•疗效指标
・不良反应(副作用)指标
・费用(临床经济学)指标
2)临床终点观察指标的数量设置应选择重点、有代表性指标:不能过多(对于大规模研究,指标过多往
往不能保证质量)。
3)、替代指标与临床结局指标
3、选择测定次数与时点
•临床研究中指标测量时间与次数确定:效应量变化特征曲线。
质控应体现在数据收集、整理、数据清理等不同阶段。常用手段如:
・收集阶段:
-培训记录员与调查员,提高依从性
-盲法测量临床软指标
-多个实验室标准样品平行试验/标准校验曲线
•整理与清理:
-双输法录入数据
5、数据质量的影响因素
•与指标本身有关(临床硬指标、临床软指标)
•客观性、易量化
•灵敏度高
•精确性强
-与指标数量及测量难易有关:不宜过多指标
•与收集方式有关:
•实验室标准测试
•面对面访谈法;电话访谈:信访
三、统计分析的基本内容
・统计描述:反映样本结果的基本特征
一统计图表(各类表格或图示)
一基本指标(均数/标准差;率、构成比)
・统计推断:样本推断总体参数
一参数估计(点估计及其95%可信区间)
一假设检验:差别(均数、率)推断;相关性推断。
资料基本分型与分析
・数值变量资料(计量资料)
一统计描述
一统计推断
・分类变量资料(计数资料)
一统计描述
一统计推断
(一)、计量资料的统计描述及结果表达
・统计图表:各类图表(频数表、直方图)
•定量描述
一临床研究中对于服从正态分布者用均数土标准差;服从对数正态分布者改用几何均数土标准差
一对于其它不服从以上分布者,用中位数和四分位间距(IQR)表达。
正态性判断
・正态性检验:判断资料是否服从正态分布。
•其它判断方法:
一统计图表:eyeballtest
一均数与中位数差
一均数与标准差(均数±1S或2s中样本例数)
一医学专业知识对资料的正态性进行估计。
・分析时不能以构成比代率
如某产院拟分析畸形儿与产妇分娩年龄的关系,检查新生儿4470例,畸形儿116例。
母亲年龄(岁)2123242526272829303133
畸形儿数:12141924181913311
%0.861.71216211616112.60.860.86
结论:产妇年龄在24-29岁时,畸形儿最多,占总数的92.2%,符合一般规律。
(三)临床常用效应量
・临床效应量(effectsize)常被定义为有临床意义或实际价值的干预效应或差值。
1、计量资料类型的效应量
・效应量(effectsize):临床上有意义的均数差值(均数差值是指试验组与对照组的均数之差)。必须结合
专业知识、指标特点综合判定差值的实际意义。
2、计数资料效应量
绝对指标:
・绝对危险降低率(absoluteriskreduction,ARR):对照组与试验组事件发生率之间的绝对差值%表示。此值
意味着试验组临床事件发生率比对照组相同事件率的绝对差值,其值越大,临床效果的意义自然会越大。
公式:ARR=P-A(%)
P=对照组的事件率,如病死率人=试验组的事件率
•治疗多少病例数才使一例患者获益
(numberneededtotreat,NNT)
NNT=1/ARR
NNT=5vsNNT=500意义
高血压患者药物预防心梗或死亡
观察期NNT
一轻度高血压5.5y10
一重度高血压1.5y10
时间矫正(假设其每年发生率是一致的)
-NNT珈kNNT螭时阿X(观察时间/矫正时|HJ)
-NNT1.5=1OX(5.5/1.5)=37
四、统计推断的方法抉择
・统计推断内容
一假设检验
一参数估计(可信区间)
五、统计方法正确抉择基本要素
一统计方法的正确抉择至关重要。
五、统计方法正确抉择基本要素
・资料类型
・设计方案
・样本含量
・数据结构
•特定条件
计量资料:统计推断方法选择
•假设检验
-t检验、U检验、方差分析、秩和检验等
・效应量可信区间(95%可信区间):
/准确度:95%、99%、90%
/精度:为可信区间的宽度
*影响精度因素:准确度、标准差、样本量
计数资料:统计推断方法
•%卡方2检验、logistic回归分析
六、结果解释与注意事项
(-统计结果的正确表达
・假设检验目的是根据P值与检验水准的比较,并得到两组总体均数是否有差异的推断结论。
P值va:两组总体均数间差异有统计学意义;
P值,a:两组总体均数间差异无统计学意义;
(P值在a附近时,下结论应慎重)。
・不能表明“显著性”差别的程度以及有无实际意义(临床意义)
“显著意义''定义
・英语表达为“significant”,它的正确意义应当是“有意义的、有重要性的”。
・俄语为3HaMMblM
•日语"有意”
•国内只有极个别的英汉词典把“significant”误译为“显著的”。
•正确的说法应是“差异有统计意义''或"差异有高度统计意义”。
“显著意义''举例
・“丙酸倍氯米松组患者吸入糖皮质激素后.其气道反应性有显著降低(P<0.05),而安慰剂组气道反应性无明
显变化(P>0.05):对照组治疗前后气道反应性无叨显变化(P>0.05)。
•可信区间:按照设计类型及相应的公式分别计算出组间均数差值95%可信区间。可信区间能提供更多的
信息:
一能表明差别有无统计学意义,
一同时能显示差别的程度及临床意义,
THCI不能提供确切概率。因此,统计结果的表达:P值与可信区间相结合,同时报告。
(二)、正确解释与评价结果
•真实性
・重要性
・适用性
检测项目患者组(32)健康组(10)P值检验效能
LAT-EF57.2±13.359.6±9.2>0.050.10
INF-EF76.8±15.282.0±14.3>0.050.17
SEPTAL-EF37.4±12.646.9±13.4>0.050.52
ESV29.3±8.527.3±7.3>0.05
EDV62.1±16.063.6±9.6>0.05
预防出现假阴性结果:正确估算样本含量
•样本含量应该足够,不能过大或过小,否则两者均可造成资源上的浪费。
•样本含量的估算需要得到以下信息:以病死率为例:
-1型错误率(a):0.05拒绝了实际上正确的HO,即弃真,假阳性(H0为阴性,H1为阳性),误诊。
-II型错误率(6):0.1—0.2不拒绝实际上不成立的H0,即存伪,假阴性,漏诊。
一检验效能(1-B),一般要求>0.8
—新方法达到的最小效应量:1%,5%
-传统基线病死率:
・根据课题设计方案和研究的主要内容,实际上可简化为两组:传统手术组与微创手术组,因此选用公式:
一其中:a为I型错误率0为II型错误率
-P,为传统手术的病死率=25%:p2为微创手术病死率=20%
2、重要性评价:
综合临床意义与统计学意义
3、评价统计结果的适用性
七、临床研究中常见统计问题
•临床研究与统计方法的有机结合,两者不能相互脱节。
公开发表论文中常见的统计学问题:
•需做而未做统计分析
•统计分析方法不清,或未标明
・应用条件不满足
・错误选用统计方法:
•结果解释不合理:
•论文写作方面:结果表达不完整、不清楚。
(一)、统计方法选择不符合分析目的
表甲乙两种疗法的疗效比较(例)
疗效甲法乙法
痊愈1020
显效3020
有效1030
无效2010
合计7080
资料特点:单向有序的计数资料
分析目的:疗效差别比较
采用方法:首选秩和检验?卡方检验?
(二)、分析方法选择未结合资料特点
•根据资料类型与具体特点选择合适的统计分析方法。
脑梗塞两种治疗方案比较研究
脑梗塞(卒中)两种治疗方案随访2年后其疗效的比较,见表
表疗效比较
结果分配内科治疗分配外科治疗
外科治疗1内科治疗2外科治疗3内科治疗4
存活2年4829635420
死亡227156
合计5032336926
对该情况有三种分析方法
・功效分析(EfficacyAnalysis):只是2与3比较
・实效分析(TreatmentReceivedAnalysis):1+3与2+4比较
・意向性治疗分析(ITT):1+2与3+4比较
上述资料的三种分析结果
三种分析方法的结果比较
分析方法内科治疗外科治疗%2P
意向性治疗分析29/373(7.8%)21/395(5.3%)1.90.17
功效分析EA27/323(8.4%)15/369(4.1%)5.60.018
实效分析TRA33/349(9.5%)17/419(4.1%)9.10.003
(三)、未考虑混杂/偏倚对结果的影响
混杂与偏倚也将直接影响统计结果的真实性,即可造成真实效应低估及假阴性结果。
1、如何处理中等混杂或偏倚
•对于能够准确测量的混杂因素:采用基线比较,必要时采用多元统计分析方法。多个中心间基线资料比
较:病人年龄构成,出血量、术后死亡比例是否相同。
•对于不能够准确的混杂因素,可以采用严格的设计加以控制,如分层、配对或盲法及隐藏等。如在随访
调查中,可对调查者盲法,避免调查性偏倚(厚此薄彼)。
2、如何减少样本的抽样误差(s/n05)
•制定严格的研究对象纳入和排除标准:
降低标准差(对于大规模应用性研究,保证代表性,标准不能过严,在标准差不能有效降低的情况下,
只有采用下一步:)
・增大样本含量:大样本的临床试验等。
概述与数值变量资料统计描述
一、概述与基本术语
■变异性与变量
■概率与频率
■总体与样本
■参数与统计量(抽样分布)
参数与统计量的表达
类别参数符号统计量符号
均数
标准差
方差
相关系数
率
描述变异性:变量基本分类
■数值变量资料(计量、连续型变量资料)
■分类变量资料(计数、离散型变量资料)
•无序分类变量资料
・二分类变量资料
■无序多分类变量资料
•有序分类变量(半定量):反映等级或秩次。
二、数值变量资料的统计描述
・连续性变量资料:血糖、总胆固醇
•整数变量资料:骨折数、胎次、心率
若不要求太高的精度,可对连续性变量取整。
■统计描述的基本方法
•统计图表法:频数表、直方图、茎叶图
•定量描述法:
■集中趋势描述:mean,median,mode
■离散趋势描述:range,SD,CV,IQR
■统计描述的应用:
•描述基本分布特征
•确定参考值范围
•发现极端值。
(一)、图表描述
频数表/直方图:最常见描述方法(apictureisworth1000words)
■便于发现一些极端值或异常值;
■描述频数分布的特征与类型;
■为进一步统计分析与处理做准备。
1、频数表
基本步骤
•计算极差(最大值与最小值之差,又称全距):以胆固醇为例,最大5.71,最小2.35,极差为3.36。
•确定组距:通常6-14个组,为方便计算,以极差的1/10为组距。组距为0.3。
•列出组段,划计归组,计数频数、计算累计频数、累计频率等。
实例频数表
组段频数频率累计频数累计频率
2.2~2222
2.5〜5577
2.8〜10101717
3.1~19193636
i-i■
5.1~449999
5.4-5.811101100
2、频数分布图:直方图
■直方图:直观反映数值变量各种数值出现的机会与分布规律。
•在频数表的基础上,以组段的组间值为横轴,以相应百分比或频数为纵坐标,所绘制的连续性条形图。
3、茎叶图
茎叶图(stem-and-leafplot)
・不需要频数表,直接绘制.
■原理:测量值整数部分作为“茎“似小数点后部分作为“叶”.
例1:2.32.42.3—,茎,为2,,叶,
例2:3.13.23.2--‘茎'为3,,叶,?
血清总胆固醇(mmol/L)Slcm-and-LeafPlot(茎叶图)
FreqStem&Leaf
1.002.3
.002
3.002.677
1.002.9
5.003.00011
7.003.2222233
10.003.4555555555
8.003.66667777
18.003.888888999999999999
10.004.0011111111
9.004.222222333
11.004.44555555555
4.004.6777
6.004.888899
3.005.001
4.005.2233
.005
1.005.7
Stemwidth:1.00
Eachleaf:1case(s)
(二人样本资料的定量描述
■集中趋势
■离散趋势
1、集中趋势定量描述
/集中位置的描述;即大多数数值所处的位置。
,描述集中趋势的常用指标
A算术均数(mean)
A几何均数(geometricmean)
A中位数(median)
A众数(mode)
♦算术均数(均数mean)
•性质相同的一组观察值的数量平均水平。
・资料满足正态分布或近似正态分布
•方法:
/直接法:基于原始数据(2.35,2.5,5.8…)
/间接法:基于频数表的近似法(利用组中值与频数)
注意事项
•直接法与间接法计算的均数可能有差异,后者为近似估算。
■均数对极端值非常敏感。
■利用等级资料计算均数应慎重。
・切勿利用均数计算均数。
在一项高血压干预研究中,某研究者根据治疗分组情况,分别计算相应组别的收缩压平均数:
/治疗A组:20例,=17(mmHg)
/治疗B组:18例,=21(mmHg)
/对照组:62例,=5(mmHg)
■三组合并均数:(17+21+5)/3=14.3?
♦中位数(median)
♦几何均数
■如某地区居民发汞含量研究(67例)
■数据资料通过对数转化,直方图如下:
几何均数:6.62
■三种集中趋势指标比较:
•在资料服从正态分布时,三种均数值接近,几何均数小于算术均数;
■平均数4.03
■中位数3.98
・几何均数3.99
•在资料分布对称时,中位数与算术均数非常接近。越偏离正态分布,则两者的位置相差越远。
2、离散趋势的定量描述
离散趋势:描述一组数据参差不齐或变异程度
■描述数值变量资料离散趋势的常用指标
•极差或全距(range)
•方差与标准差
•变异系数
•四分位间距
♦极差(Range):定义为最大值与最小值之差。
/极差大,变异程度大。
/由于只考虑两个极端值,稳健性差。
/临床研究中常用来作疑似极端值/异常值
胆固醇研究中:
,最小测量值2.35:?
/最大测量值5.8:?
极差3.45
♦方差与标准差(varianceandSD):全面反映了一组观察值的变异程度.
/将总体中每个个体值与总体均数之差称为离均差,方差是离均差平方的平均值
/方差与标准差的数值越大,则表明数值越离散;反之说明较集中在均数周围,均数的代表性越好)。
,为与原始观察值的度量衡单位一致,取方差的平方根后,为标准差。
以胆固醇研究为例
•方差:0.435(mmol/L)2
・标准差:0.66(mmol/L)
・标准差的用途:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常参考值范围
・标准差受极端值影响较大;不论何种分布,至少包括了75%的个体观察值
♦变异系数(coefficientofvariance)
标准差与均数之比的百分数为变异系数。
变异系数
・CV=(S/X)xlOO%标准差与均数之比用百分数表示•
,无度量衡单位,应用于:
•单位不同的多组数据比较;
•均数相差悬殊的多组资料比较
♦百分位数(percentile)
・百分位数是一种位置指标,用Px表示。即将原始观察值从小到大顺序排列,再将其分成100等份,各含
1%的观察值。
・百分位数实际为百等份分割值,用于确定参考值。
•百分位数可以描述样本资料的分布特征(P5,P25,P50.P75,P95)
・样本量不能过少,且靠近两端的百分位数不稳定,否则无实际价值。
♦四分位间距(interquartilerange,IQR)
将数值变量资料按照从小到大的顺序排列,确定几个特殊位点:
■极大、极小值:P100位点,P0位点
■中位数:P50位点
■P25位点与P75位点(上下四分位点)
定义为:P75-P25
考虑50%个体观察值的变异程度。
■以胆固醇研究为例:
・25%位点为3.58,75%位点为4.51
•四分位间距:0.93
离散趋势的描述指标
3、集中与离散综合描述
■服从正态分布数据资料:均数土标准差
■服从对数正态分布:用几何均数土标准差
・不服从正态分布/对数正态分布:中位数及四分位间距值
胆固醇研究的统计描述:
/定量:均数土标准差4.03±0.66(mmol/L)
/图表:直方图
三、数值变量资料常见分布类型
■正态分布
■偏态分布
(一)、正态分布与频数分布
正态分布:最常见的一种连续型分布,呈倒置钟形,中间高,两头低,左右对称。
■正态分布的位置参数(均数)N:
■正态分布的形状参数(标准差R:
(二)、偏态分布
两侧数据分布不对称,偏重于一侧
正偏态分布负偏态分布
正偏态分布实例
负偏态分布:某研究中病人的年龄分布
(三)、正态性检验
■正态性检验
・偏度系数(Skewness)
・峰度系数(Kurtosis)
■经验方法:
•均数与标准差:1.645、±1S/±2S包括例数
•均数与中位数
•目测图形分布,或借助专业知识
四、参考值范围及其确定
定义:指绝大多数正常人的生理、生化指标测量值的变化或波动范围(95%或99%参考值范围)。常用于医
学检验与质量控制。如果某个体的测定值超出这个范围,该个体就作为可疑者,需密切关注。供诊断参考。
参考值范围的确定方法
■正态或近似正态分布资料:均数±1.96SD
■偏态分布资料:百分位法
1、正态或近似正态分布资料
・95%参考值范围:均数±1.96倍标准差。
该范围仅仅告知有95%的个体测量值在此范围之内,切不可将参考标准作诊断标准使用。
■有单侧界值与双侧界值之分。
参考值范围:在1988年Jung等对某医院30名健康的男性医生测定了丙氨酸氨基转移酶,均数、标准差
分别为1.05和0.32个单位,则计算该项指标的95%参考值范围:1.05±1.96*0.32,即0.4211.68。
实例分析:
样本量偏小,这份样本不足以代表总体;
临床实践中,最小n>100以上。
2、偏态分布资料
・双侧95%参考值范围:97.5%位点测量值-2.5%位点测量值,两者间区间范围。P25~P97.5
■单侧95%参考值范围:<95%位点的测量值或者>5%位点的测量值。P95或P5
以发汞研究为例,其95%参考界值点实际上是其95%位点测量值19.08,超过此值,个体测量值异常。
102名3岁以下儿童LgA含量
组段频数累计频数位次范围
0-29291-29
15-326130-61
30-187962-79
45-149380-93
60-49794-97
75-09797
90-09797
105-29998-99
120-1100100
135-2102101-102
参考值范围注意事项
■多指标联合使用,确定联合参考值范围:
以95%参考值范围为例:单指标的误判率5%,12个指标的误判率达到46%。
■参考值工正常值:由于个体差异性与样本代表性问题,个体值不在此范围内,不•定是患者,在此范围内
的个体,不一定是健康人,仅作为临床诊断的参考.
■参考值范围不是一成不变的。
纤维蛋白原(Fg)参考值范围/孕妇能否适用?
■制定参考界值:考虑分单侧、双侧
■代表性以及有足够的样本例数(一般不低于100例)
・有无“金标准方法”考核:样本同质
统计推断概述
了解总体特征的最好方法是对总体的每个体进行观察、试验,但这在医学研究实际中往往不可行。
・无限总体:欲分析全国成年人的血压与血脂水平?直接测量?抽样?
■对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究。
■临床研究的特殊性决定了只能采用抽样方法,通过从已知或未知的总体中随机抽取样本来推论总体特征。
一、统计推断概述
,统计推断以概率论为基础,根据试验或观察得到的样本数据,来研究对象总体的客观规律性,以作出合理地
估计和判断.
1、统计推断过程
实例演示抽样过程,寻找抽样规律
・2009级研究生的临床科研设计成绩为已知总体(85±8分,400人)
■从成绩单中反复做100次抽样,每次抽取40人成绩作为模拟训练样本。
分别计算每次抽样的均数,以每个样本均数做为观察单位(共100个样本均数)。
100个样本均数抽样分布具有如下特点:
■样本均数集中于总体均数(85分)分布;
,各样本均数未必等于总体均数,均数间存在差异;
■样本均数变异范围较原变量变异范围大大缩小,这100个样本均数的均数为85.1分、标准差为1.79分
在非正态分布总体中可进行类似抽样。
2、抽样分布规律
3、中心极限定理:在样本量足够大时,不管原始分布如何,其抽样分布仍为正态分布。
4、抽样分布的描述
,抽样分布呈现正态分布:
•集中趋势:“均数”?
•离散趋势:“标准差”?
,抽样分布呈现正态分布:
•集中趋势:“均数”?=总体均数
•离散趋势:“标准差”?=标准误
常见统计量与抽样概率分布类型
■大样本-均数(正态分布)
■小样本一均数(t分布)
■OR(对数正态分布)
■方差比(F分布)
■率(卡方分布)
・???
二、推断与误差控制
■在临床研究中,总会出现推断误差:即样本平均值与总体真值之间的差值。
•系统误差(偏差):研究/临床试验本身产生
・抽样误差:随机误差
■系统误差:可以避免,固定(或规律变化)具有方向性,往往是由于混杂与偏倚造成,可以通过严格设
计加以控制。
■抽样误差:不可避免,随机没有方向性,可以测量与控制。
测量抽样误差的指标:标准误
■与标准差有关:个体变异程度大,标准误大.
■与样本含量有关:样本含量增大,标准误减少。
临床研究中控制抽样误差方法
・严格定义总体与确定抽样单位
■抽样过程
■样本含量
■严格定义总体与抽样单位
•根据研究目的,确定目标人群与框架人群
•明确诊断标准
•纳入标准与排除标准
■严格抽样过程
•严格遵守随机化原则(randomization)
•确立抽样框架(Samplingframe)
•选择恰当随机方法
■确保有足够的样本含量
•设计阶段估计样本含量
三、统计推断方法
问题的提出
背景:根据前期大量调查与文献综述,脉搏数可能与海拔高度有关,已知健康成年男性的脉搏均数为72次/
分,那么高原地区成年男性脉搏数与一般成年男性脉搏数有无差别?
实例分析
研究对象与目标人群:以川西高原某山区的成年男子(18-60岁)作为目标人群.
设计方案:横断面调查
调查结果:调查者在该山区随机抽查了25名健康男性,其脉搏均数为74.2次/分,标准差为6.0次/分.
本例资料特点分析
本该研究数据类型为数值变量资料
■已知一般人群的总体脉搏均数为72次/分
■从山区人群抽取了25人,样本均数为74.2次/分。
研究目的:山区成年人群脉搏数(总体1)与一般人群脉搏数(总体2)是否相等
步骤1:建立假设、确定检验水准
Ho:〃=〃()(无效假设)
H|:0(备择假设)
检验水准a=0.05
・无效假设:检验假设、零假设/原假设,用Ho表示。样本均数间差别是由抽样误差造成的。
・H0通常:某两个(或多个)总体参数相等,或某两个总体参数之差等于0,或……无效,或某资料服从某一
特定分布等;
■备择假设:对立假设,用Hi表示。
•凡是不属于Ho情况者,统统纳入备择假设。
•有单侧与双侧之分。
备择假设(〃>〃o.〃<〃())
■〃斗/()或〃任一种
■检验水准a:为预先设定的概率值,所确定了小概率事件标准.
•实际工作中一般取a=0.05
•可根据不同研究目的,给予不同的设置值.
注意事项
•假设的建立是针对总体而不是样本。
・无效假设与备择假设成对出现,两者相互联系、相互对立,缺一不可。
•所有假设检验均是以无效假设为出发点。
步骤2:选定检验方法,计算统计量
・依靠资料类型、设计方案、检验方法的应用条件,抉择检验方法
■基于无效假设成立的条件,利用样本资料计算统计量,并根据其抽样分布规律,确定P值。
步骤3:确定P值,作出推断结论
・P值指从无效假设规定的总体中随机抽取得到等于及大于(或等于及小于)现有样本统计量值的概率。
P值的意义:ThePvalueisdefinedastheprobability,undertheassumptionofnoeffectornodifference(the
nullhypothesis),ofobtainingaresultequaltoormoreextremethanwhatwasactuallyobserved
步骤3:确定P值,作出推断结论
■将事后获得的概率P,与事先规定的概率水准一检验水准a进行比较而得出结论。(反证法)
,推断结论包含统计结论与专业结论两部分。
步骤1:建立假设,确定检验水准
步骤2:选定t检验,计算统计量
■统计量t=1.883
步骤3:确定P值,作出推断结论
■0.05<P<0.10,按照a=0.05水准,不拒绝H。,还不能认为该山区健康成年男子的脉搏总体均数与一般健
康成年男子的脉搏数不同。
■假设检验的成功与否,建立在严格的设计的基础上:避免系统误差;严格随机,使样本具有代表性。
如何评价上述实例分析?
■P值大小与均数差值的大小不同。假设检验只能表明总体均数间的差别有无统计学意义,不能表明差异
是否显著。
(74.2-72)=2.2次/分
四、统计推断方法
一参数及可信区间估计
■参数估计是用样本统计量估计总体参数,是假设检验的重要补充。
•点估计•:用样本统计量直接作为总体参数的估计值,简单但未考虑抽样误差的大小。
•区间估计:即按预先设定的概率(1-a)确定的包含未知总体参数的可能范围。
1、(1-a)可信区间
•定义:有l-a的可能性,在所计算得到可信区间包含了总体参数(不是总体参数落在该范围的可能性为
1-a)。(置信区间)
•可信区间由两个可信上限和下限构成
可信区间估计的优劣取决两个方面:
・一是准确度l-a,即区间包含日的理论概率大小,愈接近1愈好。
,二是区间的宽度:精度,区间愈窄愈好。
■准确度:可信区间的可信范围,如95%,99%,90%
■精度:可信区间的宽度,可信上限与可信下限间的宽度
•与准确度、样本含量、标准差大小有关。
可信区间能提供更多的推断信息:
•区间范围是否包括总体参数,若不包括,表明差别无统计学意义;
•同时能显示差别的程度及临床意义,
•但CI不能提供确切概率。因此,统计结果的表达:P值与可信区间相结合,同时报告。
本例区间估计结果
■点估计:74.2次/分
・区间估计:71.7~76.7次/分(72)
若要提高可信区间估计的精度,有哪些途径?
•样本量从25例扩大到50例
2、95%可信区间与95%参考值范围
1)、意义:
■可信区间按照事先给定的概率,确定的未知参数的可能范围。(均数)
■参考值范围为针对个体在解剖、生理、生化的观测指标的变化范围。(个体观察值)
2)、计算公式:
■可信区间用标准误
■参考值范围用标准差
3)、用途
■可信区间:用于估计总体参数。
■参考值范围:判断观察对象的某项指标正常与否。
五、统计推断结果评价
诊断性试验的评价四格表
■统计结果的概率性:统计结果不是绝对肯定或否定,可能犯I、II型错误
真实情况假设检验
拒绝Ho不拒绝Ho
Ho成立a推断正确
Ho不成立推断正确p
•ll型错误与检验效能
■检验效能又称把握度、功效,用if表示(B为n型错误概率):是指事实上当两总体确有差异,按检验
水准a所能发现该差异的能力。检验效能为0.8,指做100次假设检验,有80次能检验出有差别。
检验效能的影响因素
■实际组间差异(效应量)的大小;
■研究对象个体间的标准差大小:
"I型错误率a大小;
■样本含量大小:重点考察
实例分析
■统计推断结果:
•假设检验表明P>a=0.05;
・95%可信区间:71.7~76.7次/分(72)
■讨论:
•该山区成年男子的平均脉搏数与一般成年男子的均数的差别无统计学意义。
•可考察其检验效能?
实例分析
•假设a=0.05,s=6次/分,A=3次/分
实例分析
[3=0.2946,1-0=0.7054
・检验效能=0.71
(二)专业结论同样不能绝对化
■因统计结论具有概率性质,故“肯定”、“-定”、"必定'’等词不要使用。
•在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,而不简单写成P<
0.05,以便读者与同类研究比较或进行Meta分析。
(三)、应围绕研究本身全面考虑,下结论
从研究设计、抽样等全面评估结果。如样本代表性,有无可能出现系统偏差等。
t、u、等价检验
80篇(中华医学系列杂志)临床研究论文使用统计方法汇总
统计方法篇数比例
t检验290.36
秩和检验100.1
卡方检验230.29
其他26
未做统计分析13
一、数值变量资料组间差别比较
常用假设检验方法抉择
•t检验
•u检验
•■验
•秩和检验
・方差分析
一)、与比较组别和设计类型有关
・数值资料两组间的比较可以考虑使用t、U、方差分析、『检验或者秩和检验。结合不同的设计类型又分
为:样本与总体比较、配对设计、两组完全随机设计的假设检验。
・数值资料三组及三组以上间的比较则丕能使用t检验和U检验。可考虑使用方差分析、秩和检验等方法。
结合不同的设计类型又进一步分为:多组成组设计、配伍设计(随机区组设计)、交叉设计等设计方案假
设检验。
二)、与样本含量有关
•当样本含量n较大时,其抽样分布服从正态分布(中心极限定理):*可考虑使用u检验
•当样本含量n较小时,其抽样分布服从t分布;*可考虑使用t检验
•当样本含量n较小时,若样本来源于偏态或未知分布,其抽样分布未知。
*则不能使用t、u检验,选用秩和检验
n=30/40/50/60/100
二、t检验概述
•t检验是以t分布为理论基础,以t值为统计量的假设检验方法,适用于例数较少,来源于正态分布的资
料。
・应用条件:当样本例数较少时,要求样本取自正态总体;作两样本均数比较,要求两样本总体方差齐性。
t分布的特征
•t分布是一簇与正态分布相似的单峰分布。
•t分布与标准正态分布相似,以0为中心,左右对称。
•分布与自由度v有关,自由度v越小,其峰值越小,两侧尾部面积越大,反之,其峰值越大,两侧尾部面
积越小。
•随自由度V增大,t分布逐渐逼近标准正态分布,当自由度为无穷大(V=8)时,t分布就等于标准正态
分布(U分布)。
假设检验目的与应用条件
・假设检验:推断单个样本所代表的未知总体均数〃与已知总体均数〃0(常为理论值或标准值)有无差别。
・应用条件:已知样本服从正态分布
・实例分析:36名一线抗SARS医生的血红蛋白含量是否不同于一般水平?150.83g/lw140g/l
2:选定t检验,计算统计量
・统计量t=4.11
3:确定P值,作出推断结论
•P<0.001,按照a=0.05水准,拒绝H(j,临床一线医生的血红蛋白含量高于一般水平。(自由度为36-1)
•95%可信区间:146.8~153.6,而一般水平为140g/l。
I、配对设计
比较特殊的设计方式,能很好地控制非实验因素对结果的影响,该设计有以下:
①对同对的两个受试对象分别给予两种处理(异体配对);
②对同一受试对象分别给予两种处理(自身配对),目的都是推断两种处理的效果有无差别。(窝沟封闭?)
个体变异较大时使用
2、配对设计检验过程
•配对设计的检验,先要求出各对差值的均数。若效果无差别,则理论上差值的总体均数内应为0。
因此配对设计检验,实际上是推断差值的总体均数是否为“0”。等同于单样本t检验.
3、配对t检验的检验目的、资料特点与应用条件
・假设检验目的:推断配对差值的总体均数是否等于“0”。
・应用条件:配对差值服从正态分布。
・两组比较的配对数值变量资料,检验效能较高。
4、实例分析
一项饮食缺乏维生素E与肝中维生素A含量的关系研究中.将同种属的大白鼠按性别相同,年龄、体
重相近者配成对子,共8对,并将每对中的两只动物随机分到正常饲料组和维生素E缺乏组,过一定时
期将大白鼠杀死,测得其肝中维生素A的含量,见下表,问不同饲料组的大白鼠肝中维生素A含量有无差
别?
不同饲料大白鼠肝中维生素A含量
大白鼠对号正常饲料组VE缺乏组差值
1355024501100
220002400-400
3300018001200
439503200750
538003250550
6375027001050
734502500950
8305017501300
合计6500
差值均数=6500/8=812.5s=546.3
步骤1:建立假设
Ho:从产0,即差值的总体均数为“0”,不同饲料的大白鼠肝中维生素A含量相同。
H1:口产0,即差值的总体均数不为“0”,不同饲料的大白鼠肝中维生素A含量不相同。
检验水准a=0.05(双侧)
步骤2:计算统计量t值
步骤3:计算概率P值,作出结论
查t界值表,tog7=2.365,t>to,()5.7,得Pv0.05,按a=0.05水准,拒绝H。,接受H”可认为两种饲料所得肝
中维生素A含量有差别,即维生素E缺乏对大白鼠肝中维生素A含量有影响。
95%可信区间估计
本例:均数差值的95%可信区间:
355.8—1269.2
统计推断结果:
•区间范围不包括0,差别有统计学意义;
・差别程度最小值355.8,平均差812.5。
例2吸烟前后血小板最大聚集率
1.目的、资料特点与应用条件
・目的:推断两个独立样本分别代表的总体均数是否相等。
・资料:成组设计两组比较数值变量资料
・应用条件:
(1)两样本均来自服从正态分布总体
(2)两样本的总体方差齐性(方差相等)
2、实例分析
某医生利用病例对照设计方案研究了慢性支气管炎患者与健康人的肺活量(L),资料如下,问两组有
无差别?
・病例组:18例慢性支气管炎病人、均数4.454、标准差1.324。
・对照组:16例健康人、均数5.299、标准差1.3820
步骤1:建立假设
Ho:〃尸〃2,两总体均数相等,两类人群的肺活量相等。
H1:m会〃2,两总体均数不相等,两类人群的肺活量不等。
检验水准:a=0.05(双侧)
步骤2:计算统计量t值
步骤3:计算概率,作出结论
・查t界值表1().05.32=2.037,t<to.05.32
•P>0.05,按a=0.05水准,不拒绝Ho,尚不能认为两类人群肺活量不相等。
效应量(均数差值)的可信区间
效应量95%可信区间
・to.05,32=2.037,SE(diff)=0.464
・效应量95%可信区间:
一两组的均数差值:0.845
-0.84512.037*0.464
下限:-0.10;上限:1.79
成组设计t检验在临床研究中的应用
•正态性与方差齐性是t检验的基本条件。
•对两样本要求:代表性、独立性、均衡性。
一代表性(样本来源、样本量、随机化)
一独立性应确保两组样本是相互独立的,如应有明确的诊断标准等。
一均衡性(除欲研究因素外,其它因素尽可能均衡)对于临床资料,两组应在性别、年龄、病情轻重、诊断分
期分级、有无并发症等方面具有均衡性。在设计阶段应控制混杂与偏倚。
一适用性
四)、用于方差不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论