临床科研统计方法与选择_第1页
临床科研统计方法与选择_第2页
临床科研统计方法与选择_第3页
临床科研统计方法与选择_第4页
临床科研统计方法与选择_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

临床科研统计方法与选择 临床科研中数据的处理和统计方法是临床研究得出结论的步骤之一。而描述临床数据,应用正确 的统计方法是获得正确的临床科研结果的前提。本文从描述数据到统计方法的选择介绍临床科研论文中常 用的统计方法、基本概念。 一、数据的种类 1. 数据种类:临床上的数据通常可简单地分成计量资料、等级资料和分类资料(计数资料) 三种类 型。 计量资料指连续的数据,通常有具体的数值,如身高、体重、血压、血红蛋白、胆红素和白蛋白等。 等级资料指有一定级别的数据,如: 临床疗效分为治愈、显效、好转、无效, 临床检验结果分为- 、+ 、+ + 、+ + + , 疼痛等症状的严重程度分为 0 (无疼痛) 、1(轻度) 、2 (中度) 、3 (重度) 等, 等级资料又称为半定量资料。 分类资料指各数据之间没有顺序或等级关系,而是归于一定属性,可以是两类,也可以是多类。 如性别资料,按男性和女性分类,计算男性与女性各有多少例; 职业资料,按工人、农民、职员等归类,计算各自的例数; 随访结果资料,按生存或死亡归类,计算各自的例数; 接受干预措施资料,按用试验药物、用安慰剂归类; 是否存在吸烟、饮酒、幽门螺杆菌( Hp) 感染等暴露因素,按吸烟、不吸烟,饮酒、不饮酒, Hp ( + ) 、Hp( - ) 归类等。 2. 数据的类别转换:计量资料可以根据需要或一定的标准分成两个或数个等级而变成计数或等级资 料。 如年龄资料是计量资料,但可以按大于 65 岁、4565 岁、小于 45 岁分为老、中、青年 3 类而转 变为等级资料或计数资料。但需要注意的是: 计量资料转换为等级资料或计数资料比较简单,但从等级资料或计数资料就无法再转换成计量资 料,因此,在临床上收集数据或计算机储存数据时,应考虑收集或储存计量资料,只有在数据处理时根据需要 再转换为等级资料或计数资料。 对两组病人的某项指标进行统计学检验时,数据从计量转换为计数或等级资料,统计的效率也可能 下降。 二、数据的统计描述 对于临床研究数据,通常我们不可能在论文中或在报道告诉读者每一个病人的具体特征。我们需要 知道这批数据的特征,一方面便于描述,另一方面便于两组数据或特征的差异比较,这就是统计描述。 1. 计量资料(数据) 的统计描述:计量资料的特征通常包括中心位置与离散程度。 中心位置通常用均数来描述,如 一组病人的年龄、体重、血红蛋白、白蛋白、胆红素、肌酐和尿素氮等, 要求是这类数据应该服从正态分布; 如果数据经对数转换后呈正态分布,则可以用几何均数表示其中心位置,如 HBsAg 滴度(18 ,116 ,132 ,164) ; 对于偏态数据,通常用中位数表示其中心位置,如 研究急性肝炎时 AL T、AST 等范围从数十到上千变动较大,且每个病人的变化情况不一致。 正态分布的数据离散程度可用标准差来描述; 对于偏态数据,可以用 4 分位范围(inter2quartile range , IQR) 描述离散程度,即: IQR 为第 25 百分位数(P25) 第 75 百分位数(P75) 。 2. 计数资料(数据) 的统计描述:计数资料在分类时可以计算各类别在总数中的比重或百分比,称为 构成比,如性别资料,100 例病人中,60 例男性,40 例女性,可表示为男性占 60 % ,女性占 40 %; 如果数据分为发生或不发生,如死亡、患病等,则可计算其死亡率、发病率等指标,表示其发生的强 度,称率。 构成比一般不能说明发生强度。 临床上有很多率实际上只是个比例(构成比) 。如患病率是一个比例,由于历史原因,仍称为患病率。 所以不能将构成比混为发病率来说明发生强度。当两个率进行比较时,如果某一指标足以对率的大小有影 响(如年龄对死亡率) ,而该指标的组成(如年龄构成) 在两组内不同,则需要对该指标进行标准化。 3. 等级资料的统计描述:根据数据可以用构成比或率来计算。如临床疗效可表示为治愈率、好转率 等。腹痛根据程度分为无、轻、中、重,可计算各程度的构成比。即用各种程度病人数除以总病例数,各构 成比之和应为 100 %。 4. 比数、优势比、相对危险度:在病因学研究中,是暴露因素与疾病之间的联系强度的指标。 比数是阳性率与阴性率之比。相对危险度(RR) 是两种暴露条件下发病率之比,如研究 Hp 感染与胃 癌的关系,采用前瞻性队列研究,按 Hp( + ) 与 Hp ( - ) 分为 2 组观察若干年后胃癌的发生率,计算两组 的发病率之比即估计相对危险度。 优势比(OR) 是在病例对照研究中表示暴露与疾病发生之间的相关程度,是 RR 的近似值,如同样研究,采 用病例对照设计,按胃癌与非胃癌分为两组,调查两组病人发病前 Hp 感染情况,评价 Hp 感染与胃癌之间的 关系需用优势比。 三、定量数据的统计学检验 临床研究中要进行两个样本或多个样本间差异的统计学检验,以判定差异是真实存在或者由于抽样 误差引起。 1. t 检验与方差分析:对于分组呈正态分布的定量资料,如为两组比较,可用 t 检验。 t 检验有 2 种方法,取决于资料是成组比较还是配对比较。 临床科研中对每一病人治疗前后的比较:如应用利胆药物后胆红素水平前后的比较;应用保肝药物后 白蛋白水平的前后比较等多属于配对比较。 临床上许多研究无法配对,如新药与对照药物的比较,通常都是治疗组与对照组进行成组比较。在选 用 t 检验时,这两种 t 检验的方法是不同的。 对两组以上(多组) 资料比较,则选用方差分析;方差分析也有二种方法,取决于研究设计。 如研究血液放置时间对血糖测定值的影响,对 8 名健康人抽血后将每一个体的血液分为 4 份,分别 放置 0 、45 、90 、135 min 后测定血糖浓度,这种设计每 4 份血糖测定值均来自同一个体,称为随机区 组随机,需要用随机区组分差分析。 同样,如果我们的目的是比较三种不同降血糖药物的治疗效果,采用随机化方法将病人分为三组,每 种药物应用于一组病人,三组病人最终的血糖比较则用完全随机设计方差分析。需要注意的是,各组样本含 量相等与不相等时,由于组间离均差平方和计算方法略有差别,所选用方差分析计算公式也不一样。 需要指出的是,配对或配伍组设计比成组或完全随机设计的优点是对某一因素进行控制,如上述 4 份 血糖结果,除了放置的时间外,其余因素都一样(来自同一人) ,从而减少了偏倚误差,提高统计效率。 在进行方差分析时,如对 A、B、C 三种药物的疗效进行比较时,无效假设为三组疗效相同,即 H0 :A = B = C ,差异有统计意义而推翻此无效假设时,其备选假设 H1 为三种药物的疗效全不相同或不全相同, 这时并不能区分是哪两种药物疗效相同,哪两种不同。一种自然的想法是不做方差分析而直接做三个 t 检 验,即检验 A = B、A = C、B = C ,由此直接得出结论。从统计学角度看,这是不正确的,因为它增加了第 一类错误,即假阳性错误的概率。这时统计上有意义的临界值概率 ,已超过 = 0. 05 的标准,因而是不 可取的。 比较合理的方法是在方差分析后作多重比较(两两比较) 。多重比较的方法很多,常用的有 SNK(Student2New2man2Keuls) 法、Duncan 法、LSD 法以及 Dunnett 法等。 应用 t 检验和方差分析的前提是: 小样本时,无论 t 检验或方差分析,对数据的要求均应是正态分布,资料正态性问题可以用频数图 考察或正态检验; 成组 t 检验和方差分析要求各组的样本方差间差异无显著性(方差齐性) 。两组方差齐性检验可 以用 F 检验;多组方差齐性检验可以用 Baetlett 检验。 2. 数据转换:如果数据属于某种特殊分布或数据具有一定特征,经过一定转换后可转换成正态或方 差齐性,则分析效果更好。如水中细菌数、单位时间放射性计数等符合普松分布,数据可通过平方根转换; 非传染病患病率、白细胞百分数、淋巴细胞转换率、钡条胃排空检查的残留率等符合二项分布,数据可通 过平方根反正弦函数转换;滴度资料等可通过对数转换。 3. 非参数统计:非参数统计也针对两组或多组计量资料的比较,当 t 检验或方差分析的前提条件不 能满足而对数据的总体分布不能确定或没有适当的转换方法时,可以用非参数统计方法。相应于参数检验、 配对比较的设计,非参数统计采用符号等级检验(Wilcoxon 法) ;两组比较采用两样本等级和检验 (Wilcoxon Mann and Whitney ranksum 法) 或中位数检验;配伍组设计比较采用 M 检验(Friedman 法) ; 多组比较采用 H 检验( Kruskal and Wallis) 。表 1 列出了计量资料比较时参数检验与非参数检验的选 择。 表 1 计量资料比较时参数与非参数统计方法选择 = 设计方法 参数统计(注一) 非参数统计(注二) - 配对比较 配对 t 检验 符合检验, 符号等级检验(Wilcoxon) 两组比较 成组比较 t 检验 两样本等级和检验(Wilcox2on Mann and Whitney 法) ,中位数检 验 配伍组比较 随机区组方差分析 M 检验( Friedman 法) 多组比较 完全随机设计方差分析 H 检验( Kruskal and Wallis 法) = = 注一:应用条件是数据正态分布,方差齐性; 注二:应用范围主要为偏态资料且数据无法转换为正态,等级资料分组比较。 等级资料分组比较也应用非参数检验,多组比较时采用 H 检验,两组比较时采用等级和检验 (Wilcoxon Mann andWhitney 检验) 或中位数检验。如比较两种胃动力药物治疗功能性消化不良的疗效, 疗效评价按显效、有效、好转、无效分为 4 等级,两组比较可采用等级和检验。 四、卡方检验 研究两组或几组资料的性质是定性或分类的,通常用率或构成比描述各组的特征。比较组间率或构 成情况间的差异是否有统计学意义可以用卡方检验。 1. 四格表资料的卡方检验:当比较两组定性或计数资料且资料的属性只有两种时,通常采用卡方检 验,如研究 Hp 感染与胃癌关系时,胃癌病例组 100 例, Hp 感染 80 例(感染比例 80. 0 %) ,慢性胃炎对照 组 100 例, Hp 感染 60 例(感染比例 60 %) ,是否胃癌病例组 Hp 感染率高于慢性胃炎组,即 Hp 感染与胃 癌有关是否真实存在而不是由于抽样误差引起,统计学检验时即可采用四格表卡方检验。一般计算 Pearson 卡方,仅表示两组构成比不同,有一般联系。四格表中如果数据较少,理论值(根据无效假设计算得 到的各格应有的数值) 4O ,但有 1T5 时,没有计算校正 Y 值。 2.普通四格表资料,当 n4O ,或有 T1 时,仍然用检验,没有选用四格表确切概率法。 3.R C 表资料,有理论数 T1 的格,或 1T5 的格数超过总格数的 1 5 ,没有采用适当的 处理方法,而直接套用 R C 表检验的公式,导致分析的偏性。 4.配对四格表资料整理为普通四格表,二者设计方案不同, a 、 b 、 c 、 d 的意义不同,分析目 的和方法也不同。 九、直线相关与直线回归分析中的问题 进行直线相关与回归分析时,得出回归方程式或算出了 r 值,得出结论前,应先做假设检验,用以 推断变量间是否存在直线性的依存关系或相关关系,至于相关的密切程度还要看 r 绝对值的大小,因为 r 的假设检验,无论 P 值多么小,只能说明变量间是否相关,而不能提供相关密切程度的信息。 r 绝对 值越接近变量间的相关关系越密切。称为决定系数,表示回归平方和占总平方和的比例,当变量间有相关 关系,但不是很大时,提示变量间的相关关系实际意义不大,有些科研工作者对此缺乏了解,在论文中曾 发现 r 值为 0 126 , P0 O1 ,决定系数 =1 59 ,而未引起研究者对其实际意义的关心。还 有的用直线相关代替曲线相关,用直线相关代替等级相关,应变量为二分类变量却使用线性回归。 十、多因素分析中的问题 随着计算机的普及,多因素分析已日益广泛地应用于医学研究之中。医学研究中所应用的多因素分析 有多元线性回归、 Logistic 回归、 Cox 比例风险模型、判别分析、聚类分析、主成分和因子分析、典 型相关分析、对应分析、多维标度法、 Poisson 回归分析等。由于这些分析的复杂性,有些研究者对分 析中的准则不十分熟悉,缺乏统计学原理的基本知识,对选用哪些数据,应用哪些计算以及怎样解释所得 结果等,单靠计算机不可能圆满地全部完成。因为缺乏统计学基本知识,机械使用统计软件,导致拿着计 算机给出的结果不知道是什么意思。在进行统计计算时,常常需要灵活地应用统计软件,这就需要对软件 的计算方法有较深入的了解。人们在处理“多因素多指标统计资料”方面最常犯的错误是: 1.多元 ( 或多因素 ) 资料用一元 ( 或单因素 ) 统计分析方法处理:这样会导致资料的利用率低, 不能反映资料的整体情况,不能很好地揭示变量之间的交互作用和内在联系,容易得出片面的、甚至歪曲 事实的结论。 2.多因素分析方法的选择错误:对于多因素分析我国医学论文中使用最多的是多元回归,常用的多元 回归方法有多元线性回归、 Logistic 回归和 Cox 回归,它们是按照应变量的类型来分类的,其应变量 分别为连续型变量、分类变量和生存时间。如果资料中有多个观测指标,但它们之间没有自变量和应变量 之分,研究变量之间的远近关系时,可选用变量聚类分析;根据变量之间的关系,想把受试对象进行分类 时,可选用样品聚类分析;要降低变量的维数,用少数几个综合变量表达众多原变量所反映的绝大部分信 息时,需选用主成分分析或因子分析;将变量和样品同时反映在一个直角坐标系时,应选用对应分析。当 资料中有分类变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论