




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、临床医学科研设计 & 统计分析技巧中日友好医院 李光伟第1页,共191页。考考你下述研究水平如何?非常好比较好比较差,可修改无可救药第2页,共191页。例1。胰岛素抵抗抑或胰岛细胞缺陷是2型糖尿病的始动因素?-糖尿病一级亲研究IGTNGTN2938NSAGE4846NSBMI24.1+3.023.6+3.3NSWHR0.880.85NSAIR53.5+282.6+1.70.01I30/ G3010.5+1.712.6+1.8NSHOMA_IR7266NS第3页,共191页。CONCLUSION and YOUR OPINION胰岛细胞缺陷是2型糖尿病的始动因素与国外文献结果一致Next:Wha
2、t is your suggestionto T2DM prevention and management?No need to improve insulin sensitivity?To improve insulin secretion in order to preventT2DM in IGT subjects?第4页,共191页。例2。不同糖代谢状态微量白蛋白尿发生的危险因素研究NGT(n=112)IGT(n=205)T2DM(n=356)M/F41/7169/136167/189Age51.89.9589.7*53.910.6SBP1241913818 *13319*DBP811
3、28611 *8410*BMI25.63.2283.3 *273.8*FBG5.20.66.10.6*8.92.4*BG27.81.39.31.8 *16.75.5*FINS11.56.414.59.3 *16.35.4*INS256.343.5129112 *4530*第5页,共191页。例2。不同糖代谢状态微量白蛋白尿发生的危险因素研究NGT(n=112)IGT(n=205)T2DM(n=356)TG1.480.771.560.791.970.62*TC5.41.05.81.0*5.61.0*HDL-C1.50.31.350.3*1.20.36*SMOKE13.7%17%24.4%*WIN
4、E18.8%17%22.4%*DMHIS19%19%35%*UALB(Y,N)4.5%9.8%*18.5%*UALB(mg/24h)5.189.37*18.5 *第6页,共191页。例2.糖耐量异常组微量白蛋白尿发生的危险因素 (线性回归) pDBP0.3580.001PBG0.190.001HDL-0.230.001TG0.200.001SMOKE0.2280.001第7页,共191页。例2.糖耐量异常组微量白蛋白尿发生的危险因素 (LOGIST回归) OR 95%CI HT2.111.29-2.91PG2H1.741.21-1.78HDL-C0.530.34-0.87第8页,共191页。例
5、2.新诊DM组微量白蛋白尿发生的危险因素 r pAGEO.1450.006SMOKE0.1590.003HT0.1780.01BMI0.1210.02SBP0.300.0001DBP0.310.0001TC0.080.11TG0.2940.0001HDL-C-0.250.0001FBG0.210.0001FINS0.350.0001第9页,共191页。例2.新诊DM组微量白蛋白尿发生的危险因素 (线性回归) pAGE0.0450.337sex0.0480.034smoke0.1270.005DMHIS0.0860.053BMI0.0110.816TC0.0820.07TG0.190.0001H
6、DLC-0.1460.001FINS0.3540.0001FBG0.2850.0001SBP0.266 0, 100, 和 200 Agatston units分组 P. Cleary, et al. 652-P, 63rd ADA第38页,共191页。Steno-2 研究目的 在有微量白蛋白尿的2型糖尿病患者,比较强化多因素达标治疗(包括行为和药物干预在内的)与常规治疗(8年)对心血管疾病的影响第39页,共191页。Steno-2研究 169位有微量白蛋白尿的2型糖尿病患者9名患者因C肽600而退出160位患者随机分组80位患者接受常规治疗80位患者接受强化治疗15例死亡7例发生CVD5例癌
7、症3例其他原因12例死亡7例发生CVD2例癌症3例其他原因2例自动退出1例自动退出63例完成研究67例完成研究第40页,共191页。Steno-2 初级终点: 所有心血管疾病心血管死亡非致死性心梗冠脉搭桥非致死性中风血管重建截肢 次级终点: 微血管疾病肾病的进展视网膜病变的进展神经病变的进展8年后的终点事件第41页,共191页。达到的治疗目标糖化血红蛋白6.5%胆固醇4.5 mmol/l甘油三酯1.7 mmol/l收缩压130 mmHg舒张压80 mmHg8年后达到治疗目标的患者%p=0.06p0.0001p=0.19p=0.001p=0.21Steno-2 研究强化组 常规组强化组 常规组强
8、化组 常规组强化组 常规组强化组 常规组第42页,共191页。12243648607284960随访时间(月)危险患者例数常规治疗组强化治疗组808072787074637159665063446141591319危险比 0.47 (0.24 0.73); p=0.007常规治疗组强化治疗组初级终点事件的概率初级心血管终点事件第43页,共191页。第44页,共191页。第45页,共191页。第46页,共191页。瑞格列奈与格列齐特试验目的比较经4周治疗后,瑞格列奈与格列齐特对于2型糖尿病患者胰岛素分泌的疗效试验方法对照性试验, 共20名2型糖尿病患者,随机分为两组:瑞格列奈1mg tds,每餐
9、前服用格列齐特40mg bd,早餐及晚餐前服用- 追踪4个月参数:HbA1c,空腹血糖, 胰岛素AUC0-30和AUC0-240 男女比例平均年龄BMIkg/m2HbA1c瑞格列奈组9/151317.8%格列齐特组3/758307.7%LAWRENCE S. et al. 1923-PO, 63rd ADA第47页,共191页。瑞格列奈与格列齐特试验结果1: 两者降低糖化血红蛋白和空腹血糖的作用相似 瑞格列奈格列齐特HbA1c(%)空腹血糖(mmol/L)0-1-2-3-4与基线比较的改变1.040.720.891.21 试验结果2: 经4个月服用, 瑞格列奈显著改善了2型糖尿病患者的胰岛素的
10、1相分泌,而格列齐特无此作用 瑞格列奈组胰岛素AUC0-30和AUC0-240明显增加, 但格列齐特 组没有明显增加 (p=11.1 mmol/l37% IGT, 21% IFG ,46% NGT 糖尿病早期干预试验(EDIT)第51页,共191页。 A+M 155 P+M 160 M 315 A+P 157 PP 159 P 316 A 312 P 319 631糖尿病早期干预试验(EDIT)第52页,共191页。结果:31发展为糖尿病,14失访发生糖尿病的危险性在3个药物治疗组没有差异入选时为IGT的患者,阿卡波糖组糖尿病发病危险性降低(0.66, p=0.046),二甲双胍(1.09,
11、p=0.70)或两药合用(0.72, p=0.27)没有作用。药物干预的效果与患者是IGT或者是IFG 有关糖尿病早期干预试验(EDIT)第53页,共191页。Extrapolation of the time to deterioration of beta-cell functionAdapted from UKPDS 16. Diabetes 1995;44:124958Years from diagnosisBeta-cell function (%)108642024612100806040200第54页,共191页。Name:YLSex:maleAge:28Ji L, unpubl
12、ished data第55页,共191页。罗格列酮可预防2型糖尿病患者发生冠脉再狭窄对象和方法:随机双盲、前瞻性研究对象为冠脉支架植入的2型糖尿病患者罗格列酮组(4mg/天)45例,56个支架; 安慰剂组 48例,60个支架从第1次支架植入开始随访6个月植入支架的管腔狭窄程度超过50定义 为发生再狭窄Sung Hee Choi, et al. 82-OR, 63rd ADA第56页,共191页。,p0.001罗格列酮可预防2型糖尿病患者发生冠脉再狭窄第57页,共191页。Rosiglitazone (4mg - 26 weeks) reduces coronary stent restenos
13、is in type 2 diabetes100806040200% of in-stent restenosis after 6 months % of stents with lesions after 6 monthsCONCONN = 45stents = 56stents = 60N = 48RSG*RSG*Choi SH et al 2003 ADA abstract No 82 - oralDouble-blind placebo-controlled studyCRP60%CRP60% of patients第58页,共191页。有的放矢 无病呻吟第59页,共191页。二、研究
14、设计科研设计是科研的灵魂严密的设计是取得有价值结果的先决条件从这个意义上说没有“设计”就没有科研。 不少回顾性分析,内容包罗万象,是研究无主题的反映:研究者在研究之初对研究要解决的问题即主攻方向心中无数,对研究所报的态度是逮着什么算什么,并不是想通过研究解决某一特定的问题,或不知道通过研究能解决什么问题。 这些研究缺乏严格的设计或无设计,这类研究即使有重要的发现也属偶然。 第60页,共191页。 “前瞻性”研究,无前瞻性的设计 几年前做了几万人的糖尿病普查,发现了400例糖尿病和500例糖耐量低减,几年后的今天忽然想起这些病例很可能出一篇文章,于是又去调查了一番,找到了200例糖尿病和300例
15、糖耐量低减。 写出 1.糖尿病人冠心病危险因素分析 2.高危人群糖尿病的危险因素. 这种研究是残缺不全的随访,并不是前瞻性研究,缺点是难以弥补的。 高达50%的失访率会造成严重的信息偏差(information Bias): 若是有问题的人召之即来,则发病率会被高估; 若严重者已去医院看病不来参加,来的只有轻的病人,则会低估疾病的发病率。第61页,共191页。例如糖尿病人群中有许多人合并了高血压、高血脂病不少人已用药物治疗治疗中有的长期坚持用药,有人仅偶尔用药有人血压或血脂一直控制很好,有些人时好时差 此时不论以随访的血压、血脂指标,还是以末次随访的指标分析,都不能反映干预对疾病的影响。 这些
16、重要混杂因素的干扰,分析的结果常会远离实际情况.第62页,共191页。 更糟糕的是有些研究者对这种情况非常不以为然,当审稿人提出问题让他们补充此方面材料的,得到的回答是估计 服药的人很少,不会对结果发生影响 殊不知“差之毫厘,谬之千里,”在你轻易的原谅自己的疏忽的时候,统计学的P值随之发生了改变。第63页,共191页。终点事件过少 有些研究者为了某种原因,希望尽早发表自己研究的结果,仅随访极短的时间(半年或一年),仅有几个或十几个终点事件(如死亡)就进行多因素分析,寻找危险因素。 终点事件过少的这种分析看上去可能条条是道,但其结果往往是不可靠的。应延长随访时间,增加终点事件后再分析 Navig
17、ntor研究设计出现1000个终点事体时才结题。第64页,共191页。为保证科研的成功,一个完整的科研设计应包括以下几项内容:有理论或实用价值的选题选择合适的研究对象制定可靠的测量指标选择科学的统计分析方法若能对结果做恰当的描述,则会得出符合实际的结论。 第65页,共191页。例1 大庆糖尿病研究设计目的:探讨单纯生活方式干预是否可有效预防糖尿病对象:非糖尿病成人样本量:500例随机分组:四组,拉丁方块设计 C D E D+E随访期:预计8年第0.5年 每月,以后每3月随访终点:OGTT判定 DM分析:多因素分析排除混杂因素干扰后证实生活方式干预有效。第66页,共191页。例2: DPS比大庆
18、研究干预目标体重下降7%例3: DPP干预目标体重下降7%,增加药物干预组第67页,共191页。治疗性研究设计的基本要素 研究设计的方案要科学:在研究方案的设计上,必须要坚持三条基本原则: 随机化的原则(randomization); 对比原则(comparison),设置对照组; 盲法原则(blindness)。符合上述三原则者为 随机盲法对照试验(randomized blind controlled trial, RCT)是治疗性研究设计首选方案。第68页,共191页。随机化分配的原则的基本要求是每研究对象均有相同的机会被分配到实验组和对照组,使两组具备充分的可比性防止偏倚的干扰和人为的
19、主观干预有效地避免选择偏倚(selection bias)。第69页,共191页。随机化的应用主要用于以下两个方面:从总体中随机抽取样本进行研究。因为在临床研究中,不可能将所有的某种疾病的患者都纳入研究,为了使抽取的样本能代表总体,就必须采用随机抽机样的方法。在随机对照的试验研究中样本的随机化分配(random assignment)即将研究对象随机分成实验组和对照组。第70页,共191页。 随机化的方法简单随机化:可能参照统计学工具书中介绍的方法,最不带偏倚的方法是运用随机数字表法,或电子计算器/机随机编码法。区组随机化:如将研究对象总人数,分成四人一区组,对各个区组内的患者,分别根据随机数
20、字进行编号分组,确定奇数和偶数各属于哪一组,其排列组合如下表所示,将24患者分A、B两组。可先按时间先后的顺序将24名研究对象分为6个组,每组4名为例,第71页,共191页。表1 区组随机排列组合区组号 1 2 3 4 5 6排列组合 ABAB BABA ABBA BAAB AABB BBAA随机抽取6个区组号,得3、1、6、5、2、4分序号,再按下法将研究对象分组,见表2。第72页,共191页。表2 研究对象分组患者号 1 2 3 4 5 6 7 8 9 10 11 12分配序号 3 1 6研究对象分组 A B B A A B A B B B A A患者号 13 14 15 16 17 18
21、 19 20 21 22 23 24分配序号 5 2 4研究对象分组 A A B B B A B A B A A B患者号为1、4、5、7、11、12、13、14、18、20、22、23的研究对象随机分配到A组,其余患者号共12例分配到B组。第73页,共191页。分层随机化:是根据研究对象的主要临床特点或预后危险因素等其分为不同的层,现将层内不同数量的研究对象随机分配到试验组和对照组 例如:已知与研究对象预后有关的重要因素有年龄、性别和吸烟,则分层方法见表3。第74页,共191页。表3 三层因素分层表年龄(岁) 性别 吸烟史1、4049 1、男 1、现在吸烟 2、5059 2、女 2、过去曾吸
22、烟 现已戒烟3、6069 3、从未吸烟 由上表可得323=18层次,每层次内再进行随机化分组。随机化法的应用,可以平衡实验组和对照组中已知的和未知的混杂因素,有效地避免选择性偏倚,提高两组可比性,为研究结果的准确性提供了重要保证。第75页,共191页。随机化分组在大多数情况下十分重要,但随机化并非总是有利的和有道理的。在某些情况下有比随机化更重要的东西那就是要满足适应症的要求。适应症不合理,随机化反使结果变糟。 第76页,共191页。髋关节骨折手术及保守治疗存活率(28天)手术 保守存活 102/139 (74%) 34/65(52%)结论:手术效果优于保守疗法 符合适应症 不符合适应症 手术
23、 保守 手术 保守存活 102/129(73%) 30/33(91%) 1/10(10%) 18/82(12.5%)结论:保守疗法不逊于手术效果第77页,共191页。女性激素补充治疗的循证研究(妇女健康倡议研究WHI)19世纪70年代结论:雌激素加孕激素能有效缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松。但不会增加子宫内膜癌危险。WHI(大规模,多中心,随机对照)结论:雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防,预防骨质疏松时应考虑乳腺及心血管病风险。弊多利少!心脏事件 29%,卒中 41%,乳腺癌 26%,结肠癌 37%,髋骨骨折 34%第78页,共191页。妇女健康倡议研究(
24、WHI)-再好的研究也有缺陷!50-79岁 均值63岁有子宫者随机用雌激素孕激素联合治疗无子宫者随机用雌激素第79页,共191页。妇女健康倡议研究(WHI)-再好的研究也有缺陷! 忽略了HRT最明显的益处:(缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松)没有遵照处方药应该严格掌握适应症的原则(性激素低下 而非所有老年妇女,更不是健康老年妇女。该研究中80%以上是没有绝经期症状的老年妇女。不具有HRT适应症结论不应随意扩大(品种,剂量,种族)与某些风险相比WHI所阐明的HRT对各种事件的绝对风险是 很低的第80页,共191页。妇女健康倡议研究(WHI)恐慌后的冷静思考共同意见: HRT能有效
25、缓解绝经症状及预防骨质疏松;应用小于4年风险小。 HRT不用予心血管疾病预防。风波后的冷静思考:不是否定 而是更深入不是终止 而是要阻止滥用不是恐慌和困惑 而是更成熟和清醒HRT不是更危险 而是更安全第81页,共191页。(一). 研究对象的选择 要想证实研究者的思想,确定入选和排除标准,选择合理的研究对象是关键的一环。第82页,共191页。 1. 研究对象要有代表性 做疾病患病率的调查,随机化的原则可保证研究样本是总体人群的“缩影”,从而避免结果失真。 从某一局部地区“整体人体”调查出的“率”如推广到普遍认群,应说明该局部的“整体”人群与全局的人群结构相似。 第83页,共191页。 1. 研
26、究对象要有代表性 随机化抽样的缺点是研究对象地域较为分散,每个单位仅有少量病例,这对于干预治疗的前瞻性研究的病人管理极为不利,耗费更多人力,常使研究无法进行。 而在人群较多的社区进行“整群”调查,会在相对较小的地域找到较大样本,从而有利干预治疗的管理。如果其人群结构接近全局的人群,其统计的“率”也有重要参考价值。第84页,共191页。 如果仅为测定一个“率”做几万人的调查则较为浪费人力物力,而随机分层抽样可以以最小的样本,最少的花费取得有代表性的结果。 随机化大样本研究基线资料组间不一定可比,如果差别显著,可用分层分析或多因素分析消除混杂因素的影响。第85页,共191页。 “随机化”的另一缺点
27、是可能有时“随机化”分组得到的两组(或几组)对象的某些参数值不可比,在样本量较小时尤其突出。 一般来说大样本的随机对照研究试验组资料会有可比性,但有时也会有显著差别。 病例对照研究可保证所选各组对象参考数的平衡, 第86页,共191页。 2.样本含量的估计 队列研究属前瞻性研究,应考虑到失访的可能性,故一般需再加10%的样本量。 失访率40%以上,其研究的真实性就会受到严重怀疑。如果失访与暴露或疾病都有联系,那么即使随访率达到80%以上也难以防止偏倚的发生。第87页,共191页。3. 从生物学医学原理选择持定的合理人群(不犯人群结构错误)研究对象中所观察变量的梯度 例1, 看生长激素水平与身高
28、的关系: 对2574岁者测GH与身高 结果发现GH与身高不相关 结论肯定错了 因为GH的最重要作用在于促生长 原因是人群选择失当 GH促生长表现在身高增长期,即儿童期 成人身高已不再增高。 第88页,共191页。例2: 在高血压(或血压正常)人群研究血压水平对冠心病发生的影响或研究致高血压因子的作用都可能得出假阴性的结果.第89页,共191页。 研究某些变量的生物学作用时,这些变量必须有一定梯度,否则会掩盖因果关系。 例如:研究继发性高血压的病因 有研究者发现某些 著名的继发性高血压与其公认的病因无关: 柯兴氏病高血压与皮质醇水平不相关 活动性肢端肥大症血压与生长激素水平不相关。 第90页,共
29、191页。 这些怪事如何解释?材料都是真实可靠! 研究对象中所观察变量没有足够梯度 所有来诊病例是经长期辗转来到研究者单位 看病时病情都十分典型,激素水平都很高, 该变量梯度很小,掩盖了激素与血压的相关关系。 第91页,共191页。 解决的办法: 在激素水平相当人群,若能发现病程长短与血压水平有关,也算是发现了激素对血压的影响。 但若病程长短也相同,还是不会有阳性发现。 但若手术后激素水平下降,血压也下降,将治疗前后的病情加以比较则必会发现继发性高血压与激素水平的关系 那是因为人为的制造了梯度。第92页,共191页。 研究肥胖与糖尿病的关系 不能仅选择超重和肥胖的人群(BMI 25-30) 因
30、为(BMI 25-27) 与(BMI 27-30)的人群糖尿病的患病率可能无明显差别, 但与BMI24人群差别会很显著 变量的梯度是成功的关键。第93页,共191页。例. G蛋白3基因C825T亚型多态性与血压,胰岛素抵抗,肥胖的相关性: 2000年一位作者 在血压正常人群未发现该基因多态性与血压相关; 2002年 Hyperten一文发现该基因多态性与胰岛素抵抗及肥胖相关.因为他选择了高血压人群也未发现该基因多态性与血压相关. (170/105mmHg) 在1999年一项大规模的人群调查基础上的包括高血压(43%)和非高血压人群的研究却发现两种不同亚型基因的患者高血压患病率相差3倍(OR=3
31、.43)第94页,共191页。第95页,共191页。 GNB3 C825T多态性 对胰岛素抵抗与收缩压相关性的影响(第一代子女组)第96页,共191页。 GNB3 C825T多态性 对胰岛素抵抗与舒张压相关性的影响(第一代子女组)第97页,共191页。LnIAI -4.21 -4.8 -5.15 -4.21 -4.81 -5.15 FINS(uIU/ml) 12.2 22.4 32.5 12.2 22.4 32.5 SBP DBP 第一代子女825CT/TT基因型组不同胰岛素敏感性及空腹胰岛素水平与血压的关系 (调整年龄、性别) (n=376) P0.05P0.01 P0.001GNB3 C8
32、25T多态性对胰岛素抵抗与血压关联的影响(第一代子女组)第98页,共191页。 GNB3 C825T多态性 对胰岛素抵抗与收缩压相关性的影响(第一代子女组) 第99页,共191页。 GNB3 C825T多态性 对胰岛素抵抗与舒张压相关性的影响(第一代子女组)第100页,共191页。4、设定恰当的入选和排除标准 恰当的入选和排除标准可防止混杂因素的干扰,保证研究结果的科学性,这是在各项研究遵守的。 例如,看血压与胰岛关系,不可纳入有心功障碍及肾病患者,否则可结果会有偏差。 第101页,共191页。4、设定恰当的入选和排除标准 入组的研究对象的准入指标,是保证研究质量的最重要和最基本的条件,在研究
33、设计和发表的论著中务必详细交代。 但这种选入排除标准应是实事求是的而不是过于苛求。 第102页,共191页。 在制订纳入和排除标准时,在保证研究质量的前题下,一定要考虑研究成果的代表性和研究结果推广的受益面。例:有一重点课题仅考虑入组病例诊断的严格性 排除标准竟设计了17项 合格的纳入对象约占整个患该病人群的10%左右 90%左右的患者被排除掉。即使该研究的结果有高度的内在真实性(internal validity),其代表性也仅为10%左右。 第103页,共191页。 过度严格的选择会有轻型病人被排除,使研究结果出现偏差。例:冠心病与胰岛素的关系仅用冠脉造影资料作为诊断标准结果发现冠脉造影(
34、-)者:FINS 22 mm/ml冠脉造影(+)者:FINS 23 mm/ml结论是冠心病与胰岛素无关问题出在什么地方?第104页,共191页。 问题出在“诊断标准”: 冠脉造影(-)的人为什么能接受这种不无危险的检查? 因为这些人已有许多危险因素! 或有轻度狭窄但达不到“狭窄的定义”的切点 没达到“狭窄”切点, 只是时间尚短。 这并不能说明胰岛素与冠心病无关。第105页,共191页。 选入排除标准过于苛求 例: 研究胆石症与胰岛素抵抗的关系 (国家自然基金项目): 选择对象为l 手术证实的初发胆囊胆固醇结石l 年龄,性别,BMI相配(!)l 血压,糖耐量,血甘油三脂,尿酸,PAI 1, 尿蛋
35、白量正常(!)第106页,共191页。表: 胆囊胆固醇结石与胰岛素抵抗的关系 结石组 对照组 P年龄 33.9+9.32 39.97+9.71 0.85BMI 22+2.44 22.14+2.35 0.23WHR 0.83+0.06 0.81+0.07 0.05FINS 17.6+1.3 17.8+1.2 0.72INS2H 47.5+1.4 38.9+1.5 0.04 SBP 111.4+11.1 102.4+11.9 0.00 Ins Sen index -4.37+0.29 -4.42+0.25 0.33结果: 未发现胆石症与胰岛素抵抗相关,SBP,INS2H升高是胆石症的危险因素(?)
36、第107页,共191页。(二)、选择试验效果测试指标:选择要求关联性:指标与研究目的有本质的联系,应能确切反映处理因素的作用。 生物学意义合理:冠脉造影,HbA1c看降糖药物疗效。灵敏性:指标能正确反映效应变化的最小数量或最小水平 。特异性:对治疗反应的阳性结果要能准确地测量和确定,其特异性越强越好;尽量选用客观指标作为主要观察指标。精确性:包含准确度(效度)和精密度(信度)两个方面。稳定性:变异程度经济可行:在考虑敏感性和特异性的基础上,应从各种方法比较中,选择经济及可行性良好的测试方法和指标。指标的选择要少而精第108页,共191页。 在治疗性研究方法中相应的预防和处理的措施如防止选择性偏
37、倚,使用随机抽性与随机分配法; 避免测量偏倚,使用盲法;减少机遇因素的影响,采用限制型及型错误水平的方法;有的混杂因素可通过配对及统计分层分析法加以避免或处理;通过严格培训人员,严格实验仪器、条件和方法以防止混乱;通过医学知识教育,改善医疗服务环节,以促进患者的 依从性等这些措施和方法均应贯穿整个设计、执行和资料分析的全过程,保证研究的高质量,从而获得科学的结论。第109页,共191页。三. 统计分析 在我国临床科研的统计学应用中,在统计方法的选择上存在过分强调统计检验而忽略统计学估计的倾向,存在统计方法越复杂越好的片面看法。 在发表的医学论文中,大多强调是否得到差别有统计学意义,而较少对测定
38、值进行95%可信区间估计,提及样本量估计及抽样方法、样本代表性问题的文章就更少了 在80年代初期,国外医学杂志针对类似的情况曾进行广泛的讨论,提出应重视区间估计的意义而不能将注意力集中在P值是否小于0.05上。第110页,共191页。 现在大多数的国际医学刊物发表的论文中要求作者同时给出点估计、区间估计和具体的检验统计值,如相对危险度(Relative Risk , RR, RR值就是暴露人群发病机与非暴露人群发病机率之比,即a/(a+b)与c/(c+b)之比),RR的95%可信限和P值。诸如95%可信限的区间估计可以提供更多有价值的信息 但在我国临床科研的统计学应用中尚未引起足够的重视。片面
39、地认为越复杂的统计方法越好,而忽视统计检验方法的适用性和恰当性。第111页,共191页。 (1)、描述性统计 描述性统计分析是统计检验的基础,能提供资料的总体特征,不论在最后的论文报告中描述性统计分析的结果占多大的比重,它都是实际的资料分析过程中的起点 它为选择进一步的分析方法如选择合理的变量提供重要的信息, 发现原始资料中的错误忽略必须的描述性统计分析是导致统计方法应用不当的原因。 第112页,共191页。 从简单到复杂 最基本的分析形式为单个因素的不匹配不分层资料组间比较的分析 这是病例对照研究推断性统计的基础。可比较病例组与对照之间危险因素的分布情况,分析其危险因素与患病之间的联系。 由
40、于病例和对照只是总体的代表, 无法直接计算真实的患病率,也就无法直接计算RR值,可以估计相对危险度OR,用以来代替RR。第113页,共191页。表6 饮酒与食管癌病例对照研究资料 饮酒 食管癌组 对照组 合计大量 a 328 b 258 586不饮 c 107 d 193 300合计 435 451 886 将表6的数据代入公式得:OR=ad/bc OR值是两个概率的比值,这一数值范围是从0到无限大的正数。当数值为1时,表示暴露与疾病危险无关联,当数值大于1说明疾病的危险度增加,叫做“正”关联,当数值小于1说明疾病的危险度减少,叫做“负”关联。第114页,共191页。(2)、统计分析中变量的选
41、择变量的确定: 研究的目的是相看哪两个变量之间的关系(不妨假设一因,一果) 例 ;高血压为因,冠心病为果第115页,共191页。A.明确变量的性质 重点和首要的看变量是否为正态分布分析中对变量进行正态分布检验 血胰岛素、血脂、生长激素、皮质醇、尿微量白蛋白,骨密度等都常为非正态分布。 非正态分布的变量是不能以原始资料进行参数统计分析,此时不进行正态化处理,得出结论会面目全非。第116页,共191页。B. 注意变量的动态变化 由于前瞻研究的期限较长,有些长达几年甚至十几年,这类研究中特别要注意变量的自身演变,有些变量是不会变的,如身高;有些因素在“成长”,如血压、血糖;有些变量在某一时期在“成长
42、”,在某时期却在“衰减”,甚至消失, 第117页,共191页。 例: 血胰岛素水平 从糖耐量正常到糖耐量低减这几年,胰岛素水平在逐渐升高; 从糖耐量低减到糖尿病胰岛素水平在下滑;晚期糖尿病胰岛素则衰亡,水平很低 第118页,共191页。在一个包括NGT、IGT、DM的人群中观察数年期间 有的个体胰岛素水平在升高 有的胰岛素水平在下降故此在这总人群以基线水平去预测某种疾病自然得不出正确的结论 在演变中未变成糖尿病人群中,可以发现胰岛素对某事件的阳性作用,而在IGT演变为糖尿病,尤其是糖尿病病情恶化的人群中,则会看到它的阴性作用。第119页,共191页。这种影响的两级分化在极大程度上还会受观察期限
43、的影响: 在非糖尿病人群落观察十年,如不删除研究期间恶化为糖尿病的病例,就可能大大低估胰岛素的致病作用 在NGT人群观察5年,则不会出现上述偏移 对这种消亡中的变量,如不在人群选择和研究时限上加以严格的限制,很难有可靠的结果。第120页,共191页。对象和方法1986-19921986年 170 非糖尿病人 (25-74岁) (107 NGT 63 IGT) 1992年 126NGT,IGT 44DM 第121页,共191页。基线OGTT胰岛素曲线下面基线与6年后血压的关系(n=170)第122页,共191页。非高血压人群基线OGTT胰岛素曲线下面积与6年后的收缩压水平的关系 ( n=126)
44、 因变量: 随访6年后SBP R2 =0.33自变量SEPAGE (year)0.60390.14010.0001SEX(M=1,F=0)2.62192.95250.3764BMI(kg/m2)0.67680.43470.1223Smoke yes=1,no=0)-0.82212.97490.5414PG2h(mmol/l)-0.61940.83590.4602SBP(mmHg)0.20040.09750.0427IAI-2.26712.27710.3215INSAUC5.92772.06970.0050截距 (Intercept)23.6174第123页,共191页。 .非高血压人群基线OG
45、TT INSAUC与6年后的DBP水平的关系 因变量: 随访6年后DBP (n=126) R2 = 0.27自变量SEPAGE(year)0.25680.10340.0145SEX(M=1,F=0)4.37422.18000.047BMI(kg/m2)0.84730.32490.0103Smoke(yes=1,no=0)-0.88572.20160.6882PG2h(mmol/l)-0.42680.62840.4984DBP(mmHg)0.13230.09530.1678IAI-1.57041.70480.3589INSAUC3.13551.55990.0468截距(Intercept)18.
46、8037第124页,共191页。C、决定哪些变量进入多因素分析? 过度调整? 调整失当? 调整不足?第125页,共191页。确定重要的变量(包括混杂因素)数量的方法 1.首先可根据自己对所研究领域专业知识的了解初步选择 例: 对氧磷脂酶基因多态性与糖尿病人群合并冠心病的关系 对照组 糖尿病组 糖尿病组+冠心病组病例数 38 36 39 男/女 29/9 24/12 36/3 年龄 70.8+10.8 64.8+11.9 72.7+8.3高血压(有/无) 30/8 19/17 17/22 BMI 23.86+3.41 24.96+3.14 25.29+2.56PON-192 BB 13.2% 1
47、1.1% 30.8%年龄是必须调整的混杂因素第126页,共191页。确定重要的变量(包括混杂因素)数量的方法 1.首先可根据自己对所研究领域专业知识的了解初步选择 例: 对氧磷脂酶基因多态性与糖尿病人群合并冠心病的关系 对照组 糖尿病组 糖尿病组+冠心病组病例数 38 36 39 男/女 29/9 24/12 36/3 年龄 70.8+10.8 64.8+11.9 72.7+8.3高血压(有/无) 30/8 19/17 17/22 BMI 23.86+3.41 24.96+3.14 25.29+2.56? DM病程 0 ? ? 服药 0 ? ?PON-192 BB 13.2% 11.1% 30
48、.8%年龄是必须调整的混杂因素第127页,共191页。2. 然后加入文献中同类研究必须纳入的变量3.应用逐步回归分析也会发现哪些变量应该选入。 有些研究在分析中囊括全部已测变量来做多因素步回归分析,或以为计算机挑出的变量就是最佳变量,是一种误解。 计算机挑出的变量受许多因素的影响,有些未被计算计挑出的变量有时非常重要(如年龄、性别), 所选变量中若不含有这些变量,分析结果可能不会被承认。第128页,共191页。 变量的选择1、强制进入模型(logistic stepwise); 2、 Age Age2 ; 3 、interation:BMI.INS(BMIINS);4、调整混杂因素后的(mea
49、nSE);5、调整年龄性别后的率 : logistic回归 Model DM=age sex r_BMI 第129页,共191页。连续变量(BMI)改为分组变量(r_BMI)1组2组3组4组5组HP=Age Sex r_BMI第130页,共191页。因果关系与研究对象选择及分组-BMI HP因 BMI25 BMI25AGESexHPSBPDBP第131页,共191页。因果关系与研究对象选择及分组-HP BMI因 HP0 HP1AgeSexBMITCSMOHPH.s第132页,共191页。D、决定用等级变量还是连续变量 分析中随意决定将原来的连续变量改为等级变量也是常见的错误 研究者不明白哪些变
50、量应作为连续变量,哪些变量应作为等级变量 分析中将某一变量作为等级变量还是连续变量不是可以随意决定,而是由变量本身的性质决定的。 第133页,共191页。D、决定用等级变量还是连续变量 将本应作为连续变量的参数改为等级变量有时会丢掉许多有用的信息。 决定哪些变量应作为连续变量,哪些变量应作为等级变量应由其与因变量线性相关(pearson)及等级相关(spearman)的结果来决定,线性相关优于等级相关的变量不应以等级变量进入分析。pearson 相关优于spearman 相关用连续变量较合理。spearman 相关优于Pearson相关用分组变量较合理。第134页,共191页。E. 确定入选变
51、量的数目 入选变量并非入选变量的数目越多研究越严密, 总的自变量数应由样本数决定(1:10),(对于多因素设计,观测变量数为样本例数的1/5-1/10)。 一些作者在分析中自变量的选择目的不明,一共有100个病例,每人有30个变量,就将30个变量都用作为自变量,以为自变量越多,分析水平越高。 第135页,共191页。注意变量间相互关系作者应十分明确所研究的两个主要变量的关系 将可能的混杂因素作为协变量放入模型 选入过多变量画蛇添足,徒劳无益,甚至有害 选入过多的协变量统计学上称为“过度调整”,这种调 整常常掩盖有意义的关联。第136页,共191页。 作为一个原则,多因素分析中,如不是为什么特殊
52、目的,不宜将两个密切相关的变量放入一个方程进行分析过度调整常会丢失一些有价值的信息。第137页,共191页。例如:分析糖尿病的危险因素因变量为: 糖尿病自变量为: 年龄,性别,体重指数,腰围,腰/臀比值,收缩压,舒张压,个人收入,家庭收入,家庭人口,冠心病史,高脂血症,糖尿病家族史,职业,教育水平等十五项.第138页,共191页。例如:分析糖尿病的危险因素因变量为: 糖尿病自变量为: 年龄,性别,体重指数,腰围,腰/臀比值,收缩压,舒张压,个人收入,家庭收入,家庭人口,冠心病史,高脂血症,糖尿病家族史,职业,教育水平等十五项.问题: 一些变量定义模糊 另一些变量间关系密切结果: 会丢失一些有价
53、值的信息。第139页,共191页。例如:有的学者在其研究中发现餐后高血糖与糖尿病慢性并发症显著相关,而空腹血糖不显著相关( Diabetes Intervention Study, DIS 1996) 。认为只有餐后血糖才重要 其实空腹血糖和餐后血糖在糖耐量异常人群高度相关,在进行逐步回归分析中,如将空腹及高后血糖同时做和自变量,统计中仅餐后血糖进入方程,空腹血糖不能进入,并不表明空腹血糖不重要。 这种情况下应逐个放入方程,才能不致漏掉重要的危险因素。糖化血红蛋白水平也应与血糖水平密切相关第140页,共191页。 逐步回归方析中,若一个进入方程,另一个不能进入也不能说,另一指标不重要。 这种情
54、况尤其要结合临床考虑,不要做出过于武断的结论。第141页,共191页。F. 多因素分析方法的选择: 多因素分析模式的选择取决于研究的性质:现状研究可选用线性回归和 Logistic回归,前瞻性研究选用成比例风险模型或Logistic回归因变量的性质:因变量为连续变量选用线性回归,因度量为分组变量(0,1)选Logistic回归或成比例风险模型。 一般说来前瞻性研究的成比例风险模型更为优越。第142页,共191页。 在使用多元回归分的文章中,常常存在所用分析方法的名称不详(如是Logistic回归还是多元线性回归)、定义不明、自变量选择不恰当的情况。判定统计方法优劣有某些参考指标复相关系数R2(
55、决定系数)是其一。R2接近于1说明引入方程的自变量与应变量相关的效果好。第143页,共191页。四. 结果判定 应以审视的眼光看待统计分析的结果: 为什麽? 因为人们常犯下述错误先入为主的一个想法(自己创造的,或别人特别是外国人发表的);在最容易取材的环境中收集病例(常常数量不多,不管或不知有多少因素干扰);统计分析t检验“定终身”,P0.05就皆大欢喜。第144页,共191页。五. 结果判定 这些研究在做统计学分析时常常是在 搞“逼、供、信”:强制一个不适当的人群做为研究对象强加给一个不适当的分析方法逼出一个结果并对之深信不疑 这些研究是垃圾文章的制造厂。第145页,共191页。1. P值的
56、意义: 在进行研究和阅读文献时应物别注意P值的大小。但是,P值并没有告诉我们这一性状出现的频率或水平的大小和方向 要了解这些信息必须依靠基本统计量基本统计量包括率、均数、标准差等。 比较两组(或多组)的率或均数可以了解该性状在组间分布的差异有多大及其变化的方向。在此基础上,结合统计检验的P值和专业知识下结论。 在分析评价研究结果时P值和基本统计量都是非常重要的,缺一不可。第146页,共191页。 观察对象的数量较少时,基本统计量的差别可能很大而P值大于0.05,此时应注意其专业意义。 如果这种差别在专业上已非常重要,应考虑继续扩大样本量,直至随机发生这种差别的机率小于5%。 第147页,共19
57、1页。 当基本统计量的差别较小而观察对象的数量很大时,往往发现组间差异有显著性,此时应特别注意组间差别在专业上有无意义 如果这种差异在专业上并无重要意义,即使P值小于0.05,我们也认为其并无重要的意义命题第148页,共191页。 GLP1及INS分泌的种族差异 AA (n=16) Caucasians (n=26)(F/m) 15/1 24/2 NSKg 22.974.97 23.346.97 NSBM I 46.431.70 43.621.39 NS WHR 0.860.02 0.820.01 NS FINS 22.13.2 17.72.0 NS?ISI 2.540.42 3.160.29
58、 NSIAUC 239744828 144781463 0.05GLPIAUC 1175412 822191 =0.05 结论:因敏感性相同,肥胖度相同, 所以INS 对GLP1反应(OGTT)有种族差别. 第149页,共191页。2、因果推理: 进行科学研究的重要目的之一就是探求某件事是否是发生的另一件事的结果. 因果推理是自然科学,社会科学的支柱.人们之所以能对世界取得如此深入的认识和了解,应该说与因果推理是分不开的。 推理有许多陷阱,我们常习惯于非A即B式的判断,但实际情况常有C或D存在.如果是这样,在将证据(结果)变成了故事(结论)的过程中就会出现偏差。第150页,共191页。 例1
59、中学生吸烟情况调查 吸烟组 不吸烟组 P年龄 15.3+1.0 15.21.2 NS身高 170.52.5 161.22.1 年龄50 M/F M/F 血糖 血糖 BMI BMI DM病程 DM病程 血压 血压 视网膜病 视网膜病变结论:2型DM年龄较轻者易患视网膜病。血糖、血压,2型DM病程与视网膜病变无关。新发现!不对,一定有混杂因素。经调查学校教师视力多缓慢下降,粮店职工多突然下降且多发于工作中。真正的原因是负重时突然血压升高而致眼底出血。第159页,共191页。但有时问题往往不这末简单,尤其是在你不熟悉的领域 GLP1及INS分泌的种族差异 AA (n=16) Caucasians (
60、n=26)(F/m) 15/1 24/2 NSKg 22.974.97 23.346.97 NSBM I 46.431.70 43.621.39 NS ?WHR 0.860.02 0.820.01 NS ?FINS 22.13.2 17.72.0 NS ?ISI 2.540.42 3.160.29 NSAAUC 239744828 144781463 0.05GLPIAUC 1175412 822191 =0.05 ? 结论:因敏感性相同,肥胖度相同, 所以INS 对GLP1反应(OGTT)有种族差别. 其实, NS无差异 NS是由于例数太少所致第160页,共191页。现况:Leptin 肥胖
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国木架伞市场现状分析及前景预测报告
- 2025至2030年中国曝气沙头市场现状分析及前景预测报告
- 2025至2030年中国普通型激光打标机市场分析及竞争策略研究报告
- 2025至2030年中国旱冰场专用鞋市场调查研究报告
- 曲轴动平衡培训
- 2025至2030年中国无影灯白玻璃行业投资前景及策略咨询报告
- 2025至2030年中国方向盘护套市场分析及竞争策略研究报告
- 2025至2030年中国文件篓行业投资前景及策略咨询研究报告
- 2025至2030年中国数控自动高速立式带锯床行业发展研究报告
- 全球及中国海上风电基础(桩基-塔筒-导管架)市场需求现状及前景发展策略分析报告2025-2030年
- 中小学校长在教师大会上讲话:以八项规定精神引领教育高质量发展根深・重明・规立・法新・行远
- 2025山东航空股份限公司社会招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2024年开封尉氏县事业单位招聘工作人员笔试真题
- 全球化背景下的中国外交政策试题及答案
- 食品安全管理制度打印版
- 建筑公司管理制度大全
- GB/T 45251-2025互联网金融个人网络消费信贷贷后催收风控指引
- 西交大政治考题及答案
- 铁路施工安全教育培训
- 第一届贵州技能大赛铜仁市选拔赛平面设计技术文件
- 2025年陕西农业发展集团有限公司(陕西省土地工程建设集团)招聘(200人)笔试参考题库附带答案详解
评论
0/150
提交评论