临床医学科研设计统计分析技巧_第1页
临床医学科研设计统计分析技巧_第2页
临床医学科研设计统计分析技巧_第3页
临床医学科研设计统计分析技巧_第4页
临床医学科研设计统计分析技巧_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

临床医学科研设计

&

统计分析技巧

中日友好医院李光伟考考你下述研究水平如何?非常好比较好比较差,可修改无可救药例1。胰岛素抵抗抑或胰岛ß细胞缺陷是2型糖尿病的始动因素?---糖尿病一级亲研究IGTNGTN2938NSAGE4846NSBMI24.1+3.023.6+3.3NSWHR0.880.85NSAIR53.5+282.6+1.70.01ᇫI30/ᇫG3010.5+1.712.6+1.8NSHOMA_IR7266NSCONCLUSIONandYOUROPINION胰岛ß细胞缺陷是2型糖尿病的始动因素与国外文献结果一致Next:WhatisyoursuggestiontoT2DMpreventionandmanagement?Noneedtoimproveinsulinsensitivity?ToimproveinsulinsecretioninordertopreventT2DMinIGTsubjects?例2。不同糖代谢状态

微量白蛋白尿发生的危险因素研究NGT(n=112)IGT(n=205)T2DM(n=356)M/F41/7169/136167/189Age51.8±9.958±9.7*53.9±10.6SBP124±19138±18*133±19*DBP81±1286±11*84±10*BMI25.6±3.228±3.3*27±3.8*FBG5.2±0.66.1±0.6*8.9±2.4*BG27.8±1.39.3±1.8*16.7±5.5*FINS11.5±6.414.5±9.3*16.3±5.4*INS256.3±43.5129±112*45±30*例2。不同糖代谢状态微量白蛋白尿发生的危险因素研究NGT(n=112)IGT(n=205)T2DM(n=356)TG1.48±0.771.56±0.791.97±0.62*TC5.4±1.05.8±1.0*5.6±1.0*HDL-C1.5±0.31.35±0.3*1.2±0.36*SMOKE13.7%17%24.4%*WINE18.8%17%22.4%*DMHIS19%19%35%*UALB(Y,N)4.5%9.8%*18.5%*UALB(mg/24h)5.189.37*18.5*例2.糖耐量异常组微量白蛋白尿发生的危险因素

(线性回归)ßpDBP0.358<0.001PBG0.19<0.001HDL-0.23<0.001TG0.20<0.001SMOKE0.228<0.001例2.糖耐量异常组微量白蛋白尿发生的危险因素

(LOGIST回归)OR95%CIHT2.111.29-2.91PG2H1.741.21-1.78HDL-C0.530.34-0.87例2.新诊DM组微量白蛋白尿发生的危险因素

rpAGEO.1450.006SMOKE0.1590.003HT0.1780.01BMI0.1210.02SBP0.30<0.0001DBP0.31<0.0001TC0.080.11TG0.294<0.0001HDL-C-0.25<0.0001FBG0.21<0.0001FINS0.35<0.0001例2.新诊DM组微量白蛋白尿发生的危险因素

(线性回归)ßpAGE0.0450.337sex0.0480.034smoke0.1270.005DMHIS0.0860.053BMI0.0110.816TC0.0820.07TG0.19<0.0001HDLC-0.1460.001FINS0.354<0.0001FBG0.285<0.0001SBP0.266<0.0001

例2.新诊DM组微量白蛋白尿发生的危险因素

(LOGIST回归)OR95%CIHT2.011.09-2.91FINS1.651.54-1.80FBG0.2291.21-1.56HDL-C0.420.24-0.67SMOKE1.571.19-1.88例3。糖尿病大血管及微血管病变危险因素研究560例住院病人(心梗,脑梗…)观察指标:AgeSexBMISBPDBPFPGPG2HFINSINS2HHOMA-IRHOMA-ISTCTGHDLLDLApoA1ApoBUAERDurationofDM统计分析非正态分布变量对数转化后分析PearsonSpearmanCorrelationTtestLogisticregressionResults糖尿病大血管病变:正相关:

SBP

DurationAgeMaleFINSINS2HHoma-IRHoma-ISLDLUAERDBP

BMIFPGPG2HTCTGApoA1ApoB负相关:IAIHDLFemaleLogisticRegression大血管病变(yes,no):危险因素Age2.04(p0.01)HT3.33(p0.0001)(SBPDBP)HINS2.042(p0.004)(FINSINS2H)Duration1.03(p0.05)ofDM

SexBMIFPGPG2HHOMA-IRHOMA-ISTCTGHDLLDLApoA1ApoBUAER结论&YourOpinion高血压是糖尿病大血管病的首位危险因素(OR3.33)(UKPDS为证!)糖尿病大血管病与高血糖无相关(因为a.已降糖治疗b.高血糖对高血压的次要地位)(UKPDS为证!)高胰岛素血症是糖尿病大血管病的第二位危险因素(OR2.04)(文献A,B,C.D.E…)微血管病变负相关:FINSINS2HHOMA-IRHOMA-IS(偏相关分析)负相关:HOMA-ISHOMA-IR控制FINS影响后微血管病变控制FPG影响后LogisticRegression微血管病变((DN,DNP,DR):yes,no)

危险因素UAER(0,1)45.64(p0.0001)高血糖1.488(p0.039)(FPGPG2H)HINS0.657(p0.028)(FINSINS2H)DurationofDM1.004(p0.007)

AgeSex

BMIHOMA-IR

SBPDBP

HOMA-ISTCTGHDLLDLApoA1ApoB结论1.UALB是糖尿病微血管病的首位危险因素??(OR44.64)(No!文献…..)2.高血糖与糖尿病微血管病(OR1.488)(UKPDS为证!)3.糖尿病微血管病与糖尿病病程有关(OR1.004)高胰岛素血症是糖尿病大血管病的危险因素。微血管病保护因素??负相关!

(OR0.65!!)(No!文献接过不一致A,B,C…)高胰岛素血症是糖尿病大血管病的危险因素??01正相关!(OR2.06!!)02高胰岛素血症是糖尿病微血管病的保护因素??03负相关!(OR0.65!!)04Whatisyoursuggestiontous?05为防止糖尿病并发症医生在治疗中06应该提高还是降低糖尿病人的胰岛素水平?07结论1研究目的(一个?多个?)明确吗?2变量选择(多?少?)和处理(连续?等级二分?三分?四分?)合理吗?3结果解释(各取所需?)恰当吗?4结论能说服人(能自圆其说?)吗?存在问题吗?前言科学研究:是用新的方法去研究新问题临床科研:常常是研究发病因子与疾病的因果关系,或药物干预与疗效的因果关系真实性是我们追求的最高目标许多类型的误差(选择偏倚,信息偏倚,混杂)都会将研究者引入歧途,偏离真实的结果。观察效果=真实效果+随机误差+混杂统计学(statistics):就是研究随机现象内在规律性的一门学科。它是为获得可靠必要的推断结论,研究如何获取数据、组织与表达数据、分析数据与解释结果的科学与艺术。统计学定义1理论基础:概率论与数理统计的原理和方法。2研究对象:生命科学领域中随机现象。3研究方法:科学设计、资料搜集、整理、综合归纳、表达及分析发现随机现象背后隐藏的统计学规律。医学统计学医学研究的分类从研究的目的可以分为:验证性研究与探索性研究从研究的对象可分为:以正常人群为基础的社区干预试验、以病人为基础的临床实验以动物或其他实验材料为基础的动物实验。。从研究的指标可以分为:单变量研究与多变量研究;01从研究的时限来看可以分为:前瞻性研究、回顾性研究和横断面研究;02医学研究的分类实验研究--以病人为研究对象、前瞻性、随机对照的验证性研究。(用统计设计原则控制临床研究中存在的偏倚)观察研究--以病人为研究对象、前瞻性或回顾性、非随机的观察对比研究。(用统计分析方法分析资料中的混杂因素)临床医学研究分类科学研究的基本程序提出一个欲待研究的问题---选一个有意义的课题严密的科学研究设计(专业设计和统计设计)获取试验与观察的资料(搜集资料)数据审核与计算机录入(整理资料)对资料进行恰当的统计分析(描述性统计和统计推断)分析结果的合理解释;以审慎的态度看研究的结果得到科学的合乎实际的结论。(专业结论)做一项有价值的科研必要的先决条件,是研究者对研究所涉及的领域有广博的知识和深入的了解01若研究得到的结果不是真理而是缪误,则既害人又害已。02在科学的入口处就像在地狱的入口处一样临床科研系指以病人为研究对象的医学科学研究1其目的是为了提高诊断水平和治疗效果,改善预后和对疾病病因做宏观研究。2选题是临床科研的起点3体现科研设计和实施的指导思想4影响临床科研工作的全过程5因此在科研过程中自始至终处于主导地位。6从这个角度来说,选题比科研方法更重要。7一、选题这些问题有的来自于临床实践有的来自文献资料所谓正确就是这些提出的问题要符合科学的认识规律提出新问题、新假设比完成一项科研工作更难没有好的科研假设,再好的科研方法也不会有好的科研成果。选题就是要正确地发现和提出问题医生的共识----冠心病来自已知危险因素。01但是无已知危险因素的人为什么发生冠心病?02冠心病人群血同型半胱氨酸水平显著升高,03那末同性半胱氨酸是否是冠心病新的危险因素?04使之下降发生冠心病危险是否会下降?05选题----同型半胱氨酸是否是冠心病新的危险因素?06例:提出新问题01020304我国的临床科研选题:高技术研究发展计划项目国家科研攻关项目个人经验和兴趣立题05仅从短期内是否可以完成、是否可以做出结果,发表文章而不是从临床迫切需要解决的问题着眼选题,出文章,但不会产生重大的临床科研成果。临床科研选题的原则首先是研究的问题要涉及我国的常见病、多发病、危害人民健康较严重的疾病。第二个原则是所选的课题要有创造性和先进性,要选择前人没有解决或没有完全解决的问题。研究的结果应该是前人不明了或不完全明了的。开拓性(独创性)研究最有价值。发展性研究,争鸣性研究也有一定的价值没有探索性,缺乏创造性,只是重复前人做过的工作,不能算作好的科研。选题是一项非常艰苦繁重的工作,没有该领域扎实的理论基础和对国内外有关信息深入了解,不可能有好的科研设想在信息时代,利用各种信息工具,充分掌握该领域国内外的信息和动态,经过充分的思索,是产生好的选题和立题必经之路。科研工作的特点就是创新选题必须具有科学性。所提出的新问题、新假设、新思路必须要符合客观规律。临床实践是临床科研选题的源泉:在日常临床实践中,人们无时无刻不面临着许多诊断、治疗、病因和预后估计等问题,诊断方法和治疗措施有待于科学的系统评价,这些课题其中不少可能具有较高的研究价值临床医学已发展成为一门综合性的学科,不仅涉及生物医学,而且涉及临床经济学和医学社会等,这一方面有许多有待研究的临床问题。最后一个原则是可行性,指研究课题主要技术指标实现的可能性。选题时必须考虑完成课题的条件,包括人力、物力等,如果这些条件不能满足或根本没有条件,即使所选课题有创造性、科学性又具有临床价值,也无望于成功。临床科研选题时应注意几点:前沿,新颖,最好实用(近5-10年有无类似工作,或存在某些问题)涉及人群健康的重大问题(发病危险因素,提出新的诊断方法)建立新实验方法(提供研究新手段)确定新药疗效及副作用DCCT/EDIC强化血糖控制与冠脉钙化对象和方法:DCCT后续研究1150例患者随访7~9年以CT检查冠脉钙化,以钙化评分(CAC)>0,>100,和>200Agatstonunits分组Cleary,etal.[652-P],63rdADASteno-2研究目的在有微量白蛋白尿的2型糖尿病患者,比较强化多因素达标治疗(包括行为和药物干预在内的)与常规治疗(8年)对心血管疾病的影响Steno-2研究

169位有微量白蛋白尿的2型糖尿病患者9名患者因C肽<600而退出160位患者随机分组80位患者接受常规治疗80位患者接受强化治疗15例死亡7例发生CVD5例癌症3例其他原因12例死亡7例发生CVD2例癌症3例其他原因2例自动退出1例自动退出63例完成研究67例完成研究初级终点:所有心血管疾病心血管死亡非致死性心梗冠脉搭桥非致死性中风血管重建截肢 01次级终点:微血管疾病肾病的进展视网膜病变的进展神经病变的进展028年后的终点事件Steno-2Steno-2研究达到的治疗目标糖化血红蛋白<6.5%胆固醇<4.5mmol/l甘油三酯<1.7mmol/l收缩压<130mmHg舒张压<80mmHg8年后达到治疗目标的患者%p=0.06p<0.0001p=0.19p=0.001p=0.21强化组常规组强化组常规组强化组常规组强化组常规组强化组常规组初级心血管终点事件12243648607284960随访时间(月)危险患者例数常规治疗组强化治疗组808072787074637159665063446141591319危险比0.47(0.24~0.73);p=0.007常规治疗组强化治疗组初级终点事件的概率瑞格列奈与格列齐特试验目的比较经4周治疗后,瑞格列奈与格列齐特对于2型糖尿病患者胰岛素分泌的疗效试验方法对照性试验,共20名2型糖尿病患者,随机分为两组:瑞格列奈1mgtds,每餐前服用格列齐特40mgbd,早餐及晚餐前服用-追踪4个月参数:HbA1c,空腹血糖,胰岛素AUC0-30和AUC0-240

男女比例平均年龄BMIkg/m2HbA1c瑞格列奈组9/151317.8%格列齐特组3/758307.7%LAWRENCES.etal.1923-PO,63rdADA瑞格列奈与格列齐特试验结果1:两者降低糖化血红蛋白和空腹血糖的作用相似瑞格列奈格列齐特HbA1c(%)空腹血糖(mmol/L)0-1-2-3-4与基线比较的改变1.040.720.891.21

试验结果2:经4个月服用,瑞格列奈显著改善了2型糖尿病患者的胰岛素的1相分泌,而格列齐特无此作用

瑞格列奈组胰岛素AUC0-30和AUC0-240明显增加,但格列齐特组没有明显增加(p<0.001)比较胰岛素联合二甲双胍与三种口服降糖药应用在两种口服药失效时的疗效Hollanderetal.P452No.1在两种口服药治疗不佳的糖尿病患者,分别使用三种口服药或胰岛素+二甲双胍治疗,空腹血糖和HbA1c疗效相当,但后者治疗失败率低No.2胰岛素+二甲双胍治疗费用远远低于三种口服药治疗P.Hollanderetal.P452,63rdADA总结入选人群平均年龄52.1(10.0)岁BMI28.6(4.5)kg/m2FPG6.0(0.5)mmol/lHbA1c5.9(0.5)%17%2h血糖>=11.1mmol/l37%IGT,21%IFG,46%NGT糖尿病早期干预试验(EDIT)231A+M155P+M160M315A+P157PP159P316A312P319631糖尿病早期干预试验(EDIT)31%发展为糖尿病,14%失访01020304结果:发生糖尿病的危险性在3个药物治疗组没有差异入选时为IGT的患者,阿卡波糖组糖尿病发病危险性降低(0.66,p=0.046),二甲双胍(1.09,p=0.70)或两药合用(0.72,p=0.27)没有作用。药物干预的效果与患者是IGT或者是IFG有关糖尿病早期干预试验(EDIT)Extrapolationofthetimetodeteriorationofbeta-cellfunctionYearsfromdiagnosisBeta-cellfunction(%) –10 –8 –6 –4 –2 0 2 4 6–12100806040200Name:YLSex:maleAge:28JiL,unpublisheddata罗格列酮可预防2型糖尿病患者发生冠脉再狭窄对象和方法:随机双盲、前瞻性研究对象为冠脉支架植入的2型糖尿病患者罗格列酮组(4mg/天)45例,56个支架;安慰剂组48例,60个支架从第1次支架植入开始随访6个月植入支架的管腔狭窄程度超过50%定义为发生再狭窄SungHeeChoi,etal.82-OR,63rdADA★★★,p<0.001

罗格列酮可预防2型糖尿病患者发生冠脉再狭窄Rosiglitazone(4mg-26weeks)reducescoronarystentrestenosisintype2diabetes100806040200%ofin-stentrestenosisafter6months%ofstentswithlesionsafter6monthsCONCONN=45stents=56stents=60N=48RSG***RSG***ChoiSHetal2003ADAabstractNo82-oralDouble-blindplacebo-controlledstudyCRP60%

CRP60%

%ofpatients有的放矢

无病呻吟科研设计是科研的灵魂严密的设计是取得有价值结果的先决条件从这个意义上说没有“设计”就没有科研。不少回顾性分析,内容包罗万象,是研究无主题的反映:研究者在研究之初对研究要解决的问题即主攻方向心中无数,对研究所报的态度是’逮着什么算什么’,并不是想通过研究解决某一特定的问题,或不知道通过研究能解决什么问题。这些研究缺乏严格的设计或无设计,这类研究即使有重要的发现也属偶然。二、研究设计高达50%的失访率会造成严重的信息偏差(informationBias):若是有问题的人’召之即来’,则发病率会被高估;若严重者已去医院看病不来参加,来的只有轻的病人,则会低估疾病的发病率。04这种研究是残缺不全的随访,并不是前瞻性研究,缺点是难以弥补的。05“前瞻性”研究,无前瞻性的设计01写出1.糖尿病人冠心病危险因素分析2.高危人群糖尿病的危险因素.03几年前做了几万人的糖尿病普查,发现了400例糖尿病和500例糖耐量低减,几年后的今天忽然想起这些病例很可能出一篇文章,于是又去调查了一番,找到了200例糖尿病和300例糖耐量低减。02例如糖尿病人群中有许多人合并了高血压、高血脂病不少人已用药物治疗治疗中有的长期坚持用药,有人仅偶尔用药有人血压或血脂一直控制很好,有些人时好时差此时不论以随访的血压、血脂指标,还是以末次随访的指标分析,都不能反映干预对疾病的影响。这些重要混杂因素的干扰,分析的结果常会远离实际情况.更糟糕的是有些研究者对这种情况非常不以为然,当审稿人提出问题让他们补充此方面材料的,得到的回答是‘估计‘服药的人很少,不会对结果发生影响殊不知“差之毫厘,谬之千里,”在你轻易的原谅自己的疏忽的时候,统计学的P值随之发生了改变。12有些研究者为了某种原因,希望尽早发表自己研究的结果,仅随访极短的时间(半年或一年),仅有几个或十几个终点事件(如死亡)就进行多因素分析,寻找危险因素。A终点事件过少的这种分析看上去可能条条是道,但其结果往往是不可靠的。应延长随访时间,增加终点事件后再分析BNavigntor研究设计出现1000个终点事体时才结题。C终点事件过少为保证科研的成功,一个完整的科研设计应包括以下几项内容:选择合适的研究对象选择科学的统计分析方法若能对结果做恰当的描述,则会得出符合实际的结论。有理论或实用价值的选题制定可靠的测量指标12345例1大庆糖尿病研究设计目的:探讨单纯生活方式干预是否可有效预防糖尿病对象:非糖尿病成人样本量:500例随机分组:四组,拉丁方块设计

CDED+E随访期:预计8年第0.5年每月,以后每3月随访终点:OGTT判定DM分析:多因素分析排除混杂因素干扰后证实生活方式干预有效。例2:DPS干预目标体重下降7%,增加药物干预组比大庆研究干预目标体重下降7%例3:DPP01020403治疗性研究设计的基本要素

研究设计的方案要科学:在研究方案的设计上,必须要坚持三条基本原则:①

随机化的原则(randomization);②

对比原则(comparison),设置对照组;③

盲法原则(blindness)。符合上述三原则者为随机盲法对照试验(randomizedblindcontrolledtrial,RCT)是治疗性研究设计首选方案。01随机化分配的原则的基本要求是02每研究对象均有相同的机会被分配到实验组和对照组,03使两组具备充分的可比性04防止偏倚的干扰和人为的主观干预05有效地避免选择偏倚(selectionbias)。从总体中随机抽取样本进行研究。因为在临床研究中,不可能将所有的某种疾病的患者都纳入研究,为了使抽取的样本能代表总体,就必须采用随机抽机样的方法。在随机对照的试验研究中样本的随机化分配(randomassignment)即将研究对象随机分成实验组和对照组。随机化的应用主要用于以下两个方面:单随机化:可能参照统计学工具书中介绍的方法,最不带偏倚的方法是运用随机数字表法,或电子计算器/机随机编码法。0102机化的方法区组号12345601排列组合ABABBABAABBABAABAABBBBAA02随机抽取6个区组号,得3、1、6、5、2、4分序号,再按下法将研究对象分组,见表2。03表1区组随机排列组合表2研究对象分组表2研究对象分组患者号123456789101112分配序号316研究对象分组ABBAABABBBAA患者号131415161718192021222324分配序号524研究对象分组AABBBABABAAB患者号为1、4、5、7、11、12、13、14、18、20、22、23的研究对象随机分配到A组,其余患者号共12例分配到B组。分层随机化:是根据研究对象的主要临床特点或预后危险因素等其分为不同的层,现将层内不同数量的研究对象随机分配到试验组和对照组例如:已知与研究对象预后有关的重要因素有年龄、性别和吸烟,则分层方法见表3。表3三层因素分层表表3三层因素分层表年龄(岁)性别吸烟史1、40~491、男1、现在吸烟2、50~592、女2、过去曾吸烟现已戒烟3、60~693、从未吸烟由上表可得3×2×3=18层次,每层次内再进行随机化分组。随机化法的应用,可以平衡实验组和对照组中已知的和未知的混杂因素,有效地避免选择性偏倚,提高两组可比性,为研究结果的准确性提供了重要保证。03在某些情况下有比随机化更重要的东西那就是要满足适应症的要求。02但随机化并非总是有利的和有道理的。01随机化分组在大多数情况下十分重要,04适应症不合理,随机化反使结果变糟。髋关节骨折手术及保守治疗存活率(28天)

手术保守

存活102/139(74%)34/65(52%)结论:手术效果优于保守疗法

符合适应症不符合适应症

手术保守手术保守存活102/129(73%)30/33(91%)1/10(10%)18/82(12.5%)结论:保守疗法不逊于手术效果女性激素补充治疗的循证研究

(妇女健康倡议研究WHI)19世纪70年代结论:雌激素加孕激素能有效缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松。但不会增加子宫内膜癌危险。WHI(大规模,多中心,随机对照)结论:雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防,预防骨质疏松时应考虑乳腺及心血管病风险。弊多利少!心脏事件29%,卒中41%,乳腺癌26%,结肠癌37%,髋骨骨折34%妇女健康倡议研究(WHI)

----再好的研究也有缺陷!50-79岁均值63岁有子宫者随机用雌激素孕激素联合治疗无子宫者随机用雌激素妇女健康倡议研究(WHI)

-----再好的研究也有缺陷!

忽略了HRT最明显的益处:(缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松)没有遵照处方药应该严格掌握适应症的原则(性激素低下而非所有老年妇女,更不是健康老年妇女。该研究中80%以上是没有绝经期症状的老年妇女。不具有HRT适应症结论不应随意扩大(品种,剂量,种族)与某些风险相比WHI所阐明的HRT对各种事件的绝对风险是很低的妇女健康倡议研究(WHI)

恐慌后的冷静思考共同意见:HRT能有效缓解绝经症状及预防骨质疏松;应用小于4年风险小。HRT不用予心血管疾病预防。风波后的冷静思考:不是否定而是更深入不是终止而是要阻止滥用不是恐慌和困惑而是更成熟和清醒HRT不是更危险而是更安全(一).研究对象的选择要想证实研究者的思想,确定入选和排除标准,选择合理的研究对象是关键的一环。做疾病患病率的调查,随机化的原则可保证研究样本是总体人群的“缩影”,从而避免结果失真。从某一局部地区“整体人体”调查出的“率”如推广到普遍认群,应说明该局部的“整体”人群与全局的人群结构相似。研究对象要有代表性研究对象要有代表性A随机化抽样的缺点是研究对象地域较为分散,每个单位仅有少量病例,这对于干预治疗的前瞻性研究的病人管理极为不利,耗费更多人力,常使研究无法进行。B而在人群较多的社区进行“整群”调查,会在相对较小的地域找到较大样本,从而有利干预治疗的管理。如果其人群结构接近全局的人群,其统计的“率”也有重要参考价值。C如果仅为测定一个“率”做几万人的调查则较为浪费人力物力,而随机分层抽样可以以最小的样本,最少的花费取得有代表性的结果。01随机化大样本研究基线资料组间不一定可比,如果差别显著,可用分层分析或多因素分析消除混杂因素的影响。0221“随机化”的另一缺点是可能有时“随机化”分组得到的两组(或几组)对象的某些参数值不可比,在样本量较小时尤其突出。病例对照研究可保证所选各组对象参考数的平衡,一般来说大样本的随机对照研究试验组资料会有可比性,但有时也会有显著差别。301队列研究属前瞻性研究,应考虑到失访的可能性,故一般需再加10%的样本量。02失访率40%以上,其研究的真实性就会受到严重怀疑。如果失访与暴露或疾病都有联系,那么即使随访率达到80%以上也难以防止偏倚的发生。2.样本含量的估计3.从生物学医学原理选择持定的合理人群

(不犯人群结构错误)

研究对象中所观察变量的梯度

例1,看生长激素水平与身高的关系:对25—74岁者测GH与身高结果发现GH与身高不相关结论肯定错了因为GH的最重要作用在于促生长原因是人群选择失当

GH促生长表现在身高增长期,即儿童期成人身高已不再增高。

例2:在高血压(或血压正常)人群研究血压水平对冠心病发生的影响或研究致高血压因子的作用都可能得出假阴性的结果.030102126543研究某些变量的生物学作用时,这些变量必须有一定梯度,否则会掩盖因果关系。例如:研究继发性高血压的病因有研究者发现某些著名的继发性高血压与其公认的病因无关:柯兴氏病高血压与皮质醇水平不相关活动性肢端肥大症血压与生长激素水平不相关。123456这些怪事如何解释?材料都是真实可靠!!010102030405研究对象中所观察变量没有足够梯度所有来诊病例是经长期辗转来到研究者单位看病时病情都十分典型,激素水平都很高,该变量梯度很小,掩盖了激素与血压的相关关系。0203040504030102在激素水平相当人群,若能发现病程长短与血压水平有关,也算是发现了激素对血压的影响。但若病程长短也相同,还是不会有阳性发现。但若手术后激素水平下降,血压也下降,将治疗前后的病情加以比较则必会发现继发性高血压与激素水平的关系那是因为人为的制造了梯度。解决的办法:215研究肥胖与糖尿病的关系不能仅选择超重和肥胖的人群(BMI25-30)但与BMI〈24人群差别会很显著4与(BMI27-30)的人群糖尿病的患病率可能无明显差别,3因为(BMI25-27)6变量的梯度是成功的关键。例.G蛋白ß3基因C825T亚型多态性与血压,胰岛素抵抗,肥胖的相关性:2000年一位作者在血压正常人群未发现该基因多态性与血压相关;2002年Hyperten一文发现该基因多态性与胰岛素抵抗及肥胖相关.因为他选择了高血压人群也未发现该基因多态性与血压相关.(170/105mmHg)在1999年一项大规模的人群调查基础上的包括高血压(43%)和非高血压人群的研究却发现两种不同亚型基因的患者高血压患病率相差3倍(OR=3.43)01GNB3C825T多态性02对胰岛素抵抗与收缩压相关性的影响(第一代子女组)GNB3C825T多态性对胰岛素抵抗与舒张压相关性的影响(第一代子女组)LnIAI-4.21-4.8-5.15-4.21-4.81-5.15FINS(uIU/ml)12.222.432.512.222.432.5

SBPDBP第一代子女825CT/TT基因型组不同胰岛素敏感性及空腹胰岛素水平与血压的关系(调整年龄、性别)(n=376)P<0.05P<0.01

P<0.001GNB3C825T多态性对胰岛素抵抗与血压关联的影响(第一代子女组)GNB3C825T多态性对胰岛素抵抗与收缩压相关性的影响(第一代子女组)GNB3C825T多态性对胰岛素抵抗与舒张压相关性的影响(第一代子女组)恰当的入选和排除标准可防止混杂因素的干扰,保证研究结果的科学性,这是在各项研究遵守的。01例如,看血压与胰岛关系,不可纳入有心功障碍及肾病患者,否则可结果会有偏差。024、设定恰当的入选和排除标准设定恰当的入选和排除标准01入组的研究对象的准入指标,是保证研究质量的最重要和最基本的条件,在研究设计和发表的论著中务必详细交代。但这种选入排除标准应是实事求是的而不是过于苛求。02在制订纳入和排除标准时,在保证研究质量的前题下,一定要考虑研究成果的代表性和研究结果推广的受益面。01例:有一重点课题仅考虑入组病例诊断的严格性02排除标准竟设计了17项03合格的纳入对象约占整个患该病人群的10%左右0490%左右的患者被排除掉。05即使该研究的结果有高度的内在真实性(internalvalidity),其代表性也仅为10%左右。06过度严格的选择会有轻型病人被排除,使研究结果出现偏差。例:冠心病与胰岛素的关系仅用冠脉造影资料作为诊断标准结果发现冠脉造影(-)者:FINS22mm/ml冠脉造影(+)者:FINS23mm/ml结论是冠心病与胰岛素无关问题出在什么地方?01.冠脉造影(-)的人为什么能接受这种不无危险的检查?02.因为这些人已有许多危险因素!!03.或有轻度狭窄但达不到“狭窄的定义”的切点04.没达到“狭窄”切点,只是时间尚短。05.这并不能说明胰岛素与冠心病无关。问题出在“诊断标准”:选入排除标准过于苛求例:研究胆石症与胰岛素抵抗的关系(国家自然基金项目):选择对象为l

手术证实的初发胆囊胆固醇结石l

年龄,性别,BMI相配(!!)l

血压,糖耐量,血甘油三脂,尿酸,PAI1,尿蛋白量正常(!!)表:胆囊胆固醇结石与胰岛素抵抗的关系

结石组对照组P年龄33.9+9.3239.97+9.710.85BMI22+2.4422.14+2.350.23WHR0.83+0.060.81+0.070.05FINS17.6+1.317.8+1.20.72INS2H47.5+1.438.9+1.50.04SBP111.4+11.1102.4+11.90.00InsSenindex-4.37+0.29-4.42+0.250.33结果:未发现胆石症与胰岛素抵抗相关,SBP,INS2H升高是胆石症的危险因素(??)(二)、选择试验效果测试指标:

选择要求关联性:指标与研究目的有本质的联系,应能确切反映处理因素的作用。

生物学意义合理:冠脉造影,HbA1c看降糖药物疗效。灵敏性:指标能正确反映效应变化的最小数量或最小水平。特异性:对治疗反应的阳性结果要能准确地测量和确定,其特异性越强越好;尽量选用客观指标作为主要观察指标。精确性:包含准确度(效度)和精密度(信度)两个方面。稳定性:变异程度经济可行:在考虑敏感性和特异性的基础上,应从各种方法比较中,选择经济及可行性良好的测试方法和指标。指标的选择要少而精

在治疗性研究方法中相应的预防和处理的措施如防止选择性偏倚,使用随机抽性与随机分配法;避免测量偏倚,使用盲法;减少机遇因素的影响,采用限制Ⅰ型及Ⅱ型错误水平的方法;有的混杂因素可通过配对及统计分层分析法加以避免或处理;通过严格培训人员,严格实验仪器、条件和方法以防止混乱;通过医学知识教育,改善医疗服务环节,以促进患者的依从性等这些措施和方法均应贯穿整个设计、执行和资料分析的全过程,保证研究的高质量,从而获得科学的结论。在我国临床科研的统计学应用中,在统计方法的选择上存在过分强调统计检验而忽略统计学估计的倾向,存在统计方法越复杂越好的片面看法。在发表的医学论文中,大多强调是否得到差别有统计学意义,而较少对测定值进行95%可信区间估计,提及样本量估计及抽样方法、样本代表性问题的文章就更少了在80年代初期,国外医学杂志针对类似的情况曾进行广泛的讨论,提出应重视区间估计的意义而不能将注意力集中在P值是否小于0.05上。三.统计分析现在大多数的国际医学刊物发表的论文中要求作者同时给出点估计、区间估计和具体的检验统计值,如相对危险度(RelativeRisk,RR,RR值就是暴露人群发病机与非暴露人群发病机率之比,即a/(a+b)与c/(c+b)之比),RR的95%可信限和P值。诸如95%可信限的区间估计可以提供更多有价值的信息01但在我国临床科研的统计学应用中尚未引起足够的重视。片面地认为越复杂的统计方法越好,而忽视统计检验方法的适用性和恰当性。02描述性统计分析是统计检验的基础,能提供资料的总体特征,不论在最后的论文报告中描述性统计分析的结果占多大的比重,它都是实际的资料分析过程中的起点01它为选择进一步的分析方法如选择合理的变量提供重要的信息,发现原始资料中的错误02忽略必须的描述性统计分析03是导致统计方法应用不当的原因。04(1)、描述性统计01从简单到复杂02最基本的分析形式为单个因素的不匹配不分层资料组间比较的分析03这是病例对照研究推断性统计的基础。04可比较病例组与对照之间危险因素的分布情况,分析其危险因素与患病之间的联系。05由于病例和对照只是总体的代表,无法直接计算真实的患病率,也就无法直接计算RR值,可以估计相对危险度OR,用以来代替RR。饮酒食管癌组对照组合计大量a328b258586不饮c107d193300合计435451886表6的数据代入公式得:OR=ad/bcOR值是两个概率的比值,这一数值范围是从0到无限大的正数。当数值为1时,表示暴露与疾病危险无关联,当数值大于1说明疾病的危险度增加,叫做“正”关联,当数值小于1说明疾病的危险度减少,叫做“负”关联。表6饮酒与食管癌病例对照研究资料例;高血压为因,冠心病为果研究的目的是相看哪两个变量之间的关系(不妨假设一因,一果)(2)、统计分析中变量的选择重点和首要的看变量是否为正态分布分析中对变量进行正态分布检验血胰岛素、血脂、生长激素、皮质醇、尿微量白蛋白,骨密度等都常为非正态分布。非正态分布的变量是不能以原始资料进行参数统计分析,此时不进行正态化处理,得出结论会面目全非。A.明确变量的性质B.注意变量的动态变化

由于前瞻研究的期限较长,有些长达几年甚至十几年,这类研究中特别要注意变量的自身演变,有些变量是不会变的,如身高;有些因素在“成长”,如血压、血糖;有些变量在某一时期在“成长”,在某时期却在“衰减”,甚至消失,例:血胰岛素水平01从糖耐量正常到糖耐量低减这几年,胰岛素水平在逐渐升高;02从糖耐量低减到糖尿病胰岛素水平在下滑;晚期糖尿病胰岛素则‘衰亡’,水平很低03在一个包括NGT、IGT、DM的人群中观察数年期间有的个体胰岛素水平在升高有的胰岛素水平在下降故此在这总人群以基线水平去预测某种疾病自然得不出正确的结论在演变中未变成糖尿病人群中,可以发现胰岛素对某事件的阳性作用,而在IGT演变为糖尿病,尤其是糖尿病病情恶化的人群中,则会看到它的阴性作用。这种影响的两级分化在极大程度上还会受观察期限的影响:在非糖尿病人群落观察十年,如不删除研究期间恶化为糖尿病的病例,就可能大大低估胰岛素的致病作用在NGT人群观察5年,则不会出现上述偏移对这种消亡中的变量,如不在人群选择和研究时限上加以严格的限制,很难有可靠的结果。对象和方法1986-19921986年170非糖尿病人(25-74岁)(107NGT63IGT)1992年126NGT,IGT44DM基线OGTT胰岛素曲线下面基线与6年后血压的关系(n=170)非高血压人群基线OGTT胰岛素曲线下面积与6年后的收缩压水平的关系

(n=126)

因变量:随访6年后SBP

R2=0.33自变量βSEP

AGE(year)0.60390.14010.0001SEX(M=1,F=0)2.62192.95250.3764BMI(kg/m2)0.67680.43470.1223Smokeyes=1,no=0)-0.82212.97490.5414PG2h(mmol/l)-0.61940.83590.4602SBP(mmHg)0.20040.09750.0427IAI-2.26712.27710.3215INSAUC5.92772.06970.0050截距(Intercept)23.6174

.非高血压人群基线OGTTINSAUC与6年后的DBP水平的关系因变量:随访6年后DBP

(n=126)R2=0.27自变量βSEP

AGE(year))0.25680.10340.0145SEX(M=1,F=0)4.37422.18000.047BMI(kg/m2)0.84730.32490.0103Smoke(yes=1,no=0)-0.88572.20160.6882PG2h(mmol/l)-0.42680.62840.4984DBP(mmHg)0.13230.09530.1678IAI-1.57041.70480.3589INSAUC3.13551.55990.0468截距(Intercept)18.8037

过度调整?调整失当?调整不足?C、决定哪些变量进入多因素分析?确定重要的变量(包括混杂因素)数量的方法

1.首先可根据自己对所研究领域专业知识的了解初步选择例:对氧磷脂酶基因多态性与糖尿病人群合并冠心病的关系对照组糖尿病组糖尿病组+冠心病组病例数383639

男/女29/924/1236/3

年龄70.8+10.864.8+11.972.7+8.3高血压(有/无)30/819/1717/22BMI23.86+3.4124.96+3.1425.29+2.56PON-192BB13.2%11.1%30.8%

年龄是必须调整的混杂因素确定重要的变量(包括混杂因素)数量的方法

1.首先可根据自己对所研究领域专业知识的了解初步选择例:对氧磷脂酶基因多态性与糖尿病人群合并冠心病的关系对照组糖尿病组糖尿病组+冠心病组病例数383639

男/女29/924/1236/3

年龄70.8+10.864.8+11.972.7+8.3高血压(有/无)30/819/1717/22BMI23.86+3.4124.96+3.1425.29+2.56?DM病程0???服药0??PON-192BB13.2%11.1%30.8%

年龄是必须调整的混杂因素然后加入文献中同类研究必须纳入的变量应用逐步回归分析也会发现哪些变量应该选入。有些研究在分析中囊括全部已测变量来做多因素步回归分析,或以为计算机挑出的变量就是最佳变量,是一种误解。计算机挑出的变量受许多因素的影响,有些未被计算计挑出的变量有时非常重要(如年龄、性别),所选变量中若不含有这些变量,分析结果可能不会被承认。变量的选择强制进入模型(logisticstepwise);AgeAge2;、interation:〔BMI.INS〕(BMI×INS);调整混杂因素后的(mean±SE);调整年龄性别后的率:logistic回归ModelDM=agesexr_BMI连续变量(BMI)改为分组变量(r_BMI)1组2组3组4组5组HP=AgeSexr_BMI123456因果关系与研究对象选择及分组

-----BMIHP因BMI<25BMI≥25AGESexHPSBPDBP因果关系与研究对象选择及分组因HP0HP1SexBMITCSMOHPH.s------HPBMIAge12345分析中随意决定将原来的连续变量改为等级变量也是常见的错误分析中将某一变量作为等级变量还是连续变量不是可以随意决定,而是由变量本身的性质决定的。研究者不明白哪些变量应作为连续变量,哪些变量应作为等级变量D、决定用等级变量还是连续变量将本应作为连续变量的参数改为等级变量有时会丢掉许多有用的信息。决定哪些变量应作为连续变量,哪些变量应作为等级变量应由其与因变量线性相关(pearson)及等级相关(spearman)的结果来决定,线性相关优于等级相关的变量不应以等级变量进入分析。pearson相关优于spearman相关——用连续变量较合理。spearman相关优于Pearson相关——用分组变量较合理。D、决定用等级变量还是连续变量入选变量并非入选变量的数目越多研究越严密,总的自变量数应由样本数决定(1:10),(对于多因素设计,观测变量数为样本例数的1/5-1/10)。一些作者在分析中自变量的选择目的不明,一共有100个病例,每人有30个变量,就将30个变量都用作为自变量,以为自变量越多,分析水平越高。E.确定入选变量的数目注意变量间相互关系作者应十分明确所研究的两个主要变量的关系将可能的混杂因素作为协变量放入模型选入过多变量画蛇添足,徒劳无益,甚至有害选入过多的协变量统计学上称为“过度调整”,这种调整常常掩盖有意义的关联。作为一个原则,多因素分析中,如不是为什么特殊目的,不宜将两个密切相关的变量放入一个方程进行分析过度调整常会丢失一些有价值的信息。0102例如:分析糖尿病的危险因素因变量为:糖尿病自变量为:年龄,性别,体重指数,腰围,腰/臀比值,收缩压,舒张压,个人收入,家庭收入,家庭人口,冠心病史,高脂血症,糖尿病家族史,职业,教育水平等十五项.例如:分析糖尿病的危险因素因变量为:糖尿病自变量为:年龄,性别,体重指数,腰围,腰/臀比值,收缩压,舒张压,个人收入,家庭收入,家庭人口,冠心病史,高脂血症,糖尿病家族史,职业,教育水平等十五项.问题:一些变量定义模糊另一些变量间关系密切结果:会丢失一些有价值的信息。例如:有的学者在其研究中发现餐后高血糖与糖尿病慢性并发症显著相关,而空腹血糖不显著相关(DiabetesInterventionStudy,DIS1996)。其实空腹血糖和餐后血糖在糖耐量异常人群高度相关,在进行逐步回归分析中,如将空腹及高后血糖同时做和自变量,统计中仅餐后血糖进入方程,空腹血糖不能进入,并不表明空腹血糖不重要。糖化血红蛋白水平也应与血糖水平密切相关认为只有餐后血糖才重要这种情况下应逐个放入方程,才能不致漏掉重要的危险因素。1234501逐步回归方析中,若一个进入方程,另一个不能进入也不能说,另一指标不重要。这种情况尤其要结合临床考虑,不要做出过于武断的结论。02究的性质:现状研究可选用线性回归和Logistic回归,前瞻性研究选用成比例风险模型或Logistic回归变量的性质:因变量为连续变量选用线性回归,因度量为分组变量(0,1)选Logistic回归或成比例风险模型。一般说来前瞻性研究的成比例风险模型更为优越。多因素分析模式的选择取决于F.多因素分析方法的选择:在使用多元回归分的文章中,常常存在所用分析方法的名称不详(如是Logistic回归还是多元线性回归)、定义不明、自变量选择不恰当的情况。01判定统计方法优劣有某些参考指标复相关系数R2(决定系数)是其一。R2接近于1说明引入方程的自变量与应变量相关的效果好。02四.结果判定应以审视的眼光看待统计分析的结果:为什麽??因为人们常犯下述错误先入为主的一个想法(自己创造的,或别人特别是外国人发表的);在最容易取材的环境中收集病例(常常数量不多,不管或不知有多少因素干扰);统计分析t检验“定终身”,P〈0.05就皆大欢喜。这些研究在做统计学分析时常常是在搞“逼、供、信”:强制一个不适当的人群做为研究对象强加给一个不适当的分析方法逼出一个结果并对之深信不疑这些研究是垃圾文章的制造厂。五.结果判定01020304在进行研究和阅读文献时应物别注意P值的大小。但是,P值并没有告诉我们这一性状出现的频率或水平的大小和方向基本统计量包括率、均数、标准差等。05在此基础上,结合统计检验的P值和专业知识下结论。要了解这些信息必须依靠基本统计量比较两组(或多组)的率或均数可以了解该性状在组间分布的差异有多大及其变化的方向。在分析评价研究结果时P值和基本统计量都是非常重要的,缺一不可。061.P值的意义:观察对象的数量较少时,基本统计量的差别可能很大而P值大于0.05,此时应注意其专业意义。如果这种差别在专业上已非常重要,应考虑继续扩大样本量,直至随机发生这种差别的机率小于5%。壹贰当基本统计量的差别较小而观察对象的数量很大时,往往发现组间差异有显著性,此时应特别注意组间差别在专业上有无意义如果这种差异在专业上并无重要意义,即使P值小于0.05,我们也认为其并无重要的意义命题GLP1及INS分泌的种族差异

AA(n=16)Caucasians(n=26)(F/m)15/124/2NSKg22.97±4.9723.34±6.97NSBMI46.43±1.7043.62±1.39NSWHR0.86±0.020.82±0.01NSFINS22.1±3.217.7±2.0NS?ISI2.54±0.423.16±0.29NSIAUC23974±482814478±1463<0.05GLPIAUC1175±412822±191=0.05

结论:因敏感性相同,肥胖度相同,

所以INS对GLP1反应(OGTT)有种族差别.

进行科学研究的重要目的之一就是探求某件事是否是发生的另一件事的结果.01因果推理是自然科学,社会科学的支柱.人们之所以能对世界取得如此深入的认识和了解,应该说与因果推理是分不开的。01推理有许多陷阱,我们常习惯于非A即B式的判断,但实际情况常有C或D存在.如果是这样,在将证据(结果)变成了故事(结论)的过程中就会出现偏差。012、因果推理:例1中学生吸烟情况调查烟组不吸烟组P年龄15.3+1.015.2±1.2NS身高170.5±2.5161.2±2.1<0.001论:吸烟有助于增高?.建议:为增高青少年适当吸烟?误例2Grave’s病与ICArave’s病正常对照ICA(+)30%1%GAD抗体(+)45%2%论:ICA及/或GAD抗体可做Grave’s病诊断指标,参与甲亢发病。际上Grave’s病和Ⅰ型糖尿病都些自身免疫性疾病,二者常生存于同一个体。STEP1STEP2STEP3STEP4医学科研中的推理不仅要看两变量相关是否显著,而且要在看生物学上是否合理。于上述例1,从常识上不会犯错误;但在例2,由于研充者对相关疾病不了解,所以可能得出错误结论。为保证因果推理的正确,不仅要求在研究中做为随机抽样,对照试验,还需要做换位思考和对所研究领域有广博深厚的专业知识。例如,偏回归系数决定有无统计学意义,但不能决定变量的重要性。标准回归系数的绝对值大小说明各变量的重要性。要恰如其分01在本人群cross-sectionaldata结果可以说“提示”02prospectivedata结果可以说“表明”03指出自己研究的局限04有待他人证实05有待进一步研究06五、结论尽量贴近临床,能给人们提供有实际意义,有临床实用价值的建议如:肥胖与高血压、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论