科研设计与统计常见错误解析_第1页
科研设计与统计常见错误解析_第2页
科研设计与统计常见错误解析_第3页
科研设计与统计常见错误解析_第4页
科研设计与统计常见错误解析_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中日友好医院中日友好医院 李光伟李光伟临床科研系指以病人为研究对象的医学科学研究其目的是为了提高诊断水平和治疗效果,改善预后和对疾病病因做宏观研究。选题是临床科研的起点体现科研设计和实施的指导思想影响临床科研工作的全过程因此在科研过程中自始至终处于主导地位。从这个角度来说,选题比科研方法更重要。选题就是要正确地发现和提出问题 这些问题有的来自于临床实践 有的来自文献资料所谓正确就是这些提出的问题要符合科学的认识规律提出新问题、新假设比完成一项科研工作更难没有好的科研假设,再好的科研方法也不会有好的科研成果。 医生的共识-冠心病来自已知危险因素。但是无已知危险因素的人为什么发生冠心病?冠心病人群

2、血同型半胱氨酸水平显著升高,那末同性半胱氨酸是否是冠心病新的危险因素?使之下降发生冠心病危险是否会下降?选题-同型半胱氨酸是否是冠心病新的危险因素? l 首先是研究的问题要涉及我国的常见病、多发病、危害人民健康较严重的疾病。l 第二个原则是所选的课题要有创造性和先进性,要选择前人没有解决或没有完全解决的问题。研究的结果应该是前人不明了或不完全明了的。 开拓性(独创性)研究最有价值。 发展性研究,争鸣性研究也有一定的价值 没有探索性,缺乏创造性,只是重复前人做过 的工作,不能算作好的科研。 选题必须具有科学性。所提出的新问题、新假设、新思路必须要符合客观规律。临床实践是临床科研选题的源泉:在日常

3、临床实践中,人们无时无刻不面临着许多诊断、治疗、病因和预后估计等问题,诊断方法和治疗措施有待于科学的系统评价,这些课题其中不少可能具有较高的研究价值 临床医学已发展成为一门综合性的学科,不仅涉及生物医学,而且涉及临床经济学和医学社会等,这一方面有许多有待研究的临床问题。 l 最后一个原则是可行性,指研究课题主要技术指标实现的可能性。 选题时必须考虑完成课题的条件,包括人力、物力等,如果这些条件不能满足或根本没有条件,即使所选课题有创造性、科学性又具有临床价值,也无望于成功。 临床科研选题时应注意几点:l前沿,新颖,最好实用(近5-10年有无类似 工作,或存在某些问题)l涉及人群健康的重大问题(

4、发病危险因素,提出新的诊断方法)l建立新实验方法(提供研究新手段)l确定新药疗效及副作用科研设计是科研的灵魂严密的设计是取得有价值结果的先决条件从这个意义上说没有“设计”就没有科研。 不少回顾性分析,内容包罗万象,是研究无主题的反映:研究者在研究之初对研究要解决的问题即主攻方向心中无数,对研究所报的态度是逮着什么算什么,并不是想通过研究解决某一特定的问题,或不知道通过研究能解决什么问题。 这些研究缺乏严格的设计或无设计,这类研究即使有重要的发现也属偶然。 “前瞻性”研究,无前瞻性的设计 几年前做了几万人的糖尿病普查,发现了400例糖尿病和500例糖耐量低减,几年后的今天忽然想起这些病例很可能出

5、一篇文章,于是又去调查了一番,找到了200例糖尿病和300例糖耐量低减。 写出 1.糖尿病人冠心病危险因素分析糖尿病人冠心病危险因素分析 2.高危人群糖尿病的危险因素高危人群糖尿病的危险因素. 这种研究是残缺不全的随访,并不是前瞻性研究,缺点是难以弥补的。 高达50%的失访率会造成严重的信息偏差(information Bias): 若是有问题的人召之即来,则发病率会被高估; 若严重者已去医院看病不来参加,来的只有轻的病人,则会低估疾病的发病率。例如糖尿病人群中有许多人合并了高血压、高血脂病不少人已用药物治疗治疗中有的长期坚持用药,有人仅偶尔用药有人血压或血脂一直控制很好,有些人时好时差 此时

6、不论以随访的血压、血脂指标,还是以末次随访的指标分析,都不能反映干预对疾病的影响。 这些重要混杂因素的干扰,分析的结果常会远离实际情况. 有些研究者为了某种原因,希望尽早发表自己研究的结果,仅随访极短的时间(半年或一年),仅有几个或十几个终点事件(如死亡)就进行多因素分析,寻找危险因素。 终点事件过少的这种分析看上去可能条条是道,但其结果往往是不可靠的。应延长随访时间,增加终点事件后再分析 Navigntor研究设计出现1000个终点事体时才结题。为保证科研的成功,一个完整的科研设计应包括以下几项内容:l有理论或实用价值的选题l选择合适的研究对象l制定可靠的测量指标l选择科学的统计分析方法若能

7、对结果做恰当的描述,则会得出符合实际的结论。 随机化分组在大多数情况下十分重要,但随机化并非总是有利的和有道理的。在某些情况下有比随机化更重要的东西那就是要满足适应症的要求。适应症不合理,随机化反使结果变糟。 19世纪70年代结论:雌激素加孕激素能有效缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松。但不会增加子宫内膜癌危险。WHI(大规模,多中心,(大规模,多中心,随机对照随机对照)结论:雌激素孕激素联合治疗不宜用于绝经后妇女心血管疾病预防,预防骨质疏松时应考虑乳腺及心血管病风险。乳腺及心血管病风险。弊多利少!心脏事件心脏事件 29%,卒中 41%,乳腺癌乳腺癌 26%,结肠癌 37%,髋骨

8、骨折 34%l 忽略了HRT最明显的益处:(缓解更年期症状,治疗泌尿生殖道萎缩,防止骨质疏松)l没有遵照处方药应该严格掌握适应症的原则(性激素低下 而非所有老年妇女,更不是健康老年妇女。该研究中80%以上是没有绝经期症状的老年妇女。不具有HRT适应症l结论不应随意扩大(品种,剂量,种族)l与某些风险相比WHI所阐明的HRT对各种事件的绝对风险是 很低的 要想证实研究者的思想,确定入选和排除标准,选择合理的研究对象是关键的一环。1. 1. 研究对象要有代表性 做疾病患病率的调查,随机化的原则可做疾病患病率的调查,随机化的原则可保证研究样本是总体人群的保证研究样本是总体人群的“缩影缩影”,从而,从

9、而避免结果失真。避免结果失真。 从某一局部地区从某一局部地区“整体人体整体人体”调查出的调查出的“率率”如推广到普遍认群,应说明该局部的如推广到普遍认群,应说明该局部的“整体整体”人群与全局的人群结构相似。人群与全局的人群结构相似。 1. 1. 研究对象要有代表性 随机化抽样的缺点是研究对象地域较为分散,随机化抽样的缺点是研究对象地域较为分散,每个单位仅有少量病例,这每个单位仅有少量病例,这对于干预治疗的前瞻对于干预治疗的前瞻性研究的病人管理极为不利性研究的病人管理极为不利,耗费更多人力,常,耗费更多人力,常使研究无法进行。使研究无法进行。 而在人群较多的社区进行而在人群较多的社区进行“整群整

10、群”调查,会调查,会在相对较小的地域找到较大样本,从而有利干预在相对较小的地域找到较大样本,从而有利干预治疗的管理。如果其人群结构接近全局的人群,治疗的管理。如果其人群结构接近全局的人群,其统计的其统计的“率率”也有重要参考价值也有重要参考价值。例1, 看生长激素水平与身高的关系: 对2574岁者测GH与身高 结果发现GH与身高不相关 结论肯定错了 因为GH的最重要作用在于促生长 原因是人群选择失当 GH促生长表现在身高增长期,即儿童期 成人身高已不再增高。 研究肥胖与糖尿病的关系 不能仅选择仅选择超重和肥胖的人群(BMI 25-30) 因为(BMI 25-27) 与(BMI 27-30)的人

11、群糖尿病的患病率可能无明显差别, 但与BMI24人群差别会很显著 变量的梯度是成功的关键。 恰当的入选和排除标准可防止混杂因素的干扰,保证研究结果的科学性,这是在各项研究遵守的。 例如,看血压与胰岛关系,不可纳入有心功障碍及肾病患者,否则可结果会有偏差。 入组的研究对象的准入指标,是保证研究质量的最重要和最基本的条件,在研究设计和发表的论著中务必详细交代。 但这种选入排除标准应是实事求是的而不是过于苛求。 在制订纳入和排除标准时,在保证研究质量的前题下,一定要考虑研究成果的代表性和研究结果推广的受益面。例:有一重点课题仅考虑入组病例诊断的严格性 排除标准竟设计了17项 合格的纳入对象约占整个患

12、该病人群的合格的纳入对象约占整个患该病人群的10%左右左右 90%左右的患者被排除掉。即使该研究的结果有高度的内在真实性(internal validity),其代表性也仅为10%左右。 过度严格的选择会有轻型病人被排除,使研究结果出现偏差。例:冠心病与胰岛素的关系仅用冠脉造影资料作为诊断标准结果发现冠脉造影(-)者:FINS 22 mm/ml冠脉造影(+)者:FINS 23 mm/ml结论是冠心病与胰岛素无关问题出在什么地方? 问题出在“诊断标准”: 冠脉造影(-)的人为什么能接受这种不无危险的检查? 因为这些人已有许多危险因素! 或有轻度狭窄但达不到“狭窄的定义”的切点 没达到“狭窄”切点

13、, 只是时间尚短。 这并不能说明胰岛素与冠心病无关。 对测量的方法和指标的要求 敏感性要好:对于治疗出现的客观反应,要能敏感地发现并能量度,其敏感性越高越好; l关联性:指标与研究目的有本质的联系,应能确切反映处理因素的作用。 生物学意义合理:冠脉造影,HbA1c看降糖药物疗效。l灵敏性:指标能正确反映效应变化的最小数量或最小水平 。l特异性:对治疗反应的阳性结果要能准确地测量和确定,其特异性越强越好;尽量选用客观指标作为主要观察指标。l精确性:包含准确度(效度)和精密度(信度)两个方面。l稳定性:变异程度l经济可行:在考虑敏感性和特异性的基础上,应从各种方法比较中,选择经济及可行性良好的测试

14、方法和指标。l指标的选择要少而精 在我国临床科研的统计学应用中,在统计方法的选择上存在过分强调统计检验而忽略统计学估计的倾向,存在统计方法越复杂越好的片面看法。 在发表的医学论文中,大多强调是否得到差别有统计学意义,而较少对测定值进行95%可信区间估计,提及样本量估计及抽样方法、样本代表性问题的文章就更少了 在80年代初期,国外医学杂志针对类似的情况曾进行广泛的讨论,提出应重视区间估计的意义而不能将注意力集中在P值是否小于0.05上。 现在大多数的国际医学刊物发表的论文中要求作者同时给出点估计、区间估计和具体的检验统计值,如相对危险度(Relative Risk , RR, RR值就是暴露人群

15、发病机与非暴露人群发病机率之比,即a/(a+b)与c/(c+b)之比),RR的95%可信限和P值。诸如95%可信限的区间估计可以提供更多有价值的信息 但在我国临床科研的统计学应用中尚未引起足够的重视。片面地认为越复杂的统计方法越好,而忽视统计检验方法的适用性和恰当性。 (1)、描述性统计 描述性统计分析是统计检验的基础,能提供资料的总体特征,不论在最后的论文报告中描述性统计分析的结果占多大的比重,它都是实际的资料分析过程中的起点 它为选择进一步的分析方法如选择合理的变量提供重要的信息, 发现原始资料中的错误忽略必须的描述性统计分析是导致统计方法应用不当的原因。 从简单到复杂 最基本的分析形式为

16、单个因素的不匹配不分层资料组间比较的分析 这是病例对照研究推断性统计的基础。可比较病例组与对照之间危险因素的分布情况,分析其危险因素与患病之间的联系。 由于病例和对照只是总体的代表, 无法直接计算真实的患病率,也就无法直接计算RR值,可以估计相对危险度OR,用以来代替RR。 变量的确定: 研究的目的是相看哪两个变量之间的关系(不妨假设一因,一果) 例 ;高血压为因,冠心病为果 重点和首要的看变量是否为正态分布分析中对变量进行正态分布检验 血胰岛素、血脂、生长激素、皮质醇、尿微量白蛋白,骨密度等都常为非正态分布。 非正态分布的变量是不能以原始资料进行参数统计分析,此时不进行正态化处理,得出结论会

17、面目全非。 1.首先可根据自己对所研究领域专业知识的了解初步选择 例: 对氧磷脂酶基因多态性与糖尿病人群合并冠心病的关系 对照组 糖尿病组 糖尿病组+冠心病组病例数 38 36 39 男/女 29/9 24/12 36/3 年龄 70.8+10.8 64.8+11.9 72.7+8.3高血压(有/无) 30/8 19/17 17/22 BMI 23.86+3.41 24.96+3.14 25.29+2.56? DM病程 0 ? ? 服药 0 ? ?PON-192 BB 13.2% 11.1% 30.8% 年龄是必须调整的混杂因素2. 然后加入文献中同类研究必须纳入的变量3.应用逐步回归分析也会

18、发现哪些变量应该选入。 有些研究在分析中囊括全部已测变量来做多因素步回归分析,或以为计算机挑出的变量就是最佳变量,是一种误解。 计算机挑出的变量受许多因素的影响,有些未被计算计挑出的变量有时非常重要(如年龄、性别), 所选变量中若不含有这些变量,分析结果可能不会被承认。 将本应作为连续变量的参数改为等级变量有时会丢掉许多有用的信息。 决定哪些变量应作为连续变量,哪些变量应作为等级变量应由其与因变量线性相关(pearson)及等级相关(spearman)的结果来决定,线性相关优于等级相关的变量不应以等级变量进入分析。pearson 相关优于spearman 相关用连续变量较合理。spearman

19、 相关优于Pearson相关用分组变量较合理。 入选变量并非入选变量的数目越多研究越严密, 总的自变量数应由样本数决定(1:10),(对于多因素设计,观测变量数为样本例数的1/5-1/10)。 一些作者在分析中自变量的选择目的不明,一共有100个病例,每人有30个变量,就将30个变量都用作为自变量,以为自变量越多,分析水平越高。 注意变量间相互关系l作者应十分明确所研究的两个主要变量的关系l 将可能的混杂因素作为协变量放入模型l 选入过多变量画蛇添足,徒劳无益,甚至有害 选入过多的协变量统计学上称为“过度调整”,这种调 整常常掩盖有意义的关联。 作为一个原则,多因素分析中,如不是为什么特殊目的

20、,不宜将两个密切相关的变量放入一个方程进行分析过度调整常会丢失一些有价值的信息。多因素分析模式的选择取决于 研究的性质:现状研究可选用线性回归和Logistic回归,前瞻性研究选用成比例风险模型或Logistic回归 因变量的性质:因变量为连续变量选用线性回归,因度量为分组变量(0,1)选Logistic回归或成比例风险模型。 一般说来前瞻性研究的成比例风险模型更为优越。 应以审视的眼光看待统计分析的结果: 为什麽? 因为人们常犯下述错误l先入为主的一个想法(自己创造的,或别人特别是外国人发表的);l在最容易取材的环境中收集病例(常常数量不多,不管或不知有多少因素干扰);l统计分析t检验“定终

21、身”,lP0.05就皆大欢喜。 这些研究在做统计学分析时常常是在 搞“逼、供、信”:l强制一个不适当的人群做为研究对象l强加给一个不适当的分析方法l逼出一个结果并对之深信不疑 这些研究是垃圾文章的制造厂。 在进行研究和阅读文献时应物别注意P值的大小。但是,P值并没有告诉我们这一性状出现的频率或水平的大小和方向 要了解这些信息必须依靠基本统计量基本统计量包括率、均数、标准差等。 比较两组(或多组)的率或均数可以了解该性状在组间分布的差异有多大及其变化的方向。在此基础上,结合统计检验的P值和专业知识下结论。 在分析评价研究结果时P值和基本统计量都是非常重要的,缺一不可。 观察对象的数量较少时,基本统计量的差别可能很大而P值大于0.05,此时应注意其专业意义。 如果这种差别在专业上已非常重要,应考虑继续扩大样本量,直至随机发生这种差别的机率小于5%。 当基本统计量的差别较小而观察对象的数量很大时,往往发现组间差异有显著性,此时应特别注意组间差别在专业上有无意义 如果这种差异在专业上并无重要意义,即使P值小于0.05,我们也认为其并无重要的意义命题 进行科学研究的重要目的之一就是探求某件事是否是发生的另一件事的结果.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论