常见统计学错误_第1页
常见统计学错误_第2页
常见统计学错误_第3页
常见统计学错误_第4页
常见统计学错误_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于常见统计学错误第1页,讲稿共50页,2023年5月2日,星期三1.终点指标过多,大海捞针临床试验时,不知道哪个指标在组与组间有差异;“确定某个指标后,万一组间没有差异,岂不被动!”生理、生化、组织学、基因,都做;“内容丰富,显得水平高!”许多仪器一下子可以做许多项目;“许多项目一一分析,哪个有意义,就报告哪个指标标”第2页,讲稿共50页,2023年5月2日,星期三错在哪里?哪些指标可能有组间差异,必须心中有数。科研的结果应当预见——假说是科研的灵魂心中无数,不要“先上马再说”指标多,实验工作量大。大海捞针——碰运气,不是科研指标多,翻来覆去分析,制造假阳性

Nature杂志统计学指南:常见错误之一

第3页,讲稿共50页,2023年5月2日,星期三为何翻来覆去分析,会制造假阳性?

第4页,讲稿共50页,2023年5月2日,星期三Nature常见错误之一多重比较:对一组数据作多项比较时,必须说明如何校正α水平,以避免增大第一类错误的机会第5页,讲稿共50页,2023年5月2日,星期三应当如何?主要终点(primaryendpoint):只能一个次要终点(secondaryendpoint):可以几个,但勿过多Bonfferoni校正当同一组数据同时作k次分析时,若限定犯假阳性错误的概率总共不超过,则每次分析要用来控制假阳性的概率。例

第6页,讲稿共50页,2023年5月2日,星期三事后分析(Posthocanalysis)看到数据之后才想起来做的分析其结果往往不能被进一步研究所确认不鼓励事先并未计划的亚组分析和校正分析2.事后分析,见机行事第7页,讲稿共50页,2023年5月2日,星期三为何不鼓励事后分析?数据是现象,现象具有偶然性;看到数据后进行的“分析”属于故作姿态,变偶然为“必然”——忽悠!看到数据后增加的“分析”,也属于多重分析,增加假阳性的机会第8页,讲稿共50页,2023年5月2日,星期三必要的亚组分析有助于发现适应症,指导个体化治疗;必要的校正分析有助于消除混杂偏倚,公平、公正地比较疗效亚组分析和校正分析必须事先在研究计划里规定,并说明理由;写文章时,申明这类分析是事前计划好的事后决定做的分析,如果想写,不能算是正式结果,只能视为探索性分析。应当如何?第9页,讲稿共50页,2023年5月2日,星期三3.随机化,说而不做,做而不严处理分配的随机化为什么这么重要?(1)消除分配处理有意或无意的偏倚。

(2)为实施盲法创造条件。

(3)使有可能利用概率论来描述各干预组之间的差异有多大可能仅仅是由偶然性造成的。将随机化当作“廉价名词”,实际没做,却写“随机分成两组”——科研道德?第10页,讲稿共50页,2023年5月2日,星期三说错和做错将随机化当作“廉价名词”,实际没做,却写“随机分成两组”——科研道德?将“随意分组”当作随机化将“机械分组”当作随机化略去筛选过程,简单地报告将多少人随机分组略去实施过程中丢失对象,将最后两组人数说成是随机分组人数第11页,讲稿共50页,2023年5月2日,星期三应当如何?成功的随机化取决于:

(1)产生一个不可预见的分配序列;(2)“隐蔽”(allocationconcealment)这个序列,直到分配完毕(必须建立一个分配处理的系统)。报告如何随机分组,如何“隐蔽”:谁做随机序列,谁收病人,谁分药和发药;分组方案如何保管……第12页,讲稿共50页,2023年5月2日,星期三参加者的流程图

(强烈推荐)合格对象82例拒绝参与7例随机分组75例分配至实验组38例接受干预38例分配至对照组37例。接受干预36例,1例因颈部损伤未接受干预随访例数:7周n=38,11周n=38,15周n=38,19周n=36随访例数:7周n=37,11周n=36,15周n=36,19周n=35纳入分析例数n=36排除分析例数n=2(因失访)纳入分析例数n=35,排除分析例数n=2(1例失访,1例颈部损伤)第13页,讲稿共50页,2023年5月2日,星期三4.样本量随意决定,无依据样本量太小?

----真理应经得起重复研究的功效太低样本量越大越好?

----时间长、经费不足不能保证数据质量需要事先估算最小样本量论文必须报告估算最小样本量的根据

第14页,讲稿共50页,2023年5月2日,星期三比较两组测定值的均数第15页,讲稿共50页,2023年5月2日,星期三欧洲对比剂研究

(1)预计欲比较的两总体参数的差值(2)预计总体标准差(3)允许出现假阳性结果的机会(4)允许出现假阴性结果的机会第16页,讲稿共50页,2023年5月2日,星期三欧洲研究的样本量估算决定每组含61名患者。第17页,讲稿共50页,2023年5月2日,星期三比较两组发生某结局的百分比(1)预计两组发生某结局的百分比约为(2)允许犯假阳性错误的机会(3)允许犯假阴性错误的机会

第18页,讲稿共50页,2023年5月2日,星期三南韩研究南韩对比剂研究第19页,讲稿共50页,2023年5月2日,星期三南韩研究的样本量估算第20页,讲稿共50页,2023年5月2日,星期三5.剂量-反应关系

不能作均数比较或回归例有人分析蛇毒因子(CVF)的剂量对血液白细胞噬菌率的影响,得如下数据,欲讨论剂量-反应关系。第21页,讲稿共50页,2023年5月2日,星期三

做法1:单因素方差分析?!F=0.701,P>0.5,

均数间差别无统计学意义

为什麽不对?有负初衷——探讨反应随剂量变化的趋势*由多个剂量组的比较只能得知均数间是否有差异*有统计学差异也不等于有剂量-反应关系第22页,讲稿共50页,2023年5月2日,星期三

做法2:

反应的均数关于剂量作回归分析?!

为什麽不对?均数做因变量造成“好”的假象!*回归方程是否有统计学意义与反应的变异状况有关*以诸个体反应值的均数作回归计算,掩盖变异性回归方程:Y=61.786-6.886log(剂量)决定系数:R2=0.914。第23页,讲稿共50页,2023年5月2日,星期三正确作法:用个体资料作回归分析回归方程:Y=61.782-6.884log(剂量)决定系数:R2=0.095回归方程无统计学意义,无剂量-反应关系!第24页,讲稿共50页,2023年5月2日,星期三6.重复测量资料不能时点间两两比较例各取7只兔子,分别以正常食物和待研究食物喂养,在实验前、喂养5周、10周后,各取血测量其中胆固醇浓度,自然对数转换后,数据见表22.1,问血清胆固醇浓度随时间变化的趋势是否受该食物影响。第25页,讲稿共50页,2023年5月2日,星期三例某药物有新、旧两种剂型。为比较两种剂型的代谢情况,对16例某病患者服药后0、4、8、12小时的血药浓度作了测量,问该药新旧两种剂型的血药浓度-时间曲线的差别是否具有统计学意义。

第26页,讲稿共50页,2023年5月2日,星期三第27页,讲稿共50页,2023年5月2日,星期三

常见的不妥

i)对每个时间点,分别计算均数、标准差;将各时间点测量值的均值用线连接,标出“误差”线ii)在各时间点做两组比较(t

检验或非参数检验)第28页,讲稿共50页,2023年5月2日,星期三为什麽不对?(1)连接各时间点测量值均数的方法将掩盖个体曲线位置和形状的特点:各均数所对应的点连起来形成的曲线形状可能与诸个体的曲线形状毫不相干;各时间点标上相应的标准差也会误导;(2)上述方法无法体现不同时间点的数据来自同一个体,而每一个体的多次重复测量值间具有相关性。(关键所在)第29页,讲稿共50页,2023年5月2日,星期三应当如何?1)综合指标法(summarymeasuresapproach)或派生变量法(derivedvariableapproach)采用少数独立的综合指标来概括每个个体多个时间点的测量值;用单变量方法比较各组的差异第30页,讲稿共50页,2023年5月2日,星期三综合指标第31页,讲稿共50页,2023年5月2日,星期三2)重复测量资料的方差分析

先做“球形检验:不同时间点上数据之间没有相关性?任何两个时间点之间的相关性都一样?得阴性结果才进一步作方差分析。例兔子喂养重复测量资料分析处理因素(group):F=31.69,P=0.0001—食物对家兔血清胆固醇有影响;2)测量时间(time):F=11.93,P=0.0003—家兔血清胆固醇浓度随时间变化;3)交互效应(time×group):F=10.57,P=0.0005—不同食物,血清胆固醇浓度变化趋势有所不同。第32页,讲稿共50页,2023年5月2日,星期三7.多维列联表资料不可反复做检验例某地区呼吸系统疾病的患病率较高,有人怀疑与当地室内点香的习惯有关,经抽样调查,得数据如下第33页,讲稿共50页,2023年5月2日,星期三合并后作检验?!

第34页,讲稿共50页,2023年5月2日,星期三为什麽不对?i)点香与不点香者患病率不可比!年龄组合并掩盖了:

点香(B1)与不点香(B2)者年龄结构不同ii)不同年龄组患病率不可比!点香与不点香者合并掩盖了:

不同年龄组中点香与不点香者比例的不同第35页,讲稿共50页,2023年5月2日,星期三正确作法:

对数线性模型或logistic

回归i)对数线性模型平等地讨论A,B,C三因素对各格子中频数的影响仅当其他变量的影响与某变量无关时,才可通过合并消除该变量ii)logistic回归

反应变量:患病与否,解释变量:点香和年龄交互效应:点香×年龄第36页,讲稿共50页,2023年5月2日,星期三8.中西医结合疗效研究,应设4组不少人作两组比较:试验组:西药A和中药B

对照组:西药A若(西药A和中药B)疗效>西药A疗效能说中西医结合好吗?

第37页,讲稿共50页,2023年5月2日,星期三不妥之一

如果(西药A和中药B)疗效>西药A疗效能说:“在西药A存在情形下,中药B有疗效”吗?人们质疑:“中药B的疗效可能是安慰效应!?”于是,修改为:试验组:西药A和中药B

对照组:西药A和中药安慰剂第38页,讲稿共50页,2023年5月2日,星期三不妥之二若(西药A和中药B)疗效

>(西药A和中药安慰剂)疗效则可以说:“在西药A存在情形下,中药B有疗效!”但是,人们要问:在西药A不存在情形下,中药B有疗效吗?由此,足以认为中西医结合好吗?第39页,讲稿共50页,2023年5月2日,星期三

应当如何?

——析因设计!试验组1:西药A和中药B试验组2:西药A和中药安慰剂试验组3:中药B和西药安慰剂对照组:中药安慰剂和西药安慰剂若(西药A和中药B)疗效-对照疗效>[(西药A和中药安慰剂)疗效-对照疗效]+[(中药B和西药安慰剂)疗效-对照疗效]则说:中西医结合疗效比单独疗效之和还大!第40页,讲稿共50页,2023年5月2日,星期三

换一个角度看若(西药A和中药B)疗效-对照疗效>[(西药A和中药安慰剂)疗效-对照疗效]+[(中药B和西药安慰剂)疗效-对照疗效]改写为:(西药A和中药B)疗效-(中药B和西药安慰剂)疗效

>(西药A和中药B安慰剂)疗效-对照疗效中药B存在情形下,西药A的疗效

>中药B不存在情形下,西药A的疗效则说:中药B的存在使西药A的疗效有所增加!第41页,讲稿共50页,2023年5月2日,星期三

析因设计可以告诉我们什么?西药A的作用中药B的作用西药A和中药B的协同作用若西药A和中药B的协同作用>0才说:中西医结合好!第42页,讲稿共50页,2023年5月2日,星期三例:某中西结合研究

2×2析因试验结果(均数)

第43页,讲稿共50页,2023年5月2日,星期三两因素间交互效应(interaction)第44页,讲稿共50页,2023年5月2日,星期三小结终点指标不宜过多,大海捞针,很可能捞上个假阳性。马后炮分析不足取,事先计划的分析才可信;不论干预性研究还是观察性研究,都要事先到国际网站注册,以接受同行监督。随机化是国际公认的消除选择偏倚的好办法,不可作为廉价名词,随便说说;说而不做,做而不严,自欺欺人。第45页,讲稿共50页,2023年5月2日,星期三小结4.干预研究的论文要报告样本量估算的依据和方法;对不同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论