




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Points of Significance Martin Krzywinski Canadas Michael Smith Genome Sciences Centre Naomi Altman Pennsylvania State UniversityNature Methods 引言Statistics does not tell us whether we are right. It tells us the chances of being wrong.统计不会告诉我们哪对哪错,但是它会告诉我们犯错的几率。 每次重复试验不会得到相同的结果,只是在一定范围内波动,这是由于生物的变异性和
2、测量设备的精度限制的原因,但如果每次测出来的结果都不同,如何确定测量与假设相符的? “科学的最大悲剧是:用丑陋的事实扼杀了美丽的假说。”(英国生物学家T.H.Huxley),这句话中的“丑陋”,怎样来测量? 统计能够回答上述问题,它是一种能从定量上描述不确定性的规律方法,并且数据是用含有误差的估计来表示的,而不是精确的测量。其理论框架是结合实验结果的不确定性和给观测值的推广附上置信水平。 很多概念能够从直观上理解, 但也有例外,“三门”问题Monty Hall problem:参赛者可以在三扇门当中选择一扇,其中三扇门中只有一扇门后有汽车,其它两扇门为山羊,当参赛者选择一扇门后,主持人会打开两
3、外两扇门中有山羊的门,并问参赛者是否改变主意。问题是:参赛者换门是否会增加他得奖的几率?看法一:不换门与换门而中奖的概率为1/2看法二:换门得将的概率为2/31. Importance of being uncertain统计分类:描述性统计和推断型统计 描述性统计:用一些样本特征如:均值和标准等描述数据推断型统计:用观测到的数据来详尽的概括真实世界。两者都是由抽样和估计为基础,抽样是收集数据的过程,估计是把随机的东西定量化的过程。Points of significance 专栏有助于在工作中超越直觉上对统计的理解。目的是解决医学期刊中大概一半的文章对统计的误用。Fig1a 一个实验变量的所
4、有可能值的频率直方图,称为总体分布。通常想推断总体的均值和标准差(1)抽样过程Fig1b.总体分布有两个特征参数均值和标准差,分别刻画总体的位置和形状。(1)抽样过程平均值会受到奇异值的影响。而中位数相对来说是总体位置参数的更稳定估计,更适合于偏态分布或者不规则形状的数据。 而标准差刻画的是数据的分散程度,在直观上不是很好理解,“3 原则”有助于理解它的作用。如:对正态分布,有(2)通过抽样估计总体的均值及标准差由于各种原因的限制,总体的均值和标准差不能直接观测到。最好的方法是用抽样所得的数据进行估计。Fig2a. 总体在030之间的频率直方图Fig2b. 从总体a中抽取的3个样本Fig2C.
5、 所有样本容量为5的样本均值的直方图,样本均值的分布样本必须是总体的代表,这就需要的样本是“简单随机样本”。一般,样本不同于总体,除非样本量n足够大。在抽样过程中,样本是否发生偏离,不总是那么显而易见的。如:问卷调查的样本是那些愿意参与调查的人得到的,但是那些拒绝参与调查的人的信息你是得不到的,但这两组可能有着显著的不同。Fig2C,样本均值也有分布,其均值和标准差为像总体一样,抽样分布也是不能直接测出来的,因为我们并不可能得到所有可能样本。注意到,样本均值的分布Fig.2c与Fig.2a有着显著的不同,但是均值的分布与总体分布是相关的,这个关系由中心极限定理给出:随着n的增加,样本均值的分布
6、逐渐接近于正态分布,无论总体的分布是什么形状的。是容易迷惑 为样本均值的标准差,是总体的标准差,n越大, 越小(表示越接近均值),而不变。不同总体分布的中心极限定理不同分布的总体下的样本均值的分布随着n的增加近似服从正态分布。虽然样本均值可以作为总体均值的估计,但是仍有可能某个样本均值落在总体均值很远的地方,特别是对于那些很小的n。如:从不规则总体中抽取了n=3的样本10000个,做了10次迭代,样本均值落在之外的比例从7.6%到8.6%. 当样本容量很小时,解释均值的结果务必要小心。要记住一点,测量出来的结果都是估计,你不应当把他当成精确和最终的结果。大量存在的不确定性都会确保每次的样本都不
7、一样。总体均值的估计精度的提高速度慢于数据收集的速度,这是因为存在一个比例因子 。精度提高2倍,数据量提高4倍多。样本都是来自Fig2a的总体,随着n的增加,标准误差(s.e.m.) 是样本均值的标准差 的估计。 2. Error bars(误差线)估计的不确定性通常由误差线来表示。误差线的类型:(1)标准差s.d.:反映的数据的变异度(离散程度)(2)标准误s.e.m.:反映测量的精度,是 的估计,或者说是用样本均值估计总体均值的精度的度量(3)95%置信区间(95%CI)The meaning of error bars is often misinterpreted,as is the
8、statistical significance of their overlap.误差线的意义常常被误读,就像有重叠的统计显著性一样。在科学出版物种常用误差线表示随机性,但是常常被误读。2. Error bars(误差线)Fig.1a,三种不同类型的误差线,表面上一样,但是反映的意义不一样,两者均值的检验显著性有差异,本质是标准差不一样。Fig.1b,显著性相同,即s.d.是一样的,但是误差线出现重叠和有间隙的情形。一般而言,有间隙不一定有差异,重叠就无差异。模拟和计算Fig.1a,相同长度为0.5,针对3种条件,可分别计算其p值 (1)s.d.=0.5,可得|t0|=4.472136,其检
9、验的p值为(2)s.d.m.=0.5,即sd=0.5*sqrt(10)可得|t0|= =1.414214,其检验的p值为通过类似的计算可以得到如图Fig.1b上的长度数据Fig.1a,(3)95%CI=0.5,即,可得s.d.=0.6989518其检验的p值为Sd=1.06,s.e.m.=0.335,length(CI)=0.7582. Error bars(误差线)避免三者的误用:弄清楚误差线所表达的对随机度量的含义。Only 1 figure 95%CI2012 Nature Methods,在所有平面图中有2/3使用了误差线s.d. 45% VS s.e.m. 49%5% not spe
10、cified置信区间是对不确定性的直观的度量,常用于医学文献三种误差线的含义:(1)标准差s.d.误差线基于标准差的误差线可以知道总体数据的变异度,对于新样本值范围的预测是有用的。标准差只是反应的是数据的变异,不是直观上的测量的误差。来自两个不同总体的样本,其s.d.误差线可以重叠(2)标准误s.e.m.误差线基于标准误的误差线反映的是均值的随机性,并且依赖于样本量的大小。抽取样本越多,其值越小。“如果标准误差线不重叠,则这两者之间的差异不显著“这句话是不对的。三种误差线的含义:(3)置信区间置信区间表示的是对测量可靠性的一种区间估计。置信区间表示以某种概率(置信水平)能捕获总体均值的信息。也
11、即,所有这种区间的95%能够覆盖总体均值,如图Fig2.aFig2a,20个样本容量为10的95%CI中有两个没有覆盖总体均值Fig2b,s.e.m.与95%CI的关系一个常见错误是:把置信区间理解为一种平均或期望数,总体均值落在此区间的概率为1-。错误的原因是置信区间的大小和位置是与每次取样有关的,出现相同的置信区间的概率是很小的,所以置信区间是一种随机区间。平均来说,100次取样,得到100个区间,平均上有95个区间能覆盖总体均值。Fig3 对相同的P值,s.e.m.与95%CI误差线的长度与位置不能用误差线的相对位置来判断其显著性,如P=0.05,s.e.m有间隙,但95%CI超过50%
12、的重叠;当95%CI刚好接触到,其P值为0.005,有极高的显著性。一个建议:由于误差线的多样性,在使用误差线时,在图中标注出是哪种类型,并对其进行解释。不能仅从误差线的直观上理解来判断其显著性。3.Significance,P values and t-testsThe P value reported by tests is a probabilistic significance, not a biological one.许多检验用P值来作为度量一个结果的差异是否由随机因素造成的。统计检验的思想Fig1a 一个蛋白表达水平值x=12,参考值为=10,你认为它们之间差异是由随机性造成的吗
13、?统计检验的思想Fig1b假设样本取自正态总体,均值=10统计检验的目的是用观测值定位在这个分布上去识别它是否超出了一定范围。统计检验的思想Fig1c 统计把这种范围进行了量化,观测值x的统计显著性, 阴影部分的面积,这就是Pvalue。若是单侧的检验,就是dark部分的面积统计检验的思想P值经常误解为在计算P值的过程中,假设H0为真,x是从H0为真的分布下抽取的,P值如果比较小,如小于0.05,只是告诉我们,在这个假设下,一个不大可能发生的事件出现了,有理由拒绝H0,也就是接受备则的假设,认为样本不是来自均值为的总体。 但是统计显著性并不表明生物学的显著性。假定总体服从均值为的正态分布,为得
14、到其精确的形状接下来需要对其标准差进行估计。再独立的测4次,就得到一个容量为5的样本,假设它的平均值为Fig2a 假设重复测量5次,均值为10.85,标准差sdx=0.96并且假定总体的标准差就是sdx=0.96Fig2b假设总体是正态分布,均值为=10,并且假定总体的标准差就是sdx=0.96,s.e.m=Fig2c假设H0是正态分布,则其样本均值的抽样分布也为正态分布可用 (s.e.m.) 估计其sd把 标在分布图上,可得到其P值通过计算可以构造一个统计量t的分布形状与正态分布非常接近,但与正态分布不一样,称之为Students t分布.分布形状上的差异在于,对大多数样本来说,样本方差S2
15、往往小于总体的方差,或者说是低估了总体的方差,可以证明样本方差的分布是偏态分布。(下图为模拟实验)因为不对称性,n越小,得到的样本方差小于总体方差。也就出现t分布的尾部更高的现象。(Fig3 a)模拟实验,从N(0,1)中抽取容量为5的样本,抽取2000次得到的方差的直方图,易知是偏态的Fig3a 不同的样本容量下,t分布的密度与正态分布密度的比较,t分布尾部更高。随着n的增加,t分布越来越像正态。n越大,S2越接近于总体方差2所以,如果不进行校正,不用t分布去做,而是用Fig2c中的正态分布计算的话,将会高估他的显著性。例如:在Fig2b中用样本量为5的样本,t值为1.98,得到的p值为0.
16、119.若用正态分布计算,得到p值为0.048.若t值不变,增加样本容量n=50,得到的p值为0.054.结果就与正态分布下的P值比较接近了。Fig3b 不同的样本量下,P值与t统计量值的变化,n越小,P值的改变越大。4.Power and sample sizeThe ability to detect experimental effects isundermined in studies that lack power.没有功效的研究中,检测实验效应的能力就被削弱了。分布之间的差异能够用实验效应来反映,效应的概率称为功效。功效:不犯第二类错误的概率,也称敏感性(sensitivity)T
17、ype I error:H0为真,拒绝H0,也称假阳性,False positiveType II error:H0为不真,接受H0,也称假阴性,False negative功效对检验来说非常重要,但常常被忽视。当功效低,重要的效应可能检测不到,在一些有很多条件和结果的实验中,如组学实验,显著性结果中的一大部分结果可能是错的。Fig1 有两组实验,一组50%有差异,另一组10%的差异若检验功效为0.2,说明会错过80%的真阳性结果,第一组实验阳性结果中的20%可能是错的,即阳性预测值(PPV)为0.8.(PPV=真阳性/检测为阳性)对于像基因表达研究实验中,有差异性的结果不到10%是很常见的。
18、若power=0.2,得到PPV=0.31,即阳性结果中超过2/3的结果是错的.即使用最常用的最低功效0.8,也有超过1/3的结果是错的(PPV=0.64).当检验那种真实阳性结果很少的假设时(差异性很少的假设,如第二组实验),低功效的大多数阳性结果都是错的一个关于医学研究文献分析发现,在功效至少为80%,检测有阴性结果的试验中仅有36%的能够检测出50%有差异。近来有很多文献评论报导大多数研究是功效不足。在组学研究中,为降低假阳性率,做检验时就需要用很小的显著性水平,同时,功效很低和假阴性很高成为一个普遍的现象。 当课题有潜在危害或很差的条件下时,不充足的功效的这种研究是一种对研究资源的浪费
19、和认为不道德的。怎样选择样本容量确保足够的功效能检测到一个预先指定的效应量? 怎样平衡一个实验的特异性和敏感性,以及如何增加样本容量能保证达到充分的功效?a 若一个蛋白表达水平值x超过临界值x*,说明有显著性,因为H0延伸到了x*,有可能错误的拒绝H0,其概率为.即Type I error,假阳性。一个好的实验应该是控制值的大小,一般设为 =0.05,这是为了保持有更高的特异性(1- ),即真阴性率。b 假设xx* 即拒绝H0,若x不是抽自H0 ,N(10,sd) ,假设抽自其备则假设的分布HA ,且分布为N(12,sd).一般两个分布分布间的差异来自于均值与方差的不同。称d为效应量(effect size) C 两类错误的概率都尽可能小,但是它们的关系为,降低,相应会增加。一般情形11.64,拒绝原假设,在HA中,超出临界值11.64的蓝色面积就是功效为0.64. 增加到0.12,cuttoff变为11.17,现在功效变为0.8,这种功效增加了25
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年防杀病毒软件项目资金需求报告代可行性研究报告
- 2025绿色蔬菜购销合同
- 2025合同法合同履行与违约责任的相关法律规定
- 2025个人的借款简单合同范本
- 2024年聚烯烃类线缆投资申请报告代可行性研究报告
- 2024年粉末橡胶聚硫橡胶项目资金筹措计划书代可行性研究报告
- 2025大庆市建筑工程施工设备采购合同(试行)
- 2025年新版劳动合同全面实施
- 2025写字楼租赁合同模板2
- 2025年食品销售合同模板
- 大学生创业计划书word文档(三篇)
- 暖通空调锅炉系统详细介绍
- MT 194-1989煤矿用巷道支架试验方法与型式检验规范
- 蝴蝶小知识及标本制作
- FZ/T 13056-2021涤粘混纺色纺弹力布
- 追寻美术家的视线 教案- 美术鉴赏
- 构图基础课件
- 文件记录控制培训课件
- 礼仪文书写作课件
- 微组装建线汇总-微方案
- 液化气站安全风险点告知卡
评论
0/150
提交评论