资料的正态性检验汇总_第1页
资料的正态性检验汇总_第2页
资料的正态性检验汇总_第3页
资料的正态性检验汇总_第4页
资料的正态性检验汇总_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

资料的正态性检验汇总摘要提示:本文汇总了通常在对资料进行正态性检验时遇到的问题,比如Kolmogorov-Smirnov检验(简称K-S检验),

还是Shapiro-Wilk检验,SPSS里面用哪个过程,SAS程序等。SPSS和SAS常用正态检验方法正态性检验主要有三类方法:一、 计算综合统计量如动差法、夏皮罗-威尔克Shapiro-Wilk法(W检验)、达戈斯提诺D'Agostino法(D检验)、Shapiro-Francia法(W检验).二、 正态分布的拟合优度检验如皮尔逊x2检验、对数似然比检验、柯尔莫哥洛夫Kolmogorov-Smirov法检验.三、 图示法(正态概率图NormalProbabilityplot)如分位数图(QuantileQuantileplot,简称QQ图)、百分位数(PercentPercentplot,简称PP图)和稳定化概率图(StablizedProbabilityplot,简称SP图)等.下面介绍几种较统计软件中常用的正态性检验方法1、 用偏态系数和峰态系数检验数据正态性偏态系数Sk,它用于检验不对称性;峰态系数Ku,它用于检验峰态。Sk=0,Ku=0时,分布呈正态,Sk>0时,分布呈正偏态,Sk<0时,分布呈负偏态。适用条件:样本含量应大于2002、 用夏皮罗-威尔克(Shapiro-Wilk)法检验数据正态性即W检验,1965年提出,适用于样本含量n<50时的正态性检验;。3、用达戈斯提诺(DAgostino)法检验数据正态性即D检验,1971提出,正态性D检验该方法效率高,是比较精确的正态检验法。4、 Shapiro-Francia法即W'检验,于1972年提出,适用于50<n<100时的正态性检验。5、 QQ图或PP图散点聚集在固定直线的周围,可以认为数据资料近似服从正态分布SPSS&SAS规则:SPSS规定:当样本含量3<n,5000时,结果以Shapiro-Wilk(W检验)为难,当样本含量n>5000结果以Kolmogorov-Smirnov为准。而SAS规定:当样本含量n《2000时,结果以Shapiro-Wilk(W检验)为准,当样本含量n>2000时,结果以Kolmogorov-Smirnov(D检验)为准提问问:对照组和病例组都是20例,拟对某指标进行正态性检验,是用Kolmogorov-Smirnov检验(简称K-S检验),还是Sh叩iro-Wilk检验?已用K-S检验不能认为该指标不是正态分布,但是Sh叩iro-Wilk检验表明其为非正态分布,我该相信哪个检验结果?答:Kolmogorov-Smirnov检验:检验频数分布的正态性检验,适合大样本。Shapiro-Wilk检验:小样本数据的正态性检验。矩法正态性检验:不限样本。问:用SPSS中analysze/discriptivestatistics/explore法和用analyze/nonparametrictests/1-sampleK-S法评价正态性,结果不完全相同,为什么?答:以第二个为准,第一种方法是参数检验,而第二种是非参数检验,第一种是在知道总体分布的情况下做的,第二种是在不知道总体分布的情况进行的检验,而且大多数的检验,我们都是不知道总体分布到底是什么才做的K-S检验。

两种正态性检验方法差异比较SPSS.2010-06-2613:20:34阅读56评论0字号:大中小SPSS里面有两处可以检验数据正态性,一个是:Analysis-DescriptiveStatistics--Explore,这可能是常用的方法Explore:'PlotsBoxplotsFactorlevelsDependentstogeth'NoneIDescriptiveGstemDescriptiveGstem-aitd-lea£Hist.ogramSpreadvs.LevelwithLeveneTest@Non^OPowerestimationPower:Naturallog另一处是:Analysis-Nonparametrictests--OnesampleK-StestPower:Naturallog另一处是:Analysis-Nonparametrictests--OnesampleK-Stest,两个地方虽然都用到了名称相同的Kolmogorov-SmirnovTest,但是经常会出现检验的结果不一致的情况。比如就用SPSS自带的数据Anxiety2.sav,分别对trial1-trial4的检测值做正态性检验用EXPLORE得出的结果是:TestsofNonnalih-KDljiwEDrcv-Emtrncv'Shapiro-^'ilkStatistic言£12:.Statistiecz 五宜.Trial1.23812rh£n.L*Cu.35012.二-Trial2.16912..xUu,5+fl12495Trial3.13212tppji..xUU.54-12.595Trial4.20112.193.88512tnn.1UUThisise就*bffim止thstreesizr.i5cEf.c-2.已口.山圣§SiELiicnx-BCarrezLioi:

而用NPAR做出的结果是:One-SampleKolmagarci^'-SmirDO^'TestTrial1Trial2Zrial3ZHal-12121212Ncmial 五,雄 Al三an其.翌二.对7.75425St-d.D三riaHen2eg?24312.-1-2.364Mcs-tExtf=dii= Abs-cluts.238ms.LS2.2C1Di巳2 知血代壬.179.一常.1S2.2C1Nazativa-.238-.'.55IfKoljTicECfDv-SratrfLcvZ.824.534.631.658Asyinp1.Sig.(2-taitsd).335.321二三!■T*tdiWbwiBtiNdtiM.b.Calculated三对datE.在‘探索’里出现的Kolmogorov-Smirnov检验,它的右上角有一个a的注释号。下面的介绍表明它是经过Lilliefors改进或纠正的结果。它将Kolmogorov-Smirnov检验改进用于一般的正态性检验。而在‘非参数检验’里出现的Kolmogorov-Smirnov检验,是没有经过纠正或改进的。该正态性检验只能做标准正态检验。SPSS规定:当样本含量3Wn,5000时,结果以Shapiro—Wilk(W检验)为难,当样本含量n>5000结果以Kolmogorm—mimov(D检验)为准。SAS规定:当样本含量n<2000时,结果以Shapim—Wilk(W检验)为准,当样本含量n>2000时,结果以Kolmogorov—Smimov(D检验)为准。在SPSS和SAS等统计分析软件中,通常用统计描述模块中的Shapiro-Wilk检验、经过Lilliefors显著水平修正的Kolmogorov—Smirnov检验和非参数检验模块中的单一样本Kolmogorov—Smirnov检验进行正态性判定。但是这几种检验方法存在以下几方面的问题。(1) 在实际应用中常出现检验结果与直方图、正态性概率图不一致,甚至几种假设检验方法结果完全不同的情况。(2) Shapiro—Wilk检验(W检验)和经过Lilliefors显著水平修正的Kolmogorov—Smirnov检验(D检验)是用一个综合指标(顺序统计量W或D)来判定资料的正态性由于两种方法都是用一个指标反映资料的正态性所以当资料的正态峰和对称性两个特征有一个不满足正态性要求时,两种方法出现假阴性错误的机率均较大;而且两种方法的检验统计量都是进行大小排序后得到,所以易受异常值的影响。⑶Kolmogorov—Smirnov单一样本检验是根据实际的累计频数分布和理论的累计频数分布的最大差异来检验资料的正态性,可对正态分布进行拟合优度检验。但它并非检验正态性的专用方法,因此它的检验效率是最低的,最容易受样本量和异常值等因素的影响。⑴没有修正的K-S检验的原始公式里面,检验的既是标化后的数据是否服从理论的分布。正态性检验(上)2008-04-2510:451.样本量较大时的结果:运用的数据是SPSS13.0Data里面的diameter_sub.sav,样本含量是216对数据分别支用SAS和SPSS进行正态性检验:1.1SAS中用Procunivariatenormal;命令结果如下:TestsforNormalityTest --Statistic--- pValue Shapiro-Wilk W0.993604Pr<W0.4813Kolmogorov-SmirnovD0.057717Pr>D0.0789其中SAS中SAS规定:当样本含量n<2000时,结果以Shapiro-Wilk(W检验)为准,当样本含量n>2000时,结果以Kolmogorov-Smirnov(D检验)为准。1.2SPSS里面用Explor过程Plots选项中NormalityPlotswithtests结果如下:TestsofNormalityKolnStatisticiogorov-Smirn(dfov(a)Sig.StatisticShapiro-WilkdfSig.APdiameter(mm),058216,070,994216,476aLillieforsSignificanceCorrection对于SPSS结果选用哪个方法,我看的资料并不一致:在SPSS13.0书上以样本量<50,选Shapiro-Wilk检验,(而有文献SPSS说样本含量3<n<5000时,结果以Shapiro-Wilk(W检验)为准,有出入)1.3在SPSS13.0中单样本的K-S拟合优度检验讲到:可以用来检验样本的分布是否服从某种理论分布一一可以是正态、均匀等。用上述例子选Normal分布进行计算结果如下:One-SampleKolmogorov-SmirnovTestAPdiameter(mm)N216NormalParameters(a,b) Mean14.4421Std.Deviation.71728MostExtremeDifferencesAbsolute.058Positive.032Negative-.058Kolmogorov-SmirnovZ.859Asymp.Sig.(2-tailed).451aTestdistributionisNormal.bCalculatedfromdata.正态性检验方法的比较正态分布是许多检验的基础,比如F检验,t检验,卡方检验等在总体不是正太分布是没有任何意义。因此,对一个样本是否来自正态总体的检验是至关重要的。当然,我们无法证明某个数据的确来自正态总体,但如果使用效率高的检验还无法否认总体是正太的检验,我们就没有理由否认那些和正太分布有关的检验有意义,下面我就对正态性检验方法进行简单的归纳和比较。一.图示法P-P图以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标,以样本值表现为直角坐标系的散点。如果数据服从正态分布,则样本点应围绕第一象限的对角线分布。Q-Q图以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为直角坐标系的散点。如果数据服从正太分布,则样本点应围绕第一象限的对角线分布。以上两种方法以Q-Q图为佳,效率较高。直方图判断方法:是否以钟型分布,同时可以选择输出正态性曲线。

箱线图判断方法:观察矩形位置和中位数,若矩形位于中间位置且中位数位于矩形的中间位置,则分布较为对称,否则是偏态分布。茎叶图判断方法:观察图形的分布状态,是否是对称分布。二.偏度、峰度检验法:S,K的极限分布样本偏度系数S=-^3-(B);

2该系数用于检验对称性,S>0时,分布呈正偏态,S<0时,分布呈负偏态。样本峰度系数K=样本峰度系数K=21检验统计量S1检验统计量S=~N(O,1)6/n~N(0,1)24/n该系数用于检验峰态,K>0时为尖峰分布,S<0时为扁平分布;当该系数用于检验峰态,K>0时为尖峰分布,H°:F(x)服从正态分布H:F(x)不服从正态分布当原假设为真时,对于给定的a R={|r^1>入5 1>入} 其中人=u6/n <24/n i-a4Jarque-Bera检验(偏度和峰度的联合分布检验法)检验统计量为 JB==n—k[S2+-K2)2(2)6" 4JJB过大或过小时,拒绝原假设。非参数检验方法Kolmogorov-Smirnov正态性检验(基于经验分布函数(ECDF)的检验)D=maxIFG)-FG)IF(x)表示一组随机样本的累计概率函数,F(x)表示分布的分布函数。当原假设为真时,D的值应较小,若过大,则怀疑原假设,从而,拒绝域为 R={D>d}对于给定的a p=P{d>d}=a 又p=P{D>D}Lilliefor正态性检验该检验是对Kolmogorov-Smirnov检验的修正,参数未知时,由口=X,A2=S2可计算得检验统.人一-.计量D的值。n3.Shapiro-Wilk(W检验)检验统计量:

£(a-£(a-aXx-X)i (i)1-i=1 £J-a)以x—x)i=1当原假设为真时(i)i=1W的值应接近于1,若值过小,则怀疑原假设,从而拒绝域为R={w<c}在给定的a水平下P{w<c}=a4.X2拟合优度检验(也是基于经验分布函数(ECDF)的检验)检验统计量为x2=£n(匕-p)2=£^npt顼".]Pn1 .1npX2¥(匕-P)2=£f* —r-1)pni n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论