正态性检验方法说明介绍_第1页
正态性检验方法说明介绍_第2页
正态性检验方法说明介绍_第3页
正态性检验方法说明介绍_第4页
正态性检验方法说明介绍_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、正态性检验方法简介一、 Anderson-Darling 检验Anderson Darling检验(简称A-D检验)是一种拟合检验,此检验是将 样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较,如果差异足够大,该检验将否定总体呈正态分布的原假设。样本数据的经验累积分布函数与理论累积分布函数之间的差异可通过两种分布之间的二次AD距离进行衡量,若二次AD距离小于置信水平下的临界值, 则可认为样本数据来源于正态分布。Anderson-Darling检验的计算步骤如下:1,提出假设:H 0 :样本数据服从正态分布;H 0 :样本数据不服从正态分布;2.计算统计量A2 ,其计算步骤为:

2、? 首先将样本数据按照从小到大的顺序进行排序并编号,排在第i位的数据其次进行样本数据的标准化,计算公式如下:xi xYi-i S(式 1-1 )其中,x为所有样本数据的平均值,S为所有样本数据的标准差。?接着计算F(Yi),计算公式为F(Y)(Yi)(式 1-2 )其中,其中 为标准正态分布函数,可查表获得。最后A2值,计算公式如下:NA2N (2i1)lnF(Yi) ln 1F (Yn 1 i)N i 1(式 1-3 )其中,N为样本总个数,i为样本序号,23.计算判定统计量A ,计算公式为:A2A2(1 等2.252") N2(式 1-4)4 .查找临界化根据给定的显著性水平a,

3、查Anderson-Darling临界值表,2得到临界值A ;,2,25 .作出判定:若A>A ,则在a水平上,拒绝H0,即认为样本数据不服从正态分布;若A,2< A'2,则不能拒绝Ho,即认为样本数据服从正态分布。例1.采用Anderson-Darling 判断表1中的数据是否符合正态分布表1 A-D检测样本数据1 丁 P数据1 丁 P数据1 丁 P数据18.141810.38359.6228.301910.38369.7238.442010.43379.7448.452110.48389.7858.622210.50399.9268.772310.56409.9478.

4、822410.58419.9888.822510.69429.9998.902610.774310.02108.972710.804410.04119.012811.254510.06129.282911.444610.16139.343011.684710.22149.413111.844810.32159.443212.044910.36169.513312.125010.37179.543412.51检验步骤如下:1提出假设.H0 :样本数据服从正态分布.H0:样本数据不服从正态分布.2.计算统计量A2,其计算步骤为:? 首先将样本数据按照从小到大的顺序进行排序并编号,排在第i位的数据为

5、Xi ,如表2中的第2列所小;? 按照式1-1进行样本数据的标准化,如:xi x 8.14 10.01Yi 1.0261.823 ,X2 X 8.30 10.01S 1.0261.667其余依次类推,计算结果如表2中的第3列所示? 按照式1-2计算F(Y),如:F(Y1)(Y1)( 1.823) 0.034, F(Y2)(Y2)( 1.667) 0.048其余依次类推,计算结果如表2中的第4列所示。计算 ln F(Yi)和垢1 F(Yi),如:lnF(Y,) ln( 0.034)3.376, ln1 F (Y1) ln(1 0.034)0.035其余依次类推,计算结果如表2中的第5列和第6列所

6、示。计算 ln F(Yi) ln1 F(Yn i 1),如:当i=1时,ln F (Yi) ln1 F(YN i 1) ln F(Y1) ln1 F (Y50)3.376 ( 4.095)8.281当i =2时,In F (Yi) ln1 F(Yn i 1) In F (Y2) ln1F(Y49)3.041 ( 3.919)6.960其余依次类推,计算结果如表2中的第7列所示。? 计算(2i 1) In F (Yi) ln1 F(Yn i 1),如:当i =1时,(2i 1)ln F(Y) ln1 F(Yn i 1)lnF(Y1)ln1 F*。)8.281当i=2时,(2i 1)ln F(Yi

7、) ln1 F(YN i 1) 3ln F(Y2) ln1 F(Y49) 3 ( 6.960)20.879其余依次类推,计算结果如表2中的第8列所示。? 最后计算A2 :502 1A250 (2i 1) lnF(Yi) ln 1 F(Yn 1 i)50 i 1150 8.281 ( 20.879)( 4.180)150 ( 2519.612)500.392表2 A-D检测计算过程表J 丁 pi数据Xi标准化YiF(Yi)lnF(Yi)ln1 F(Y)lnF(Yi) ln1 F(Yn)(2i 1)ln F(Y) ln1 F(Yn)18.14-1.8230.034-3.376-0.035-8.28

8、1-8.28128.30-1.6670.048-3.041-0.049-6.960-20.87938.44-1.5300.063-2.765-0.065-6.497-32.4871 丁 pi数据Xi标准化YiF(Yi)lnF(Yi)ln1 F(Y)lnF(Yi) ln1 F(Yn)(2i 1)ln F(Y) ln1 F(Yn)48.45-1.5200.064-2.746-0.066-6.036-42.25358.62-1.3550.088-2.433-0.092-5.394-48.54468.77-1.2090.113-2.177-0.120-4.681-51.49678.82-1.1600.

9、123-2.095-0.131-4.272-55.53488.82-1.1600.123-2.095-0.131-3.606-54.09498.90-1.0820.140-1.969-0.150-3.441-58.493108.97-1.0140.155-1.862-0.169-3.233-61.434119.01-0.9750.165-1.803-0.180-3.043-63.904129.28-0.7120.238-1.434-0.272-2.651-60.982139.34-0.6530.257-1.359-0.297-2.510-62.742149.41-0.5850.279-1.27

10、5-0.328-2.404-64.909159.44-0.5560.289-1.240-0.341-2.316-67.161169.51-0.4870.313-1.162-0.375-2.185-67.748179.54-0.4580.323-1.129-0.391-2.153-71.037189.62-0.3800.352-1.044-0.434-2.058-72.034199.72-0.2830.389-0.945-0.492-1.949-72.100209.74-0.2630.396-0.926-0.505-1.890-73.712219.78-0.2240.411-0.888-0.53

11、0-1.758-72.098229.92-0.0880.465-0.766-0.626-1.582-68.040239.94-0.0680.473-0.749-0.640-1.482-66.6841 丁 pi数据Xi标准化YiF(Yi)lnF(Yi)ln1 F(Y)lnF(Yi) ln1 F(Yn)(2i 1)ln F(Y) ln1 F(Yn)249.98-0.0290.488-0.717-0.670-1.434-67.375259.99-0.0190.492-0.709-0.678-1.410-69.0792610.020.0100.504-0.685-0.701-1.363-69.5192

12、710.040.0290.512-0.670-0.717-1.340-71.0292810.060.0490.519-0.655-0.733-1.295-71.2362910.160.1460.558-0.583-0.817-1.209-68.9003010.220.2050.581-0.543-0.870-1.073-63.2903110.320.3020.619-0.480-0.964-0.985-60.0623210.360.3410.633-0.456-1.004-0.949-59.7683310.370.3510.637-0.451-1.014-0.884-57.4923410.38

13、0.3610.641-0.445-1.024-0.836-55.9963510.380.3610.641-0.445-1.024-0.820-56.6123610.430.4090.659-0.417-1.075-0.759-53.8673710.480.4580.677-0.391-1.129-0.718-52.4383810.500.4780.684-0.380-1.151-0.677-50.8033910.560.5360.704-0.351-1.218-0.623-47.9894010.580.5560.711-0.341-1.240-0.522-41.2074110.690.6630

14、.746-0.293-1.371-0.462-37.3854210.770.7410.771-0.261-1.472-0.411-34.1164310.800.7700.779-0.249-1.511-0.381-32.3521 丁 Pi数据Xi标准化YiF(Yi)lnF(Yi)ln1 F(Y)lnF(Yi) ln1 F(Yn)(2i 1)ln F(Y) ln1 F(Yn)4411.251.2090.887-0.120-2.177-0.252-21.8974511.441.3940.918-0.085-2.505-0.206-18.2984611.681.6280.948-0.053-2.96

15、0-0.145-13.1974711.841.7840.963-0.038-3.290-0.104-9.7004812.041.9790.976-0.024-3.733-0.089-8.4814912.122.0570.980-0.020-3.919-0.069-6.6965012.512.4370.993-0.007-4.905-0.042-4.180,23 .计算判定统计量A,220,752.250.752.25AA2(1)0.392 (1:)0.398NN2505024 .查找临界值:根据给定的显著性水平a =0.05 ,查附件中、2«Anderson-Darling临界值表彳

16、马至U临界值A 0.752 ;2,25.作出判定:因为A <A ,则不能拒绝H。,即认为样本数据服从正态分 布。二、 Ryan-Joiner 检验此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近1,则总体就很有可能呈正态分布。Ryan-Joiner统计量可以评估 这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布的原 假设。此检验类似于 Shapiro-Wilk 正态性检验。Ryan-Joiner检验的步骤为:1提出假设.H。:样本数据服从正态分布.H。:样本数据不服从正态分布.2.计算相关系数Rp,其计算步骤为:? 首先将样本数据按照从小到大

17、的顺序进行排序,排在第 i位的数据为Xi ;其次进行样本数据的标准化,计算公式如下:xi Xb-S(式 2-1 )其中,X为所有样本数据的平均值,S为所有样本数据的标准差。然后Rp值,计算公式如下:RpNX bi i 1NS2(N 1)bi2i 1(式 2-2 )其中,N为样本总个数,i为样本序号3 .查找临界值:根据给定的显著性水平 a ,查Ryan-Joiner检测临界值表, 得至IJ临界值Rp(n,);4 .作出判定:若RpRp(n,),则在a水平上,不能拒绝H。,即认为样本数据 服从正态分布;若Rp< Rp(n,),则拒绝Ho ,即认为样本数据不服从正态 分布。例2.采用Ryan

18、-Joiner方法判断表3中的数据是否符合正态分布。1 丁 P数据1 丁 P数据1 丁 P数据18.141810.38359.6228.301910.38369.7238.442010.43379.7448.452110.48389.78表3 Ryan-Joiner检测样本数据58.622210.50399.9268.772310.56409.9478.822410.58419.9888.822510.69429.9998.902610.774310.02108.972710.804410.04119.012811.254510.06129.282911.444610.16139.343011

19、.684710.22149.413111.844810.32159.443212.044910.36169.513312.125010.37179.543412.51检测过程如下:1 .提出假设:Ho:样本数据服从正态分布;H。:样本数据不服从正态分布2 .计算统计量Rp,其计算步骤为: ? 首先将样本数据按照从小到大的顺序进行排序并编号,排在第i位的数据为X ,如表4中的第2列所示;? 按照式2-1进行样本数据的标准化,如:xi x8.14 10.01bi -S 1.0261.823 ,X2x 8.30 10.01b2 S 1.0261.667其余依次类推,计算结果如表2中的第3列所示? 计

20、算X bi ,如:x1bl8.14 ( 1.823)14.836, x2b2 8.30 ( 1.667)13.833其余依次类推,计算结果如表4中的第4列所示,?计算bi2,如:2222b1( 1.823)23.322, b2( 1.667)2 2.778其余依次类推,计算结果如表4中的第5列所示RPNXibi i 1S2(N 1)bi2i 1? 计算Rp,如:(14.836) ( 13.833)30.482)49.818 0 987,1.0262 (50 1) (3.322 2.7785.937)50.486表4 Ryan Joiner检测过程计算表J 丁 pXibiXibbi218.14-

21、1.823-14.8363.32228.30-1.667-13.8332.77838.44-1.530-12.9152.34248.45-1.520-12.8482.31258.62-1.355-11.6781.83568.77-1.209-10.5991.46178.82-1.160-10.2301.34588.82-1.160-10.2301.34598.90-1.082-9.6291.170108.97-1.014-9.0921.027119.01-0.975-8.7820.9501 丁 pXibixhbi2129.28-0.712-6.6030.506139.34-0.653-6.09

22、90.426149.41-0.585-5.5030.342159.44-0.556-5.2440.309169.51-0.487-4.6350.237179.54-0.458-4.3700.210189.62-0.380-3.6570.144199.72-0.283-2.7470.080209.74-0.263-2.5630.069219.78-0.224-2.1920.050229.92-0.088-0.8700.008239.94-0.068-0.6780.005249.98-0.029-0.2920.001259.99-0.019-0.1950.0002610.020.0100.0980

23、.0002710.040.0290.2940.0012810.060.0490.4900.0022910.160.1461.4850.0213010.220.2052.0920.0423110.320.3023.1180.0913210.360.3413.5340.1161 丁 PXibixhbi23310.370.3513.6390.1233410.380.3613.7430.1303510.380.3613.7430.1303610.430.4094.2700.1683710.480.4584.8010.2103810.500.4785.0150.2283910.560.5365.6610

24、.2874010.580.5565.8780.3094110.690.6637.0850.4394210.770.7417.9780.5494310.800.7708.3160.5934411.251.20913.5961.4614511.441.39415.9451.9434611.681.62819,0112.6494711.841.78421,1183.1814812.041.97923,8223.9154912.122.05724,9254.2295012.512.43730,4825.937合计49,81849,0315,查找临界化根据给定的显著性水平a =0.05 ,查Ryan-J

25、oiner检测临界值表到临界值Rp(50O05) 0.9766;6.作出判定:因为RpRp(n,),则在a水平上,不能拒绝H。,即认为样本数 据服从正态分布。三、K-S检验K-S ( Kolmogorov Smirnov )检验是以两位苏联数学家柯尔莫哥(Kolmogorov )和斯米诺夫(Smirnov )命名的。K-S检验是一种拟合优度检 验,研究样本观察值的分布和设定的理论分布问是否吻合, 通过对两个分布差异 的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。设Fn(x)是一个n次观察的随机样本观察值的累积概率分布函数,即经验分布函数;F0(x)是一个特定的累积概率分布函数

26、,即理论分布函数。定义D Fn(x) Fo(x),显然若对每一个X值来说,Fn(x)与Fo(x)十分接近,也就是差异很小,则表明经验分布函数与特定分布函数的拟合程度很高, 有理由认为样本 数据来自具有该理论分布的总体。K-S检验主要考察的是绝对差数 D Fn(x) F°(x)中那个最大的偏差,即利用下面的统计量作出判断。Dmax maxFn(x) Fo(x)(式 3-1 )K-S检验的步骤为:1 .提出假设:H0:Fn(x) FO(x), Hi : Fn(x) F0(x)2 .计算各个D,找出统计量Dmax3 .查找临界值:根据给定的显著性水平a和样本数据个数n,查单样本K-S检验临

27、界值表可以得到临界值 D4 .作出判定:若Dmax>D(n,),则在a水平上,拒绝H。,即认为样本数据不服从正态分布;若Dmax<D(n,),则不能拒绝H。,即认为样本数据服从正态分布。例2: 35位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来 自正态分布:87, 77, 92, 68, 80, 78, 84, 77, 81,80, 80, 77, 92 ,86 ,76 ,80 ,81 ,75 ,77, 72 ,81,72, 84 ,86, 80 ,68 ,77, 87, 76, 77, 78, 92, 75, 80, 78解:检验过程如下:1 .首先计算样本均值和标

28、准差,经计算样本均值以=79.7429 ,标准差(7=5.93763 ,故做出如下假设:H0 :健康成人男性血糖浓度服均值为79.7429 ,标准差为5.93763的正态分布;H1:健康成人男性血糖浓度不服均值为79.7429,标准差为5.93763的正态分布;2 .计算检验统计量D值表5 K-S检验中D统计量计算表血糖浓度次数累计次数(F)经验分布函数Fn (x) =F/n标准化值Z= (x u ) /s理论分布函数F0 (x) = 6 (Z)Di=| F0 (x) - Fn (x) |68220.0571-1.980.02400.033272240.1143-1.300.09610.018

29、275260.1714-0.800.21220.040876280.2286-0.630.26420.0357776140.4000-0.460.32210.0779783170.4857-0.290.38460.1012806230.65710.040.51730.1399813260.74290.210.58380.1590842280.80000.720.76330.0367862300.85711.050.85400.0031872320.91431.220.88920.0251923351.00002.060.98050.0195? 首先将样本数据按照从小到大的顺序进行排列,并计算每

30、个样本数据出现的次数f和累计次数F ,如表5中的第1、2、3列所示;?其次计算样本数据的经验分布函数'(X),计算公式为:Fn(x):。其中F为样本数据的累计次数,n为样本总数,如:2Fn (68) 一 0.057135'Fn(72)康0143,其余依次类推,计算结果如表5中的第4列所示;?然后进行样本数据的标准化,标准化计算公式为:Z(x)X X苴中S ,x为所有样本数据的平均值,S为所有样本数据的标准差,如:Z(68) 与68 79.74295.937631.98Z(72) 72s72 79.74295.937631.30其余依次类推,计算结果如表 5中的第5列所示;? 接

31、着计算样本数据的理论分布函数F0(x),计算公式为:Fo(x)(Z),其中(Z)为标准正态分布函数,可通 过查找正态分布表获得,如:Fo (68)Z(68)( 1.98) 0.0228,Fo(72)Z(72)( 1.30) 0.0912,其余依次类推,计算结果如表 5中的第6列所示;? 计算K-S的D统计量,计算公式为:Di F°(Xi) Fn(xJ ,例如:DiF0(Xi) Fn(X1) |F0(68) Fn(68)0.0332,D2 匠)七人)|F0(72) Fn(72)0.0182,依次类推,计算结果如表5中的第7列所示。? 最后找出统计量Dmax max(Di) 0.1590

32、3 .查找临界值:根据给定的显著性水平a和样本数据个数n,查单样本K-S检验临界值表可以得到临界值D(n,)。取 0.05,当n=35时,D 0.224,4 .做出判定:由于Dmax= 0.1590< D ,所以,不能拒绝H。,即测试数据服从 正态分布。四、 关于Johnson转换中Z值选取的说明在Johnson转换中,需要根据正态性检验的结果进行 Z值的选取,根据所选取的正态性检当方法的不同,Z值的选取方法也有所不同:(1) Anderson-Darling 检验若选用Anderson-Darling 检验,则应计算转换后数据的 A2值和相应的,2,2A值,从中选取最小的A2值,如果该

33、A2值所对应的A小于A值,则相应的Z 值即为最优的Z值,且所对应的转换形式就是最优的 Johnson转换形式。若无 法找到这样的z值,则说明样本数据不适合进行 Johnson变换。(2) Ryan-Joiner 检验若选用Ryan-Joiner检验,则应计算转换后数据的Rp值,从中选取最大的Rp 值,如果该Rp值大于临界值Rp(n,),则相应的Z值即为最优的Z值,且所对应 的转换形式就是最优的Johnson转换形式。若无法找到这样的z值,则说明样 本数据不适合进行Johnson变换。(3) K-S检验检验若选用K-S检验,则应计算转换后数据的Dmax值,从中选取最小的Dmax值, 如果该Dma

34、x小于临界值D(n,),则相应的Z值即为最优的Z值,且所对应的转 换形式就是最优的Johnson转换形式。若无法找到这样的z值,则说明样本数 据不适合进行Johnson变换。附表一:Anderson-Darling 临界值表0.10.050.0250.010.005,2A0.6310.7520.8731.0351.159附表二:Ryan-Joiner 检验临界值表0.100.050.0150.90260.87930.8260.100.050.0160.91060.88860.837970.91770.89740.849780.9240.90520.860590.92940.9120.87011

35、00.9340.91790.8786110.93810.9230.8861120.94170.92760.8928130.94490.93160.8987140.94770.93520.904150.95030.93840.9088160.95260.94130.9132170.95470.94390.9171180.95660.94630.9207190.95830.94840.924200.95990.95040.927210.96140.95230.9297220.96270.9540.9323230.9640.95560.9347240.96520.95710.9369250.9663

36、0.95840.939260.96730.95970.94090.100.050.01270.96830.96090.9427280.96920.9620.9444290.970.96310.946300.97080.96410.9475310.97160.96510.9489320.97230.9660.9503330.9730.96680.9516340.97360.96760.9528350.97420.96840.9539360.97480.96910.955370.97540.96980.956380.97590.97050.957390.97640.97110.958400.976

37、90.97170.9589410.97740.97230.9598420.97780.97280.9606430.97820.97340.9614440.97860.97390.9621450.9790.97440.9629460.97940.97480.9636470.97980.97530.96420.100.050.01480.98010.97570.9649490.98050.97620.9655500.98080.97660.9661510.98110.9770.9667520.98140.97730.9673530.98170.97770.9678540.9820.97810.96

38、83550.98230.97840.9688560.98250.97870.9693570.98280.97910.9698580.98310.97940.9703590.98330.97970.9707600.98350.980.9711610.98380.98020.9716620.9840.98050.972630.98420.98080.9724640.98440.9810.9728650.98460.98130.9731660.98480.98150.9735670.9850.98180.9738680.98520.9820.97420.100.050.01690.98540.98220.9745700.98560.98250.9748710.98570.98270.9752720.98590.98290.9755730.98610.98310.9758740.98620.98330.9761750.98640.98350.9764800.98710.98440.9777900.98840.98590.97991000.98940.98720.98182000.99430.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论