多独立样本Kruskal-Wallis检验的原理及其实证分析_第1页
多独立样本Kruskal-Wallis检验的原理及其实证分析_第2页
多独立样本Kruskal-Wallis检验的原理及其实证分析_第3页
多独立样本Kruskal-Wallis检验的原理及其实证分析_第4页
多独立样本Kruskal-Wallis检验的原理及其实证分析_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多独立样本Kruskal-Wallis检验的原理及其实证分析摘要:阐述了多独立样本Kruskal-Wallis检验的基本思想和如何构造K-W统计量,运用多独立样本Kruskal-Wallis检验方法进行了实例分析,并进行H检验的事后比较,给出应用MathematicalSPSS做出的相关图形。关键词:Kruskal-Wallis检验;K-W统计量;Mathematica中图分类号:O212.7非参数检验在总体分布未知时有很大的优越性。这时如果利用传统的假定分布已知的检验,就会产生错误甚至灾难。非参数检验总是比传统检验安全。但是在总体分布形式已知时,非参数检验就不如传统方法效率高这是因为非参数方

2、法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。但非参数统计在总体未知时效率要比传统方法高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定1。笔者就Kruskal-Wallis检验方法及其在经济研究中的应用进行分析,以期对经济分析领域的实证研究提供借鉴。1 多独立样本Kruskal-Wallis检验的基本思想多独立样本Kruskal-Wallis检验又称H检验)的实质上是两独立样本时的Mann-WhitneyU检验在多个独立样本下的推广,用于检验多个总体的分布是否存在显著差异。其原假设是:多个独立样本来自的多个总体的分布无显著差异。多独立样本K

3、ruskal-Wallis检验的基本思想是:首先,将多组样本数混合并按升序排序,求出各变量值的秩;然后,考察各组秩的均值是否存在显著差异。如果各组秩的均值不存在显著差异,则认为多组数据充分混合,数值相差不大,可以认为多个总体的分布无显著差异;反之,如果各组秩的均值存在显著差异,则是多组数据无法混合,有些组的数值普遍偏大,有些组的数值普遍偏小,可认为多个总体的分布存在显著差异,至少有一个样本不同于其他样本。为研究各组的秩差异,可借鉴方差分析的方法。方差分析认为,各样本组秩的总变差一方面源于各样本组之间的差异寿间差)另一方面源于各样本组内的抽样误差组内差)。如果各样本组秩的总变差的大部分可由组间差

4、解释,则表明各样本组的总体分布存在显著差异;反之,如果各样本组秩的总变差的大部分不能由组间差解释,则表明各样本组的总体分布没有显著差异。由上可以得出多独立样本非参数检验的目的曲独立样本数据推断多个总体的分布是否存在显著差异)基本假设H0:多个总体分布无显著差异)数据要求样本数据和分组标志)。2 构造K-W统计量基于以上思路可以构造K-W统计量,即收稿日期2013-0374基金项目广东省教育科学十二五”规划项目2012JK078)广东女子职业技术学院项目0XB201206)作者简介张林泉Q965-)男,广东化州人,副研究员,硕士,研究方向应用统计分析,数量经济学。以消除量纲的影响秩总平方和的平均

5、=1样右1驾!勺自电度为n-1。所以n+1Rj-唇n+1-1=wi2,nn+1)n-1kinin-2n-1i=1n-1162n+1)2G+1)_n12n+1)3)n+1)2因此,Kruskal-Wallis秩和统计量K-W为k秩总平方和的平均K.W=秩的组间平方和nn+1尸=Eni1-2n+12n+1)22i=1nrRi-3n+1)i4)1)K-W秩的组间脚辟需要检验的原假设为各组之间不存在差异,或者说各组的样本来自的总体具有相同的中心或均值或中位数。在原假设为真时.各伊.样本的秩平均应该与全体样本的秩平均彳出二n+1平方和为组间平方七口1nii=1ni,可其中k为样本组数,n是总样本量,ni

6、是第中的秩总和,Rij是第i组样本中的i组的样本量;Ri是第i组样本恰好是刻画这种接近程度的一个统计量,除以全体样本秩方差的平均第j个观察值的秩值如果样本中存在结值,校正系数C为6),需要调整公式34)中的K-W统计量CM-LJLln0-n其中寸第j个结值的个数。调整后的KWc统计量为KWc=KW/C6)如果每组样本中的观察数目至少有5个,那么样本统计量KWc非常接近自由度为k-1的卡方分布。因止匕,用卡方分布来决定KWc统计量的检验2-3。3H检验后比较若检验结果拒绝无效假设,认为各总体的分布位置不全相同,可进一步两两比较。H检验后的两两比较公式>伊新tHok52L7)姨12n-K)_

7、ninj其中:尔"it.)等于第i组与第j组秩均值差的临界值。ni是第i组的样本量,nj是第j组的样本量4-5。4应用实例表1来自四个不同城市儿童身高及希望对A、B、C、D四个统一秩值城市的周岁儿童身高进flAflBfl?fl/行比较分析,采用独立抽fl17277147S样的方式获得四组独立样本,数据来源见文献6把K个样本的观察的值混合评2?4S12.S6917S12.S727614.S7?7818.747920.7477697710.S7810.S7814.S7016.71187118722447fla%。Afla72%oBfla41%o?fla79%oDfla18f%M-4l14

8、.4%°Bfl8%o?fl1S.8%oDfl?.6秩。首先,必须将来自四个城市的20名儿童统一按身高编排秩,见表1中的第3、5、7、9列所示。计算每个样本的秩总和。n1=5,n2=5,n3=5,n4=5,n=20,可得R1=72,R2=41,R3=79,R4=18,k=4,H0:四个总体的身高分布是相同的。计算K-W检验统计量。用4)式计算K-W统计量为222220215555K-W=127+-320+1)13.742)41)79)Q8)用5)式计算校正系数C,从表1可见,身高相等秩值的个数分别为71cm3个,72cm3个,74cm2个,75cm2个,76cm2个,78cm3个。所以

9、CM-33-3+33-3+23-2+23-2+23-2+33-3)/203-20)=0.988722调整后的KWc=KW/C=13.74/0.988722=13.89962o检验结论。查表可知道,自由度为k-1=3的卡方分布,在=0.05显著水平下,分布的右尾临界值为2R053)3.815团图1)用于13.89962>7.8145,所以拒绝原假设。认为四个城市儿童身高的总体分布存在显著差异。因此,秩和最低的D组至少与秩和最高的C组是不同的。由图2可以看出B组、D组的中位数低于人员总汇的中位数;A组、C组的中位数高于人员总汇的中位数independent-SamplesMedianTest

10、图2四个城市儿童身高中位数对比盒形图KruskaLWallis秩和检验给出的结果只能表明各样本总体上是否存在差异,当总体上检验表明存在差异时,具体是哪几个组间存在差异却不能给出,这种情况下就需要进一步的两两比较7。由7)式得到会Crit.)=Z1199姨2020+1)20-1-13.9)/122d4)XQ/5+1/5)=4.47825结语文章阐述了多独立样本Kruskal-Wallis检验的基表2H检验后本思想和如何构造KW统计量,运用多独立样本比较Kruska-Wallis检验分析了四个城市的周岁而儿童身高的差异性,研究发现:四个城市的周岁儿童身高存?B?B6.2*?-1.4-7.6*D10

11、.8*4.6*12.2*在显著差异°H检验后比较更表2)除了A、C没有显著差异外,其余两城市比较均显著差异。并给出应用Mathematical和SPSS故出的相关图形参考文献:1吴喜之.统计学:从数据到结论M.3版.北京:中国统计出版社,2006:35,179-193.2李金昌,苏为华.统计学M.3版.北京:机械工业出版社,2012:336-340.3 RonLarson,BestyFarber.基础统计学M.4版.北京:中国人民大学出版社,2010:397-400.4 ConoveWJ.PracticalNonpaametricStatisticsM.2thed.NewYork:J

12、ohnWiley&SonsInc,1980.5ConoveWJ.PracticalNonpaametricStatisticsM.3thed.NewYork:JohnWiley&Sons,Inc,1999.6薛微.统计分析与SPSS的应用M.3版.北京:中国人民大学出版社,2011:182-217.7何晓群.多元统计分析M.3版.北京:中国人民大学出版社,2012.8StephenWolfram.TheMathematicaBookM.5thed.Wolfram:WolframMedia,2003.HosoyaindexofQuadrangularchainsTIANWenwe

13、n,TIANShuangliangSchoolofMathematicsandComputeScience,NorthwestUniversityforNationalities,Lanzhou730030,China)Abstract:Quadrangularchainisaconnectedgraphconsstingofseveralunitsquaresequences,ofwhichanytwoadjacentsquareshaveonlyonecutedge.ThispaperpresentstheHosoyaindexanditscomputationalformulaofQua

14、drangularchainsmadeupbynunitsquaresequenceundertwonon-isomorphcconnectedpositions.Keywords:Quadrangularchains;Hosoyaindex;Fibonaccinumber化接第16页)PrinciplesofKruskal-WallistestanditsempiricalanalysisZHANGLinquanCenterofInformationResource,GuangdongWomen'sPolytechnicCollege,Guangzhou511450,China)Abstract:AfterdiscussngthebasicprinciplesofKruskal-WallistestandtheconstructonofK-Wstatistic,thispapera

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论