KruskalWallis秩和检验PPT学习教案_第1页
KruskalWallis秩和检验PPT学习教案_第2页
KruskalWallis秩和检验PPT学习教案_第3页
KruskalWallis秩和检验PPT学习教案_第4页
KruskalWallis秩和检验PPT学习教案_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1KruskalWallis秩和检验秩和检验引例:在一项健康试验中,两组人有两种生活方式,他们的减肥效果如下表:生活方式1 2一个月后减少的重量3.7 7.3 3.7 5.23.0 5.33.9 5.72.7 6.5想要知道的是从这些数据能否得出他们的减肥效果是一样的?第1页/共24页若假定两种减肥的重量都服从正态分布,则该问题可转化为相互独立的两个正态总体均值的比较,所用检验统计量11XYTSmn第2页/共24页若不假定分布,则可用非参数方法检验两总体中位数,uBM符号检验:混合样本,计算出X样本中大于 混合样本中位数的点的个数A, 根据A的大小进行判断。uWMW检验:混合样本,计算个

2、样本中样本点 在混合样本中的秩的和WX,根据 WX的大小进行判断第3页/共24页如果问题变为生活方式1 2 3一个月后减少的重量3.7 7.3 9.03.7 5.2 4.93.0 5.3 7.13.9 5.7 8.72.7 6.5能否从这些数据得出三种减肥效果是一样的?即检验01231123:,HH不全相等第4页/共24页如果假定三种减肥方法体重减少量服从正态分布,则可以利用T统计量进行两两比较,但如果减肥的方法数再增加几种,即数据结构形式为:样本均值 1x2xkx第5页/共24页定义:221()kAiiiSnxx组内差平方和:2211()inkEijiijSxx组间差平方和:总离差平方和:2

3、211()inkTijijSxx222TAESSS第6页/共24页若个总体间存在差异,则组间差应该很大,因此,可取检验统计量2212211()(1)(1)()()()ikiiiAnkEijiijnxxkSkFSNkxxNk 原假设成立时,FF(k-1,N-k),p值定义为P(Ff)第7页/共24页上述方法即为单因素方差分析法。主要检验几种不同的处理处理所产生的结果是否一样。(处理指的是同一个因素所处的不同的试验条件,如几种不同的减肥方法,几种不同的药物,几种不同的广告宣传等等)单因素方差分析的前提假定:1)各总体之间相互独立2)各总体均服从正态分布,且方差相等。第8页/共24页如果不假定总体分

4、布,仅仅假定个总体具有类似的分布(除了位置参数可能不同),这时可以采用非参数的单因素方差分析法。 Kruskal-Wallis秩和检验第9页/共24页一、检验问题检验多个总体中位数是否相等,即012112:.:,.,nnHMMMHMMM不 全 相 等第10页/共24页一、基本原理类似处理两个样本相关性位置检验的秩和检验方法类似,将多个样本混合起来求秩,如果遇到打结的情况,采用平均秩,然后再按样本组求秩和。第11页/共24页计算第j组的样本平均秩: 对秩仿照方差分析原理:得到Kruskal-Wallis的H统计量: 1jnijjijjjRRRnn22111212()3(1)(1)(1)kkiii

5、iiiRHn RRNN NN Nn第12页/共24页二、检验统计量的分布由H的第二个表达式可以看出,H的分布仅与Ri的分布有关,Ri为第i个样本的秩和,当固定各样本容量时,将N个秩分配到各样本中去有 种分配方法,原假设成立时,每种分配都是等可能的,因此(R1,R2,Rk)取任意一组可能值的概率为 ,因此原假设成立时,假设(R1,Rk)的分配值中使得H大于等于他的实现值的组数为m,则H大于等于他的实现值的概率为 。1!.!kNMnn1MmM第13页/共24页当k=3,ni5时,H在原假设下的分布有表可查,(表中n1,n2,n3的值与次序无关);也可以应用R函数计算。(阶乘函数factorial(

6、m)当N较大时,H在原假设成立时,近似服从一个自由度为k-1的卡方分布,即2(1)Hk第14页/共24页三、检验准则由备择假设形式及H的统计意义,当H非常大时应拒绝原假设,因此检验的p值定义为()pP Hh第15页/共24页四、步骤1、计算各样本中样本点在混合样本中的秩2、计算各样本的平均秩3、计算检验统计量H的观测值4、计算p值第16页/共24页引例续:生活方式1 2 3一个月后减少的重量3.7(3.5) 7.3(12) 9.0(14)3.7(3.5) 5.2(7) 4.9(6)3.0(2) 5.3(8) 7.1(11)3.9(5) 5.7(9) 8.7(13)2.7(1) 6.5(10)秩

7、和Ri15 46 44秩平均3 9.2 11第17页/共24页N=14, k=3,计算查表计算,由差值公式可以算出P(H9.4114)=0.009.在显著性水平下,拒绝原假设,即认为三种减肥效果有所不同。第18页/共24页三、对比其中每两组差异对比其中每两组差异的时候,用Dunn(1964年)提出用:*ij1| d |u*/ k(k1) () /ijijdRRSE(1)1112ijN NSEnn其中如果 ,那么表示i和j两组之间存在差异, 第19页/共24页引例中,两两对比的表格如下比较式|Ri/ni-Rj/nj|SE|dij|u0.99171 vs 29.2-3=6.22.64582.343

8、3(2.39,2.40)1 vs 311-3=82.80622.8508(2.39,2.40)2 vs 311-9.2=1.82.80620.6414(2.39,2.40)从表中可以看出2.8508u,即|d13|u,所以第一种方法和第三种方法有明显差异。第20页/共24页练习:下表为三个生产番茄的土地产量,试比较三种番茄品种的产量是否相同品种ABC2.6(9)3.1(13.5)2.5(7.5)2.4(5.5)2.9(11.5)2.2(4)2.9(11.5)3.2(15)1.5(3)3.1(13.5)2.5(7.5)1.2(1)2.4(5.5)2.8(10)1.4(2)秩和4557.517.5秩平均911.53.5第21页/共24页检验统计量22111212()3(1)(1)(1)kkiiiiiiRHn RRNN NN Nn本次实现值为h=45.9583,查表45.95839.92,因此因此拒绝原假设,即认为三种番茄品种的产量是有区别的。第22页/共24页比较式|Ri/ni-Rj/nj|SE|dij|u0.9917A vs B11.5-9=2.52.82840.8839(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论