方差分析对应的非参检验(课堂PPT)_第1页
方差分析对应的非参检验(课堂PPT)_第2页
方差分析对应的非参检验(课堂PPT)_第3页
方差分析对应的非参检验(课堂PPT)_第4页
方差分析对应的非参检验(课堂PPT)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1方差分析对应的非参检验方差分析对应的非参检验Kruskal Wallis 检验(对应单因素)Friedman检验(对应双因素)2Kruskal Wallis 检验l这个检验的目的是看多个总体的位置参数是这个检验的目的是看多个总体的位置参数是否一样。否一样。l方法和方法和Wilcoxon-Mann-Whitney检验的思想检验的思想类似。类似。l假定有假定有k个总体。个总体。l先把从这个先把从这个k个总体来的样本混合起来排序,个总体来的样本混合起来排序,记各个总体观测值的秩之和为记各个总体观测值的秩之和为Ri,i=1,k。l显然如果这些显然如果这些Ri很不相同,就可以认为它们很不相同,就可以认

2、为它们位置参数相同的零假设不妥(备选假设为各位置参数相同的零假设不妥(备选假设为各个位置参数不全相等)。个位置参数不全相等)。3Kruskal Wallis 检验检验l注意这里所说的位置参数是在下面意义上的注意这里所说的位置参数是在下面意义上的q qi;由于它在分布函数由于它在分布函数Fi(x)中可以和变元中可以和变元x相加成相加成为为F(x+q qi)的样子,所以称的样子,所以称q qi为位置参数,即为位置参数,即Fi(x)=F(x+q qi)l形式上,假定这些总体有连续分布形式上,假定这些总体有连续分布F1,Fk,零假设为零假设为H0:F1=Fk,备选假设为备选假设为Ha:F(x+q qi

3、),i=1,k,这些参数这些参数q qi并并不相等不相等4Kruskal Wallis 检验检验lKruskal-Wallis检验统计量为检验统计量为公式中公式中n ni i为第为第i i个样本量,而个样本量,而N N为各个样本量之和(总为各个样本量之和(总样本量)。样本量)。如果观测值中有大小一样的数值,这个公式会有稍如果观测值中有大小一样的数值,这个公式会有稍微的变化。微的变化。这个统计量在位置参数相同的零假设下有渐近的自这个统计量在位置参数相同的零假设下有渐近的自由度为由度为k-1k-1的的c c2 2分布。分布。Kruskal-WallisKruskal-Wallis检验仅仅要求各个总

4、体变量有相似检验仅仅要求各个总体变量有相似形状的连续分布。形状的连续分布。21123(1)(1)kiiiRHNN Nn5Kruskal Wallis 检验案例检验案例housel为了调查三个地区的房价是否类似,在每个地区抽样,得为了调查三个地区的房价是否类似,在每个地区抽样,得到三个样本量分别为到三个样本量分别为2020、3030、2525的房价样本。利用的房价样本。利用SPSSSPSS软软件容易得到下面的检验结果:件容易得到下面的检验结果:Test Statisticsb,c10.3652.006.005a.003.007Chi-SquaredfAsymp. Sig.Sig.Lower Bo

5、undUpper Bound99% ConfidenceIntervalMonte CarloSig.PRICEBased on 10000 sampled tables with starting seed2000000.a. Kruskal Wallis Testb. Grouping Variable: GROUPc. 6Kruskal Wallis 检验检验SPSS实现实现l使用使用house.sav数据。数据。l选项为选项为AnalyzeNonparametric TestsK Independent Samples。l把变量(这里是把变量(这里是price)选入)选入Test Va

6、riable List;再把数据中用再把数据中用1、2、3来分类的变量来分类的变量group输入输入Grouping Variable,在,在Define Groups输入输入1、2、3。l在下面在下面Test Type选中选中Kruskal-Wallis H。l点点Exact时打开的对话框中可以选择精确方法时打开的对话框中可以选择精确方法(Exact),),Monte Carlo抽样方法(抽样方法(Monte Carlo)或用于大样本的渐近方法(或用于大样本的渐近方法(Asymptotic only)。)。l最后最后OK即可即可7Jonckheere-TerpstraJonckheere-T

7、erpstra检验检验l这个检验处理的问题和这个检验处理的问题和Kruskal-WallisKruskal-Wallis检检验类似,零假设都是各个总体的位置参数验类似,零假设都是各个总体的位置参数相同,但这里的相同,但这里的备选假设为各个总体的位备选假设为各个总体的位置参数按升幂排列置参数按升幂排列(如为降幂排列,可把(如为降幂排列,可把总体编号颠倒顺序即为升幂排列)。总体编号颠倒顺序即为升幂排列)。l注意这里所说的位置参数和前面的注意这里所说的位置参数和前面的Kruskal-WallisKruskal-Wallis检验中的位置参数意义一检验中的位置参数意义一样。样。8Jonckheere-T

8、erpstraJonckheere-Terpstra检验检验lJonckheere-TerpstraJonckheere-Terpstra检验先在每两个样本检验先在每两个样本所有观测值对之间比较,计算第所有观测值对之间比较,计算第i i个样本观个样本观测值中小于第测值中小于第j j个样本观测值的对子数:个样本观测值的对子数:#(,1,.,1,.,)ijikjlilUXXkn lnijijJU9Jonckheere-TerpstraJonckheere-Terpstra检验检验househouseJonckheere-Terpstra Testa3751229.500925.000102.299

9、2.977.003.003.001.000Number of Levels inGROUPNObserved J-T StatisticMean J-T StatisticStd. Deviation of J-TStatisticStd. J-T StatisticAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)Exact Sig. (1-tailed)Point ProbabilityPRICEGrouping Variable: GROUPa. 10Jonckheere-TerpstraJonckheere-Terpstra检验检验SPSSSPSSl

10、使用使用house.sav数据。数据。l选项为选项为AnalyzeNonparametric TestsK Independent Samples。l把变量(这里是把变量(这里是price)选入)选入Test Variable List;再把数据中用再把数据中用1、2、3来分类的变量来分类的变量group输入输入Grouping Variable,在,在Define Groups输入输入1、2、3。l在下面在下面Test Type选中选中Jonckheere-Terpstra。l在点在点Exact时打开的对话框中可以选择精确时打开的对话框中可以选择精确方法方法(Exact),),Monte C

11、arlo抽样方法(抽样方法(Monte Carlo)或用于大样本的渐近方法(或用于大样本的渐近方法(Asymptotic only)。)。l最后最后OK即可即可11Friedman秩和检验秩和检验双因素双因素l参数统计中讨论了两因子试验设计数据的参数统计中讨论了两因子试验设计数据的方差分析,那里所用的方差分析,那里所用的F F检验需要假定总体检验需要假定总体的分布为正态分布。的分布为正态分布。l有 一 种 非 参 数 方 差 分 析 方 法 , 称 为有 一 种 非 参 数 方 差 分 析 方 法 , 称 为Friedman Friedman (两因子)秩和检验,或(两因子)秩和检验,或Fri

12、edmanFriedman方差分析。方差分析。它适用于两个因子的各种水平的组合都有一个观它适用于两个因子的各种水平的组合都有一个观测值的情况。测值的情况。12Friedman秩和检验秩和检验l假定第一个因子有假定第一个因子有k k个水平(称为处理,个水平(称为处理,treatmenttreatment),第二个因子有),第二个因子有b b个水平(称个水平(称为区组);因此一共有为区组);因此一共有k kb bkbkb个观测值。个观测值。l这里之所以称一个因子为处理,是因为这这里之所以称一个因子为处理,是因为这是我们想要看该因子各水平是否对试验结是我们想要看该因子各水平是否对试验结果有显著的不同

13、。果有显著的不同。l而另一个因子称为区组,不同的区组也可而另一个因子称为区组,不同的区组也可能对结果有影响。下面是一个例子。能对结果有影响。下面是一个例子。13Friedman秩和检验案例秩和检验案例fertl这里有三种肥料作为第一个因子(肥料因子)的三个水平;这里有三种肥料作为第一个因子(肥料因子)的三个水平;而四种土壤为第二个因子(土壤因子)的四个水平。感兴而四种土壤为第二个因子(土壤因子)的四个水平。感兴趣于是否这三种肥料对于某作物的产量有区别。称肥料因趣于是否这三种肥料对于某作物的产量有区别。称肥料因子为处理,而土壤因子为区组。(单位公斤)。子为处理,而土壤因子为区组。(单位公斤)。肥

14、料种类肥料种类肥料肥料A肥料肥料B肥料肥料C土土壤壤类类型型土壤土壤1224668土壤土壤2253648土壤土壤3182120土壤土壤411131914Friedman秩和检验秩和检验lFriedman秩和检验是关于位置的,和秩和检验是关于位置的,和Kruskal-Wallis检验类似,形式上,假定这些样本有连检验类似,形式上,假定这些样本有连续分布续分布F1,Fk,零假设为,零假设为H0:F1=Fk,备选,备选假设为假设为Ha:Fi(x)=F(x+q qi),i=1,k,这里,这里F为为某连续分布函数,而且这些参数某连续分布函数,而且这些参数q qi并不相等。并不相等。l由于区组的影响由于区

15、组的影响, 要首先在每一个区组中计算各要首先在每一个区组中计算各个处理的秩;个处理的秩;l再把每一个处理在各区组中的秩相加再把每一个处理在各区组中的秩相加.l如果如果Rij表示在表示在j个区组中第个区组中第i个处理的秩。则秩按个处理的秩。则秩按照处理而求得的和为照处理而求得的和为 1,1,.,biijjRRik15Friedman秩和检验秩和检验l这样做的目的是在每个区组内比较处理。这样做的目的是在每个区组内比较处理。例如例如, 同个年龄段中比较药品的疗效比不分年龄来比较同个年龄段中比较药品的疗效比不分年龄来比较疗效要合理;疗效要合理;在同一个部位比较不同的材料要比混合起来比较要合在同一个部位

16、比较不同的材料要比混合起来比较要合理等等。理等等。l这里要引进的这里要引进的Friedman统计量定义为统计量定义为l第一个式子表明,如果各个处理很不一样,和的第一个式子表明,如果各个处理很不一样,和的平方就会很大,结果就显著。平方就会很大,结果就显著。l第二个公式是为了计算方便而导出的。它有近似第二个公式是为了计算方便而导出的。它有近似的(有的(有k-1个自由度的)卡方分布。个自由度的)卡方分布。 221112(1)123 (1)(1)2(1)kkiiiib kQRRb kbk kbk k16Friedman秩和检验案例秩和检验案例fertRanks1.002.252.75ABCMean RankTest Statisticsa46.5002.039.042.037NChi-SquaredfAsymp. Sig.Exact Sig.Point ProbabilityFriedman Testa. 17Friedman秩和检验秩和检验SPSS实现实现l使用使用fert.sav数据。数据。l选项为选项为A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论