第十一章 非参数检验_第1页
第十一章 非参数检验_第2页
第十一章 非参数检验_第3页
第十一章 非参数检验_第4页
第十一章 非参数检验_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十一章第十一章 非参数检验方法非参数检验方法李金德李金德一、非参数检验一、非参数检验(一)什么是(一)什么是“非参数非参数”非参数模型:非参数模型:缺乏总体分布模式的信息缺乏总体分布模式的信息。(二)非参数检验的定义(二)非参数检验的定义非参数检验:非参数检验:不需要假设总体是否为正态分布或不需要假设总体是否为正态分布或方差是否为齐性的假设检验方差是否为齐性的假设检验称非参数检验。称非参数检验。第一节 非参数检验的基本概念及特点(三)非参数检验的优点和缺点(三)非参数检验的优点和缺点1、优点:、优点:n一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广适用面较广。n计算简便计算

2、简便。2、缺点:、缺点:n统计效能远不如参数检验方法。统计效能远不如参数检验方法。由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。 (四)非参数检验的特点(四)非参数检验的特点1、它不需要严格的前提假设;2、特别适用于顺序数据;3、适用于小样本,且方法简单;4、最大的不足是不能充分利用资料的全部信息;5、不能处理“交互作用”,即多因素情况。常用非参常用非参数检验数检验两样本差两样本差异比较异比较独立样本独立样本相关样本相关样本秩和检验法秩和检验法中数检验法中数检验法

3、多样本差多样本差异比较异比较完全随机设计:克完全随机设计:克瓦氏单向方差分析瓦氏单向方差分析随机区组设计:弗里德曼双向等级方差分析随机区组设计:弗里德曼双向等级方差分析符号检验法符号检验法符号等级检验法符号等级检验法 一、秩和检验法秩和检验法 秩和检验法秩和检验法也叫Mann-Whitney-Wilcoxon检验,简称M-W-W检验,也称Mann-Whitney U检验。 秩和秩和即秩次的和或等级之和。 与参数检验法中独立样本的独立样本的t检验法相检验法相对应。;当两个样本都为定序(顺序)变量定序(顺序)变量时,也需使用秩和法进行差异显著性检验。第二节 两个独立样本的非参数检验方法(一)秩统计

4、量(一)秩统计量 秩统计量指样本数据的排序等级秩统计量指样本数据的排序等级。 假设从总体中反复抽取样本,就能得到一个对应于样本容量n1和n2的秩和U的分布。这是一个间断而对称的分布。 当n1和n2都大于10时,秩和的U分布近似于正态分布。(二)计算过程(二)计算过程1、小样本:两个样本容量均小于、小样本:两个样本容量均小于10(n1 10,n2 10)(1)排序:)排序:所有数据混合由小到大等级排列;(2)计算统计量)计算统计量T:把样本容量较小的样本中各数据的等级相加,以T表示;如果两样本容量相等,则取等级和较小的为T。(3)比较与决策:)比较与决策:把T值与秩和检验表(附表14)中的临界值

5、比较,若T T1或TT2,则表明两样本差异显著;若T1 T T2,则意味着两样本差异不显著。例111:在一项关于模拟训练的实验中,以技工学在一项关于模拟训练的实验中,以技工学校的学生为对象,对校的学生为对象,对5名学生用针对某一工种的模拟名学生用针对某一工种的模拟器进行训练,内外让器进行训练,内外让6名学生下车间直接在实习中训名学生下车间直接在实习中训练,经过同样的时间后对两组人进行该工种的技术操练,经过同样的时间后对两组人进行该工种的技术操作考核,结果如下:作考核,结果如下:模拟器组:模拟器组:56,62,42,72,76实习组:实习组: 68,50,84,78,46,92假设两组学生初始水

6、平相同,则两种训练方式有无显假设两组学生初始水平相同,则两种训练方式有无显著差异?著差异?(1)建立假设)建立假设 H0: ,即两样本无显著差异 H1: ,即两样本有显著差异(2)计算统计量)计算统计量1)将数据从小到大排列,见下表。2)混合排列等级,即将两组数据视为一组进行等级排列,见上表。3)计算各组的秩和,并确定值,即 T =min (T1,T2)=min(25,41)=2521RR21RR表11-1 两种训练方式的成绩 考核成绩考核成绩成绩排列成绩排列等级等级等级和等级和模拟器组模拟器组(5人)人)56421T1256256442625 72727 76768实习组实习组68462T2

7、41(6人)人)50503 84686 78789 468410 929211 (3)比较与决策)比较与决策 查秩和检验表,当n1=5,n2=6, T1=19,T2=41, 因为 192541, 即T1TT2, 所以接受虚无假设,拒绝研究假设,差异不显著。说明两种训练的成绩无显著差异。n其检验值检验值为:n 2、大样本:、大样本:当n1和n2都大于10时,秩和的U分布近期近似正态分布,其平均数平均数为:n其标准差其标准差为:21211nnnT1212121nnnnTTTTZ例112:对某班学生进行注意稳定性实验男生与女生的实验结果如下,试检验男女生之间注意稳定性有否显著差异? 男生:(n1=1

8、4) 19,32,21,34,19,25,25,31,31,27,22,26,26,29 女生:(n217) 25,30,28,34,23,25,27,35,30,29,29,33,35,37,24,34,32n检验过程:(1)建立假设)建立假设 H0: H1:(2)计算统计量)计算统计量1)求秩和。先混合排列等级,再计算和。排序如下:男生:女生: ,17 5 .11 5 .11 4 5 .13 5 .21 5 .21 5 . 8 5 . 8 5 . 1 27 3 5 .23 5 . 15 .23 27 6 31 5 .29 25 17 17 5 .19 5 .29 5 .13 5 . 8 5

9、 27 15 5 .19 5 . 8,21RR21RR174 175 .115 .1145 .135 .215 .215 . 85 . 8 5 . 1 273 5 .23 5 . 1T2)求Z值3)比较与决策)比较与决策 ,pMdn 的次数10515 r0.05。所以差异不显著,接受虚无假设,不能认为新法显著优于传统方法。r与临界值(CR)比较P值差异显著性rr0.05r0.01rr0.05rr0.01P0.050.01P0.05P0.01不显著显 著极显著2、大样本(样本容量、大样本(样本容量N25时)时) n+和n-服从二项分布,当N25时,将二项分布近似看成正态分布。根据二项分布的原理,

10、有: 21qpNNp2122121NNNpq检验统计量:rZ22NNr 校正公式:2205. 0NNrZ例115 :在教学评价活动中,要求学生对教师的教学进行7点评价(即17分),表格(P348)是某班学生对一位教师期中与期末的两次评价结果,试问两次结果差异是否显著?解:解: 1)建立假设)建立假设单侧检验H0:P+P-Ha: P+ P-2)确定正、负号数目,正负号总数)确定正、负号数目,正负号总数N的的r值值 。 统计符号总数N。符号总数中不包含0,只包括正号和负号个数和,即 = 8 + 19 = 27 将n+和n-中的较小者记为r,即nnN8)19, 8min(r3)计算统计量计算统计量4

11、)比较与决策比较与决策 ,p0.05,接受虚无假设,差异不显著。不能认为期中、期末两次评价结果有显著差异。92. 12/272/27)5 . 08(Z2/05. 092. 1ZZ二、符号等级检验法二、符号等级检验法(一)适用条件(一)适用条件 维尔克松符号等级检验法(Wilcoxon Signed-Rank test)又称符号秩和检验。其使用条件与符号检验法相同,也适合于配对比较,但它的精度比符号检验法高,因为它不仅仅考虑差值的符号还同时不仅仅考虑差值的符号还同时考虑差值大小考虑差值大小。 目的是推断配对样本差值的总体中位数总体中位数是否和0有差别,即推断配对的两个相关样本所来自的两个推断配对

12、的两个相关样本所来自的两个总体中位数是否有差别。总体中位数是否有差别。(二)步骤(二)步骤1、N 25(小样本小样本)(1)把相关样本对应数据之差值按绝对值绝对值从小到大作等级排列(注意差值为零时,零不参加等级排列);(2)在各等级前面添上原来的正负号;(3)分别求出带正号的等级和(T)与带负号的等级和(T),取两者之中较小的记作T;(4)根据)根据N,T查符号等级检验表,当查符号等级检验表,当T大于表中大于表中临界值时表明差异不显著;小于临界值时说明差临界值时表明差异不显著;小于临界值时说明差异显著。异显著。例11-6:某幼儿园对10名儿童在刚入园时和入园一年后均进行了血色素检查,结果如下,

13、试问两次检查有否明显变化?(p349)解:1)建立假设)建立假设 H0: H1: .2)求成对数据的差数求成对数据的差数D值值,见上表。3)按)按 排列顺序(不包括排列顺序(不包括0)并添加符号。并将原来差)并添加符号。并将原来差值的正负号添加在等级前。值的正负号添加在等级前。4)计算正号等级和(计算正号等级和(T+)与负号等级和()与负号等级和(T-),并取),并取较小者为值较小者为值,即 T1+6+2+514 ;T+=8+4+3+7+9=31 =TT TTDTTT,min1414,31min5)根据符号总数,查符号秩序临界值表,进行比较与根据符号总数,查符号秩序临界值表,进行比较与决策决策

14、: 当 N=5+4时, 。因为,T=146,p0.05,接受虚无假设,拒绝研究假设,差异不显著。说明入园时与入园一年幼儿的血色素没有明显变化。T与临界值(CR)比较P值差异显著性TT0.05T0.01TT0.05TT0.01P0.050.01P0.05P0.01不显著显 著极显著nnN605. 0T2、N25(大样本) 当N25时,一般认为T的分布接近正态分布,其平均数和标准差分别为:TTTTNNNNN检验进行TZZ24121,4)1( 若出现相同等级较多(超过25%)时,应采用校正统计量Z: 48)(24)12)(1(5 .04/)1(3jjcttnnnnnTZ例117:对例115进行符号等

15、级检验。序号期中x期末yX-y秩次添号136-321-21227-527-2735416+6415-424.5-24.553216+6623-16-6713-215.5-15.5837-424.5-24.593216+61013-215.5-15.511330001212-16-6135416+61426-424.5-24.51536-321-211614-321-211753215.5+15.51812-16-61946-215.5-15.5203216+62137-424.5-24.52212-16-62313-215.5-15.52446-215.5-15.52535-215.5-15.

16、52653215.5+15.5274316+62856-16-6解:1)建立假设)建立假设 H0:正负号等级和无显著差异。即入园时和入园一年没有显著差异, 。 H1:正负号等级和有显著关系。即入园时和入园一年有显著差异, 。2)确定)确定T值值 T67,T311TT67),min(TTTT TT3) 计算统计量计算统计量 求均数求均数 求标准差 求Z值 ,p0.05,拒绝虚无假设,接受研究假设,差异显著。说明对该教师的两次评价有显著差异。1894) 127(27TU6 .4124) 154() 127(27T93. 26 .4118967Z93. 2Z96. 1205. 0Z一、克瓦氏单向方差

17、分析一、克瓦氏单向方差分析(一)适用条件(一)适用条件 当实验是按完全随机方式分组设计完全随机方式分组设计,且所得数据资料又不符合参数方法中的方差分析不符合参数方法中的方差分析所需假设条件时,可进行克瓦氏单向方差分析,即Kruskal and Wallis方差分析,也称H检验检验。第三节第三节 等级方差分析等级方差分析(二)检验步骤(二)检验步骤 1、当K=3 且ni5时K1iiii12nNN R n ;K13112总样本量,某组数据的等级和;某组的样本容量;分组数式中KiiiNnRNNH例118: 有 11名学生分别来自教师、工人和干部家庭,进行创造力测验的结果如下,试问家长的职业与学生创造

18、力有否某些联系?1)将数据进行排序,计算)将数据进行排序,计算 ,见下表。,见下表。R教师家庭工人家庭干部家庭测验分数等级测验分数等级测验分数等级1281190489311410915801103810691017926852373718181111R2)计算统计量)计算统计量3)进行统计决策进行统计决策 查表17,当n1=5,n2=3,n3=3时, ,接受原假设,说明家长的职业与学生创造力无显著关系。37. 2123)311318537(121112) 1( 3) 1(1222212NnRNNHkii51. 505. 0H05.0HH 2、大样本(、大样本(K3或或n i5时)时) 先计算出

19、H值,然后查 表,df=K-1,进行统计决策。 2例119: A、B、C、D四所学校分别选出一部分人作为本校代表队参加物理竞赛,结果如下。问四所学校成绩有否显著差异? 1)将数据进行排序,计算)将数据进行排序,计算 ,见上表。,见上表。2)计算统计量)计算统计量3)进行统计决策,进行统计决策, 查 表,当df=4-1=3时, , ,拒绝原假设,说明四个代表队成绩有显著差异。R281. 7205. 05 .27343)1057813282367136(343312) 1( 3) 1(12222212NnRNNHkii205. 0H(一)适用条件(一)适用条件 弗里得曼双向等级方差分析(弗里得曼双

20、向等级方差分析(Friedman)可解决随机区组实验设计的一些非参数检验问题。(二)检验步骤(二)检验步骤 1、将每一区组的K个数据(K为实验处理数)从小到大排出等级; 2、计算每种实验处理n个数据(n为区组数)等级和,用Ri表示; 二、弗里得曼双向等级方差分析二、弗里得曼双向等级方差分析13112122KnRKnKKiiT3、代入公式例11-10: 研究A、B、C三种实验处理是否有差异,选5个被试进行实验,用随机区组设计,即每个被试视为一个区组,分别先后接受A、B、C三种实验处理,结果如下(已经将每一区组的结果作了等级排列,故所列数据是表示等级的),试问三种实验处理的差异是否显著? n1)将数据在各区组内排序,计算 ,见上表n2)计算统计量 =3.13)进行统计决策 R131121

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论