第章两样本的非参数检验课件_第1页
第章两样本的非参数检验课件_第2页
第章两样本的非参数检验课件_第3页
第章两样本的非参数检验课件_第4页
第章两样本的非参数检验课件_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 两样本非参数检验在单样本非参数检验中,研究者可以解决诸如一个总体的中心是否等于一个已知的值,某个随机变量是否服从某种特定的分布,某个序列是否具有随机性等问题。然而在实际中,更受注意的往往是比较两个总体的位置参数。比如,两种训练方法中哪一种更出成绩,两种汽油中哪一种污染更小,两种营销策略中哪种更有效,两种药物哪一种的治疗效果更好等等,这就需要使用两样本的非参数方法,第三章中所介绍的方法大都适用。1编辑版pppt第三章 两样本非参数检验在单样本非参数检验中,研究者可以解决在抽取样本时有两种形式:相关的和独立的。若第一次抽样的所有样本某一属性的测量结果,不影响第二次抽样的所有样本同一属性的测

2、量结果,则这种抽样是独立的,若第一次抽样的测量结果影响另一次抽样测量结果,则这种抽样是相关的。为了避免或者尽量减少由于其他因素影响引起的两组之间的附加差异,得到更准确地结论,研究中通常采用两个相关的样本。2编辑版pppt在抽取样本时有两种形式:相关的和独立的。若第一次抽样的所有样相关样本的获取有两种方式:1.让每一研究对象做自身的对照者2.将研究对象两两配对,分别给每一对两个成员以不同的处理。在进行配对时,应让每一对在可能影响处理结果的其他因素方面尽量相似,以尽量避免和减少附加差异。一般来说,用研究对象自身作为对照者要优于配对方法,因为在配对过程中很难完全控制住其他的影响因素。两个相关样本的非

3、参数检验方法主要有符号检验法和Wilcoxon符号秩和检验法。3编辑版pppt相关样本的获取有两种方式:3编辑版pppt利用两个相关样本进行研究,对于某些问题是很方便的。但现实中要做到很好配对并不容易。若由于配对不当或无法配对,就要使用两个独立样本的非参数检验方法:Brown-Mood检验法,Mann-Whitney-Wilcoxon检验法,Wald-Wolfowitz游程检验法, 检验法,Kolmogorov-Smirnov检验法等。两个独立样本可以各自从两个总体中随机抽选获得,也可以对随机抽样的一个样本诸元素随机分别实施两种处理而形成。4编辑版pppt利用两个相关样本进行研究,对于某些问题

4、是很方便的。但现实中要本章主要介绍两个相关样本和两个独立样本的非参数检验方法,包括:3.1 符号检验法(相关样本)3.2 Wilcoxon符号秩和检验法(相关样本)3.3 Brown-Mood检验法(独立样本)3.4 Mann-Whitney-Wilcoxon检验法(独立样本)3.5 Wald-Wolfowitz游程检验法(独立样本)3.6 检验法(独立样本)3.7 Kolmogorov-Smirnov检验法(独立样本)5编辑版pppt本章主要介绍两个相关样本和两个独立样本的非参数检验方法,包括3.1 符号检验法(Sign Test)3.1.1 基本思路与检验步骤(同第二章)设有两个连续总体x

5、,y,累积的分布函数分别为F(x),F(y)。随机的分别从两个总体中抽取数目为n的样本数据, 和 将它们 配对得到 若研究的问题是它们是否具有相同的分布,即F(x)=F(y)是否成立,由于x,y的总体分布未知,而研究者也不关心它们的具体分布形式,只是关心分布是否相同,因而可以采用位置参数进行判断。若两个样本的总体具有相同的分布,则中位数应相同,即在n个数对中,Xi大于yi的个数与Xi小于yi的个数应相差不大。6编辑版pppt3.1 符号检验法(Sign Test)3.1.1 基本思检验步骤:(1)提出假设7编辑版pppt检验步骤:(1)提出假设7编辑版pppt(2)计算检验统计量8编辑版ppp

6、t(2)计算检验统计量8编辑版pppt(3)确定拒绝域9编辑版pppt(3)确定拒绝域9编辑版pppt3.1.2 应用例.为帮助学生通过自学提高对知识的掌握,有关专家编辑了符合教学大纲的教学参考资料。为了研究“教学参考资料对于指导学生自学是否有效”这一问题,随机选取了15名学生进行测试,学生使用参考资料前的试卷(A)得分与使用参考资料后的试卷(B)得分列在下表内(A卷与B卷的范围,内容与难度相当):10编辑版pppt3.1.2 应用例.为帮助学生通过自学提高对知识的掌握,有3.1.2 应用学生编号123456789101112131415A卷成绩707070707575757575787675

7、797275B卷成绩758070767175828670808075808383这些资料能否说明参考资料能够促进学生掌握知识11编辑版pppt3.1.2 应用学生编号1234567891011121312编辑版pppt12编辑版pppt3.2 Wilcoxon符号秩和检验法( Wilcoxon Signed-Rank Test)13编辑版pppt3.2 Wilcoxon符号秩和检验法( Wilcoxon检验步骤:14编辑版pppt检验步骤:14编辑版pppt(3)确定拒绝域a.根据检验统计量W和a查Wilcoxon符号秩和检验表以得到在零假设下的 值 如果 小于给定的显著性水平,拒绝零假设;反

8、之不能拒绝零假设。b.如果n很大,要用正态近似,得到一个与W有关的正态随机变量z值,再查正态分布表得到 值,最后将 与a作比较。15编辑版pppt(3)确定拒绝域15编辑版pppt例1根据3.1.2中的例题,利用Wilcoxon检验法检验参考资料能否促进学生掌握知识(a=0.05)3.2.2 应用16编辑版pppt例1根据3.1.2中的例题,利用Wilcoxon检验法检验参17编辑版pppt17编辑版pppt用A,B两种材料生产的产品其寿命检测记录如下:例2:18编辑版pppt用A,B两种材料生产的产品其寿命检测记录如下:例2:18编辑产品编号A材料B材料产品编号A材料B材料116001610

9、11152015052163015501216431650315801560131530150841560157214148614705159015881514741480616201620161480147571610160517162815888165016361814921510915791590191556149010151015202016251568产品使用寿命统计表 单位:小时试分析两种材料对产品的使用寿命由无显著性影响(a=0.05)19编辑版pppt产品编号A材料B材料产品编号A材料B材料116001610120编辑版pppt20编辑版pppt21编辑版pppt21编辑版pp

10、pt3.3 Brown-Mood检验法Brown-Mood检验法是一种位置参数检验,主要用来检验两个独立样本的中位数是否相同。和位置参数相同零假设的表述方法:1.P(XY)=P(XY)=1/2 2.分布函数F(X)=F(Y) 3.X+a和Y同分布,且有:当a大于时,XY4.中位数22编辑版pppt3.3 Brown-Mood检验法Brown-Mood检验法假设 和 是两个相互独立的随机样本,来自两个总体X和Y,其相应的中位数为 和 。我们关注的问题是,两个总体的位置参数 = 是否成立。零假设 成立的情况下,由m个X、n个Y可以组成一个观测值数为m十nN的混合样本,其样本中位数为 , 应该对于两

11、个总体样本数据说都处于中间位置。与符号检验思想相似,如果任何一个样本中大于 或小于 的数目过多或过少,我们就有理由怀疑零假设的真实性。3.3.1 检验思想与检验方法23编辑版pppt假设 和 是两个相互独若a或者b过大或过小,则有理由怀疑原假设。令A表示列联表中左上角取值a的x样本中大于 的变量,则A为我们的检验统计量。由初等概率可知,在m, n及t固定时,A分布在零假设下为超几何分布(对于不超过m的k): x y 总和 27编辑版pppt27编辑版pppt实际运用中p值的计算Excel中的超几何分布函数:HYPGEOMDIST(sample_s,number_sample,populatio

12、n_s,number_population)Sample_s 样本中成功的次数A。 Number_sample 样本容量T。 Population_s 样本总体中成功的次数m。 Number_population 样本总体的容量N。Hypgeomdist(A,t,m,N)=R程序:P(Aa)=phyper(a,m,n,a+b)28编辑版pppt实际运用中p值的计算Excel中的超几何分布函数:28编辑版3.3.2 检验的大样本近似根据超几何分布的性质,可以检验统计量的性质:29编辑版pppt3.3.2 检验的大样本近似根据超几何分布的性质,可以检验1960年匈牙利学者Hajek证明了以下结论:

13、1.Z的渐进分布为N(0,1)分布;2.Z2为 分布,其渐进分布为 分布。30编辑版pppt1960年匈牙利学者Hajek证明了以下结论:30编辑版pp3.3.2 检验的大样本近似31编辑版pppt3.3.2 检验的大样本近似31编辑版pppt3.3.3 假设检验步骤如果P值小于给定的显著性水平,拒绝“两个数列的中位数相同”的假设。检验步骤可归结为下表:严格的说,在 时因A不对称,双边检验结果不那么理想。零假设:备择假设:检验统计量 值 A A A32编辑版pppt3.3.3 假设检验步骤如果P值小于给定的显著性水平,拒绝“3.3.3 应用33编辑版pppt3.3.3 应用33编辑版pppt3

14、.3.3 应用34编辑版pppt3.3.3 应用34编辑版pppt3.4 WMW检验Wilcoxon-Mann-Whitney检验译作维尔科克森曼惠特尼检验,简称WMW检验,这种方法不考虑总体分布的具体形式,只需假定两个独立的相比较的总体有相同或相似的的连续分布,分布不需要对称。WMW检验的精确度较高,在正态总体情况下使用可以达到参数检验方法t检验法功效的95%的精度;如果是偏态总体,它的精度还要高于t检验法。相比brown-mood检验,不仅利用了样本的符号信息,也利用了相对大小信息。35编辑版pppt3.4 WMW检验Wilcoxon-Mann-Whitney3.4.1检验方法的思想W统计

15、量将两个样本混合在一起,并按从小到大的顺序排列起来,得到混合顺序样本:在混合样本中,将各数值排序得到它们 的秩。令 和 分别为 和 在混合样本中的秩, 和 分别为 和 的总和(秩和):如果 为真,则 与 应较均匀地分布在混合顺序样本中,这 N个观察值能够被看作是来自共同总体的一个单一的随机样本。两个样本的秩和将相差不大。36编辑版pppt3.4.1检验方法的思想W统计量将两个样本混合在一起,并显然,如果x的秩大部分都小于y的秩( 很小),则表明x样本的值偏小,我们就有理由怀疑混合子样是一个随机的混合样本, 不能成立。同理,如果 很小, 也不能成立。可见, 和 都可以用作检验统计量,一般取两者中

16、较小的一个作为检验统计量,记作 ,W被称为Wilcoxon秩和统计量(Wilconxon Rank-Sum Statistics),该统计量是由Wilconxon于1945年提出的。37编辑版pppt显然,如果x的秩大部分都小于y的秩( 很小),则表3.4.2 检验方法的思想U统计量Mann-Whitney与1947年提出了U检验量,我们也可以用U来检验零假设。这里定义 为所有X观察值在混合样本中超过Y观察值的个数, 为所有Y观察值在混合样本中大于X观察值的个数,U为 和 中较小者,即 。若 成立, 与 的差别不会很大,U不会太小。如果U很小,我们就有理由怀疑 。实际上,检验统计量W和U等价,

17、二者之间只是一个线性变换关系,一般将其统称为Wilconxon-Mann-Whitney统计量。38编辑版pppt3.4.2 检验方法的思想U统计量Mann-Whitnem=n=2情形下统计量的可能取值39编辑版ppptm=n=2情形下统计量的可能取值39编辑版pppt40编辑版pppt40编辑版pppt41编辑版pppt41编辑版pppt1. 为离散分布。其中 的最大值为n(n+1)/2+mn,最小值为n(n+1)/2。2. 都是中心对称的。其中, 的中心为n(N+1)/2。统计量的性质42编辑版pppt1. 为离散分布。统计量的性质42编辑P值的计算43编辑版ppptP值的计算43编辑版p

18、pptm=n=2情形下统计量的可能取值44编辑版ppptm=n=2情形下统计量的可能取值44编辑版pppt3.4.2 正态逼近45编辑版pppt3.4.2 正态逼近45编辑版pppt打 结46编辑版pppt打 结46编辑版pppt检验步骤47编辑版pppt检验步骤47编辑版pppt3.4.3 应用例:两种材料制成同一零件,随机抽取19件作疲劳强度测试,得到如下结果: A材料:82 64 53 61 59 83 76 55 70 73 B材料:80 60 65 91 86 84 77 93 75 试问两种材料制造的零件,其疲劳强度有无显著差异(=5%)48编辑版pppt3.4.3 应用例:两种材

19、料制成同一零件,随机抽取19件作疲3.4.3 应用(2)计算检验统计量 秩 和1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 数 据A材料B材料53 55 59 61 64 70 73 76 82 83 60 65 75 77 80 84 86 91 9349编辑版pppt3.4.3 应用(2)计算检验统计量 秩 和1 3.4.3 应用R程序:wilcox.test(x,y)50编辑版pppt3.4.3 应用R程序:wilcox.test(x,y)503.4.4 练习今测得甲、乙两矿灰分含量(%)资料如下: 甲:3.75 4.3 3.95 3.8

20、 3.85 乙:3.9 4.05 4.1 4.0 试用Wilcoxon-Mann-Whitney检验法判定甲乙两矿的灰分有无显著差异(=0.05) 51编辑版pppt3.4.4 练习今测得甲、乙两矿灰分含量(%)资料如下:53.5 Wald-Wolfowitz 游程检验( Wald-Wolfowitz Runs Test)Mann-Whitney-Wilcoxon检验主要应用于检验两个样本是否来自具有相同位置的总体,是对两个总体在集中趋势方面有无差异的一种考察,而不研究其它类型方面的差异。 Wald-Wolfowitz 游程检验则可以考察任何一种差异。 Wald-Wolfowitz Runs

21、Test译为沃尔德-沃尔福威茨连串检验或游程检验,简称W-W串检验。52编辑版pppt3.5 Wald-Wolfowitz 游程检验( Wald3.5.1 基本方法与检验步骤设有x, y两个总体具有连续分布,其累积分布函数分别为F (x)和F (y)。如果想知道两个总体是否存在某种差异,可以用“两个总体分布相同”作为零假设。为此,需要从x中随机抽取m个数据 , 从y中随机抽取n个数据 , 数据的测量层次至少要是定序尺度。将两个独立样本的m + n=N个数据混合排序,并确定序列的游程(取自同一样本的一串相连的数据)。如果零假设为真,则两个样本的数据期望能相互混合地排列,游程数会相对较大。若x的游

22、程或y的游程过长,也就是来自同一总体的数据在有序的序列中过多地相互连接,则游程数将会相当少,数据不支持 。故序列的游程数据可以作为检验统计量。 53编辑版pppt3.5.1 基本方法与检验步骤设有x, y两个总体具有连续3.5.1 基本方法与检验步骤54编辑版pppt3.5.1 基本方法与检验步骤54编辑版pppt3.5.2 应用例 研究者想知道“问题按难易次序提问是否影响学生正确回答的能力”。今从全校学生中随机抽取一个班的学生,随机地将学生分为两组,让第一组的学生做A卷(问题从易到难),第二组学生做B卷(问题从难到易)。考试被控制在完全相同的条件下进行,评分结果如下: A卷 83 82 84

23、 96 90 64 91 71 75 72 B卷 42 61 52 78 69 81 75 78 78 65 试问在0.05显著性水平下“问题按难易次序提问是否影响学生正确回答的能力”?55编辑版pppt3.5.2 应用例 研究者想知道“问题按难易次序提问是否影3.5.2 应用解:(1)提出假设 :F(X)=F(Y) (两种提问方式对学生成绩无影响) : F(X)F(Y) (两种提问方式会造成学生成绩的差异) (2)计算检验统计量 u=642 52 61 64 65 69 71 72 75 75 78 78 78 81 82 83 84 90 91 96 y y y x y y x x x y

24、 y y y y x x x x x x56编辑版pppt3.5.2 应用解:(1)提出假设42 52 61 63.5.2 应用(3)作出决策 根据m=10,n=10,=0.05查表得: 因为 ,所以拒绝 ,可以认为在 下提问的顺序对学生正确回答问题的能力有影响(也可以计算或查P值判断)。 57编辑版pppt3.5.2 应用(3)作出决策57编辑版pppt3.5.2 应用注意:如果出现同分,分值来自同一样本,游程数u不会受到影响;但若同分值来自不同样本,u就可能会受到影响,并影响最后的结论。因此,在运用Wald-Wolfowitz游程检验时,若同分值来自两个不同的样本,一般应将各种排序的可能性

25、都进行考察,分别计算每种情况下的游程总数u,并查找相应的P值。如果得出的结论一致,表明同分没有带来什么问题;如果得出的结论不一致,可以将n个P值求简单平均数,以此作为是否拒绝H的依据。如果同分在两个样本之间多次出现,u实际上是不确定的,因而不宜采用Wald-Wolfowitz游程检验。58编辑版pppt3.5.2 应用注意:如果出现同分,分值来自同一样本,游程数3.5.3 练习某年华北五省市区的GDP指数为: 109.2 114.3 113.5 111.0 112.7 华东七省的GDP指数为: 113.0 112.2 112.7 114.4 115.4 113.4 112.2试问:在 下,利用

26、 Wald-Wolfowitz游程检验法检验华北五省的GDP指数与华北七省的GDP指数分布是否相同?59编辑版pppt3.5.3 练习某年华北五省市区的GDP指数为:59编辑版p3.6 两样本的 检验 单样本的 检验可以推广到两个独立样本的总体差异性的检验。 问题: 分别从两个分布函数为 和 的总体中,随机抽取 和 个样本数据,利用样本值推断两个总体是否具有某中差异。为了对假设作出判定,所需要的数据是两个样本,测量层次最低可为定类尺度。60编辑版pppt3.6 两样本的 检验 单样本的 3.6.1 基本方法与检验步骤61编辑版pppt3.6.1 基本方法与检验步骤61编辑版pppt3.6.1

27、基本方法与检验步骤用联表表示为: 组 别 观察频数 合计 期望频数 1 2 r合计 N62编辑版pppt3.6.1 基本方法与检验步骤用联表表示为: 3.6.1 基本方法与检验步骤63编辑版pppt3.6.1 基本方法与检验步骤63编辑版pppt3.6.1 基本方法与检验步骤64编辑版pppt3.6.1 基本方法与检验步骤64编辑版pppt3.6. 2 应用例:为了研究已婚和独身妇女请假和工作时间是否有差异,研究者随机抽取了100名已婚妇女和200名独身妇女,调查她们在一年内请假和工作的情况,得到了下列数据:注:没有工作的时间不包括正常休假(如怀孕、住院等);独身妇女一组包括离婚、分居、丧偶但

28、身边无子女在一起生活的妇女。试问能否在0.05的显著性水平下认为已婚妇女比独身妇女更容易请假而从事的工作时间更少?无工作日数分组已婚妇女(人)独身妇女(人) 03 47 811 1215 1619 20以上 60 21 11 4 2 2 130 50 10 6 3 1 合 计 100 20065编辑版pppt3.6. 2 应用例:为了研究已婚和独身妇女请假和工作时间是3.6.2 应用66编辑版pppt3.6.2 应用66编辑版ppptxf1f2fi.e1e20-36013019063.33126.670.17510.08754-721507123.6747.330.30120.15068-11

29、1110217.0014.002.28571.142912-1546103.336.670.13480.067316-192352.675.330.66250.331920以上213合计1002003003.55931.7802Q=3.5593+1.7802=5.8395 df=5-1=4Q统计量计算表67编辑版ppptxf1f2fi.e1e20-36013019063.3312(3)做出决策68编辑版pppt(3)做出决策68编辑版pppt3.6.3 练习学生按性别和考试成绩分组的调查数据如下:试判断在0.05的显著性水平下学生的考试成绩是否与性别有关? 成绩 人数 性别 及 格 不及格 合

30、计 男 女 2600 2180 130 90 2730 2270 合 计 4780 220 500069编辑版pppt3.6.3 练习学生按性别和考试成绩分组的调查数据如下: 3.7 Kolmogorov-Smirnov检验单样本的Kolmogorov-Smirnov检验可以推广应用于两个独立样本。两样本的Kolmogorov-Smirnov检验,简称Smirnov拟合优度检验,主要用于检验两个独立样本是否抽自两个相同分布的总体,也为其基本思路和检验步骤与单样本的K-S检验完全一致,只是在检验时需要将前面的假设改为:70编辑版pppt3.7 Kolmogorov-Smirnov检验单样本的Ko

31、 是第一个样本的经验分布函数,它可以用第一个样本观察值小于等于的x的次数除以总次数m (m为第一个样本的数据个数)求得; 是第二个样本的经验分布函数,它可以用第二个样本观察值小于等于x的次数除以总次数n(n为第二个样本的数据个数)求得。若两个总体是连续的,检验统计量 的抽样分布已知。当 为真时, 应该很小,与其相应的概率和临界值可以在Smirnov检验临界值(王书第306页)中查到,它满足: 。当时,不能拒绝 ;当 时,拒绝 。 3.7.1 两样本K-S检验基本思想71编辑版pppt 是第一个样本的经验分布函数,它可以用第一个样本观察72编辑版pppt72编辑版pppt双侧检验对于总体分布的任

32、何一种差异,如位置差异(集中趋势)、离散度差异、偏斜度差异等都很敏感。K-S检验的单侧检验则用来检验某一总体值是否大于或小于另一总体的值。其假设为: 或其检验统计量是: 73编辑版pppt双侧检验对于总体分布的任何一种差异,如位置差异(集中趋势)、例1:随即抽取9个远郊县和7个近郊县调查其近10年的人口增长速度(%): 近郊县:3.1 2.1 8.2 2.7 3.4 7.9 3.2 远郊县:5.3 3.7 5.8 3.5 4.8 5.6 6.8 9.3 10.3 根据这些资料,能否认为近郊县比远郊县的人口增长速度低? 解(1)提出假设3.7.2 两样本K-S检验实例74编辑版pppt例1:随即抽取9个远郊县和7个近郊县调查其近10年的人口增

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论