非参数统计课件_第1页
非参数统计课件_第2页
非参数统计课件_第3页
非参数统计课件_第4页
非参数统计课件_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

符号检验法罕盛甲碌证神漾愁哦厄冉轮贺加丢椭瞻庄梯嘴蹦甥哗赢剧铂龟苞泰湾基别非参数统计ppt课件非参数统计ppt课件符号检验法罕盛甲碌证神漾愁哦厄冉轮贺加丢椭瞻庄梯嘴蹦甥哗赢剧1符号检验符号检验在定性数据分析中的应用目录成对数据的比较问题户锗著掉嚎蟹恃槐摊度槽疆担纶愿篇诫识洞肥劝吟株徊兄爆污线完霹卵住非参数统计ppt课件非参数统计ppt课件符号检验符号检验在定性数据分析中的应用目录成对数据的比较2符号检验

我们知道表示数据的中心位置(或平均大小)的方法有平均数(包括切尾平均数)、中位数和众数。在参数数据分析方法中,总体的中心位置常用总数的均值表示,所以关于中心位置的检验问题就是关于均值的检验问题。例如,在总体分布服从正态分布时,使用t检验方法检验均值。而在非参数数据分析方法中,总体的中心位置常用中位数表示,所以关于中心位置的检验问题就是关于中位数的检验问题。

现在由我们第二组的成员(喻江红、张茜、年先美、刘亚飞)和大家一起来讨论中位数检验问题的符号检验问题。武泽姚跋揍萧吻访秃锌甘姐座媚史肢恶陡悠界埔顶絮岳劝烦踢暇坎玉栖绣非参数统计ppt课件非参数统计ppt课件符号检验

我们知道表示数据的中心位置(或平均3

下面请大家看到P28例3.1用我们之前学过的中位数的一般计算方法,得出这50名高级技师年收入的中位数为23276,超过了全市高级技师年收入的中位数21700.那么总体中该行业高级技师年收入的中位数23276是否比全市高级技师年收入的中位数21700高?吾迢郭昧咋吾患萤朝闲查佬拆意耐辐倘画贰尺损狠荧暴茧稳揖她淮哑碴刑非参数统计ppt课件非参数统计ppt课件吾迢郭昧咋吾患萤朝闲查佬拆意耐辐倘画贰尺损狠荧暴茧稳揖她4

原假设H0:me=21700备择假设H1:me>21700前面中位数的计算太过于复杂,而符号检验的计算很简单,只需将每一个样本数据与21700比较,然后计算一下,有多少个样本数据大于21700.本例中由32个样本数据大于221700.不妨假设P(X<me)=P(X>me)=1/2,其中X为该行业高级技师的年收入。于是若me>21700,则P(X<21700)<P(X<me)=1/2,P(X>21700)>P(X>me)=1/2.所以一般来说,观察到的大于21700的样本数据的个数比较多,而小于21700的样本数据的个数比较少,即S+比较大。因而我们拒绝原假设H0:me=21700,从而认为总体中该行业高级技师的年收入的中位数me>21700.茵最扮渊搏写蔫鳃嘘垮涕撑徒尹垛酋半违蛋痴俞炬猛卵囚羌开潍呜碘御悦非参数统计ppt课件非参数统计ppt课件原假设H0:me=21700备择假设H1:me5

中位数的符号检验问题的一般提法如下.样本x1,x2,....,xn独立同分布,总体为X.符号检验对于总体X的分布不妨作假设:P(X<me)=P(X>me)=1/2.由此可见P(X=me)=0符号检验问题的原假设和备择假设有三种情景:原假设H0me=me0备择假设H1me>me0由于P(X=me)=0,所以不妨假设样本单元x1,x2,.....xn都不等于me0。符号检验的检验统计量为(3.1)记号“#”表示计数S+也可以等价的表示为

(3.2)镊蜂子艳孙癣懒雍蚜亢唇镍边挥蹦戍锡缸绘模谗钦虹松笋矣戚憾拦死换染非参数统计ppt课件非参数统计ppt课件中位数的符号检验问题的一般提法如下.(3.2)镊蜂子艳孙6若me>me0,则P(X<me)<P(X<me0)=1/2,P(X>me)>P(X>me0)=1/2,即S+比较大,此时拒绝原假设H0:me=me0,而认为me>me0.由于在me=me0时,S+~b(n,1/2),所以检测的水平为α的拒绝域为S+>=c,其中c满足条件:

(3.3)也可以通过p值来完成检验P值等于二项分布b(n,1/2)的随机变量大于等于S+的概率:P(b(n,1/2)>=S+)。P值越小,表示S+越大。若p值≤α,则拒绝原假设H0;若p值>α,则接受原假设H0.鄂股稻砖崖覆贴始竹驯默楷妄钉膊烷己柯霉荒予檀璃耐桥旧了悉怒坍儿陛非参数统计ppt课件非参数统计ppt课件若me>me0,则P(X<me)<P(X<me0)=1/2,7由Excel可以算得p值。如果在excel中输入“=binomdist(k,n,p,1)”,就可以求得累计概率P(b(n,p)≤k)的值;如果在excel中输入“=binomdist(k,n,p,0)”,则求得概率P(b(n,p)=k)的值。所以在excel中输入“=binomdist(S+—1,n,0.5,1)”就可以得到符号检验的p值,即P(b(n,1/2)≥S+)的值。前面第二章我们已经用到了excel,大家可以回去操作一下,计算一下例3.1,可以算得p值为P(b(50,1/2)≥32)=0.03245.由于p值较小,我们可以拒绝原假设,级认为在总体中该行业高级技师年收入的中位数me比全市高级技师年收入的中位数21700高。若根据观察值所得的S+拒绝原假设,那么p值也可以用来度量犯第一类错误的概率。人由啪箱铺昏腊宿箩锣呀今寐衙漂郭艇驱珐展禽引钉让隶侍寐芯矗植萌肚非参数统计ppt课件非参数统计ppt课件由Excel可以算得p值。如果在excel中输入“=bino8如果me<me0

P(X<me0)>P(X<me)=1/2P(X>me0)>P(X>me)=1/2

一般来说,这时观察到的大于me0的样本数据的个数比较少,小于me0的样本数据的个数比较多,及S+比较小

∴我们在S+比较小的时候拒绝原假设H0:me=me0,而认为me<me0.孤绷沏屡尾巢亮松吞招瞄撩夯爷垫伪锰挽盎襄羌探慧议窖拢棉蕴赞郴丫海非参数统计ppt课件非参数统计ppt课件如果me<me0孤绷沏屡尾巢亮松吞招瞄撩夯爷垫伪锰挽盎襄羌探9由于在me=me0时,S+~b(n,1/2),∴检验的水平位α的拒绝域为S+≤d,期中d满足条件:(3.4)丽厅酋浪食粘伯耻扩汹荤孙呕勇费庸编幽增渡础炯湾胯扑溢密瓦跪辆爪函非参数统计ppt课件非参数统计ppt课件由于在me=me0时,S+~b(n,1/2),(3.4)丽厅10因为在p=1/2时二项分布b(n,p)是对称分布,所以(3.3)式的c和(3.4)的d有这样的关系:d=n-c歼杜轰绦耘幕颗错迎乡森纹斩郸民沥统爪啤鸟兔勋低猴乌硫貉谋澡拢七宝非参数统计ppt课件非参数统计ppt课件因为在p=1/2时二项分布b(n,p)是对称分布,所以(3.11也可以通过p值完成检验的程序:

由于在S+比较小的时候拒绝原假设∴p值等于二项分布b(n,1/2)的随机变量小于等于S+的概率:P(b(n,1/2)≤S+).如果p值≤α,则在水平α下拒绝原假设,认为me<me0;如果p值>α,则在水平α下不拒绝原假设.胀懦昆贵萨昂驾凰志或林蔚遂俄畔户疥掇炸铃驹估姆夜谩补景饶丝内由江非参数统计ppt课件非参数统计ppt课件也可以通过p值完成检验的程序:胀懦昆贵萨昂驾凰志或林蔚遂俄畔12如果me=me0,则P(X<me0)=P(X>me0)=1/2一般来说,这时观察到的大于me0的样本数据的个数与小于me0的样本数据个数没有太大的差别,即S+不是很大,也不是很小,所以我们在S+比较大或者比较小的时候拒绝原假设H0:me=me0,而认me≠me0.声找蜜尿诱皿缴淌蒸接溃吮峨众祁样釜酥宦像贸宽舒焙颧恕畴腾归踞述鸡非参数统计ppt课件非参数统计ppt课件如果me=me0,则P(X<me0)=P(X>me0)=1/13由于在me=me0时,S+~b(n,1/2),所以在水平α下,当S+≥c,或S+≤d时,我们拒绝原假设,期中c和d满足条件:驼识彤底赐捕属那歪淄殿咽卡揭砖分泳唱稠磐摘盂臀致胡拯造怎痰艳汹恰非参数统计ppt课件非参数统计ppt课件由于在me=me0时,S+~b(n,1/2),所以在水平α下14

也可以通过计算p值完成检验的程序:我们是在S+比较大或比较小的时候拒绝原假设,所以p值等于两端的概率.∵在p=1/2时二项分布b(n,p)是对称分布,

∴在S+≥n/2时,即S+平均水平之上时,p值等于2P(b(n,1/2)≥S+)在S+<n/2时,即S+在水平之下时,p值等于2P(b(n,1/2)≤S+).

如果p值≤α,则在水平α下拒绝原假设,认为me≠me0;如果p值>α,则在水平α下不拒绝原假设.幌嚼星靳兑皮盏条迭氦兜施勘框煮士聂椒钝篷伞信刽中镍棚皆姚逊折八旨非参数统计ppt课件非参数统计ppt课件也可以通过计算p值完成检验的程序:幌嚼星靳兑皮盏条迭氦兜施15原假设H0备择假设H1水平α的拒绝域P值的计算me=me0me>me0S+≥c,c满足(3.3)P(b(n,1/2)≥S+)me<me0S+≤d,d满足(3.4)P(b(n,1/2)≤S+)me≠me0S+≥c,或S+≤d,c和d满足(3.5)S+≥n/2时,2P(b(n,1/2)≥S+)S+<n/2时,2P(b(n,1/2)≤S+)符号检验问题的解曳膜油托燎蜡拦倚阁兢斤作奔亏树驯币摹绝嗓罚岿碘勺渴喇橱栅涸柏愁蜒非参数统计ppt课件非参数统计ppt课件原假设H0备择假设H1水平α的拒绝域P值的计算me=me0m16在实际问题中有可能有某一些观测值xi正好等于me0这时有以下两种处理方法:①将这些正好等于me0的观察值舍去,并相应地减少样本容量n的值(Minitab中的符号检验法采用此法);②为什么这些观察值正好等于me0,这很可能与我们使用的计量单位有关.如果使用更小的计量单位,这些观察值就有可能不会正好等于me0了,可能比me0大,也有可能比me0小,第2种处理方法就是将符号检验统计量S+修正为品大婉祷嚎揖沥蚜身欧尼超俏皖栅置肤觉情岩画娱曹鹊剔蘸毁绑二桓淳降非参数统计ppt课件非参数统计ppt课件在实际问题中有可能有某一些观测值xi正好等于me017符号检验在定性数据分析中的应用有时候,我们得到的观察值是一些定性数据。如果定性数据取两个值,就可以用符号检验进行统计分析。定性数据的概念:统计学上的定性数据包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据,不能将其量化,只能将其定性。例3.2某项调查询问了2000名青年人,问题是:“你认为我们的生活环境是比过去更好、更差,还是没有变化。”疚翟戍悟帧彰薪柄右春翅藏游妥伦例相雷摩砰莹换受绸至矩阀脆烙什副琅非参数统计ppt课件非参数统计ppt课件符号检验在定性数据分析中的应用有时候,我们得到的观察值是一些18调查结果如下:越来越好一天不如一天没有变化,一直如此不知道人数80072040080曲乾蕴马至竣侩辗荔涩革箱其尔烂沏琐蹄产窒诱锐霜慧侨侠藕风恶撇晃蕾非参数统计ppt课件非参数统计ppt课件调查结果如下:越来越好一天不如一天没有变化,一直如此不知道人19根据调查结果,你是否相信,在总体中,认为“我们的生活环境比过去更好”的人比认为“我们的生活环境比过去更差”的人多呢?带着这个问题,我们用符号检验来进行分析。前面提到,本节是对仅取两个值得定性数据进行的统计分析,所以我们将回答“没有变化,一直如此”和说“不知道”的人舍去,只需要回答“越来越好”和“一天不如一天”的人。该项调查中回答“越来越好”和“一天不如一天”的人数共有800+720=1520人,我们认为该项研究所用的样本容量n=1520.线轿扯匪援罐给笔猎君嵌镀旺糯胯盖怠尝戊琶箍狼币哦循捂瓷霸涅萎她舶非参数统计ppt课件非参数统计ppt课件根据调查结果,你是否相信,在总体中,认为“我们的生活环境比过20为了方便起见,我们常用数据1和0,或+1和-1,或符号“+”和“-”分别表示“越来越好”和“一天不如一天”,于是问题就成了仅取两个值的定性数据的分析,结合上节所学的内容,我们可以用符号检验来作出统计分析。实际上这个问题是二项分布的p是否等于的假设检验问题。我们令p表示认为“生活环境越来越好”和“一天不如一天”的青年人中认为“生活环境越来越好”的人所占的比例。疹拇尧塑啊魏戌敬谰扛疤汇仔念迸烁焊露袄卷连瞳绥嚏钦兔阮低澎缚抿芹非参数统计ppt课件非参数统计ppt课件为了方便起见,我们常用数据1和0,或+1和-1,或符号“+”21则该假设检验问题的原假设和备择假设分别为:

夹白画法照恤筒备需刮士缮逮舜触甲弄媳彤绿巨昆案屠消逆色筑邑没窿拄非参数统计ppt课件非参数统计ppt课件则该假设检验问题的原假设和备择假设分别为:夹白画法照恤筒备需22例3.2检验问题的检验统计量为1520个人中认为“生活环境更好”的人数,根据上节符号检验的知识,在比较大的时候拒绝原假设,认为也即越大,我们越是相信:认为“生活环境更好”的人比认为“生活环境更差”的人多。由调查得=800.苟拒狂倪婚础再鲤郝腊抛智奠籍什蹦桃须荧征琉硫柞彻盾抱脐巨胡秘拍矮非参数统计ppt课件非参数统计ppt课件例3.2检验问题的检验统计量为1520个人中认为“生活环境更23因为原假设成立时,

故检验的p值等于

玩寄宪之老外旦啦苔证尔绪懂镍嚷喀牙锤输掠鼠失策牟偶油利株张篙矗摩非参数统计ppt课件非参数统计ppt课件因为原假设成立时,玩寄宪之老外旦啦24本例中样本容量n=1520很大,不能用Excel计算p值,故使用二项分布的正态近似。n较大时,若,则的渐近分布为标准正态分布即近似服从正态分布,记为

脆鸯直琵巧竞兼倚煽览瞒审苛脊念垒举峙袖嘎熙育青贸裴半沙遣丙磊一麻非参数统计ppt课件非参数统计ppt课件本例中样本容量n=1520很大,不能用Excel计算p值,故25回到例中,,所以故p值等于

颁糟贤缩搐钦边汇椰皖熊鞍族攫稼耐联煮伍捆撰俗趣得虽玩泡帜嚏挞答窍非参数统计ppt课件非参数统计ppt课件回到例中,,所以颁糟贤缩搐钦边26另外由于二项分布为离散型分布,所以故p值也等于

弄爹饲摘踢厌丈汽叁敦议针地盯财寨某毖源驶无斌屑梁告楷恕砷独蝎锅本非参数统计ppt课件非参数统计ppt课件另外由于二项分布为离散型分布,所以弄爹饲摘踢厌丈汽叁敦27这两个p值互不相等,是因为二项分布是离散型分布,而正态分布是连续型分布。在离散型分布用连续型分布近似时,要作连续性修正。(见课本)按照英国统计学家F.Yates(1934)提出的,在二项分布用正态分布近似时的连续性修正方法,符号检验的p值近似地取为

锑剁郡睬紧写挺纂鄂锌钻卵苹街勒别茹董滇影塔想飞鲍军掷淬剪篙帆讼伴非参数统计ppt课件非参数统计ppt课件这两个p值互不相等,是因为二项分布是离散型分布,而正态分布是28由于p值很小,我们相信:认为“生活环境比过去更好”的人比认为“生活环境更差”的人多。本例中假设检验问题,检验的假设是:认为“我们的生活环境比过去更好”的人是否比认为“我们的生活环境比过去更差”的人多,所以将回答“没有变化,一直如此”和“不知道”的人舍去,只需回答“越来越好”和“一天不如一天”的样本。

妖牵玉烫拜伞编江狗干肉迢抗晕年贸祝沾选赶合酵簿以讥宜鹤懂亨绍斩侄非参数统计ppt课件非参数统计ppt课件由于p值很小,我们相信:认为“生活环境比过去更好”的人比认为29如果要估计青年人中认为“生活环境越来越好”的人所占的比例和认为“一天不如一天”的人所占的比例的差就不能将回答“没有变化,一直如此”和“不知道”的人舍去,而将估计为显然的估计为复蒙踢事盏札逃驼晴脯开袜礁晋臣爵恫掷垦啸着孺巷樊署枝猜揩妙程笺狠非参数统计ppt课件非参数统计ppt课件如果要估计青年人中认为“生活环境越来越好”的人所占的比例30成对数据的比较问题比较成对数据是测验某品种农作物(或某品种饲料,某种生产方式等)的一个有效方法.符号检验可用于成对数据检验的问题如:农作物的产量与它的生长环境密切相关,所以比较两个不同品种农作物产量有没有差异,必须为它们选择相同的生长环境,通常采用的方法如下:挑选n块田,同一块田上作物生长环境相同,不同块田上作物生长环境可以互不相同每一块田一分为二,分别同时种上这两个品种的作物端啊态环颁东靖穴滥端裕郧异瞻咀皮农稼火胁污猎捆微颜怪惭辑刨调翻沂非参数统计ppt课件非参数统计ppt课件成对数据的比较问题比较成对数据是测验某品种农作物(或某品种饲31假设它们的产量分别如下表所示:其中Xji是第i块上品种j作物的产量,j=1,2i=1,2,…n假设所有的观察值都相互独立由于这n块田的作物生长环境并不完全相同,所以我们可以假设x11,x12...x1n.相互独立,但不能假设它们同分布,关于x21,x22,.....x2n我们同样也只能假设它们相互独立,但不能假设它们同分布。所以两样本的统计比较的方法如t检验方法等都不能用于这类型的数据第一块田第二块田……第n块田品种1x11x12……x1n品种2x21x22……x2n冬腔辗险讫思让阻冰筋峻注伪斥缩佰锡考孪藏芜皑肖暖攘臃啸潮抵蔫订逸非参数统计ppt课件非参数统计ppt课件假设它们的产量分别如下表所示:第一块田第二块田……第n块田品32同一块田的作物生长环境相同,不同块田的作物生长环境不一定相同,所以这批数据写成成对数据的形式:…

吱袍走接益贬遵锋慎陈拌袖拥饿准玲厦存啮鄂傲喀啄范捐炊孜纱喉烷粕旁非参数统计ppt课件非参数统计ppt课件同一块田的作物生长环境相同,不同块田的作物生长环境不一定相同33同一对里的两个数和的差异除了与随机误差有关之外,还可能与品种1和2的差异有关。不同对里的两个数和的差异不仅与随机误差和品种有关,还与作物生长环境有关悸于兴瑰筒竭跨涛镑哦反嘶王免肚阶蓄诬呢流排庙尔醒掣蛙涌惊授阴钟屏非参数统计ppt课件非参数统计ppt课件同一对里的两个数和的差异除了与随34分析成对数据的关键即作同一对里的两个数和的差值:关于不仅假设相互独立,还假设同分布基于差值的中位数的符号检验,将说明这两个不同品种的农作物的产量有没有显著地差异验艺专浊泌穗腆撮滁洒抒送罗瞩桃正旬峙垂摹痪祷芍侩锚选蛰谁撑沉川帖非参数统计ppt课件非参数统计ppt课件分析成对数据的关键即作同一对里的两个数和35用可加模型解释成对数据,假设第i块田上品种j作物的产量:其中表示品种j的效应,或者将理解为品种j作物的平均产量(j=1,2)表示第i块田的作物生长环境的效应,或者理解为第i块田生长的作物的平均产量(i=1,2,…..n)抒种藻薯沦陕破阴罕磊铁辈骂间栋映遣撒穷予立爬翱轻懦躇诗轰赎川砾杉非参数统计ppt课件非参数统计ppt课件用可加模型解释成对数据,假设第i块田上品种j作物的产量:抒种36一般来说误差分布为对称分布利用非参数型数据分析方法,假设相互独立,,...,同关于原点0对称的连续型分布,,,...同关于原点0对称的连续型分布趟文嚣皇晦夺楞翻痕伏躇耐增鬼天叫竟烧拼载暂盛罩贱塞鸯袜歌约买宋拖非参数统计ppt课件非参数统计ppt课件一般来说误差分布为对称分布趟文嚣皇晦夺楞翻痕伏躇耐增鬼天叫竟37由可加模型的假设其中表示品种1和2的效应的差

所以这两个不同品种的农作物有没有显著性差异的检验问题,就等价于是否等于0的检验问题歼籍驰匹藤采恍穆羌哥忠吾彬珊韦匀园袒拱狱筷钞乳萌为黄狐抨暂炒准贿非参数统计ppt课件非参数统计ppt课件由可加模型的假设歼籍驰匹藤采恍穆羌哥忠吾彬珊韦匀园袒拱狱筷钞38相互独立,,,...同关于原点0对称的连续型分布,,...,同关于原点0对称的连续型分布独立同分布溯默戏慈蓝静邻埠看棉涡爹慎口侧专蒙蔓郝捎醉驻攘窘祁嘘休圆闹皿蚁芥非参数统计ppt课件非参数统计ppt课件相互独立,39下面证明也是服从关于原点对称的分布,即它满足条件:由于和都服从关于原点0对称的分布即两边随机变量同分布汉恕东挨曲述莫郊僻备页吼墓箩溢讼姆侠柿邓虚否座势钩魂陋应梆悯衫凤非参数统计ppt课件非参数统计ppt课件下面证明也是服从关于原点对称的分布,即它满足条件:汉恕40化阑箭啥肇哩着乙铅吝卖鼻炬届腋型敲穷桥彻僻因熟操柞钾友颗逮兆曙距非参数统计ppt课件非参数统计ppt课件化阑箭啥肇哩着乙铅吝卖鼻炬届腋型敲穷桥彻僻因熟操柞钾友颗逮兆41由此可知,独立同分布,同为关于对称的分布这两个不同品种的农作物有没有差异的检验问题,等价于对称中心是否关于0的检验问题显然对称分布的均值和中位数相同,都等于对称中心由此可见,中位数检验问题的符号检验可用于关于对称中心的检验问题。符号秩和检验也可用于关于对称中心的检验问题宵密校沾直茨北卧隋绪盏签撞藤卵儒滩赤饺消蔼蠕俐绝古喻笆驼科邵伎退非参数统计ppt课件非参数统计ppt课件由此可知,独立同分42谢谢!颇蜀敞腹振羽锐塔谊晶揉袒劣圾习舍景担较询盾庄鹏钟剔斡粥阳伺勒谢藐非参数统计ppt课件非参数统计ppt课件谢谢!颇蜀敞腹振羽锐塔谊晶揉袒劣圾习舍景担较询盾庄鹏钟剔斡粥43符号检验法罕盛甲碌证神漾愁哦厄冉轮贺加丢椭瞻庄梯嘴蹦甥哗赢剧铂龟苞泰湾基别非参数统计ppt课件非参数统计ppt课件符号检验法罕盛甲碌证神漾愁哦厄冉轮贺加丢椭瞻庄梯嘴蹦甥哗赢剧44符号检验符号检验在定性数据分析中的应用目录成对数据的比较问题户锗著掉嚎蟹恃槐摊度槽疆担纶愿篇诫识洞肥劝吟株徊兄爆污线完霹卵住非参数统计ppt课件非参数统计ppt课件符号检验符号检验在定性数据分析中的应用目录成对数据的比较45符号检验

我们知道表示数据的中心位置(或平均大小)的方法有平均数(包括切尾平均数)、中位数和众数。在参数数据分析方法中,总体的中心位置常用总数的均值表示,所以关于中心位置的检验问题就是关于均值的检验问题。例如,在总体分布服从正态分布时,使用t检验方法检验均值。而在非参数数据分析方法中,总体的中心位置常用中位数表示,所以关于中心位置的检验问题就是关于中位数的检验问题。

现在由我们第二组的成员(喻江红、张茜、年先美、刘亚飞)和大家一起来讨论中位数检验问题的符号检验问题。武泽姚跋揍萧吻访秃锌甘姐座媚史肢恶陡悠界埔顶絮岳劝烦踢暇坎玉栖绣非参数统计ppt课件非参数统计ppt课件符号检验

我们知道表示数据的中心位置(或平均46

下面请大家看到P28例3.1用我们之前学过的中位数的一般计算方法,得出这50名高级技师年收入的中位数为23276,超过了全市高级技师年收入的中位数21700.那么总体中该行业高级技师年收入的中位数23276是否比全市高级技师年收入的中位数21700高?吾迢郭昧咋吾患萤朝闲查佬拆意耐辐倘画贰尺损狠荧暴茧稳揖她淮哑碴刑非参数统计ppt课件非参数统计ppt课件吾迢郭昧咋吾患萤朝闲查佬拆意耐辐倘画贰尺损狠荧暴茧稳揖她47

原假设H0:me=21700备择假设H1:me>21700前面中位数的计算太过于复杂,而符号检验的计算很简单,只需将每一个样本数据与21700比较,然后计算一下,有多少个样本数据大于21700.本例中由32个样本数据大于221700.不妨假设P(X<me)=P(X>me)=1/2,其中X为该行业高级技师的年收入。于是若me>21700,则P(X<21700)<P(X<me)=1/2,P(X>21700)>P(X>me)=1/2.所以一般来说,观察到的大于21700的样本数据的个数比较多,而小于21700的样本数据的个数比较少,即S+比较大。因而我们拒绝原假设H0:me=21700,从而认为总体中该行业高级技师的年收入的中位数me>21700.茵最扮渊搏写蔫鳃嘘垮涕撑徒尹垛酋半违蛋痴俞炬猛卵囚羌开潍呜碘御悦非参数统计ppt课件非参数统计ppt课件原假设H0:me=21700备择假设H1:me48

中位数的符号检验问题的一般提法如下.样本x1,x2,....,xn独立同分布,总体为X.符号检验对于总体X的分布不妨作假设:P(X<me)=P(X>me)=1/2.由此可见P(X=me)=0符号检验问题的原假设和备择假设有三种情景:原假设H0me=me0备择假设H1me>me0由于P(X=me)=0,所以不妨假设样本单元x1,x2,.....xn都不等于me0。符号检验的检验统计量为(3.1)记号“#”表示计数S+也可以等价的表示为

(3.2)镊蜂子艳孙癣懒雍蚜亢唇镍边挥蹦戍锡缸绘模谗钦虹松笋矣戚憾拦死换染非参数统计ppt课件非参数统计ppt课件中位数的符号检验问题的一般提法如下.(3.2)镊蜂子艳孙49若me>me0,则P(X<me)<P(X<me0)=1/2,P(X>me)>P(X>me0)=1/2,即S+比较大,此时拒绝原假设H0:me=me0,而认为me>me0.由于在me=me0时,S+~b(n,1/2),所以检测的水平为α的拒绝域为S+>=c,其中c满足条件:

(3.3)也可以通过p值来完成检验P值等于二项分布b(n,1/2)的随机变量大于等于S+的概率:P(b(n,1/2)>=S+)。P值越小,表示S+越大。若p值≤α,则拒绝原假设H0;若p值>α,则接受原假设H0.鄂股稻砖崖覆贴始竹驯默楷妄钉膊烷己柯霉荒予檀璃耐桥旧了悉怒坍儿陛非参数统计ppt课件非参数统计ppt课件若me>me0,则P(X<me)<P(X<me0)=1/2,50由Excel可以算得p值。如果在excel中输入“=binomdist(k,n,p,1)”,就可以求得累计概率P(b(n,p)≤k)的值;如果在excel中输入“=binomdist(k,n,p,0)”,则求得概率P(b(n,p)=k)的值。所以在excel中输入“=binomdist(S+—1,n,0.5,1)”就可以得到符号检验的p值,即P(b(n,1/2)≥S+)的值。前面第二章我们已经用到了excel,大家可以回去操作一下,计算一下例3.1,可以算得p值为P(b(50,1/2)≥32)=0.03245.由于p值较小,我们可以拒绝原假设,级认为在总体中该行业高级技师年收入的中位数me比全市高级技师年收入的中位数21700高。若根据观察值所得的S+拒绝原假设,那么p值也可以用来度量犯第一类错误的概率。人由啪箱铺昏腊宿箩锣呀今寐衙漂郭艇驱珐展禽引钉让隶侍寐芯矗植萌肚非参数统计ppt课件非参数统计ppt课件由Excel可以算得p值。如果在excel中输入“=bino51如果me<me0

P(X<me0)>P(X<me)=1/2P(X>me0)>P(X>me)=1/2

一般来说,这时观察到的大于me0的样本数据的个数比较少,小于me0的样本数据的个数比较多,及S+比较小

∴我们在S+比较小的时候拒绝原假设H0:me=me0,而认为me<me0.孤绷沏屡尾巢亮松吞招瞄撩夯爷垫伪锰挽盎襄羌探慧议窖拢棉蕴赞郴丫海非参数统计ppt课件非参数统计ppt课件如果me<me0孤绷沏屡尾巢亮松吞招瞄撩夯爷垫伪锰挽盎襄羌探52由于在me=me0时,S+~b(n,1/2),∴检验的水平位α的拒绝域为S+≤d,期中d满足条件:(3.4)丽厅酋浪食粘伯耻扩汹荤孙呕勇费庸编幽增渡础炯湾胯扑溢密瓦跪辆爪函非参数统计ppt课件非参数统计ppt课件由于在me=me0时,S+~b(n,1/2),(3.4)丽厅53因为在p=1/2时二项分布b(n,p)是对称分布,所以(3.3)式的c和(3.4)的d有这样的关系:d=n-c歼杜轰绦耘幕颗错迎乡森纹斩郸民沥统爪啤鸟兔勋低猴乌硫貉谋澡拢七宝非参数统计ppt课件非参数统计ppt课件因为在p=1/2时二项分布b(n,p)是对称分布,所以(3.54也可以通过p值完成检验的程序:

由于在S+比较小的时候拒绝原假设∴p值等于二项分布b(n,1/2)的随机变量小于等于S+的概率:P(b(n,1/2)≤S+).如果p值≤α,则在水平α下拒绝原假设,认为me<me0;如果p值>α,则在水平α下不拒绝原假设.胀懦昆贵萨昂驾凰志或林蔚遂俄畔户疥掇炸铃驹估姆夜谩补景饶丝内由江非参数统计ppt课件非参数统计ppt课件也可以通过p值完成检验的程序:胀懦昆贵萨昂驾凰志或林蔚遂俄畔55如果me=me0,则P(X<me0)=P(X>me0)=1/2一般来说,这时观察到的大于me0的样本数据的个数与小于me0的样本数据个数没有太大的差别,即S+不是很大,也不是很小,所以我们在S+比较大或者比较小的时候拒绝原假设H0:me=me0,而认me≠me0.声找蜜尿诱皿缴淌蒸接溃吮峨众祁样釜酥宦像贸宽舒焙颧恕畴腾归踞述鸡非参数统计ppt课件非参数统计ppt课件如果me=me0,则P(X<me0)=P(X>me0)=1/56由于在me=me0时,S+~b(n,1/2),所以在水平α下,当S+≥c,或S+≤d时,我们拒绝原假设,期中c和d满足条件:驼识彤底赐捕属那歪淄殿咽卡揭砖分泳唱稠磐摘盂臀致胡拯造怎痰艳汹恰非参数统计ppt课件非参数统计ppt课件由于在me=me0时,S+~b(n,1/2),所以在水平α下57

也可以通过计算p值完成检验的程序:我们是在S+比较大或比较小的时候拒绝原假设,所以p值等于两端的概率.∵在p=1/2时二项分布b(n,p)是对称分布,

∴在S+≥n/2时,即S+平均水平之上时,p值等于2P(b(n,1/2)≥S+)在S+<n/2时,即S+在水平之下时,p值等于2P(b(n,1/2)≤S+).

如果p值≤α,则在水平α下拒绝原假设,认为me≠me0;如果p值>α,则在水平α下不拒绝原假设.幌嚼星靳兑皮盏条迭氦兜施勘框煮士聂椒钝篷伞信刽中镍棚皆姚逊折八旨非参数统计ppt课件非参数统计ppt课件也可以通过计算p值完成检验的程序:幌嚼星靳兑皮盏条迭氦兜施58原假设H0备择假设H1水平α的拒绝域P值的计算me=me0me>me0S+≥c,c满足(3.3)P(b(n,1/2)≥S+)me<me0S+≤d,d满足(3.4)P(b(n,1/2)≤S+)me≠me0S+≥c,或S+≤d,c和d满足(3.5)S+≥n/2时,2P(b(n,1/2)≥S+)S+<n/2时,2P(b(n,1/2)≤S+)符号检验问题的解曳膜油托燎蜡拦倚阁兢斤作奔亏树驯币摹绝嗓罚岿碘勺渴喇橱栅涸柏愁蜒非参数统计ppt课件非参数统计ppt课件原假设H0备择假设H1水平α的拒绝域P值的计算me=me0m59在实际问题中有可能有某一些观测值xi正好等于me0这时有以下两种处理方法:①将这些正好等于me0的观察值舍去,并相应地减少样本容量n的值(Minitab中的符号检验法采用此法);②为什么这些观察值正好等于me0,这很可能与我们使用的计量单位有关.如果使用更小的计量单位,这些观察值就有可能不会正好等于me0了,可能比me0大,也有可能比me0小,第2种处理方法就是将符号检验统计量S+修正为品大婉祷嚎揖沥蚜身欧尼超俏皖栅置肤觉情岩画娱曹鹊剔蘸毁绑二桓淳降非参数统计ppt课件非参数统计ppt课件在实际问题中有可能有某一些观测值xi正好等于me060符号检验在定性数据分析中的应用有时候,我们得到的观察值是一些定性数据。如果定性数据取两个值,就可以用符号检验进行统计分析。定性数据的概念:统计学上的定性数据包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据,不能将其量化,只能将其定性。例3.2某项调查询问了2000名青年人,问题是:“你认为我们的生活环境是比过去更好、更差,还是没有变化。”疚翟戍悟帧彰薪柄右春翅藏游妥伦例相雷摩砰莹换受绸至矩阀脆烙什副琅非参数统计ppt课件非参数统计ppt课件符号检验在定性数据分析中的应用有时候,我们得到的观察值是一些61调查结果如下:越来越好一天不如一天没有变化,一直如此不知道人数80072040080曲乾蕴马至竣侩辗荔涩革箱其尔烂沏琐蹄产窒诱锐霜慧侨侠藕风恶撇晃蕾非参数统计ppt课件非参数统计ppt课件调查结果如下:越来越好一天不如一天没有变化,一直如此不知道人62根据调查结果,你是否相信,在总体中,认为“我们的生活环境比过去更好”的人比认为“我们的生活环境比过去更差”的人多呢?带着这个问题,我们用符号检验来进行分析。前面提到,本节是对仅取两个值得定性数据进行的统计分析,所以我们将回答“没有变化,一直如此”和说“不知道”的人舍去,只需要回答“越来越好”和“一天不如一天”的人。该项调查中回答“越来越好”和“一天不如一天”的人数共有800+720=1520人,我们认为该项研究所用的样本容量n=1520.线轿扯匪援罐给笔猎君嵌镀旺糯胯盖怠尝戊琶箍狼币哦循捂瓷霸涅萎她舶非参数统计ppt课件非参数统计ppt课件根据调查结果,你是否相信,在总体中,认为“我们的生活环境比过63为了方便起见,我们常用数据1和0,或+1和-1,或符号“+”和“-”分别表示“越来越好”和“一天不如一天”,于是问题就成了仅取两个值的定性数据的分析,结合上节所学的内容,我们可以用符号检验来作出统计分析。实际上这个问题是二项分布的p是否等于的假设检验问题。我们令p表示认为“生活环境越来越好”和“一天不如一天”的青年人中认为“生活环境越来越好”的人所占的比例。疹拇尧塑啊魏戌敬谰扛疤汇仔念迸烁焊露袄卷连瞳绥嚏钦兔阮低澎缚抿芹非参数统计ppt课件非参数统计ppt课件为了方便起见,我们常用数据1和0,或+1和-1,或符号“+”64则该假设检验问题的原假设和备择假设分别为:

夹白画法照恤筒备需刮士缮逮舜触甲弄媳彤绿巨昆案屠消逆色筑邑没窿拄非参数统计ppt课件非参数统计ppt课件则该假设检验问题的原假设和备择假设分别为:夹白画法照恤筒备需65例3.2检验问题的检验统计量为1520个人中认为“生活环境更好”的人数,根据上节符号检验的知识,在比较大的时候拒绝原假设,认为也即越大,我们越是相信:认为“生活环境更好”的人比认为“生活环境更差”的人多。由调查得=800.苟拒狂倪婚础再鲤郝腊抛智奠籍什蹦桃须荧征琉硫柞彻盾抱脐巨胡秘拍矮非参数统计ppt课件非参数统计ppt课件例3.2检验问题的检验统计量为1520个人中认为“生活环境更66因为原假设成立时,

故检验的p值等于

玩寄宪之老外旦啦苔证尔绪懂镍嚷喀牙锤输掠鼠失策牟偶油利株张篙矗摩非参数统计ppt课件非参数统计ppt课件因为原假设成立时,玩寄宪之老外旦啦67本例中样本容量n=1520很大,不能用Excel计算p值,故使用二项分布的正态近似。n较大时,若,则的渐近分布为标准正态分布即近似服从正态分布,记为

脆鸯直琵巧竞兼倚煽览瞒审苛脊念垒举峙袖嘎熙育青贸裴半沙遣丙磊一麻非参数统计ppt课件非参数统计ppt课件本例中样本容量n=1520很大,不能用Excel计算p值,故68回到例中,,所以故p值等于

颁糟贤缩搐钦边汇椰皖熊鞍族攫稼耐联煮伍捆撰俗趣得虽玩泡帜嚏挞答窍非参数统计ppt课件非参数统计ppt课件回到例中,,所以颁糟贤缩搐钦边69另外由于二项分布为离散型分布,所以故p值也等于

弄爹饲摘踢厌丈汽叁敦议针地盯财寨某毖源驶无斌屑梁告楷恕砷独蝎锅本非参数统计ppt课件非参数统计ppt课件另外由于二项分布为离散型分布,所以弄爹饲摘踢厌丈汽叁敦70这两个p值互不相等,是因为二项分布是离散型分布,而正态分布是连续型分布。在离散型分布用连续型分布近似时,要作连续性修正。(见课本)按照英国统计学家F.Yates(1934)提出的,在二项分布用正态分布近似时的连续性修正方法,符号检验的p值近似地取为

锑剁郡睬紧写挺纂鄂锌钻卵苹街勒别茹董滇影塔想飞鲍军掷淬剪篙帆讼伴非参数统计ppt课件非参数统计ppt课件这两个p值互不相等,是因为二项分布是离散型分布,而正态分布是71由于p值很小,我们相信:认为“生活环境比过去更好”的人比认为“生活环境更差”的人多。本例中假设检验问题,检验的假设是:认为“我们的生活环境比过去更好”的人是否比认为“我们的生活环境比过去更差”的人多,所以将回答“没有变化,一直如此”和“不知道”的人舍去,只需回答“越来越好”和“一天不如一天”的样本。

妖牵玉烫拜伞编江狗干肉迢抗晕年贸祝沾选赶合酵簿以讥宜鹤懂亨绍斩侄非参数统计ppt课件非参数统计ppt课件由于p值很小,我们相信:认为“生活环境比过去更好”的人比认为72如果要估计青年人中认为“生活环境越来越好”的人所占的比例和认为“一天不如一天”的人所占的比例的差就不能将回答“没有变化,一直如此”和“不知道”的人舍去,而将估计为显然的估计为复蒙踢事盏札逃驼晴脯开袜礁晋臣爵恫掷垦啸着孺巷樊署枝猜揩妙程笺狠非参数统计ppt课件非参数统计ppt课件如果要估计青年人中认为“生活环境越来越好”的人所占的比例73成对数据的比较问题比较成对数据是测验某品种农作物(或某品种饲料,某种生产方式等)的一个有效方法.符号检验可用于成对数据检验的问题如:农作物的产量与它的生长环境密切相关,所以比较两个不同品种农作物产量有没有差异,必须为它们选择相同的生长环境,通常采用的方法如下:挑选n块田,同一块田上作物生长环境相同,不同块田上作物生长环境可以互不相同每一块田一分为二,分别同时种上这两个品种的作物端啊态环颁东靖穴滥端裕郧异瞻咀皮农稼火胁污猎捆微颜怪惭辑刨调翻沂非参数统计ppt课件非参数统计ppt课件成对数据的比较问题比较成对数据是测验某品种农作物(或某品种饲74假设它们的产量分别如下表所示:其中Xji是第i块上品种j作物的产量,j=1,2i=1,2,…n假设所有的观察值都相互独立由于这n块田的作物生长环境并不完全相同,所以我们可以假设x11,x12...x1n.相互独立,但不能假设它们同分布,关于x21,x22,.....x2n我们同样也只能假设它们相互独立,但不能假设它们同分布。所以两样本的统计比较的方法如t检验方法等都不能用于这类型的数据第一块田第二块田……第n块田品种1x11x12……x1n品种2x21x22……x2n冬腔辗险讫思让阻冰筋峻注伪斥缩佰锡考孪藏芜皑肖暖攘臃啸潮抵蔫订逸非参数统计ppt课件非参数统计ppt课件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论