《非参数假设检验》第四次课省公开课金奖全国赛课一等奖微课获奖课件_第1页
《非参数假设检验》第四次课省公开课金奖全国赛课一等奖微课获奖课件_第2页
《非参数假设检验》第四次课省公开课金奖全国赛课一等奖微课获奖课件_第3页
《非参数假设检验》第四次课省公开课金奖全国赛课一等奖微课获奖课件_第4页
《非参数假设检验》第四次课省公开课金奖全国赛课一等奖微课获奖课件_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非参数假设检验辽宁工程技术大学L.NTECHNICALUNIVERSITY追求1/83

非参数检验是相对于参数检验而言,这两种检验方法在实际中都有广泛应用,但它们有着不一样数理统计原理和应用场所。在统计学发展过程中,最先出现推断统计方法都对样本所属总体性质作出若干假设,即对总体分布形状作一些限定,比如Z检验、t检验,假设样本总体分布加以一些限定,把所要推断总体数字特征看作未知“参数”进行推断,称之为参数统计方法(Parameterstatisticalmethods)或限定分布统计方法(distribution-specifiedstatistical

methods),基于此所做假设检验就称为参数检验(Parametrictest)。惯用检验如t检验、Z检验、F检验等都是参数检验。2/83参数检验只有在关于总体分布假设成立时,所得出结论才是正确,所以它在很多场所不便应用,于是统计学家发展了许多对总体不作太多或严格限定统计推断方法,这些方法普通不包括总体参数假设,与之相对应统计方法通常称为非参数统计(Nonparametricstatistics)或自由分布统计方法(Distribution-freestatiscalmethods),基于此所做假设检验则称为非参数检验(Nonparametrictest)或自由分布统计检验(Distribution-freestatisticaltest)。非参数检验前提假设比参数检验方法少很多,也轻易满足,适合用于已知信息相对较少数据资料,而且它计算方法也简便易行。3/83对于多数参数检验方法,都有一个或几个相对应非参数检验方法,以下表所表示。参数检验与非参数检验方法对应表参数检验方法非参数检验方法t检验法两个独立样本中位数检验两个独立样本秩和检验t检验法(配对样本)成对比较、单样本正负号检验成对比较、单样本符号秩检验单原因方差分析K个独立样本H检验法多原因方差分析Friedman检验法相关系数Spearman秩相关系数4/83非参数检验缺点非参数检验也有一些不可防止缺点:非参数检验方法对总体分布假定不多,适应性强,但方法本身也就缺乏针对性,其功效不如参数检验。非参数检验使用是等级或符号秩,而不是实际数值,方法虽简单,但会失去许多信息,因而检验有效性也就比较差。比如对于一批适合用于t检验配对资料,假如采取符号秩检验处理,其功效将低于t检验,假如用符号检验处理则效率更低,因为它对信息利用更不充分。当然,假如假定分布不成立,那么非参数检验就是更值得信赖。5/83与参数检验方法对比,非参数检验方法含有以下优点:检验条件宽松,适应性强。参数检验假定总体分布为正态、近似正态或以正态分布为基础而结构t分布或分布;非参数检验不受这些条件限制,填补了参数检验不足,对于非正态、方差不等以及分布形状未知数据都适用。检验方法灵活,用途广泛。非参数检验不但能够应用与定距、定比等连续变量检验,而且适合用于定类、定序等分类变量检验。对于那些不能直接进行四则运算定类数据和定序数据,利用符号检验、符号秩检验都能起到好效果。非参数检验计算相对简单,易于了解。因为非参数检验更多地采取计数方法,其过程及结果都能够被直观地了解,为使用者所接收。非参数检验优点6/83一个总体分布非参数假设检验(2)两个总体分布未知,它们是否相同;非参数假设检验需要处理问题:(1)猜出总体分布(假设),用另一组样本检验。两个总体分布非参数假设检验内容多个总体分布非参数假设检验7/83配对样本非参数检验SPSS

非参数检验一个总体:单样本总体分布检验两个总体多个总体独立样本非参数检验配对样本非参数检验独立样本非参数检验8/83一个总体分布检验检验总体卡方分布检验总体二项分布单样本变量值随机性检验(游程检验)单样本Kolmogorov—Smirnov检验检验总体正态分布9/83

P-P正态概率分布图(GraphsP-P)

Q-Q正态概率单位分布图(GraphsQ-Q)检验总体正态分布图示法

是依据变量累计百分比对所指定理论分布累计百分比绘制图形。

是依据变量分布分位数对所指定理论分布分位数绘制图形。10/8311/83半正态分布(Half-normal)伽玛分布(Gamma)指数分布(Exponential)TestDistribution提供13种概率分布:贝塔分布(Beta)卡方分布(Chi-square)拉普拉斯分布(Laplace)逻辑斯谛分布(Logistic)对数正态分布(Lognormal)正态分布(Normal)帕累托分布(Pareto)T分布(StudentT)威布尔分布(Weibull)均匀分布(Uniform)12/83Blom’s方法:使用公式:Tukey方法:使用公式:Rankit方法:使用公式:VanderWaerden方法:使用公式:n:个案数目r:从1到n秩次式中:选择比率估测公式,每次只能选择一项。13/83

若与某个概率分布统计图一致,即被检验数据符合所指定分布,则代表个案点簇在一条直线上。14/83

总体分布卡方检验原理:假如从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在XK个互不相交子集中观察频数服从一个多项分布,该多项分布当K趋于无穷时,就近似服从X总体分布。

所以,假设样原来自总体服从某个期望分布或理论分布,同时取得样本数据各子集实际观察频数,则可依据下面统计量作出推断:例题检验总体卡方分布15/83

例题:某地一周内每日患忧郁症人数如表所表示,请检验一周内每日人们忧郁数是否满足1:1:2:2:1:1:1。周日患者数131238370480529624731SPSS实现过程1.定义变量;2.变量加权;3.进入Analyze菜单16/8317/83

用于选择计算非参数检验统计量对应P值方法。SPSS提供了3种计算P值方法:Asymptoticonly:渐进性显著性检验,适合于样本服从渐进分布或较大样本。MonteCarlo:不依赖渐进性方法估测准确显著性,这种方法在数据不满足渐进性分布,而且样本数据过大以致不能计算准确显著性时尤其有效。Exact:准确计算法,即准确计算观察结果统计概率。计算量较大,适合用于小样本。18/8319/83

卡方检验要求样本量是充分大,使用时提议样本容量应该大于30,同时每个单元中期望频数不能太小,假如有类别频数小于5,则提议将它与相邻类别合并,假如有20%单元期望频数都小于5,就不能再使用卡方检验了。20/83

练习:赛马比赛时,任一马起点位置是起跑线上所指定标杆位置。现有8匹马比赛,位置1是内侧最靠近栏杆跑道,位置8是外侧离栏杆最远跑道,下表是某赛马在一个月内某特定圆形跑道上纪录,而且按照起点标杆位置分类。试检验起点标杆位置对赛马结果影响。起点标杆位置总数12345678获胜频数2919182517101511144马在8个圆形跑道起点标杆位置上获胜纪录均匀分布检验21/83

二项分布检验基本思想:依据搜集到样本数据,推断总体分布是否服从某个指定二项分布。SPSS中二项分布检验,在样本小于等于30时,按照计算二项分布概率公式进行计算;样本数大于30时,计算是Z统计量,认为在零假设下,Z统计量服从正态分布。

其零假设:样原来自总体与所指定某个二项分布不存在显著差异。K:观察变量取值样本个数,当K小于n/2时,取加号;p为检验概率。练习检验总体二项分布22/83

练习:某地某一时期内出生35名婴儿,其中女孩儿19名(Sex=0),男孩儿16名(Sex=1)。问,该地域出生婴儿性别百分比与通常男女性别百分比(总体概率约为0.5)是否不一样?数据以下表所表示:续23/83婴儿性别婴儿Sex婴儿Sex11131251201412613115127041161280511702906118030070190311802003209021033010022034011123135012124135名婴儿性别24/8325/8326/83单样本变量值随机性检验(游程检验)

依时间或其它次序排列有序数列中,含有相同事件或符号连续部分称为一个游程。调用Runs过程可进行游程检验,即用于检验序列中事件发生过程随机性分析。

单样本变量值随机性检验是对某变量取值出现是否随机进行检验,也称游程检验。例题27/83例题:某村发生一个地方病,其住户沿一条河排列,调查时对发病住户标识为“1”,对非发病住户标识为“0”,共20户,其取值以下表所表示:续28/8335家住户发病情况住户发病情况住户发病情况住户发病情况11131251201412613115127041161281511702906118030070191311802013209021033010022034011123135012124129/8330/8331/83单样本Kolmogorov—Smirnov检验

单样本K—S检验是一个拟合优度非参数检验,是利用样本数据推断总体是否服从某一理论分布方法,适合用于探索连续性随机变量分布形态。进行Kolmogorov-SmirnovZ检验,是将一个变量实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)进行比较。SPSS实现K—S检验过程以下:32/83(1)依据样本数据和用户指定结构出理论分布,查分布表得到对应理论累计概率分布函数。(2)利用样本数据计算各样本数据点累积概率,得到检验累计概率分布函数

。(3)计算和在对应变量值点X上差,得到差值序列。单样本K—S检验主要对差值序列进行研究。例题33/83

例题:某地144个周岁儿童身高数据以下表,问该地域周岁儿童身高频数是否成正态分布?身高区间人数64—268—469—770—1671—2072—2573—2474—2276—1678—279—683—134/8335/8336/83

练习:某报刊亭为研究天天报刊销售量,为以后天天报刊进量提供依据,统计其在140天销售中,某日报日销售量频数资料以下表,问该资料频数是否服从正态分布?日销售量(份)天数日销售量(份)天数<1592210~21924160~1694220~22922170~1797230~23916180~18916240~2492190~19920250~2596200~20925>260137/83两个总体独立样本非参数检验检验两个总体分布是否相同:方差相同分布函数形式相同两个总体分布若相同参数相同均值相同(2)两个总体分布未知,它们是否相同;38/83Wald-wolfowitzRuns游程检验Mann-WhitneyU秩和检验Kolmogorov—Smirnov检验MosesExtremeReactions极端反应检验两个总体独立样本非参数检验方法两个总体独立样本非参数检验方法SPSS操作39/83零假设:样原来自两独立总体分布无显著差异

K-S检验实现方法:将两组样本数据混合并升序排列,分别计算两组样本秩累计频率和每个点上累积频率,然后将两个累计频率相减,得到差值序列数据。K-S检验将关注差值序列,并计算K-SZ统计量,依据正态分布表给出对应相伴概率值。(1)Kolmogorov—Smirnov检验40/83两组样本是能够各自独立颠倒次序(2)Mann-WhitneyU秩和检验法检验这两组样本是否来自同一个总体(或两组样本总体分布是否相同)。问题:有两个总体样本为:与可能。。Mann-WhitneyU检验统计量是:式中对给定,查值表,得若,则总体分布相同。41/83

两样本Wald-wolfowitz游程检验中,计算游程方法与观察值秩相关。首先,将两组样本混合并升序排列。在数据排序时,两组样本每个观察值对应样本组标志值序列也随之重新排列,然后对标志值序列求游程。

假如计算出游程数相对比较小,则说明样原来自两总体分布形态存在较大差距。SPSS将自动计算游程数得到Z统计量,并依据正态分布表给出对应相伴概率值。(3)Wald-wolfowitz游程检验42/83

假如跨度或截头跨度很小,说明两个样本数据无法充分混合,认为试验样本存在极端反应。

两独立样本极端反应检验,将一个样本作为控制样本,另一个样本作为试验样本。以控制样本做对照,检验试验样本是否存在极端反应。

首先,将两组样本混合并升序排列;然后计算控制样本最低秩和最高秩之间观察值个数,即:Span(跨度)。

为控制极端值对分析结果影响,可先去掉样本两个最极端观察值后,再求跨度,这个跨度称为截头跨度。零假设:样原来自两独立总体分布没有显著差异。(4)Moses极端反应检验43/83两组独立样本总体分布是否相同检验比如:用两种激励方法对一样工种两个班组进行激励,每个班组都有7个人,测得激励后业绩增加率以下表所表示,问:两种激励方法激励效果分布有没有显著差异?两种激励方法分别用于两个班组效果(%)激励法A16.1017.0016.8016.5017.5018.0017.20激励法B17.0016.4015.8016.4016.0017.1016.90SPSS实现过程:

点击进入Analyze菜单NonparametricTests子菜单,选择2IndependentSample命令。44/8345/83

MosesExtremeReactions(极端检验):检验两个独立样本观察值散布范围是否有差异存在,以检验两个样本是否来自含有同一分布总体。

Mann-WhitneyU:检验两个独立样本所属总体均值是否相同。

Kolmogorov-SmirnovZ(K—S):推测两个样本是否来自含有相同分布总体。

Wald-Wolfowitzruns(游程检验):考查两个独立样本是否来自含有相同分布总体。46/8347/83

练习:研究两个不一样厂家生产灯泡使用寿命是否存在显著性差异,随机抽取两个厂家生产灯泡,试验得到使用寿命数据以下表:灯泡寿命厂家编号6751682169116701650169316501649268026302650264626512620248/83两个总体配对样本非参数检验方法McNemar检验Sign符号检验法(正负号检验法)Wilcoxon秩和检验49/83(1)Wilcoxon秩和检验法

设有两个总体样本为:把两组样本放在一起,按样本观察值较多地集中在左段。w太大,说明样本较多地集中在右段。。两组样本是能够各自独立颠倒次序。可能与w太小,说明样本(秩)加总起来,记为w。假如两个总体分布相同,则样本应该是均匀混合,即w不能太小,也不能太大。序号为秩。把样本个数少这组样本那么每个观察值就有一个序号,称大小重新排序,不妨设续50/83显著性水平,则接收

因为,∴w应在某两个数字之间:,能够由威尔可可逊表,依据是由所决定。对于给定查出。若,或,则拒绝反之,若。51/83McNemar改变显著性检验,以研究对象本身为对照,检验其两组样本“前后”改变是否显著。该检验要求待检验两组样本观察值是二值数据。即该法适合用于相关二分变量数据。零假设:样原来自两配对总体分布无显著差异McNemar改变显著性检验基本方法:二项分布检验。例题(2)McNemar检验52/83

例题:分析学生接收某种方法进行训练效果,搜集到10个学生在训练前、训练后成绩以下表所表示,问训练前后学生成绩是否存在显著性差异?训练前训练后训练前成绩训练后成绩0158.0070.001170.0071.000145.0065.000156.0068.000045.0050.000050.0055.001161.0075.001170.0070.000155.0065.001160.0070.0053/8354/8355/83不能各自独立地颠倒次序。要求样本发生概率为(3)符号检验法(正负号检验法)复习二项分布:或在次重复努力试验中,事件,在次试验中出现次数为,则假如随机变量分布以下:则称服从参数为二项分布,记为且二项分布均值为,方差为。56/83若随机变量X~分布,则统计量且,定理一:~定理二:函数均值定理三:

当充分大时,近似地服从均值、正态分布,即标准差为

按照经验,只要,同时,,就可以认为足够大了,用正态分布来近似它。57/83符号检验法思绪:若两个总体分布相同,即,则令::个数个数:个数:个数:则设∴式中用容量相同两个配对样本来检验,即所以问题转化为:58/83求从小到大累积概率:正负号个数检验法处理①小样本情况下:对对求从大到小累积概率:即若则接收是拒绝最高界限。是拒绝最低界限。小样本情况下大样本情况下S统计量59/83对于显著性水平假设:(即式中用(即))绝还是接收。所谓“大样本”,就是要检验统计量为:代替,得出拒是否大于判断,同时

②大样本情况下,正负号个数检验法处理60/83例一个卖衬衣邮购店从过去经验中得知有15%购置者说衬衣大小不合身,要求退货。现这家邮购店改进了邮购定单设计,结果在以后售出500件衬衣中,有60件要求退货。问:在5%a水平上,改进后退货百分比(母体百分比)与原来退货百分比有没有显著差异?

因为=500×0.15=75>25,已经足够大,故由中心极限定理,近似地服从均值为、正态分布。于是取显著性水平,方差为解::61/83与可从“符号检在显著性水平之下,依据S=min(,)③处理正负号个数检验法S统计量方法

,选统计量:记,若则拒绝假设认为则接收假设若,认为。这一检验法主要前提与前两个方法相同,验表”中查出

:与就越靠近。S越小,差异就越大与即按照问题原来属性,天然地配对。不能各自独立地颠倒次序。或样本注意:S越大,62/83多独立样本K—W检验多独立样本Median检验多个总体独立样本非参数检验多独立样本K—T检验63/83SPSS实现过程中,将多组样本数据混合并升序排列,求出混合样本数据中位数,并假设是共同中位数。

假如多组独立样本中位数无显著差异,则说明多组独立样本有共同中位数。假如每组中大于该中位数中位数大致等于每组中小于该中位数样本数,则能够认为该多个独立总体中位数没有显著差异。多独立样本中位数检验

经过对多组数据分析,推断多个独立总体分布是否存在显著差异。

零假设:样原来自多个独立总体中位数无显著差异。64/83多独立样本K—W检验

零假设:样原来自多个独立总体分布无显著差异。SPSS实现,将多组样本数据混合并升序排列,求出求出每个观察值秩,然后对多组样本值分别求平均值。假如各组样本平均秩大致相等,则认为多个独立总体分布无显著差异。n第i组样本观察值个数;R平均秩。例题65/83

例题:随机抽取3个班级学生21个成绩样本,问3个班级学生总体成绩是否存在显著差异?学生成绩所属班级学生成绩所属班级60.00190.00270.00196.00271.00170.00280.00185.00375.00192.00365.00197.00390.00196.00380.00288.00385.00289.00381.00280.00383.00266/8367/8368/83多个总体配对样本非参数检验多配对样本Friendman检验多配对样本Kendall检验多配对样本CochranQ检验69/83多配对样本Friendman检验要求:数据是定距。

实现原理:以样本为单位,将各个样本数据按照升序排列,求各个样本数据在各自行中秩,然后计算个样本秩总和及平均秩。

假如多个配对样本分布存在显著性差异,则数值普遍偏大组秩和必定偏大,各组秩之间就会存在显著差异。假如个样本平均秩大致相当,则能够认为个组总体分布没有显著差异。例题70/83

例题:为了试验某种减肥药品性能,测量11个人在服用该药以前以及服用该药1个月后、2个月后、3个月后体重。问:在这4个时期,11个人体重有没有发生显著改变?Pre-1Post-1Post-2Post-380.0080.0070.0069.0079.0075.0071.0070.0085.0080.0075.0075.0080.0075.0068.0070.0075.0075.0074.0070.0074.0074.0070.0069.0065.0065.0063.0061.0070.0070.0070.0070.0080.0070.0065.0065.0075.0072.0070.0060.0080.0080

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论