《非参数假设检验》第四次课新.ppt

上传人：m*** IP属地：四川上传时间：2020-04-01 格式：PPT 页数：88 大小：4.14MB 积分：15 举报 版权申诉

已阅读5页，还剩83页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

非参数假设检验追求非参数检验是相对于参数检验而言的这两种检验方法在实际中都有广泛的应用但它们有着不同的数理统计原理和应用场合在统计学的发展过程中最先出现的推断统计方法都对样本所属总体的性质作出若干假设即对总体的分布形状作某些限定例如Z检验 t检验假设样本的总体分布加以某些限定把所要推断的总体数字特征看作未知的参数进行推断称之为参数统计方法 Parameterstatisticalmethods 或限定分布统计方法 distribution specifiedstatisticalmethods 基于此所做的假设检验就称为参数检验 Parametrictest 常用的检验如t检验 Z检验 F检验等都是参数检验参数检验只有在关于总体分布的假设成立时所得出的结论才是正确的所以它在很多场合不便应用于是统计学家发展了许多对总体不作太多或严格限定的统计推断方法这些方法一般不涉及总体参数的假设与之相对应的统计方法通常称为非参数统计 Nonparametricstatistics 或自由分布统计方法 Distribution freestatiscalmethods 基于此所做的假设检验则称为非参数检验 Nonparametrictest 或自由分布统计检验 Distribution freestatisticaltest 非参数检验的前提假设比参数检验方法少很多也容易满足适用于已知信息相对较少的数据资料而且它的计算方法也简便易行对于多数参数检验方法都有一种或几种相对应的非参数检验方法如下表所示参数检验与非参数检验方法的对应表与参数检验方法对比非参数检验方法具有以下优点检验条件宽松适应性强参数检验假定总体分布为正态近似正态或以正态分布为基础而构造的t分布或分布非参数检验不受这些条件的限制弥补了参数检验的不足对于非正态的方差不等的以及分布形状未知的数据都适用检验方法灵活用途广泛非参数检验不但可以应用与定距定比等连续变量的检验而且适用于定类定序等分类变量的检验对于那些不能直接进行四则运算的定类数据和定序数据运用符号检验符号秩检验都能起到好的效果非参数检验的计算相对简单易于理解由于非参数检验更多地采用计数的方法其过程及结果都可以被直观地理解为使用者所接受非参数检验的优点非参数检验的缺点非参数检验也有一些不可避免的缺点非参数检验方法对总体分布的假定不多适应性强但方法本身也就缺乏针对性其功效不如参数检验非参数检验使用的是等级或符号秩而不是实际数值方法虽简单但会失去许多信息因而检验的有效性也就比较差例如对于一批适用于t检验的配对资料如果采用符号秩检验处理其功效将低于t检验如果用符号检验处理则效率更低因为它对信息的利用更不充分当然如果假定的分布不成立那么非参数检验就是更值得信赖的一个总体分布的非参数假设检验 2 两个总体的分布未知它们是否相同非参数假设检验需要处理的问题 1 猜出总体的分布假设用另一组样本检验两个总体分布的非参数假设检验内容多个总体分布的非参数假设检验配对样本非参数检验 SPSS的非参数检验一个总体单样本总体分布的检验两个总体多个总体独立样本非参数检验配对样本非参数检验独立样本非参数检验一个总体分布的检验检验总体的卡方分布检验总体的二项分布单样本变量值的随机性检验游程检验单样本的Kolmogorov Smirnov检验检验总体的正态分布 P P正态概率分布图 GraphsP P Q Q正态概率单位分布图 GraphsQ Q 检验总体的正态分布的图示法是根据变量的累计比例对所指定的理论分布累计比例绘制的图形是根据变量分布的分位数对所指定的理论分布分位数绘制的图形半正态分布 Half normal 伽玛分布 Gamma 指数分布 Exponential TestDistribution提供13种概率分布贝塔分布 Beta 卡方分布 Chi square 拉普拉斯分布 Laplace 逻辑斯谛分布 Logistic 对数正态分布 Lognormal 正态分布 Normal 帕累托分布 Pareto T分布 StudentT 威布尔分布 Weibull 均匀分布 Uniform Blom s方法使用公式 Tukey方法使用公式 Rankit方法使用公式 VanderWaerden方法使用公式 n 个案的数目r 从1到n的秩次式中选择比率估测的公式每次只能选择一项若与某个概率分布的统计图一致即被检验的数据符合所指定的分布则代表个案的点簇在一条直线上总体分布的卡方检验的原理如果从一个随机变量X中随机抽取若干个观察样本这些观察样本落在X的K个互不相交的子集中的观察频数服从一个多项分布该多项分布当K趋于无穷时就近似服从X的总体分布因此假设样本来自的总体服从某个期望分布或理论分布同时获得样本数据各子集的实际观察频数则可依据下面统计量作出推断例题检验总体的卡方分布例题某地一周内每日患忧郁症的人数如表所示请检验一周内每日人们忧郁的数是否满足1 1 2 2 1 1 1 SPSS实现过程 1 定义变量 2 变量加权 3 进入Analyze菜单用于选择计算非参数检验统计量对应的P值的方法 SPSS提供了3种计算P值的方法 Asymptoticonly 渐进性的显著性检验适合于样本服从渐进分布或较大样本 MonteCarlo 不依赖渐进性方法估测精确显著性这种方法在数据不满足渐进性分布而且样本数据过大以致不能计算精确显著性时特别有效 Exact 精确计算法即准确计算观测结果的统计概率计算量较大适用于小样本卡方检验要求样本量是充分大的使用时建议样本容量应该不小于30 同时每个单元中的期望频数不能太小如果有类别的频数小于5 则建议将它与相邻的类别合并如果有20 的单元期望频数都小于5 就不能再使用卡方检验了练习赛马比赛时任一马的起点位置是起跑线上所指定的标杆位置现有8匹马的比赛位置1是内侧最靠近栏杆的跑道位置8是外侧离栏杆最远的跑道下表是某赛马在一个月内某特定圆形跑道上的纪录并且按照起点的标杆位置分类试检验起点标杆位置对赛马结果的影响马在8个圆形跑道的起点标杆位置上获胜的纪录均匀分布检验二项分布检验的基本思想根据搜集到的样本数据推断总体分布是否服从某个指定的二项分布 SPSS中的二项分布检验在样本小于等于30时按照计算二项分布概率的公式进行计算样本数大于30时计算的是Z统计量认为在零假设下 Z统计量服从正态分布其零假设样本来自的总体与所指定的某个二项分布不存在显著的差异 K 观察变量取值的样本个数当K小于n 2时取加号 p为检验概率练习检验总体的二项分布练习某地某一时期内出生35名婴儿其中女孩儿19名 Sex 0 男孩儿16名 Sex 1 问该地区出生婴儿的性别比例与通常的男女性别比例总体概率约为0 5 是否不同数据如下表所示续 35名婴儿的性别单样本变量值的随机性检验游程检验依时间或其他顺序排列的有序数列中具有相同的事件或符号的连续部分称为一个游程调用Runs过程可进行游程检验即用于检验序列中事件发生过程的随机性分析单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验也称游程检验例题例题某村发生一种地方病其住户沿一条河排列调查时对发病的住户标记为 1 对非发病的住户标记为 0 共20户其取值如下表所示续 35家住户的发病情况单样本的Kolmogorov Smirnov检验单样本K S检验是一种拟合优度的非参数检验是利用样本数据推断总体是否服从某一理论分布的方法适用于探索连续性随机变量的分布形态进行Kolmogorov SmirnovZ检验是将一个变量的实际频数分布与正态分布 Normal 均匀分布 Uniform 泊松分布 Poisson 进行比较 SPSS实现K S检验的过程如下 1 根据样本数据和用户的指定构造出理论分布查分布表得到相应的理论累计概率分布函数 2 利用样本数据计算各样本数据点的累积概率得到检验累计概率分布函数 3 计算和在相应的变量值点X上的差得到差值序列单样本K S检验主要对差值序列进行研究例题例题某地144个周岁儿童身的高数据如下表问该地区周岁儿童身高频数是否成正态分布练习某报刊亭为研究每天报刊的销售量为以后每天报刊进量提供依据统计其在140天的销售中某日报的日销售量的频数资料如下表问该资料的频数是否服从正态分布两个总体独立样本的非参数检验检验两个总体的分布是否相同方差相同分布函数形式相同两个总体的分布若相同参数相同均值相同 2 两个总体的分布未知它们是否相同 Wald wolfowitzRuns游程检验 Mann WhitneyU秩和检验 Kolmogorov Smirnov检验 MosesExtremeReactions极端反应检验两个总体独立样本的非参数检验方法两个总体独立样本非参数检验方法的SPSS操作零假设样本来自的两独立总体分布无显著差异 K S检验实现的方法将两组样本数据混合并升序排列分别计算两组样本秩的累计频率和每个点上的累积频率然后将两个累计频率相减得到差值序列数据 K S检验将关注差值序列并计算K S的Z统计量依据正态分布表给出相应的相伴概率值 1 Kolmogorov Smirnov检验两组样本是可以各自独立颠倒顺序的 2 Mann WhitneyU秩和检验法检验这两组样本是否来自同一个总体或两组样本的总体分布是否相同问题有两个总体的样本为与可能 Mann WhitneyU检验的统计量是式中对给定查值表得若则总体分布相同两样本Wald wolfowitz游程检验中计算游程的方法与观察值的秩有关首先将两组样本混合并升序排列在数据排序时两组样本的每个观察值对应的样本组标志值序列也随之重新排列然后对标志值序列求游程如果计算出的游程数相对比较小则说明样本来自的两总体分布形态存在较大差距 SPSS将自动计算游程数得到Z统计量并依据正态分布表给出对应的相伴概率值 3 Wald wolfowitz游程检验如果跨度或截头跨度很小说明两个样本数据无法充分混合认为实验样本存在极端反应两独立样本的极端反应检验将一个样本作为控制样本另一个样本作为实验样本以控制样本做对照检验实验样本是否存在极端反应首先将两组样本混合并升序排列然后计算控制样本最低秩和最高秩之间的观察值个数即 Span 跨度为控制极端值对分析结果的影响可先去掉样本两个最极端的观察值后再求跨度这个跨度称为截头跨度零假设样本来自的两独立总体分布没有显著差异 4 Moses极端反应检验两组独立样本的总体分布是否相同的检验例如用两种激励方法对同样工种的两个班组进行激励每个班组都有7个人测得激励后的业绩增长率如下表所示问两种激励方法的激励效果的分布有无显著差异两种激励方法分别用于两个班组的效果激励法A16 1017 0016 8016 5017 5018 0017 20 激励法B17 0016 4015 8016 4016 0017 1016 90 SPSS的实现过程点击进入Analyze菜单的NonparametricTests子菜单选择2IndependentSample命令 MosesExtremeReactions 极端检验检验两个独立样本观察值的散布范围是否有差异存在以检验两个样本是否来自具有同一分布的总体 Mann WhitneyU 检验两个独立样本所属的总体均值是否相同 Kolmogorov SmirnovZ K S 推测两个样本是否来自具有相同分布的总体 Wald Wolfowitzruns 游程检验考察两个独立样本是否来自具有相同分布的总体练习研究两个不同厂家生产的灯泡使用寿命是否存在显著性差异随机抽取两个厂家生产的灯泡试验得到的使用寿命数据如下表两个总体配对样本的非参数检验方法 McNemar检验 Sign符号检验法正负号检验法 Wilcoxon秩和检验 1 Wilcoxon秩和检验法设有两个总体的样本为把两组样本放在一起按样本观察值较多地集中在左段 w太大说明样本较多地集中在右段两组样本是可以各自独立颠倒顺序的可能与 w太小说明样本秩加总起来记为w 如果两个总体的分布相同则样本应当是均匀混合的即w不能太小也不能太大的序号为秩把样本个数少的这组样本那么每个观察值就有一个序号称的大小重新排序不妨设续显著性水平则接受由于 w应在某两个数字之间可以由威尔可可逊表依据是由所决定的对于给定的查出若或则拒绝反之若 McNemar变化显著性检验以研究对象自身为对照检验其两组样本前后变化是否显著该检验要求待检验的两组样本的观察值是二值数据即该法适用于相关的二分变量数据零假设样本来自的两配对总体分布无显著差异 McNemar变化显著性检验基本方法二项分布检验例题 2 McNemar检验例题分析学生接受某种方法进行训练的效果收集到10个学生在训练前训练后的成绩如下表所示问训练前后学生的成绩是否存在显著性差异不能各自独立地颠倒顺序要求样本发生的概率为 3 符号检验法正负号检验法复习二项分布或在次重复努力试验中事件在次试验中出现的次数为则如果随机变量的分布如下则称服从参数为的二项分布记为且二项分布的均值为方差为若随机变量X 分布则统计量且定理一定理二函数的均值定理三当充分大时近似地服从均值的正态分布即标准差为符号检验法的思路若两个总体的分布相同即则令则设式中用容量相同的两个配对样本来检验即所以问题转化为求从小到大的累积概率正负号个数检验法的处理小样本情况下对对求从大到小的累积概率即若则接受是拒绝的最高界限是拒绝的最低界限小样本情况下大样本情况下 S统计量对于显著性水平假设即式中用即绝还是接受所谓大样本就是要检验统计量为代替得出拒是否大于判断同时大样本情况下正负号个数检验法的处理例一个卖衬衣的邮购店从过去的经验中得知有15 的购买者说衬衣的大小不合身要求退货现这家邮购店改进了邮购定单的设计结果在以后售出的500件衬衣中有60件要求退货问在5 的a水平上改进后的退货比例母体比例与原来的退货比例有无显著差异与可从符号检在显著性水平之下依据 S min 处理正负号个数检验法的S统计量方法选统计量记若则拒绝假设认为则接受假设若认为这一检验法的重要的前提与前两个方法相同验表中查出与就越接近 S越小的差别就越大与即按照问题本来的属性天然地配对不能各自独立地颠倒顺序或样本注意 S越大多独立样本的K W检验多独立样本的Median检验多个总体独立样本的非参数检验多独立样本的K T检验 SPSS实现的过程中将多组样本数据混合并升序排列求出混合样本数据的中位数并假设是共同的中位数如果多组独立样本的中位数无显著差异则说明多组独立样本有共同的中位数如果每组中大于该中位数的中位数大致等于每组中小于该中位数的样本数则可以认为该多个独立总体的中位数没有显著差异多独立样本的中位数检验通过对多组数据的分析推断多个独立总体分布是否存在显著差异零假设样本来自的多个独立总体的中位数无显著差异多独立样本的K W检验零假设样本来自的多个独立总体的分布无显著差异 SPSS的实现将多组样本数据混合并升序排列求出求出每个观察值的秩然后对多组样本的值分别求平均值如果各组样本的平均秩大致相等则认为多个独立总体的分布无显著差异 n第i组样本的观察值个数 R平均秩例题例题随机抽取3个班级学生的21个成绩样本问3个班级学生总体成绩是否存在显著差异多个总体配对样本的非参数检验多配对样本的Friendman检验多配对样本的Kendall检验多配对样本的CochranQ检验多配对样本的Friendman检验要求数据是定距的实现原理以样本为单位将各个样本数据按照升序排列求各个样本数据在各自行中的秩然后计算个样本的秩总和及平均秩如果多个配对样本的分布存在显著性差异则数值普遍偏大组的秩和必然偏大各组的秩之间就会存在显著差异如果个样本的平均秩大致相当则可以认为个组的总体分布没有显著差异例题例题为了试验某种减肥药物的性能测量11个人在服用该药以前以及服用该药1个月后 2个月后 3个月后的体重问在这4个时期 11个人的体重有无发生显著的变化多配对样本的Kendall检验主要用于分析评判者的判别标准是否一致公平

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《非参数假设检验》第四次课新.ppt

文档简介

温馨提示

最新文档

评论

《非参数假设检验》第四次课新.ppt

文档简介

温馨提示

最新文档

评论

相关文档