第六章SPSS的非参数检验_第1页
第六章SPSS的非参数检验_第2页
第六章SPSS的非参数检验_第3页
第六章SPSS的非参数检验_第4页
第六章SPSS的非参数检验_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 SPSS的非参数检验 v 第1节 单样本的非参数检验v 第2节 两独立样本的非参数检验v 第3节 多独立样本的非参数检验v 第4节 两配对样本的非参数检验v 第5节 多配对样本的非参数检验统计方法描述统计描述统计推断统计推断统计估计估计假设检验假设检验非参数检验非参数检验参数检验参数检验推断统计 推断统计是根据样本数据推断总体数量特征的统计分析方法 推断统计通常包括以下两个内容 总体分布已知,根据样本数据对总体分布的统计参数(如均值、方差)进行推断,此时采用的推断方法称为参数估计或者参数检验 总体分布未知,根据样本数据对总体的分布形式进行推断,此时采用的推断方法称为非参数检验非参数检验

2、的概念 无需假定总体分布的具体形式,仅仅依赖于数据观测值的相对大小(秩)建立检验统计量;然后找到在零假设下这些统计量的分布;并且看这些统计量的数据是否在零假设下属于小概率事件. 这种和数据本身的具体总体分布无关进行的检验都称为非参数检验(nonparametric testing) 由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验非参数检验在总体分布的优越性 非参数检验在总体分布未知时有很大的优越性。在分布未知时,还假定总体有诸如正态分布那样的分布,在进行统计推断就可能产生错误,非参数检验总是比传统检验安全。 但在总体分布形式已知时,非参数检验不如传统方法效率高

3、。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。 非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定SPSS非参数检验 在总体分布未知的情况下,利用样本数据对总体的分布或各总体的分布特征是否有显著差异进行推断 SPSS中的非参数检验方法: 单样本非参数检验 两独立样本的非参数检验 多独立样本的非参数检验 两配对样本的非参数检验 多配对样本的非参数检验SPSS单样本非参数检验 得到一批样本数据以后,往往希望了解样本来自的总体的分布是否与某个已知的理论分布相吻合。可以通过绘制样本数据的直方图

4、、P-P图、Q-Q图等方法作粗略判断,还可以利用非参数检验的方法实现。 SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法。包括: 总体分布的chi-square检验 二项分布检验 K-S检验 变量值随机性检验等总体分布的卡方(chi-square)检验 目的: 根据样本数据推断总体的分布与某个已知分布(某一理论分布)是否有显著差异-吻合性检验 通常适用于对有多项分类值资料的总体分布统计推断 原假设: 样本来自的总体分布与期望分布或某一理论分布无显著差异总体分布的卡方(chi-square)检验 基本思想 如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的k个互不相

5、交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。基于这一思想,对变量X总体分布的检验就可从对各个观察频数的分析入手 在原假设成立的条件下,如果变量值落在第i子集中的理论概率值为Pi,则相应的期望频数便为npi。由此计算出的期望频数分布代表了原假设成立时的理论分布。为检验实际分布是否与理论分布(期望分布)一致,可采用卡方检验统计量总体分布的卡方(chi-square)检验 卡方统计量:Pearson卡方 k为子集个数; 服从k-1个自由度的卡方分布 如果卡方值较大,说明观测频数分布与期望频数分布差距较大 如果卡方值较小,则说明观测频数分布与期望频数分布较接近 如

6、果p大于,不能拒绝H0,认为总体分布与已知分布无显著差异.反之,则应拒绝原假设kioieioifff122)(总体分布的chi-square检验基本操作步骤 数据要求:原始数据(1个变量)或加权后的频数数据(2个变量) 菜单:analyze-Nonparametric test-chi square待检验变量待检验个案的取值范围全部样本用户自定义:只有在该取值范围内的观测数据才参与分析指定期望频数所有子集频数都相同-均匀分布用户自定义依次输入例题 6.1 医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病人猝死者比较多,其他日子则基本相当。各天的比例近似为2.8:1:1:1

7、:1:1:1。现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合。 “心脏病猝死.sav”二项分布检验 基本思想 在现实生活中有很多数据的取值是二值的,例如,人群可以分成男性和女性,产品可以分成合格和不合格,投掷硬币实验的结果可以分成出现正面和反面等。通常将这样的二值分别用1和0表示 如果进行n次相同的实验,则出现两类(1或0)的次数可以用离散型随机变量来描述。如果随机变量值为1代表“成功”,其概率设为p,则随机变量值为0的概率q便等于1-p,则成功次数变量X的分布为二项分布二项分布检验 SPSS的二项分布检验:通过样本数据检验样本来自的总体是否服从指定的概率为p的二项

8、分布 原假设:样本来自的总体与指定的二项分布无显著差异二项分布检验 SPSS二项分布检验 在小样本中采用精确检验方法 大样本则采用近似检验方法 精确检验方法:计算n次试验中某类出现的次数小于等于x次的概率,即二项分布检验 近似检验方法 采用Z检验统计量,在原假设成立下Z统计量近似服从正态分布,其数学定义为 式中进行了连续性修正,当x小于n/2时加0.5,当x大于n/2时减0.5 SPSS自动计算上述精确概率和近似概率值。如果概率值小于显著性水平.则拒绝原假设,认为样本来自的总体与指定的二项分布有显著差异;如果概率值大于显著性水平a,则不能拒绝原假设,认为样本来自的总体与指定的二项分布无显著差异

9、)1 (5 . 0qnpnpxz二项分布基本操作步骤 选择菜单: AnalyzeNonparametric Tests Binomial待检验变量指定分类方式检验变量为二值变量检验变量不是二值变量输人具体数值,小于等于该值的观察值为第一组,大于该值的观察值为第二组检验概率值p例题 6.2 从某批产品中随机抽取23个样品进行检测并得到检测结果数据。用1表示一级品,用0表示非一级品。根据抽样结果验证该品产品的一级品率是否为90%。 “产品合格率.sav”SPSS单样本的K-S检验 K-S检验是以俄罗斯数学家柯尔莫哥和斯米诺夫(Kolmogorov-Smirnov)的名字命名的一种非参数检验方法 利

10、用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法 适用于探索连续型随机变量的分布 正态分布,Poisson分布,均匀分布和指数分布 例如 收集一批周岁儿童身高的样本数据,需利用样本数据推断周岁儿童总体的身高是否服从正态分布 利用收集的住房状况调查的样本数据,分析家庭人均住房面积是否服从正态分布SPSS单样本的K-S检验 基本思路:基本思路: 在原假设成立的前提下,根据用户指定检验的总体分布,构造出一理论的频数分布,计算各样本观测值在理论分布中出现的累计概率值F(x) 计算各样本观测值的实际累计概率值S(x) 计算实际累计概率值与理论累计概率值的差D(x) 计算差值序列

11、中的最大绝对差值,即实际累积概率为离散值,因此修正为: 如果相差较小,则认为样本所代表的总体符合指定的总体分布) )F(x- )S(xmax(Dii)F(x-)S(xmax(Di1 - iSPSS单样本的K-S检验 在小样本下,原假设成立时,D统计量服从Kolmogorov分布 在大样本下,原假设成立时, 近似服从K (x)分布: 当D小于0时,K(x)为0 当D大于0时, 如果样本总体的分布与理论分布的差异不明显,那么D不应较大。如果D统计量的概率P值小于显著性水平,则应拒绝原假设,认为样本来自的总体与指定的分布有显著差异。反之。 在SPSS中,仅给出大样本下的 和对应的概率p值Dn)2ex

12、p() 1()(22xjxKjDnSPSS的单样本K-S检验基本步骤 菜单选项:analyze-nonparametric tests-1-sample k-s待检验变量指定检验的分布名称:normal:正态分布 uniform:均匀分布possion:泊松分布 exponential:指数分布Exact: 精确方法Monte Carlo: Monte Carlo抽样方法Asymptotic only: 用于大样本的渐近方法SPSS的单样本K-S检验 经常有人在Kolmogorov-Smirnov检验中,当检验不能拒绝总体分布为某分布时,来“接受”或“证明”该样本来自该分布。这是错误的。 比如

13、我们有由1、2、3、4、5五个数目组成的数据,我们分别检验该数据是否是正态分布、均匀分布、Poisson分布或指数分布。结果归纳为下表Kolmogorov-Smirnov单样本分布检验单样本分布检验零假设的分布零假设的分布 (渐近双边检验的)(渐近双边检验的)p-值值正态分布正态分布1.000均匀分布均匀分布0.988Poisson分布分布1.000指数分布指数分布0.806根据此表,没有足够证据来拒绝任何一个零假设。难道我根据此表,没有足够证据来拒绝任何一个零假设。难道我们可以随意们可以随意“接受接受”该总体为其中任一个分布吗?该总体为其中任一个分布吗? 例题 6.3 收集到21名周岁儿童身

14、高的样本数据,分析周岁儿童身高的总体是否服从正态分布 “儿童身高.sav”变量值Z分数理论累积概率 实际累计概率差值修正差值64-1.97490.02410.04760.0235.68-0.96950.16610.19050.0243-0.118568-0.96950.16610.19050.02430.024468-0.96950.16610.19050.02430.024469-0.71810.23630.23810.0018-0.045870-0.46680.32030.3810.0606-0.082270-0.46680.32030.3810.06060.060770-0.46680.

15、32030.3810.06060.060771-0.21540.41470.6190.2043-0.033771-0.21540.41470.6190.20430.204371-0.21540.41470.6190.20430.204371-0.21540.41470.6190.20430.204371-0.21540.41470.6190.20430.2043720.03590.51430.66670.15230.1047730.28730.6130.71430.10120.0537740.53860.70490.76190.0570.0094750.790.78520.80950.0243

16、-0.0233761.04130.85110.85710.006-0.0416781.5440.93870.9048-0.0339-0.0816791.79540.96370.9524-0.0113-0.0589802.04670.979710.0203-0.0273概率P值大于显著性水平,因此不能拒绝原假设,可以认为周岁儿童身高的总体分布与正态分布无显著差异变量值的随机性检验 目的 利用样本数据对总体可能出现的变量值是否随机进行检验 投硬币:以1表示出现的是正面,以0表示出现的是反面。在进行了若干次投币后,将会得到一个以1、0组成的变量值序列。这时可能会分析“硬币出现正反面是否是随机的”这样

17、的问题 基本假设: H0:总体可能出现的变量值是随机的SPSS的单样本随机性检验 基本方法观察样本序列出现了多少游程(run).游程:样本序列中连续出现相同的变量值的次数.一般出现太多或太少的游程表示变量值序列有一定的非随机性其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算) 4个0组成的游程和3个1组成的游程。一共是R=7个游程。其中0的个数为m=15,而1的个数为n=100 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0游程检验的分布利用游程数构造检验统计量,把游程出现0和1的的这样一个过程可以看成是参数为某未知p的Bernou

18、lli试验。但在给定了m和n之后,在0和1的出现是随机的零假设之下,R的条件分布就和这个参数无关了。根据初等概率论,R的分布可以写成(令N=m+n)11211(2 ),11112211(21)mnkkP RkNnmnmnkkkkP RkNn游程检验的近似分布 在大样本下,游程近似服从正态分布。R为游程数 SPSS将自动计算Z统计量,并依据正态分布表给出对应的概率P-值。如果概率P-值小于给定的显著性水平a,则应拒绝原假设,认为变量值的出现不是随机的;如果概率P-值大于给定的显著性水平a,则不能拒绝原假设,可以认为变量值的出现是随机的rrRZ2rmnmn222(2)() (1)rmnmnmnmn

19、mnSPSS的单样本随机性检验基本操作步骤 菜单选项:analyze-nonparametric test-runs待检验变量指定如何计算游程:median:以中位数为界线 mode:以众数为界线mean:以均值为分界线 custom:以用户指定值为界线小于界线值的为一类;大于等于界线值的为另一类例题 6.4 为检验某耐压设备在某段时间内工作是否持续正常,测试并记录下该时间段内各个时间点上的设备耐压的数据。现采用游程检验方法对这批数据进行分析。 如果耐压数据的变动是随机的,可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。 “电缆数据.sav”SPSS两独立样本非参数检验 目的 由

20、独立样本数据推断两总体的分布是否存在显著差异(或两样本是否来自同一总体)。 独立样本:在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本 基本假设 H0:两总体分布无显著差异(两样本来自同一总体) 数据要求 样本数据和分组标志 基本内容 曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验秩(rank) 非参数检验中秩是最常使用的概念。 秩就是该数据按照升幂排列之后,每个观测值的位置或名次。变量值有几个,对应的秩便有几个。 例如我们有下面数据:下面一行(记为Ri)是上面一行数据Xi的秩。利用秩的大小进行推断就避免了不知道背景分布的困难。这也是非参数检验的优点Xi15

21、918317851379Ri75918426310曼-惠特尼U检验(Mann-Whitney U) 通过对两组样本平均秩的研究来进行推断将两样本数据混合并按升序排序求出其秩对两样本的秩分别求平均如果两样本的平均秩大致相同,则认为两总体分布无显著差异。 如果两个平均秩相差甚远,则应是一组样本的秩普遍偏小,另一组样本的秩普遍偏大的结果,也就是一组样本的值普遍偏小,另一组样本的值普遍偏大的结果。此时原假设很可能是不成立的Wilcoxon (Mann-Whitney)秩和检验曼一惠特尼U检验常用Wilcoxon (或称Mann-Whitney)秩和W检验,其原理是假定两个个样本X和Y分别有m个和n个观

22、测值。 把两个样本混合后把这m+n个观测值升幂排序,记下每个观测值在混合排序下面的秩。之后分别把两个样本所得到的秩相加。记第一个样本观测值的秩的和为WX而第二个样本秩的和为WY。这两个值可以互相推算,称为Wilcoxon统计量。 Wilcoxon W为:如果mn,则Wilcoxon W =Wx;曼惠特尼U统计量的计算公式为式中,W值即为Wilcoxon W; k为W对应样本组的样本量) 1(21kkWUWilcoxon (Mann-Whitney)秩和检验在小样本下,U统计量服从曼-惠特尼分布。 SPSS自动计算出U统计量的观测值和概率P-值。在大样本下,U统计量近似服从正态分布,计算公式为该

23、统计量的分布和两个总体分布无关。由此分布SPSS将自动计算Z统计量和对应的p-值。直观上看,如果WX与WY之中有一个显著地大,则可以选择拒绝零假设。在小样本下,依据U统计量的概率P-值进行决策;而在大样本下,则依据Z统计量的概率P-值进行决策)1(12121nmmnmnUZ 例题 6.5 某工厂用甲乙两种不同的工艺生产同一种产品,如果希望检验两种工艺下产品的使用寿命是否存在差异,可以从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据。 “使用寿命.sav”工艺工艺使用寿命样本值使用寿命样本值甲工艺(1)675, 682, 692, 679, 669, 661, 693乙工艺(2)662,

24、 649, 672, 663, 650, 651, 646, 652混合后样本数据各组标记秩6462164922650236512465225661166622766328669196722106751116791126821136921146931154) 18(82140) 1(21kkWU)1(12121nmmnmnUZ两独立样本分布的K-S检验原假设 两组独立样本来自的两总体的分布无显著差异基本思想 与单样本K-S检验的基本思想大体一致 主要差别:这里是以变量值的秩作为分析对象,而非变量值本身首先,将两组样本混合并按升序排序然后,分别计算两组样本秩的累计频数和累计频率最后,计算两组累计

25、频率的差,得到秩的差值序列并得到D统计量如果差距较小,则认为两总体分布无显著差异两独立样本分布的K-S检验 假定两个样本的样本量分别为n1和n2,用S1 (X)和S2 (X)分别表示两个样本的累积经验分布函数。再记DjS1 (Xj)-S2 (Xj)。近似正态分布的检验统计量为 SPSS中将自动计算在大样本下的Z的观测值和概率P-值。如果概率P-值小于给定的显著性水平a,则应拒绝原假设,认为两总体的分布有显著差异;反之,如果概率P-值大于给定的显著性水平a,则不能拒绝原假设,可以认为两总体的分布无显著差异1212max |jjn nZDnn工艺工艺使用寿命样本值使用寿命样本值甲工艺(1)675,

26、 682, 692, 679, 669, 661, 693乙工艺(2)662, 649, 672, 663, 650, 651, 646, 652两样本Wald-Wolfowitz游程检验 不同于单样本游程检验,两独立样本的游程检验用来检验两独立样本来自的两总体的分布是否存在显著差异。 原假设:两组独立样本来自的两总体的分布无显著差异。 两独立样本的游程检验(Wald-Wolfowitz runs test)和单样本游程检验基本思想基本相同。不同的是计算游程数的方法。两独立样本的游程检验中,游程数依赖于变量的秩。两独立样本游程检验首先,把两个样本混合,按照大小次序排列,对应的组标记值也会随之重

27、新排列,同样本的组标记值在一起的为一个游程。然后,计算分组标志序列的游程数 如果两总体的分布存在较大差距,那么游程数会相对比较少 如果游程数比较大,则应是两组样本值充分混合的结果,两总体的分布不会存在显著差异最后,根据游程数据计算Z统计量,该统计量近似服从正态分布。SPSS将自动计算Z统计量的观测值和对应的概率P_值。如果概率P-值小于给定的显著性水平a,则应拒绝原假设,认为两总体的分布存在显著差异;反之,如果概率P-值大于给定的显著性水平a,则不能拒绝原假设,可以认为两总体的分布无显著差异混合排序后的样本数据混合排序后的样本数据各组标记各组标记646264926502651265226611

28、662266326691672267516791682169216931R=6两独立样本的极端反应检验 原假设:两独立样本来自的两个总体的分布无显著差异。 基本思想: 将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。 如果实验样本没有出现极端反应,则认为两总体的分布无显著差异 如果实验样本存在极端反应,则认为两总体的分布存在显著差异两独立样本的极端反应检验分析过程 将两组样本混合按升序排序;然后,求出控制样本的最小秩Qmin和最大秩Qmax,并计算出跨度(Span) 为消除样本数据中极端值对分析结果的影响,在计算跨度之前可按比例

29、(通常为5%)去除控制样本中部分靠近两端的样本值,然后再求跨度,得到截头跨度 如果跨度或截头跨度较小,则是两组样本数据无法充分混合,一组样本值显著大于另一组样本值的结果,则认为相对控制样本,实验样本出现了极端反应,样本来自的两总体的分布存在显著差异 如果跨度或截头跨度较大,则应是两组样本数据充分混合,一组样本值没有显著大于另一组样本值的结果,则认为相对控制样本,实验样本没有出现极端反应,样本来自的两总体的分布没有显著差异1minmaxQQS极端反应检验统计量 针对跨度或截头跨度计算H检验统计量 m为控制样本的样本量;Qi为控制样本在混合样本中的秩; 为控制样本的平均秩 小样本下,H统计量服从H

30、ollander分布;大样本下,H统计量近似服从正态分布 SPSS将自动计算H统计量的观测值和概率P-值。如果概率P-值小于给定的显著性水平a,则应拒绝原假设,认为两独立样本来自的两总体的分布存在显著差异。反之21)(miiQQHQ样本值样本值646649650651652661662663669672675679682692693组标记222221221211111秩123456789101112131415去除极端值后12345678910111213跨度为:15-6+1=10截头跨度为:13-8+1=6以样本1为控制组SPSS两独立样本非参数检验基本操作步骤 菜单选项:analyze-n

31、onparametric tests-2 independent sample例题 6.6 分析两种工艺下产品的使用寿命是否存在差异工艺工艺使用寿命样本值使用寿命样本值甲工艺(1)675, 682, 692, 679, 669, 661, 693乙工艺(2)662, 649, 672, 663, 650, 651, 646, 652SPSS多独立样本非参数检验 目的 由多组独立样本数据推断多个总体的分布是否存在显著差异 多组独立样本是指按独立抽样方式获得的多组样本 基本假设: H0:多个总体分布无显著差异 数据要求: 样本数据和分组标志 基本内容 中位数检验、Kruskal-Wallis检验、

32、Jonckheere-Terpstra检验例题 6.7 利用“四城市儿童身高”数据,对北京、上海、成都、广州四城市的周岁儿童身高进行比较分析,推断四城市周岁儿童身高是否存在显著差异中位数检验(median) 中位数检验通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异。 原假设 多个独立样本来自的多个总体的中位数无显著差异 基本思想 如果多个总体的中位数无显著差异,或者说多个总体有共同的中位数,那么这个共同的中位数应在各样本组中均处在中间位置上。 于是,每组样本中大于该中位数与小于该中位数的样本量应大致相同中位数检验(median) 基本步骤 将多组样本混合按升序排序,并求出

33、混合样本的中位数 分别计算各组样本中大于和小于上述中位数的样本量,形成列联表 利用卡方检验方法分析各组样本来自的总体对于上述中位数的分布是否一致中位数检验(median) 如果各组中大于(或小于)上述中位数的样本比例大致相同,则可以认为多组样本有共同的中位数,它们来自的总体的中位数无显著差异 反之,如果各组中大于(或小于)上述中位数的样本比例相差较大,则可以认为多组样本的中位数不全部相同,它们来自的总体的中位数存在显著差异 假定有k个总体,ni为第i个样本量;把所有样本量之和记为N 先把从这个k个总体来的样本混合起来排序,找出它们的中位数 计算每个总体中小于该中位数的观测值个数O1j,j=1,

34、k,和每个总体中大于该中位数的观测值个数O2j,j=1,k。这样就形成了一个由元素Oij组成的2k表。其列总和为ni,j=1,k;而两个行总和为各样本小于总中位数的观测值总和:R1O11+O12+ O1k及各样本大于总中位数的观测值总和R2O21+O22+ O2k 列联表,可以用Pearson 2统计量 卡方统计量服从(2-1) X (n-1)个自由度的卡方分布22211()kijijjiijOEEijijRnEN中位数检验的计算示例 对样本数据混合排序后,得到共同的中位数为74k-w检验(推广的平均秩检验) 多独立样本的Kruskal-Wallis检验的实质是两独立样本的曼-惠特尼U检验在多

35、个独立样本下的推广,用于检验多个总体的分布是否存在显著差异 原假设:多个独立样本来自的多个总体的分布无显著差异 基本思想 首先,将多组样本数据混合并按升序排序,求出各变量值的秩;然后,考察各组秩的均值是否存在显著差异 如果各组秩的均值不存在显著差异,则是多组数据充分混合,数值相差不大的结果,可以认为多个总体的分布无显著差异; 如果各组秩的均值存在显著差异,则是多组数据无法混合,某些组的数值普遍偏大,另一些组的数值普遍偏小的结果,可以认为多个总体的分布有显著差异Kruskal-Wallis关于多个样本的秩和检验 目的是检验多总体位置参数是否一样。方法和Wilcoxon-Mann-Whitney检

36、验的思想类似 为研究各组秩的差异,可借鉴方差分析方法总变差=组间差+组内差如果各样本组秩的总变差的大部分可由组间差解释,则表明各样本组的总体分布存在显著差异;反之,如果各样本组秩的总变差的大部分不能由组间差解释,则表明各样本组的总体分布没有显著差异构造K-W检验统计量Kruskal-Wallis多个样本的秩和检验 假定有k个总体。先把从这个k个总体来的样本混合起来排序,记各个总体观测值的秩之和为Ri,i=1,k。显然如果这些Ri很不相同,就可以认为它们位置参数相同的零假设不妥(备选假设为各个位置参数不全相等)Kruskal-Wallis检验统计量 公式中表示样本组数;ni为第i组的样本量,而N

37、为各个样本量之和(总样本量)。 这个统计量在位置参数相同的零假设下有渐近的自由度为k-1的2分布221112123(1)(1)(1)kkiiiiiiiRRHnRNN NnN NnKruskal-WallisKruskal-Wallis检验的计算示例 有一些秩出现了“打结”。对此SPSS中通常以平均秩来处理 北京、上海、成都、广州的平均秩: 14.4,8.2,15.8,3.6Jonckheere-TerpstraJonckheere-Terpstra多样本的秩检验 Jonckheere-Terpstra检验先在每两个样本所有观测值对之间比较,计算第i个样本观测值中小于第j个样本观测值的对子数Ui

38、j 上式表明,J-T统计量是所有Uij在ij组范围内的总和,称为观测的J-T统计量,在大样本下近似服从正态分布ijijJU), 1, 1,(#lijlikijnlnkXXUJ-T统计量计算J-T统计量时会涉及样本标记值的大小顺序。例如,如果有三组样本,样本标记值分别为1, 2, 3,则观测的J-T统计量为:第1组样本观察值小于第2组样本观察值的个数+第1组样本观察值小于第3组样本观察值的个数+第2组样本观察值小于第3组样本观察值的个数除计算观测的J-T统计量,通常还将计算所有情况下的J-T统计量。例如,如果仍有1, 2, 3三组样本,除了按照(l, 2, 3)的顺序计算J-T值,还要按照(1,

39、 3, 2), (2, 1, 3), (2. 3, 1), (3, 1, 2), (3, 2, 1)的顺序计算所有的J-T值,并计算这些J-T值的均值和标准差等如果观测的J-T统计量远大于或远小于J-T均值,那么可以认为,按照样本标记值的升序,样本数据有明显的上升或下降趋势,从而能够判定样本来自的多个总体的分布存在显著差异检验统计量 在大样本下,J-T统计量近似服从正态分布 式中,J为观测的J-T统计量;k为样本组数;ni为第i组样本的样本量SPSS将自动计算J-T统计量、Z统计量和相应的概率P-值。如果概率P-值小于给定的显著性水平a,则应拒绝原假设,认为多个独立样本来自的多个总体的分布存在

40、显著差异;反之,如果概率P-值大于给定的显著性水平a,则不能拒绝原假设,认为多个独立样本来自的多个总体的分布不存在显著差异72/)32()32(4/)(122122ikiikiinnNNnNJZJonckheere-TerpstraJonckheere-Terpstra检验的计算示例“打结”的情况计为0. 5,观测的J-T值为45. 5,所有排列下的J-T平均值为75SPSS软件使用说明 数据要求: AnalyzeNonparametric TestsK Independent SamplesSPSS两配对样本非参数检验 含义 由配对样本数据推断两总体分布是否存在显著差异 基本假设 H0:两配

41、对样本来自的两总体分布无显著差异 数据要求 配对样本的样本量是相同的,且各样本值的先后次序是不能随意更改的 基本方法 McNemar检验、符号检验、Wilcoxon符号秩检验举例 要检验一种新的训练方法是否对提高跳远运动员的成绩有显著效果,可以收集一批跳远运动员在使用新训练方法前后的跳远最好成绩,这样的两组样本便是配对的 分析不同广告形式是否对商品的销售产生显著影响,可以比较几种不同商品在不同广告形式下的销售额数据(其他条件保持基本稳定)。这里不同广告形式下的若干组商品销售额样本便是配对样本。 配对样本的样本量相同,且各样本值的先后次序不能随意更改变化显著性检验(McNemar) 将研究对象作

42、为自身的对照者检验其“前后”的变化是否显著 McNemar检验是基于列联表进行分析的 关心的对象是发生变化的两个单元格中频数变化。发生变化的两格中,如果频数变化相当,则认为无显著变化 数据要求:只能是二分值数据 分析学生在学习“统计学”课程前后对统计学重要性的认知程度是否发生了显著改变例题学习统计学前和学习后的样本是两组配对样本。在学习统计学课程前后对统计学重要性的认识会有下列四种情况A, B, C, D分别代表前后两种状态转换的频数,它们的总和为所有样本量如果频数B和C大致相当,即态度从“不重要”到“重要”的人数与态度从“重要”到“不重要”的人数大致相当,那么可理解为学习前后学生对统计学重要

43、性的认知总体上并没有发生显著的变化如果频数B和C相差较大,即态度从“不重要”到“重要”的人数与态度从“重要”到“不重要”的人数相差较大,那么可理解为学习前后学生对统计学重要性的认知总体上发生了显著的变化学习后不重要(0)重要(1)学习前不重要(0)34重要(1)23检验为了研究这个问题,McNemar检验采用二项分布检验的方法,计算表中态度变化的分布是否服从概率P为0.5的二项分布。在小样本下计算二项分布的累计精确概率,大样本下采用修正的Z统计量式,它近似服从正态分布SPSS将自动计算Z统计量和相应的概率P-值。如果概率P-值小于给定的显著性水平a,则应拒绝原假设,认为态度变化的分布与P为0.

44、5的二项分布存在显著差异,即两配对样本所来自的两总体的分布存在显著差异;如果概率P-值大于给定的显著性水平a,则不能拒绝原假设,认为态度变化的分布与p为0.5的二项分布不存在显著差异,即两配对样本所来自的两总体的分布没有显著差异注意:两配对样本的McNemar检验分析的是二值变量例题学习后01学习前0341233438. 05 . 05 . 062060iiiiinixiinCqpCxXP两配对样本的符号检验 目的: 检验量配对样本所来自的总体的分布是否存在显著差异 原假设:两配对样本来自的量总体的分布无显著差异 基本思路: 利用正负符号的个数实现检验 将样本2的各样本值减去样本1的各样本值.

45、如果差值为正,则记为正号;如果差值为负,则记为负号 如果正负号的个数与负号的个数相当,则认为无显著变化.否则,认为有显著变化例 采用新训练方法前后的最好成绩比较正负符号检验 为了研究这个问题,两配对样本的符号检验采用二项分布检验的方法,检验正号个数和负号个数的分布是否服从概率P为0. 5的二项分布,即对正负符号变量进行单样本二项分布检验。在小样本下计算二项分布的精确概率,大样本下采用修正的Z统计量,近似服从正态分布。 SPSS将自动计算Z统计量和相应的概率P-直。如果概率异值小于给定的显著性水平a,则应拒绝原假设,认为两配对样本所来自的两总体的分布存在显著差异;否则,则不能拒绝原假设0898.

46、 05 . 05 . 092090iiiiinixiinCqpCxXP两配对样本的Wilcoxon符号秩检验 正负符号检验只考虑了两总体数据变化的性质,而没有注意其变化的程度.符号平均秩检验注意到了这点 基本思想: 将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号 将差值的绝对值按升序排序,并求其秩.分别计算正号秩和负号秩总和 W+W-最小为0,最大为n(n+1)/2 如果正秩和和负秩和相当,认为正负变化程度相当,两总体无显著差异检验统计量 在原假设成立的前提下,小样本下的检验统计量W=min(W+,W-)服从Wilcoxon符号秩分布。在大样本下利用

47、W可构造Z统计量,它近似服从正态分布: SPSS将自动计算Z统计量和对应的概率P-值。如果概率P-值小于给定的显著性水平a,则应拒绝原假设,认为两配对样本来自的两总体的分布有显著差异;反之,如果概率P-值大于给定的显著性水平a,则不能拒绝原假设,可认为两配对样本来自的两总体的分布无显著差异24/ ) 12)(1(4/ ) 1(nnnnnWZ例运动员编号运动员编号使用新方法前使用新方法前使用新方法后使用新方法后绝对值差绝对值差秩秩差的负号差的负号15.745.790.053+26.286.120.168-35.465.440.021-46.036.03055.395.570.189+65.775

48、.810.042+76.416.480.075+86.196.320.137+95.555.640.096+105.875.930.064+正号秩总和为36,负号秩总和为9。W检验统计量为9两配对样本非参数检验基本操作步骤 数据要求:两个变量,分别存放两组样本的样本值 选项AnalyzeNonparametric TestsRelated Samples 把变量before和after同时选入Test Pair(s) List之中 选择一种或几种检验的方法SPSS多配对样本非参数检验 目的: 由多配对样本数据推断多个总体的中位数或分布是否存在显著差异. 基本假设: H0:各总体分布无显著差异.

49、 数据要求: 多配对的样本数据. 基本内容: Friedman检验、Cochran Q检验、Kendall协同系数检验SPSS多配对样本非参数检验 收集乘客对多家航空公司是否满意的数据,分析航空公司的服务水平是否存在显著差异; 收集不同促销形式下若干种商品的销售额数据,分析比较不同促销形式的效果; 收集多名评委对同一批歌手比赛打分的数据,分析评委的打分标准是否一致,等等推广的平均秩检验(Friedman检验) 将每个个案的变量值数据按升序排序,并求其秩 求各样本的平均秩 如果平均秩相当,则认为各总体分布无显著差异Friedman秩和检验 适用于两个因子的各种水平的组合都仅有一个观测值的情况 假

50、定第一个因子有b个水平(称为处理,treatment),第二个因子有k个水平(称为区组);因此一共有kbkb个观测值。 这里之所以称一个因子为处理,是因为这是我们想要看该因子各水平是否对试验结果有显著的不同(它的各个水平的观测值也就是多个相关样本)。而另一个因子称为区组,不同的区组也可能对结果有影响。例有三种肥料作为第一个因子(肥料因子)的三个水平;而四种土壤为第二个因子(土壤因子)的四个水平。感兴趣于是否这三种肥料对于某作物的产量有区别。称肥料因子为处理,而土壤因子为区组。数据在下表中(表中数字为相应组合的产量,单位公斤) 肥料种类肥料种类肥料肥料A肥料肥料B肥料肥料C土土壤壤类类型型土壤土

51、壤1224668土壤土壤2253648土壤土壤3182120土壤土壤4111319Friedman秩和检验基本思想: 无论哪个区组,每一种处理下的数据的秩在本区组内的所有可能取值为1k中的任何一个值。如果k种处理不存在差异,那么每一种处理下的各区组的秩总和Ri(或平均秩 )应等于其他任何一种处理下的各区组的秩总和Rj(或平均秩 )。即: 则: 总体分布不存在差异: 总体分布存在显著差异:秩总和或平均秩差距较大iRjR)()(jiRRjiRRjiji或) 1(2)21 (21kknknRRRk21) 1(2kRknRii或Friedman秩和检验为研究上述秩的差异问题,Friedman检验用类似

52、方差分析的方法进行分析和构造检验统计量。即如果不同处理(控制水平)下的秩(观测值)不存在显著差异,则由不同处理(控制水平)引起的秩的变差(组间差)应在秩的总平均变差中占相对较小的比例Friedman统计量定义为大样本下Friedman检验统计量近似服从k-1个自由度的卡方分布个样本的平均秩第配对样本个数样本数,iRknkkRkknFridemanikii) 1()21() 1(12221Friedman秩和检验 检验实现: 首先以行为单位将数据按升序排序,并求得各变量值在各自行中的秩 然后,分别计算各组样本下的秩总和与平均秩为比较三种促销形式对商品促销的影响,收集若干种商品在不同促销形式下的月

53、销售额数据商品编号商品编号促销形式促销形式1促销形式促销形式2促销形式促销形式3112866172239865246735894522031048014461100724769196273756482132039423679674277178439656398193612601793946945222406110635558542商品编号商品编号促销形式促销形式1促销形式促销形式2促销形式促销形式3形式形式1的的秩秩形式形式2的的秩秩形式形式3的的秩秩112866172239865231246735894522013231048014461100722314769196273723156482

54、132039423132679674277131278439656392318193612601793312946945222406123110635558542321秩总和212514平均秩2.12.51.4多配对样本的Cochran Q检验 适用于变量值是二值变量的情况乘客号乘客号甲航空公司甲航空公司乙航空公司乙航空公司丙航空公司丙航空公司111021003100410151106110710081109000101001110012111131101411015010多配对样本的Cochran Q检验基本思想 认为每行中取1的个数是可确定的。于是,在原假设成立的条件下,每列中出现1的概率是相等的,且这个概率值与各行中出现1的个数有关 构造Cochran Q检验统计量niniiikjkiijLLkGkGkkQ112121)1() 1(的个数行中取为第,的个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论