一、多元统计讲座非参数检验_第1页
一、多元统计讲座非参数检验_第2页
一、多元统计讲座非参数检验_第3页
一、多元统计讲座非参数检验_第4页
一、多元统计讲座非参数检验_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS多元统计分析方法及应用系列讲座1SPSS多元统计分析方法及应用系列讲座2SPSS多元统计分析方法及应用系列讲座非参数检验基本原理单样本非参数检验两独立样本非参数检验多独立样本非参数检验两相关样本非参数检验多相关样本非参数检验非参数检验SPSS实例SPSS多元统计分析方法及应用系列讲座4非参数检验是相对于参数检验而言的,是指在总体分布未知或知之甚少时,利用已知样本数据对总体分布形态做出推断的方法。非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体的分布是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。SPSS多元统计分析方法及应用系列讲座5

2、相对于参数检验,非参数检验的优点包括:对总体的假定相对较少,效率高,结果一般有较好的稳定性;不仅适用于定比数据和定距数据的检验,还适用于定类数据和定序数据的检验,可以解决参数假设检验无法解决的定性资料的检验问题;思想容易理解,计算简单,尤其适用于小样本。SPSS多元统计分析方法及应用系列讲座6非参数检验的缺点包括:最大的不足是没能充分利用数据资料的全部信息;如果对总体有充分的了解且足以确定其分布类型,非参数检验就不如参数检验具有更强的针对性,有效性会差一些;目前还不能用于处理因素间的交互作用。SPSS多元统计分析方法及应用系列讲座7非参数检验并非要取代参数检验,而是作为参数检验的一个有力的补充

3、。与参数检验类似,非参数检验过程也是先根据问题提出原假设,然后利用统计学原理构造适当的统计量,最后利用样本数据计算统计量的概率p值,与显著性水平进行比较,得出拒绝或者接受原假设的结论。SPSS多元统计分析方法及应用系列讲座8卡方检验二项分布检验游程检验单样本K-S检验SPSS多元统计分析方法及应用系列讲座9对离散型数据样本进行检验可对连续型数据样本进行检验用于检验样本数据是否与某种概率分布的理论数值相符合,进而推断样本数据是否是来自于该分布的样本。检验的过程,通常是先根据以往的经验或实际观测数据的分布情况,推测总体服从于某种分布,分布函数为F(x),然后再利用样本数据检验该总体的分布函数是否真

4、的是 F(x)。卡方检验直接检验的是实际频数与指定分布的频数是否相符。最典型的卡方检验统计量是Pearson统计量,其数学定义为:SPSS多元统计分析方法及应用系列讲座10221()kiiiinnpnp 在进行n次相同的试验之后,出现0或者1的次数可以用离散型随机变量X表示,X值为1的概率设为p,X值为0的概率设为1 p,形成二项分布。二项分布检验通过样本数据来判断其总体是否服从概率为指定数值的二项分布。在大样本中,采用Z检验统计量,在原假设成立的条件下,Z检验统计量近似服从正态分布,其数学定义为:SPSS多元统计分析方法及应用系列讲座110.5(1)xnpZnpp游程检验的目的是检验取值为二

5、分类,并且按照时间或者其他某种顺序排列的数列数值是否真的随机出现。在一个连续符号排列中,所谓游程就是一个具有相同符号的连续串,在它前后相接的是与其不同的符号或者完全没有符号。SPSS多元统计分析方法及应用系列讲座12设 和 是分别来自同总体X和Y的随机样本数据,将这两个样本合在一起,并按照从小到大的顺序排列,得到次序统计量: 。如果将次序统计量中来自于总体X的样本值记为0,来自于总体Y的样本值记为1,仍然按照原顺序表示次序统计量,则得到了一个由0和1构成的序列。将连续出现0(或者连续出现1)的一组数分别称为0的游程(或者1的游程),一个游程中包含0(或者1)的个数成为游程长度。SPSS多元统计

6、分析方法及应用系列讲座1312,mxxx12,nyyy12,m nzzz在任一给定容量的样本中,游程的总数标志着样本是否是随机的。如果0和1是随机出现的,则出现连续的很多0或者连续的很多1的可能性很小,同时,0和1频繁交叉出现的可能性也很小。如果游程的数目很少,就意味着样本由于缺乏独立性而形成了一致的趋势或者成束结构;如果游程数目很多,则表明有系统的短周期波动影响观察结果。游程检验是一种检验效能非常低的方法,它只利用了游程的数目,失去了绝大部分的信息,得出的隐性结论只供参考,如果有其它方法可供选择的时候,一般不要选择游程检验方法。SPSS多元统计分析方法及应用系列讲座14K-S检验是柯尔莫哥洛

7、夫-斯米尔诺夫检验(Kolmogorov-Smirnov Test)的简称。K-S检验就是一种可以对连续性数据进行分析的方法,可以利用样本数据推断样本来自的总体是否服从某一理论分布。由于卡方拟合优度检验需要将样本空间分成不相交的子集,包含了较多的主观因素,特别是对于连续型总体,有可能会由于子集划分的不同而导致对同一样本得到对立的检验结果;而K-S检验方法在一定程度上克服了卡方检验的缺点,是比卡方检验更精确的一种非参数检验方法。SPSS多元统计分析方法及应用系列讲座15K-S检验是将观测量的累积分布函数与某个确定的理论分布函数相比较,以检验一个样本是否是来自于某指定分布的样本。基本思路是:分别求

8、出已知理论分布下的累积概率分布和观察的累积概率分布,对两者进行比较,从而确定两种分布的最大差异点。如果样本确实服从理论分布,那么差异值不应太高。计算各样本观测值在理论分布中出现的累计概率值 F(x)和实际累计概率值S(x),并计算实际概率值与累计概率值的差值D(x),最后求出差值序列中的最大绝对差值:SPSS多元统计分析方法及应用系列讲座16max( )( ) )xDS xF x两独立样本非参数检验是在对总体分布不太了解的情况下,通过对两独立样本进行分析,推断来自的两个总体的分布是否存在显著性差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下获得的样本。SPS

9、S多元统计分析方法及应用系列讲座17曼-惠特尼U检验 检验两总体均值是否相等Moses极端反应检验 检验是否产生极端反应K-S Z检验Wald-Wolfowitz游程检验SPSS多元统计分析方法及应用系列讲座18检验两总体分布是否相同基本思路为:设两个样本 和 分别来自总体X和Y,将其观察值 和 按照升序排列,如果两样本均值相等,则观察值 中大于观察值 的数量与观察值 中大于观察值 的数量应相差不多。其原假设为:总体X和Y的均值相等。将两样本 和 混合后按升序排列,求出混合后每个数据的秩。然后分别将样本 和 各个观察值的秩相加,记为 和 ,平均秩记为 和 。如果原假设成立, 和 相差应比较小。

10、SPSS多元统计分析方法及应用系列讲座1912,mXXX12,nYYY12,nyyy12,mxxx12,mxxx12,nyyy12,nyyy12,mxxx12,mXXX12,nYYY12,mXXX12,nYYYxWyWxWmyWnxWmyWn当预期试验条件将以一个方向影响某些受试者而以相反方向影响另一些受试者时,采用Moses极端反应检验。设两个样本 和 分别来自总体X和Y,其中X为实验组,Y为对照组。Moses极端反应检验基本思路为:把来自两个独立总体的样本的观察值混合,然后对每个观察值进行评分并按照升序排列,计算对照组Y的得分跨度S,如果S较大,表明存在极端反应;反之,不存在极端反应。SP

11、SS多元统计分析方法及应用系列讲座2012,mXXX12,nYYYKolmogorov-Smirnov双样本检验,简称K-S Z检验,其基本思路与单样本K-S检验的思路基本上是一致的,差别在于K-S Z检验以变量值的秩作为分析对象,而不是变量值本身。操作步骤为:首先将两组样本混合并按升序排列;然后分别计算两组样本秩的累计频数和累计频率;最后计算两组累计频率的差,得到秩的差值序列并得到检验统计量D。此处统计量D的计算方法与单样本K-S检验中统计量 计算方法相同,但不需要进行修正。SPSS多元统计分析方法及应用系列讲座21基本思路为:设两个样本 和 分别来自总体X和Y,把来自两独立总体样本的观察值

12、混合,给每个观察值进行评分并按升序排列,然后确定序列中的游程数量r。当两总体分布相同时,观察值混合均匀,游程数量较大;如果两总体分布不相同,观察值混合不均匀,游程数量较小。SPSS多元统计分析方法及应用系列讲座2212,mXXX12,nYYY中位数检验 检验多个独立样本的中位数是否相同Kruskal-Wallis检验 检验多个总体分布是否相同Jonckheere-Terpstra检验 检验多个独立样本位置是否有上升趋势SPSS多元统计分析方法及应用系列讲座23基本思路为:为检验k组独立样本指定指标的中位数是否存在差异,首先将k组独立样本混合在一起,求出全部样本指定指标的公共中位数,然后分别计算

13、每组样本指定指标大于或者小于等于公共中位数个案的数量。如果每组样本大于或者小于等于公共中位数个案的数量基本相同,则k组样本的中位数不存在显著差异;反之, k组样本的中位数存在显著差异。SPSS多元统计分析方法及应用系列讲座24Kruskal-Wallis检验是通过来自多个独立总体样本的观察值,判断其在指标p上的分布是否相同的非参数检验方法。基本思路为:将来自多个独立总体的样本在指标p上的观察值混合,并按照升序排列,得到每个观察值的秩,然后求秩的平均数。如果各组样本的平均秩与混合样本的平均秩大致相等,则认为其分布无显著差异;反之,其分布存在显著差异。SPSS多元统计分析方法及应用系列讲座25Jo

14、nckheere-Terpstra检验是通过多组独立样本的观察值,判断样本来自的多个总体在指定指标上的观察值是否呈现上升或下降趋势的非参数检验方法。基本思路为:假设k组独立样本 在指标p上的观察值呈现上升趋势,则 在指标p上观察值小于 在指标p上观察值的样本数量比较多(ij);否则, 在指标p上观察值小于 在指标p上观察值的样本数量比较少(ij)。SPSS多元统计分析方法及应用系列讲座2612,kXXXiXjXiXjX两相关样本非参数检验是在总体分布类型未知的情况下,通过两个相关样本判断它们的抽样总体是否具有相同分布的非参数检验方法。两相关样本是指从一个对象上测得两个或多个指标,将这些指标分别

15、视为两个抽样,这时由于一个指标的抽样会对其它指标的抽样产生影响,这两个抽样就不是独立的,而是具有相关性。SPSS多元统计分析方法及应用系列讲座27McNemar变化显著性检验符号检验Wilcoxon符号秩检验SPSS多元统计分析方法及应用系列讲座28判断两个称名量表测量指标之间是否存在显著差异判断两个间隔量表或者比例量表测量指标之间是否存在显著差异McNemar变化显著性检验适合先后匹配性的设计,在这种设计中,每个研究对象以自身作为参照物,研究试验前后变化的有效程度。指标的测量水平较低,只是称名量表或者顺序量表。SPSS多元统计分析方法及应用系列讲座29表中“+”和“”表示不同的反应,试验前后

16、有变化的研究对象数量填在B或C格内,试验前后没有变化的研究对象数量填在A或D格内。SPSS多元统计分析方法及应用系列讲座30基本思路:如果试验对研究对象没有影响,则B、C的数量应该接近其期望值 ;否则B、C的数量与其期望值 存在较大差距。McNemar变化显著性检验的统计量为 ,在原假设成立时, 统计量近似服从自由度为1的卡方分布。 的数学定义为:SPSS多元统计分析方法及应用系列讲座311/ 2()BC1/ 2()BC2222222()()()2222BCBCBCBCBCBCBC对两个相关样本分布是否相同进行检验时,如果所收集到的数据测量水平为间隔量表或者比例量表,可以使用符号检验方法来判断

17、两个配对总体的分布是否存在显著差异。符号检验的基本思路为:首先去掉观察值相同的样本对,再进行分析。将实验组样本的观察值减去对照组样本的观察值,差值为正记作“+”,差值为负记作“”,然后计算“+”和“”的数量k和nk ,其中n为样本对的数量。如果两个样本的分布基本相同,则k和nk基本相等;否则k和nk差异较大。SPSS多元统计分析方法及应用系列讲座32Wilcoxon符号秩检验也用于判断两个配对总体的分布是否存在显著差异,比符号检验更能充分利用样本信息。基本思路为:首先去掉观察值相同的样本对,再进行分析。将实验组样本的观察值减去对照组样本的观察值,差值为正记作“+”,差值为负记作“”。然后将差值

18、绝对值数据按照升序排列,并求出相应的秩,计算出正号秩总和 和负号秩总和 。如果 与 相差较小,则两个样本分布基本相同。SPSS多元统计分析方法及应用系列讲座33WWWWFriedman双向评秩方差检验Kendall W协同系数检验Cochran Q检验SPSS多元统计分析方法及应用系列讲座34判断多个相关指标之间是否存在显著差异判断多个相关指标之间是否存在一致性根据多个称名量表测量的指标判断其总体分布是否相同在对多个相关样本分布是否相同进行检验时,如果收集到的数据的测量水平为顺序量表、间隔量表或者比例量表,可采用Friedman双向评秩方差检验方法来判断多个相关总体分布是否存在显著性差异。SP

19、SS多元统计分析方法及应用系列讲座35基本思路为:从行出发,对每个样本的各个指标观察值按照升序排列,计算每个样本各个指标观察值的秩 ( ; ),然后计算k个指标的秩和。如果多个指标的分布没有显著差异,则秩和相差很小;反之,秩和存在较大差距。设 为第j个指标在所有样本上的观察值的秩和则 ,Friedman双向评秩方差检验统计量为 ,其数学定义为:SPSS多元统计分析方法及应用系列讲座36ijR1,2,in1,2,jkjR1njijiRR 2221123 (1)(1)kjjRn knk kKendall W协同系数检验是对样本多个指标得分是否存在一致性进行检验的方法,协和系数越大,多个指标之间的一

20、致性越强。在对多个指标之间的一致性进行判断时,如果收集到的数据的测量水平为顺序量表、间隔量表或者比例量表,可以采用Kendall W协同系数检验。SPSS多元统计分析方法及应用系列讲座37SPSS多元统计分析方法及应用系列讲座38基本思路为:从行出发,对所有样本在每个指标上的观察值按照升序排列,计算每个样本在各个指标观察值的秩 ( ; ),然后计算各个样本的秩和 ( )。如果k个指标评价的一致性最高,即完全相符时, ( ) 应为 ;否则 ( )应该十分接近,每个 与平均值 相差较小。Kendall W协同系数:SPSS多元统计分析方法及应用系列讲座39ijR1,2,ik1,2,jnjR1,2,jnjR1,2,jn,2 ,kknkjR1,2,jnjR(1)2k n2221(1) / 2(1) /12njjRk nWk n n Cochran Q检验是检验三组或三组以上的相关样本分布是否存在显著差异的非参数检验方法。当样本观测值的观测水平为称名量表或者二值顺序量表时,Cochran Q检验非常适用。SPSS多元统计分析方法及应用系列讲座40以二分的评价为例,“1”代表满意,“0”代表不满意。Cochran Q检验的基本思路

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论