




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
清华时立文详解演示文稿当前1页,总共40页。优选清华时立文当前2页,总共40页。8.1非参数检验概述非参数检验处理问题大致分为两类:一类是两个母体的分布未知,用两组样本来检验它们是否相同;另一类是假设一组样本的母体分布,然后用另一组样本来检验它是否正确。3当前3页,总共40页。8.1.1非参数统计与参数统计参数统计是这样一种检验:它的模型对抽出研究样本的总体的参数规定了某些条件。由于这些条件通常未受检验,因此假设它们成立。参数检验结果的意义取决于这些假设的合理性。参数检验也要求所分析的数据要至少是从间隔量表水平的测量中获取的。非参数检验是这样一种检验:其模型对于被抽样总体的参数不规定条件。大多数非参数检验都包含一定的假设,即观测是独立的,所研究的变量具有基础的连续性。不过这些假设比起参数检验的假设来要少,并且弱得多。而且,非参数检验并不要求像参数检验所要求的那么高的测量,大多数非参数检验用于顺序量表的数据,也有一些用于名称量表的数据。在现实生活中,往往不知道客观现象的总体分布情况如何,因此应用参数检验的方法就会产生困难。例如,要检验两个总体的均值是否相同,利用T分布进行检验,就需要假定两个总体的分布都是服从正态分布的。但若不知道总体分布的情况或总体不满足正态分布的假设,应用T检验就会存在困难。在不知道客观现象服从何种分布的情况下,需要根据样本信息来推断总体是否属于某种理论分布。在数理统计中,对不考虑原来的总体分布进行估计和检验的方法统称为非参数统计方法。4当前4页,总共40页。8.1.2参数检验的优点在本章中所讲的非参数检验都是最简单、最基本的非参数检验方法,非参数检验方法近年来发展极为迅速,已成为21世纪统计学发展的焦点之一。这是因为,与参数检验相比,非参数检验具有很多优势。(1) 大多数非参数检验所得出的概率描述是精确的概率(大样本情况除外,那里有极好的近似可用),与其抽样的总体分布形式如何无关。(2) 如果所使用的样本容量小到N=6,那么除非确切知道总体分布的性质,否则我们只能用非参数统计检验,而没有别的选择余地。(3) 对于处理来自几个不同总体的观测量所组成的样本,有一些合适的非参数统计检验。(4) 非参数统计检验可用来处理确实只是分等的数据,以及表面上是数字结果但实质为分等水平的数据。(5) 非参数估计对检验的限制少,具有较好的稳健性。(6) 非参数检验方法不仅适用于定比数据和定距数据的检验,还适用于定类和定序数据的检验,即以名称量表测量的数据,可以弥补参数检验中碰到的无法运用的定性资料的检验问题。5当前5页,总共40页。8.1.3参数检验的缺点非参数检验虽然适用范围较广且稳健性良好,尤其是高级非参数检验已经显示出参数检验所无法比拟的优势,但这些方法都要求用户有非常深厚的数理统计功底,并且大都需要编写程序才能完成。与参数检验相比,非参数检验有以下缺点。(1) 如果参数统计模型的所有假设在数据中事实上都能满足,而且测量达到了所要求的水平,那么用非参数检验就浪费了数据。(2) 非参数检验通常利用的不是原始数据,而是原始数据的秩或等级,这就可能损失了原始数据中所包含的信息。(3) 如果大部分数据分布比较集中,但存在少数非常大或非常小的极端值,此时采用无参数检验就不能完全覆盖信息。(4) 进行分组比较后,若母体存在差异,那就应该进行两两比较,但还没有一种非参数统计方法能用来检验方差分析模型中的交互作用,除非对其特征作特殊假设。6当前6页,总共40页。8.2卡方检验卡方检验是一种极为典型的对总体分布进行检验的非参数检验方法,也称为卡方拟合优度检验,用于检验数据是否与某种概率分布的理论数字相吻合,进而推断样本数据是否来自该分布的问题。7当前7页,总共40页。8.2.1卡方检验的原理1.卡方检验基本介绍2.卡方检验的基本思想8当前8页,总共40页。8.2.2卡方检验的SPSS操作建立或打开数据文件后,即可进行卡方检验,卡方检验通过“卡方”命令来实现。SPSS的卡方检验的数据存放有两种方式:一种是定义一个变量存放所有的样本值,并将重复的样本值作为不同的个案保存;另一种是定义两个变量,一个存放不同的样本值,另一个存放该样本值的相应频率,但这时应将频率变量定义为加权变量。在数据编辑窗口中,执行菜单栏中的“分析”→“非参数检验”→“旧对话框”→“卡方”命令,打开图8-1所示的“卡方检验”对话框。9当前9页,总共40页。8.2.2卡方检验的SPSS操作在主对话框中,单击“选项”按钮,打开图8-2所示的“卡方检验:选项”对话框。在主对话框中单击“精确”按钮,打开图8-3所示的“精确检验”对话框。10当前10页,总共40页。8.2.3卡方检验实例下面以一个实例来简单说明卡方检验的运用,以及对其结果的解读。在一个正20面体的各面上分别标上0~9十个数字,每个数字在两个面上标出。为了检验其均匀性,现将它投掷805次,得出各数字朝上的次数。依据此数据,建立数据文件frequency.sav,数据如图8-4所示。11当前11页,总共40页。8.2.3卡方检验实例1.操作步骤按如下顺序进行操作。(1) 打开数据文件frequency.sav,如图8-4所示。(2) 首先对数据进行加权,从菜单栏选择“数据”→“加权个案”命令,打开“加权个案”对话框。在该对话框中,以frequency为加权变量,选择对其数据进行加权。关于该操作,在第2章已经详细讲解过,此处不再赘述。(3) 执行菜单栏中的“分析”→“非参数检验””→“旧对话框”→“卡方”命令,打开图8-1所示的“卡方检验”对话框。(4) 将变量Number作为检验变量选入“检验变量列表”框中。(5) 单击“选项”按钮,打开图8-2所示的“卡方检验:选项”对话框。选择“描述性”复选框,要求输出描述性统计量。选择“四分位数”复选框,要求输出4分位数。单击“继续”按钮确认并返回主对话框。(6) 单击“确定”按钮,执行上述操作。12当前12页,总共40页。8.2.3卡方检验实例2.结果解读执行上述操作后,即可在输出窗口中得到分析结果。表8-1为描述性统计量表,给出了观测量个数(N)、均值(Mean)、最小值(Minimum)、最大值(Maxmium)、标准差(Std.Deviation)以及4分位数(25th、50th和75th)。表8-2为期望频率和观测频率表。表8-3为卡方检验表。参见教材P21213当前13页,总共40页。8.3二项检验实际情况是,很多数据的取值是二值的,一般采用0和1来表示两个取值。通常将这种二值情况构造为二项分布,SPSS中的二项分布检验过程(BinomialTestsProcedure)正是通过样本数据检验样本来自总体是否服从指定概率为p的二项分布。14当前14页,总共40页。8.3.1二项分布检验的原理1.二项分布检验的简单介绍2.二项分布检验的方法15当前15页,总共40页。8.3.2二项检验的SPSS操作创建或打开数据文件后,即可进行二项分布检验。二项分布检验在SPSS中通过“二项式”命令来实现。在数据编辑窗口中,从菜单栏中选择“分析”→“非参数检验”→“旧对话框”→“二项式”命令,打开图8-5所示的“二项式检验”对话框。16当前16页,总共40页。8.3.2二项检验的SPSS操作在主对话框中单击“选项”按钮,打开图8-6所示的“二项式检验:选项”对话框。在主对话框中单击“精确”按钮,打开图8-7所示的“精确检验”对话框。17当前17页,总共40页。8.3.3二项分布检验实例1.操作步骤建立数据文件后,在数据编辑器中打开数据文件“硬币结果.saw”。(1) 从菜单栏中选择“分析”→“非参数检验”→“旧对话框”→“二项式”命令,打开图8-5所示的“二项式检验”对话框。(2) 将变量result作为检验变量从左侧的源变量列表框中选入“检验变量列表”框中。(3) 在主对话框中单击“选项”按钮,打开图8-6所示的“二项式检验:选项”对话框。选择“描述”复选框,要求输出描述性统计量,然后单击“继续”按钮确认,返回主对话框。(4) 单击“确定”按钮,执行上述操作。18当前18页,总共40页。8.3.3二项分布检验实例2.结果解读二项分布检验的结果比较简单。执行上述操作后,SPSS会在结果输出窗口中给出描述性统计量表和二项分布检验表。表8-4为描述性统计量表,给出了观测量个数(N)、均值(Mean)、标准差(Std.Deviation)、最小值(Minimum)和最大值(Maximum)。表8-5为二项分布检验表。参见教材P21719当前19页,总共40页。8.4游程检验在多数研究中,样本都是从母体中随机抽取的,若样本不是随机抽样而得,则所做的任何推断都是无意义的。因此,研究者除了研究分布的位置或形状外,还需要研究样本的随机性。游程检验(RunsTest)的目的就是检验取值为二分类,并且按时间或某种顺序排列的数列数据是否为真正随机出现,即各观察对象是否来自同一母体,并且取值各自独立。20当前20页,总共40页。8.4.1游程检验的原理游程检验是一种利用游程的总数获得统计推断结论的方法,其目的就是检验取值为二分类,并且按时间或某种顺序排列的数列数据是否为真正随机出现,即各观察对象是否来自同一母体,并且取值各自独立。游程检验方法是基于样本所显示的游程数。在任一给定容量的样本中,游程的总数标志着样本是否是随机的。如果游程的数目很少,就意味着样本由于缺乏独立性而形成了一致的趋势或成束结构;若有极大量的游程,则看来有系统的短周期波动影响着观察结果。在SPSS中,通过非参数检验中的“游程”命令来实现游程检验。游程检验的原假设为序列具有随机性。在SPSS的游程检验中,利用游程构造检验统计量,判断样本数据的随机性。在大样本条件下,游程的抽样分布近似服从正态分布,SPSS将自动计算统计量,并根据正态分布的分布函数求出相应的概率p值,并将p值与显著性水平相比较。利用游程检验方法既可以对次序统计量进行随机性检验,还可以对不同的两个总体进行显著性检验。单样本游程检验用来检验变量值的出现是否具有随机性,而两个独立变量的游程检验则用来检验两组独立样本来自的两个总体的分布是否存在显著性差异。其原假设是:两组独立样本来自的两个总体分布无显著性差异。两组独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。在两组独立样本的游程检验中,游程数依赖于变量的秩。游程检验是一种检验效能非常低的方法,它只利用了游程的数目,失去了绝大部分的信息,得出的隐性结论只能供参考,因此如果有其他方法可供选择,请读者尽量不要使用此方法。21当前21页,总共40页。8.4.2游程检验的SPSS操作建立或打开数据文件后,即可进行游程检验。从菜单栏中执行“分析”→“非参数检验”→“旧对话框”→“游程”命令,打开“游程检验”对话框,如图8-8所示。单击“选项”按钮,打开“游程检验:选项”对话框。单击“精确”按钮,打开“精确检验”对话框。这两个对话框的功能和设置方法与上一节相应的对话框完全相同,此处不再赘述,读者可参照第8.2.2节进行学习。单击“确定”按钮,开始进行游程检验分析过程。22当前22页,总共40页。8.4.3游程检验实例下面以一个实际案例来说明游程检验的运用并对其结果作解读。1.操作步骤(1) 打开数据文件。从“转换”菜单下选择“重新编码为不同变量”命令,按平均寿命将20个观测个案分为两组。寿命值比平均寿命值小的记为1,比平均寿命值大的记为2。用新变量after来表示分组结果。(2) 从菜单栏中选择“分析”→“非参数检验”→“旧对话框”→“游程”命令,打开图8-8所示的“游程检验”对话框。(3) 将变量after作为检验变量选入“检验变量列表”框。(4) 从“割点”栏选择“均值”,以平均数作为分界点。(5) 其他采用默认设置。单击“确定”按钮执行游程检验。23当前23页,总共40页。8.4.3游程检验实例2.结果解读在结果输出窗口中输出描述性统计量表和游程检验表。表8-6为描述性统计量表。表8-7为游程检验表。参见教材P22024当前24页,总共40页。8.5单样本K-S检验前面所讲述的几种分析方法实际上都是对分类数据进行研究。实际上,很多时候收集到的都是连续性数据。本节要讲解的Kolmogorov-Smirnov检验则可以对连续性数据进行分析。Kolmogorov-Smirnov检验是以俄罗斯数学家柯尔莫哥洛夫和斯密尔洛夫的名字命名的一种非参数检验,该检验是一种拟合优度检验,可以利用样本数据推断样本来自的总体是否服从某一理论分布。25当前25页,总共40页。8.5.1单样本K-S检验的原理1.K-S检验的简单介绍2.单样本K-S检验的基本方法26当前26页,总共40页。8.5.2单样本K-S检验的SPSS操作建立或打开数据文件后,即可进行单样本K-S检验。在数据编辑器窗口中,从菜单栏中选择“分析”→“非参数检验”→“旧对话框”→“1-样本K-S”命令,打开图8-9所示的“单样本Kolmogorov-Smirnov检验”对话框。该对话框下方的“检验分布”栏用于指定检验的分布类型,包括以下4个复选框。常规,选择此项,则检验变量是否服从正态分布,这是系统默认选项。相等,选择此项,则检验变量是否服从均匀分布。泊松,选择此项,则检验变量是否服从泊松分布。指数分布,选择此项,则检验变量是否服从指数分布。27当前27页,总共40页。8.5.3单样本K-S检验实例下面以一个实际案例来简单说明单样本K-S检验的应用并对其结果进行解读。1.操作步骤(1) 根据数据建立数据文件“电子元件使用寿命.sav”。(2) 在数据编辑窗口中,从菜单栏中选择“分析”→“非参数检验”→“旧对话框”→“1-样本K-S”命令,打开图8-9所示的“单样本Kolmogorov-Smirnov检验”对话框。(3) 将变量使用寿命作为检验变量选入“检验变量列表”框中。(4) 在主对话框下方的“检验分布”栏中,选择“指数分布”复选框,检验变量是否服从指数分布。(5) 从选项对话框中选择“描述性”复选框,要求输出描述性统计量。(6) 单击“确定”按钮,执行单样本K-S检验。28当前28页,总共40页。8.5.3单样本K-S检验实例2.结果解读执行上述操作后,在结果输出窗口中输出描述性统计量表和单样本K-S检验表。表8-8为描述性统计量表,表中输出了观测量个数、均值、最小值、最大值和标准差。表8-9为单样本K-S检验表。参见教材P22429当前29页,总共40页。8.6两组独立样本检验两组独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本进行分析,推断来自两个总体的分布是否存在显著性差异的方法。独立样本是指在一个总体中随机抽样与在另一个总体中随机抽样没有影响的情况下获得的样本。SPSS提供了多种两组独立样本的非参数检验方法,主要包括Mann-Whitney检验、K-S检验、W-W游程检验、极端反应检验等。30当前30页,总共40页。8.6.1两组独立样本检验的原理1.两组独立样本检验的简单介绍2.两组独立样本检验的方法(1) Mann-WhitneyU检验(2) Moses极端反应检验(3) Kolmogorov-SmirnovZ检验(4) Wald-Wolfowitz游程检验31当前31页,总共40页。8.6.2两组独立样本检验的SPSS操作建立或打开数据文件后,即可开始进行两组独立样本检验。在数据编辑窗口中,从菜单栏中选择“分析”→“非参数检验”→“旧对话框”→“两个独立样本”命令,打开图8-10所示的“两个独立样本检验”对话框。“分组变量”文本框用于指定分组变量。和两样本T检验相同,该分组变量也必须是“定义组”详细定义进行比较的两个组的变量取值。选入分组变量后,“定义组”按钮被激活,单击该按钮,打开“两独立样本:定义组”对话框,如图8-11所示。32当前32页,总共40页。8.6.2两组独立样本检验的SPSS操作主对话框下方的“检验类型”栏用于选择所采用的检验方法:Mann-WhitneyU复选框,选择此项,则使用Mann-WhitneyU方法来进行检验;Moses极限反应复选框,选择此项,则使用Moses极端反应检验来进行检验;Kolmogorov-SmirnovZ复选框,选择此项,则使用Kolmogorov-Smirnov双样本检验来进行检验;Wald-Wolfowitz游程复选框,选择此项,则使用Wald-Wolfowitz游程检验来进行检验。在主对话框中单击“选项”按钮,将打开“两独立样本:选项”对话框,在其中可以选择要输出的统计量以及缺失值的处理方式。单击“精确”按钮将打开“精确检验”对话框。所有设置结束后,单击“确定”按钮,执行两组独立样本检验。33当前33页,总共40页。8.6.3两组独立样本检验实例在利用SPSS进行两组独立样本的非参数检验之前,应按规定的格式组织好数据。这里设置两个变量:一个变量存放样本值,另一个变量存放组标记值。下面以一个实际案例来讲解两组独立样本检验的应用及其结果的解读。1.操作步骤(1) 打开数据文件“工艺产品.sav”。(2) 从菜单栏中选择“分析”→“非参数检验”→“旧对话框”→“两个独立样本”命令,打开图8-10所示的对话框。(3) 将变量sysm作为检验变量选入“检验变量列表”框。(4) 将变量gy作分组变量选入“分组变量”文本框,然后单击“定义组”按钮,打开“两独立样本:定义组”对话框,给出两组的组标记值。(5) 在“检验类型”栏中选中所有的检验方法。(6) 单击“选项”按钮,打开“两独立样本:选项”对话框。选择“描述性”复选框,要求输出描述性统计量。(7) 单击“确定”按钮,执行上述操作。34当前34页,总共40页。8.6.3两组独立样本检验实例2.结果解读执行上述操作后,按照每种检验方法分别给出检验结果。表8-10为描述性统计量表,分别给出两个变量的观测量数、均值、最小值、最大值和标准差。表8-11为采用Mann-WhitneyU检验方法得出的结果。表8-12为采用K-S检验方法的结果。表8-13为Moses极端反应检验的结果。表8-14为Wald-Wolfowitz游程检验得到的结果。参见教材P22935当前35页,总共40页。8.7多独立样本检验多独立样本检验是通过分析多组独立样本的数据,推断样本来自的多个总体的中位数或分布是否存在显著性差异。多组独立样本是指按独立抽样方式获得的多组样本。SPSS提供的多独立样本检验的方法包括中位数检验、Kruskal-Wallis检验和Jonckheere-Terpstra检验。36当前36页,总共40页。8.7.1多独立样本检验的原理1.Kruskal-Wallis单向评秩方差分析2.推广的中位数检验3.Jonckheere-Terpstra检验37当前37页,总共40页。8.7.2多独立样本检验的SPSS操作建立或打开数据文件后,即可开始进行多独立样本的非参数检验。在主菜单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论