版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
S
P
S
S
在会计和财务管理中的应用苏海洋SPSS
在会计和财务管理中的应用1第6章非参数检验学习目标:理解非参数检验和参数检验的区别;掌握分布拟合检验的SPSS操作及结果解释;掌握独立性检验的SPSS操作及结果解释;掌握二项检验的SPSS操作及结果解释;掌握两独立样本非参数检验的SPSS操作及结果解释;掌握两相关样本非参数检验的SPSS操作及结果解释。第6章非参数检验学习目标:2前言由于参数假设检验需要满足一系列前提条件,因而无法对所有数据类型做出正确的统计推断。于是人们又发展出了非参数检验的方法以解决不适合参数检验条件数据的统计推断。前言由于参数假设检验需要满足一系列前提条件,因而无法对所有数36.1非参数检验简介6.1.1非参数检验和参数检验的异同参数检验(parametrictest),是在总体分布形式已知的前提下,检验同一分布族中的参数异同。非参数检验(non-parametrictest),是在总体分布未知,或参数检验的其它必要条件(如方差齐性)不满足时,对总体做统计推断的方法假设检验的一般原理对这两类方法都适用,置信水平1-α、p值等的概念也具有相同的涵义。6.1非参数检验简介6.1.1非参数检验和参数检验的46.1非参数检验简介6.1.1非参数检验和参数检验的异同6.1非参数检验简介6.1.1非参数检验和参数检验的56.1非参数检验简介6.1.2非参数检验的优缺点优点非参分布的限制,对不满足总体分布假设的数据仍可使用。非参数检验往往不需要大样本,小样本情况下结果也较为可靠。非参数检验对计数数据、定类数据和定序数据等非连续变量数据都可使用。6.1非参数检验简介6.1.2非参数检验的优缺点66.1非参数检验简介6.1.2非参数检验的优缺点缺点未能充分利用数据的全部信息。在将原始数据转换成等级、符号时,丢失了原始数据提供的数量大小的信息。非参数方法不能像多因素方差分析一样分析交互作用,并对其做假设检验。非参数方法的统计检验力往往低于相应的参数检验。
6.1非参数检验简介6.1.2非参数检验的优缺点76.1非参数检验简介6.1.3非参数检验的SPSS过程6.1非参数检验简介6.1.3非参数检验的SPSS过86.2卡方检验6.2.1卡方检验的一般原理卡尔·皮尔逊(Pearson,K.,1900),以频数数据对象的假设检验,它以实际观测次数和理论期望次数之间的差异构造出
统计量,从而利用
分布进行假设检验,
统计量公式为
k是样本分类数;foi表示第i
类实际观测到的频数;fei表示第i类理论分布下的频数。6.2卡方检验6.2.1卡方检验的一般原理96.2卡方检验6.2.1卡方检验的一般原理当频数n充分大时,
统计量渐进服从
分布。如果从样本计算出的
统计量很大,则它所对应的p值会很小,说明总体在原假设条件下样本取到实际观测频数的可能性是非常小的,若小于事先确定的显著性水平α,则拒绝原假设H0;反之,观测到的频数与理论频数差距越小,
值就越小,假设检验的p值就越大,若该p值大于事先确定的显著性水平α,则接受原假设H0。6.2卡方检验6.2.1卡方检验的一般原理106.2卡方检验6.2.1卡方检验的一般原理当某个类别的理论频数较小(fei﹤5)时,
统计量与
分布有一定差距,这时应用费雪精确检验法来进行假设检验。费雪精确检验(Fisher,R.A.,1922)是用排列组合的原理算出原假设条件下出现样本频数的精确概率。6.2卡方检验6.2.1卡方检验的一般原理116.2卡方检验6.2.2分布拟合检验6.2.3独立性检验6.2卡方检验6.2.2分布拟合检验126.2卡方检验6.2.2分布拟合检验分布拟合检验用于检验总体是否具有某个指定的分布或属于某一个分布族。拟合优度检验法是分布拟合检验的一种,它针对分组数据。原理:假设样本来自的总体服从某一分布,然后求出随机变量落在每一组中的理论频数。6.2卡方检验6.2.2分布拟合检验136.2卡方检验6.2.2.2拟合优度检验的SPSS过程案例6-1:数据“收入分布1.sav”中,某社区9557名居民的收入按行业惯例被分成了7个档次,如右图所示。检验该社区居民的人均月收入X(元)是否来自服从N(6000,2000)的总体?6.2卡方检验6.2.2.2拟合优度检验的SPSS过146.2卡方检验6.2.2.2拟合优度检验的SPSS过程案例分析:这是一个典型的分布拟合检验,正态分布参数是已知的,我们可以用
拟合优度检验法来检验样本数据是否和该正态分布有差异。首先我们需要将理论分布计算出来。第一步:计算理论分布步骤1:先将每组收入下限输入一个新的数据集中,如图。6.2卡方检验6.2.2.2拟合优度检验的SPSS过156.2卡方检验第一步:计算理论分布步骤2:计算出理论累积概率。选择主菜单【转换(T)】中的【计算变量(C)】命令,打开计算变量对话框。按图中提示输入。6.2卡方检验第一步:计算理论分布166.2卡方检验第一步:计算理论分布步骤2【续】:计算出理论累积概率。结果如图。6.2卡方检验第一步:计算理论分布176.2卡方检验第一步:计算理论分布步骤3:计算累积次数分布。选择主菜单【转换】中的【计算变量】命令,打开计算变量对话框。在【目标变量】框中新建变量“累积人数”,并在【数学表达式】框中填写“累计概率*9557”,即得到理论分布的人数频次。6.2卡方检验第一步:计算理论分布186.2卡方检验第一步:计算理论分布步骤3【续】:计算累积次数分布。结果如图。6.2卡方检验第一步:计算理论分布196.2卡方检验第一步:计算理论分布步骤4:将累积次数分布转换成简单次数分布。用累积人数中的后一组人数减前一组就可以得到每组的简单次数分布情况,即每组的理论人数。6.2卡方检验第一步:计算理论分布206.2卡方检验第一步:计算理论分布步骤4:将累积次数分布转换成简单次数分布。用累积人数中的后一组人数减前一组就可以得到每组的简单次数分布情况,即每组的理论人数。将这个理论人数复制到本章数据“收入分布1.sav”数据中6.2卡方检验第一步:计算理论分布216.2卡方检验第二步:拟合优度检验步骤1:在进行
拟合优度检验之前,还要先对个案进行加权。选择主菜单【数据(D)】中的【加权个案(W)】命令,进入【加权个案】对话框,在对话框中选择【加权个案】选项,并将变量“实际人数”置入右边的【频率变量(F)】框中。6.2卡方检验第二步:拟合优度检验226.2卡方检验第二步:拟合优度检验步骤2:分组变量进行个案加权之后就可以开始进行
拟合优度检验了。依次选择【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【卡方(C)】命令。6.2卡方检验第二步:拟合优度检验236.2卡方检验第二步:拟合优度检验步骤3:单击【卡方(C)】进入其主对话框,把变量“组序号”置入右边的【检验变量列表(T)】框中,右边勾选【期望】下的【值(V)】以便输入理论人数。6.2卡方检验第二步:拟合优度检验246.2卡方检验第二步:拟合优度检验步骤4:结果解释。表6-2给出的是观察数、期望数和残差,利用这些数据我们做
检验。6.2卡方检验第二步:拟合优度检验256.2卡方检验第二步:拟合优度检验步骤4【续】:统计量的值为(2.034E9)2.034×109,对应的p值(渐进显著性)为0.000,即p<0.05,该例题的原假设H0是数据分布服从N(6000,2000)的正态分布,因此应该拒绝原假设。6.2卡方检验第二步:拟合优度检验266.2卡方检验思考:
统计量的值为(2.034E9),即2.034×109这么大的统计量?理论次数小于5的单元格有1个,因此统计量不服从
分布。此时应采用费雪精确检验,但SPSS不提供该检验的办法。我们可以用合并单元格来解决6.2卡方检验思考:276.2卡方检验合并单元格后进行拟合优度检验我们将最后两组合并,使得合并后的所有组理论频数大于5。合并后我们可以重复上述的
拟合优度检验操作步骤。6.2卡方检验合并单元格后进行拟合优度检验286.2卡方检验合并单元格分析后结果解释。此时
统计量的值为27157.805,对应于自由度为5的
分布p值为0.000<0.05,因此应该原假设。虽然在这个例子中最后的统计推论和合并组之前无异,但是检验统计量的值却相差甚远,因此我们要特别注意单元格理论频数不得小于5的假设。6.2卡方检验合并单元格分析后结果解释。296.2卡方检验6.2.3独立性检验独立性检验简介:目的是从样本数据中推断总体两个变量是否彼此独立的检验,相当于独立样本比率差异的显著性检验,所需的数据通常为k×j交叉表。6.2卡方检验6.2.3独立性检验306.2卡方检验6.2.3独立性检验例如,对200名消费者购买日用品的名牌偏好和性别这两个变量做了调查,汇总结果如表6-6所示,试问名牌偏好和性别两个变量是否相互独立?男女合计偏好名牌6971140不偏好名牌411960合计11090N=200观察频数6.2卡方检验6.2.3独立性检验男女合计偏好名牌6316.2卡方检验6.2.3独立性检验独立性检验的原假设H0为男女消费者在品牌偏好上的比率没有显著差异,若该原假设成立,则每一格的理论fei次数应为
(fxi和fyi分别为性别变量和偏好变量的边际频数。)男女合计偏好名牌7763140不偏好名牌332760合计11090N=200理论频数6.2卡方检验6.2.3独立性检验男女合计偏好名牌7326.2卡方检验6.2.3独立性检验由此我们可以计算出
统计量并进行假设检验,此时
统计量服从自由度为(k-1)(j-1)=(2-1)(2-1)=1的
分布。男女合计偏好名牌6971140不偏好名牌411960合计11090N=200观察频数男女合计偏好名牌7763140不偏好名牌332760合计11090N=200理论频数6.2卡方检验6.2.3独立性检验男女合计偏好名牌6336.2卡方检验6.2.3独立性检验案例6-2:本章数据“性别与偏好.sav”是男性和女性购买日用品时对品牌的偏好类型(偏好品牌和不偏好品牌),试分析消费者购买日用品时对品牌的偏好是否与性别有关,或者说男性和女性购买日用品时的品牌偏好比率是否存在差异。6.2卡方检验6.2.3独立性检验346.2卡方检验6.2.3独立性检验步骤1:打开数据,依次选择【分析(A)】→【描述统计】→【交叉表(C)】命令6.2卡方检验6.2.3独立性检验356.2卡方检验6.2.3独立性检验步骤2:单击【交叉表(C)】进入其主对话框,并将两个变量分别置入【行(S)】和【列(C)】框中,这里将“性别”放入【行(S)】中,将“名牌偏好”放入【列(C)】框中。6.2卡方检验6.2.3独立性检验366.2卡方检验6.2.3独立性检验步骤3:单击【统计量(S)】进入其对话框,选择【卡方(H)】选项,如图6-17所示。单击【继续】按钮回到主对话框,最后单击【确定】按钮,提交系统分析6.2卡方检验6.2.3独立性检验376.2卡方检验6.2.3独立性检验步骤4:结果解释。该例的原假设是性别与名牌偏号是没有关联的(独立的),因为
统计量的检验概率p=0.013<0.05,因此拒绝原假设,即认为消费者性别与对名牌的偏好存在关联。6.2卡方检验6.2.3独立性检验386.2卡方检验6.2.3独立性检验步骤4【续】:交叉表数据分布情况,结合上面分析,我们可以推断出女性消费者更偏爱购买名牌的日用品。男女合计偏好名牌6971140不偏好名牌411960合计11090N=2006.2卡方检验6.2.3独立性检验男女合计偏好名牌6396.3二项检验6.3.1二项检验的原理二项检验仅适用于二分类数据,即取值只有两类的数据。例如,性别男女,考试成绩分为及格和不及格。二分变量一般用0和1加以编码。从这种二分类总体中抽取样本量为n的样本,其频数分布服从二项分布。二项检验(Binomialtest)就是一种用来检验样本是否来自参数为(n,p)的二项分布总体的方法。6.3二项检验6.3.1二项检验的原理406.3二项检验6.3.1二项检验的原理进行二项检验所需的数据非常简单,即二分变量中每一个类别的频数。设第一个类别的频数为X,则二项检验的原假设H0为:X~B(n,p),p=p0其中,n为样本容量,p为二分变量其中一个类别的比例,p0为原假设H0中该参数的取值。相应的备择假设H1为:
X~B(n,p),p≠p06.3二项检验6.3.1二项检验的原理416.3二项检验6.3.2二项检验的SPSS过程案例6-3:据媒体报道,2015年我国智能手机平均使用率达74%。某社区70岁以上的老年男性总数为1278,其中使用智能手机的有748人,不使用的有530人。那么该社区70岁以上的男性智能手机使用率与全国总人口的平均使用率74%是否有显著差异?6.3二项检验6.3.2二项检验的SPSS过程426.3二项检验6.3.2二项检验的SPSS过程步骤1:由于数据为分类汇总数据,因而在进行检验之前要先对分组变量进行个案加权。选择【数据(D)】菜单中的【加权个案(W)】在子菜单,在出现的对话框中选择【加权个案(W)】命令,把变量“人数”置入【频率变量(F)】框中。6.3二项检验6.3.2二项检验的SPSS过程436.3二项检验6.3.2二项检验的SPSS过程步骤2:依次选择【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【二项式(B)】命令。6.3二项检验6.3.2二项检验的SPSS过程446.3二项检验6.3.2二项检验的SPSS过程步骤3:单击【二项式(B)】进入二项式对话框,在其对话框中,将“智能手机使用情况”置入【检验变量列表(T)】框中,因为2015年我国智能手机平均使用率达74%,我们要检验的是样本数据是否符合这个比例,因此在检验比例处输入0.74,其他选项默认系统设置,得到如图6-23所示的对话框。6.3二项检验6.3.2二项检验的SPSS过程456.3二项检验步骤4:结果解释。
从表中的“渐进显著性(单侧)”一栏的p值可以看出,该社区70岁以上的老年男性智能手机使用率与74%有显著差异,该被试群体使用手机的观测比例是0.59,所以可以认为该群体收集使用率小于我国的基本水平。6.3二项检验步骤4:结果解释。466.4两独立样本非参数检验6.4.1两独立样本非参数检验的一般原理两独立样本来自于非正态总体时,不能用t检验。通过对两个独立样本的均值、中数、离散趋势、偏度等进行差异性检验,分析它们是否来自相同分布的总体。6.4两独立样本非参数检验6.4.1两独立样本非参476.4两独立样本非参数检验6.4.2Mann-WhitneyU检验Mann-WhitneyU检验又名Mann-Whitney-Wilcoxon秩和检验,适用于比例数据和顺序数据,它检验两样本的总体在位置上是否有差异。检验的基本原理是利用秩统计量,即将两样本合并、排列后每个观测值所处的顺序位置做为“秩”,通过比较两个样本的秩推断两样本所来自总体的位置信息(即总体的均值)。检验统计量U
在大样本(n1>10,n2>10)和小样本两种情形下计算方法不同,但都是以两样本的秩为出发点进行计算的。原假设下的U统计量的分布为已知,小样本时为精确概率,样本量大时趋于正态分布。6.4两独立样本非参数检验6.4.2Mann-Whi486.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程案例6-4:数据“电暖气月销量.sav”(见表6-11)为某企业某款电暖气2014和2015年度的月销售量数据,请分析这两年的月销量分布是否相同。1月2月3月4月5月6月7月8月9月10月11月12月20141351191068941322331409812112320151951751821507542921237181106表6-11某企业某款电暖气月销量(台)6.4两独立样本非参数检验6.4.2Mann-Whi496.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程案例分析:数据的组织方式和进行两独立样本t检验时一样,只是月销量的数据并不服从正态分布,也不需要这样的假设。6.4两独立样本非参数检验6.4.2Mann-Whi506.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程步骤1:打开数据,依次选择【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【2个独立样本(2)】命令。6.4两独立样本非参数检验6.4.2Mann-Whi516.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程步骤2:单击【2个独立样本(2)】进入其主对话框。将“电暖气月销量”置入【检验变量列表(T)】框中,将“年份”置入【分组变量(G)】框中,定义组的方式与两独立样本t检验过程相同,这里通过单击【定义组(D)】进入对话框定义比较的组别,即2014和2015年6.4两独立样本非参数检验6.4.2Mann-Whi526.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程步骤3:这里选择系统默认的Mann-WhitneyU检验法,由于此例中两个样本量都大于10,因此不需要使用精确检验法。6.4两独立样本非参数检验6.4.2Mann-Whi536.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程步骤4:结果解释。表6-11分别输出了电暖气月销量在2014年和2015年的样本量、秩平均值和秩和。表6-12中的Z统计量值为-0.231,渐进显著性p值为0.817>0.05,因此我们接受电暖气在2014和2015年度的销量分布来自同一总体的原假设。6.4两独立样本非参数检验6.4.2Mann-Whi546.5两相关样本非参数检验6.5.1两相关样本非参数检验的一般原理两相关样本非参数检验对应于参数检验中的配对样本t检验,只是配对样本假设两样本来自正态分布的总体,而两相关样本非参数检验则用于总体非正态的数据。两相关样本非参数检验同样也是检验两个成对数据的差值的中位数是否与0存在显著性差异。两相关样本非参数检验中,SPSS提供了4种检验方法:Wilcoxon检验、符号检验、McNemar检验和边际同质性检验。6.5两相关样本非参数检验6.5.1两相关样本非参数556.5两相关样本非参数检验6.5.2符号检验1.符号检验的原理符号检验是把正负符号作为数据的一种非参数检验程序,适用于检验两个来自不对称分布的配对样本的差异。符号检验以中位数作为集中趋势的量度,其原假设是配对资料差值来自中位数为零的总体。与配对样本t检验的思路类似,符号检验先求出两样本每对数据之差(xi-yi),若原假设成立,则正差值的个数n+和负差值的个数n-应各占一半左右。检验统计量为N=n++n-,当样本量较小时(N<25),可以精确计算出原假设成立时N的各个取值的精确概率,而样本量较大时,N渐进服从正态分布。这样我们可以根据N统计量进行假设检验。6.5两相关样本非参数检验6.5.2符号检验566.5两相关样本非参数检验6.5.2符号检验2.符号检验的SPSS过程案例6-5:本章数据“台式电脑销量.sav”是各个企业在各电商平台开设旗舰店前后的同期月销量对比数据。试研究电商平台的使用是否显著增加了这些企业的台式电脑月销量。6.5两相关样本非参数检验6.5.2符号检验576.5两相关样本非参数检验6.5.2符号检验1.符号检验的原理2.符号检验的SPSS过程案例分析:各企业的台式电脑月销量数据不服从正态分布的状态下,样本量少于30,达不到配对样本t检验的条件,为了保证检验的准确性,这时采用非参数检验该类型数据是比较合适的。6.5两相关样本非参数检验6.5.2符号检验586.5两相关样本非参数检验2.符号检验的SPSS过程案例分析:各企业的台式电脑月销量数据不服从正态分布的状态下,样本量少于30,达不到配对样本t检验的条件,为了保证检验的准确性,这时采用非参数检验该类型数据是比较合适的。步骤1:打开数据,依次选择【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【2个相关样本(L)】命令。6.5两相关样本非参数检验2.符号检验的SPSS过程596.5两相关样本非参数检验2.符号检验的SPSS过程步骤2:单击【2个相关样本(L)】进入其对话框,将变量“电脑月销量_前”和“电脑月销量_后”依次选中置入【检验对】框中,系统默认的是【Wilcoxon】检验法,但是这里重新勾选【符号检验(S)】检验法。如果检验的对数超过1对,也可以一次性进行检验。6.5两相关样本非参数检验2.符号检验的SPSS过程606.5两相关样本非参数检验2.符号检验的SPSS过程步骤3:由于样本量较小,应精确计算概率。单击对话框右上角的【精确(X)】按钮,在弹出的对话框中勾选【精确(X)】,如图6-30,其余保持SPSS默认值。单击【继续】按钮回到主对话框。6.5两相关样本非参数检验2.符号检验的SPSS过程616.5两相关样本非参数检验2.符号检验的SPSS过程步骤4:结果解释。表6-14给出的是“电脑月销量_后”小于“电脑月销量_前”(负差分)的次数(5),“电脑月销量_后”大于“电脑月销量_前”(正差分)的次数(6)。6.5两相关样本非参数检验2.符号检验的SPSS过程626.5两相关样本非参数检验2.符号检验的SPSS过程步骤4【续】:经检验,表6-15的精确显著性的单双侧p值都是大于0.05,所以接受原假设,即说明电商这种平台的使用并没有显著增加这些企业的台式电脑同期月销量。6.5两相关样本非参数检验2.符号检验的SPSS过程63小结本章学习了非参数检验的适用条件以及它和参数检验的区别与联系;非参数检验的具体方法有很多,本章着重讨论了卡方检验、二项检验、Mann-WithneyU检验和符号检验的原理,操作步骤和结果解释。小结本章学习了非参数检验的适用条件以及它和参数检验的区别与联64THANKYOU!!!THANKYOU!!!65S
P
S
S
在会计和财务管理中的应用苏海洋SPSS
在会计和财务管理中的应用66第6章非参数检验学习目标:理解非参数检验和参数检验的区别;掌握分布拟合检验的SPSS操作及结果解释;掌握独立性检验的SPSS操作及结果解释;掌握二项检验的SPSS操作及结果解释;掌握两独立样本非参数检验的SPSS操作及结果解释;掌握两相关样本非参数检验的SPSS操作及结果解释。第6章非参数检验学习目标:67前言由于参数假设检验需要满足一系列前提条件,因而无法对所有数据类型做出正确的统计推断。于是人们又发展出了非参数检验的方法以解决不适合参数检验条件数据的统计推断。前言由于参数假设检验需要满足一系列前提条件,因而无法对所有数686.1非参数检验简介6.1.1非参数检验和参数检验的异同参数检验(parametrictest),是在总体分布形式已知的前提下,检验同一分布族中的参数异同。非参数检验(non-parametrictest),是在总体分布未知,或参数检验的其它必要条件(如方差齐性)不满足时,对总体做统计推断的方法假设检验的一般原理对这两类方法都适用,置信水平1-α、p值等的概念也具有相同的涵义。6.1非参数检验简介6.1.1非参数检验和参数检验的696.1非参数检验简介6.1.1非参数检验和参数检验的异同6.1非参数检验简介6.1.1非参数检验和参数检验的706.1非参数检验简介6.1.2非参数检验的优缺点优点非参分布的限制,对不满足总体分布假设的数据仍可使用。非参数检验往往不需要大样本,小样本情况下结果也较为可靠。非参数检验对计数数据、定类数据和定序数据等非连续变量数据都可使用。6.1非参数检验简介6.1.2非参数检验的优缺点716.1非参数检验简介6.1.2非参数检验的优缺点缺点未能充分利用数据的全部信息。在将原始数据转换成等级、符号时,丢失了原始数据提供的数量大小的信息。非参数方法不能像多因素方差分析一样分析交互作用,并对其做假设检验。非参数方法的统计检验力往往低于相应的参数检验。
6.1非参数检验简介6.1.2非参数检验的优缺点726.1非参数检验简介6.1.3非参数检验的SPSS过程6.1非参数检验简介6.1.3非参数检验的SPSS过736.2卡方检验6.2.1卡方检验的一般原理卡尔·皮尔逊(Pearson,K.,1900),以频数数据对象的假设检验,它以实际观测次数和理论期望次数之间的差异构造出
统计量,从而利用
分布进行假设检验,
统计量公式为
k是样本分类数;foi表示第i
类实际观测到的频数;fei表示第i类理论分布下的频数。6.2卡方检验6.2.1卡方检验的一般原理746.2卡方检验6.2.1卡方检验的一般原理当频数n充分大时,
统计量渐进服从
分布。如果从样本计算出的
统计量很大,则它所对应的p值会很小,说明总体在原假设条件下样本取到实际观测频数的可能性是非常小的,若小于事先确定的显著性水平α,则拒绝原假设H0;反之,观测到的频数与理论频数差距越小,
值就越小,假设检验的p值就越大,若该p值大于事先确定的显著性水平α,则接受原假设H0。6.2卡方检验6.2.1卡方检验的一般原理756.2卡方检验6.2.1卡方检验的一般原理当某个类别的理论频数较小(fei﹤5)时,
统计量与
分布有一定差距,这时应用费雪精确检验法来进行假设检验。费雪精确检验(Fisher,R.A.,1922)是用排列组合的原理算出原假设条件下出现样本频数的精确概率。6.2卡方检验6.2.1卡方检验的一般原理766.2卡方检验6.2.2分布拟合检验6.2.3独立性检验6.2卡方检验6.2.2分布拟合检验776.2卡方检验6.2.2分布拟合检验分布拟合检验用于检验总体是否具有某个指定的分布或属于某一个分布族。拟合优度检验法是分布拟合检验的一种,它针对分组数据。原理:假设样本来自的总体服从某一分布,然后求出随机变量落在每一组中的理论频数。6.2卡方检验6.2.2分布拟合检验786.2卡方检验6.2.2.2拟合优度检验的SPSS过程案例6-1:数据“收入分布1.sav”中,某社区9557名居民的收入按行业惯例被分成了7个档次,如右图所示。检验该社区居民的人均月收入X(元)是否来自服从N(6000,2000)的总体?6.2卡方检验6.2.2.2拟合优度检验的SPSS过796.2卡方检验6.2.2.2拟合优度检验的SPSS过程案例分析:这是一个典型的分布拟合检验,正态分布参数是已知的,我们可以用
拟合优度检验法来检验样本数据是否和该正态分布有差异。首先我们需要将理论分布计算出来。第一步:计算理论分布步骤1:先将每组收入下限输入一个新的数据集中,如图。6.2卡方检验6.2.2.2拟合优度检验的SPSS过806.2卡方检验第一步:计算理论分布步骤2:计算出理论累积概率。选择主菜单【转换(T)】中的【计算变量(C)】命令,打开计算变量对话框。按图中提示输入。6.2卡方检验第一步:计算理论分布816.2卡方检验第一步:计算理论分布步骤2【续】:计算出理论累积概率。结果如图。6.2卡方检验第一步:计算理论分布826.2卡方检验第一步:计算理论分布步骤3:计算累积次数分布。选择主菜单【转换】中的【计算变量】命令,打开计算变量对话框。在【目标变量】框中新建变量“累积人数”,并在【数学表达式】框中填写“累计概率*9557”,即得到理论分布的人数频次。6.2卡方检验第一步:计算理论分布836.2卡方检验第一步:计算理论分布步骤3【续】:计算累积次数分布。结果如图。6.2卡方检验第一步:计算理论分布846.2卡方检验第一步:计算理论分布步骤4:将累积次数分布转换成简单次数分布。用累积人数中的后一组人数减前一组就可以得到每组的简单次数分布情况,即每组的理论人数。6.2卡方检验第一步:计算理论分布856.2卡方检验第一步:计算理论分布步骤4:将累积次数分布转换成简单次数分布。用累积人数中的后一组人数减前一组就可以得到每组的简单次数分布情况,即每组的理论人数。将这个理论人数复制到本章数据“收入分布1.sav”数据中6.2卡方检验第一步:计算理论分布866.2卡方检验第二步:拟合优度检验步骤1:在进行
拟合优度检验之前,还要先对个案进行加权。选择主菜单【数据(D)】中的【加权个案(W)】命令,进入【加权个案】对话框,在对话框中选择【加权个案】选项,并将变量“实际人数”置入右边的【频率变量(F)】框中。6.2卡方检验第二步:拟合优度检验876.2卡方检验第二步:拟合优度检验步骤2:分组变量进行个案加权之后就可以开始进行
拟合优度检验了。依次选择【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【卡方(C)】命令。6.2卡方检验第二步:拟合优度检验886.2卡方检验第二步:拟合优度检验步骤3:单击【卡方(C)】进入其主对话框,把变量“组序号”置入右边的【检验变量列表(T)】框中,右边勾选【期望】下的【值(V)】以便输入理论人数。6.2卡方检验第二步:拟合优度检验896.2卡方检验第二步:拟合优度检验步骤4:结果解释。表6-2给出的是观察数、期望数和残差,利用这些数据我们做
检验。6.2卡方检验第二步:拟合优度检验906.2卡方检验第二步:拟合优度检验步骤4【续】:统计量的值为(2.034E9)2.034×109,对应的p值(渐进显著性)为0.000,即p<0.05,该例题的原假设H0是数据分布服从N(6000,2000)的正态分布,因此应该拒绝原假设。6.2卡方检验第二步:拟合优度检验916.2卡方检验思考:
统计量的值为(2.034E9),即2.034×109这么大的统计量?理论次数小于5的单元格有1个,因此统计量不服从
分布。此时应采用费雪精确检验,但SPSS不提供该检验的办法。我们可以用合并单元格来解决6.2卡方检验思考:926.2卡方检验合并单元格后进行拟合优度检验我们将最后两组合并,使得合并后的所有组理论频数大于5。合并后我们可以重复上述的
拟合优度检验操作步骤。6.2卡方检验合并单元格后进行拟合优度检验936.2卡方检验合并单元格分析后结果解释。此时
统计量的值为27157.805,对应于自由度为5的
分布p值为0.000<0.05,因此应该原假设。虽然在这个例子中最后的统计推论和合并组之前无异,但是检验统计量的值却相差甚远,因此我们要特别注意单元格理论频数不得小于5的假设。6.2卡方检验合并单元格分析后结果解释。946.2卡方检验6.2.3独立性检验独立性检验简介:目的是从样本数据中推断总体两个变量是否彼此独立的检验,相当于独立样本比率差异的显著性检验,所需的数据通常为k×j交叉表。6.2卡方检验6.2.3独立性检验956.2卡方检验6.2.3独立性检验例如,对200名消费者购买日用品的名牌偏好和性别这两个变量做了调查,汇总结果如表6-6所示,试问名牌偏好和性别两个变量是否相互独立?男女合计偏好名牌6971140不偏好名牌411960合计11090N=200观察频数6.2卡方检验6.2.3独立性检验男女合计偏好名牌6966.2卡方检验6.2.3独立性检验独立性检验的原假设H0为男女消费者在品牌偏好上的比率没有显著差异,若该原假设成立,则每一格的理论fei次数应为
(fxi和fyi分别为性别变量和偏好变量的边际频数。)男女合计偏好名牌7763140不偏好名牌332760合计11090N=200理论频数6.2卡方检验6.2.3独立性检验男女合计偏好名牌7976.2卡方检验6.2.3独立性检验由此我们可以计算出
统计量并进行假设检验,此时
统计量服从自由度为(k-1)(j-1)=(2-1)(2-1)=1的
分布。男女合计偏好名牌6971140不偏好名牌411960合计11090N=200观察频数男女合计偏好名牌7763140不偏好名牌332760合计11090N=200理论频数6.2卡方检验6.2.3独立性检验男女合计偏好名牌6986.2卡方检验6.2.3独立性检验案例6-2:本章数据“性别与偏好.sav”是男性和女性购买日用品时对品牌的偏好类型(偏好品牌和不偏好品牌),试分析消费者购买日用品时对品牌的偏好是否与性别有关,或者说男性和女性购买日用品时的品牌偏好比率是否存在差异。6.2卡方检验6.2.3独立性检验996.2卡方检验6.2.3独立性检验步骤1:打开数据,依次选择【分析(A)】→【描述统计】→【交叉表(C)】命令6.2卡方检验6.2.3独立性检验1006.2卡方检验6.2.3独立性检验步骤2:单击【交叉表(C)】进入其主对话框,并将两个变量分别置入【行(S)】和【列(C)】框中,这里将“性别”放入【行(S)】中,将“名牌偏好”放入【列(C)】框中。6.2卡方检验6.2.3独立性检验1016.2卡方检验6.2.3独立性检验步骤3:单击【统计量(S)】进入其对话框,选择【卡方(H)】选项,如图6-17所示。单击【继续】按钮回到主对话框,最后单击【确定】按钮,提交系统分析6.2卡方检验6.2.3独立性检验1026.2卡方检验6.2.3独立性检验步骤4:结果解释。该例的原假设是性别与名牌偏号是没有关联的(独立的),因为
统计量的检验概率p=0.013<0.05,因此拒绝原假设,即认为消费者性别与对名牌的偏好存在关联。6.2卡方检验6.2.3独立性检验1036.2卡方检验6.2.3独立性检验步骤4【续】:交叉表数据分布情况,结合上面分析,我们可以推断出女性消费者更偏爱购买名牌的日用品。男女合计偏好名牌6971140不偏好名牌411960合计11090N=2006.2卡方检验6.2.3独立性检验男女合计偏好名牌61046.3二项检验6.3.1二项检验的原理二项检验仅适用于二分类数据,即取值只有两类的数据。例如,性别男女,考试成绩分为及格和不及格。二分变量一般用0和1加以编码。从这种二分类总体中抽取样本量为n的样本,其频数分布服从二项分布。二项检验(Binomialtest)就是一种用来检验样本是否来自参数为(n,p)的二项分布总体的方法。6.3二项检验6.3.1二项检验的原理1056.3二项检验6.3.1二项检验的原理进行二项检验所需的数据非常简单,即二分变量中每一个类别的频数。设第一个类别的频数为X,则二项检验的原假设H0为:X~B(n,p),p=p0其中,n为样本容量,p为二分变量其中一个类别的比例,p0为原假设H0中该参数的取值。相应的备择假设H1为:
X~B(n,p),p≠p06.3二项检验6.3.1二项检验的原理1066.3二项检验6.3.2二项检验的SPSS过程案例6-3:据媒体报道,2015年我国智能手机平均使用率达74%。某社区70岁以上的老年男性总数为1278,其中使用智能手机的有748人,不使用的有530人。那么该社区70岁以上的男性智能手机使用率与全国总人口的平均使用率74%是否有显著差异?6.3二项检验6.3.2二项检验的SPSS过程1076.3二项检验6.3.2二项检验的SPSS过程步骤1:由于数据为分类汇总数据,因而在进行检验之前要先对分组变量进行个案加权。选择【数据(D)】菜单中的【加权个案(W)】在子菜单,在出现的对话框中选择【加权个案(W)】命令,把变量“人数”置入【频率变量(F)】框中。6.3二项检验6.3.2二项检验的SPSS过程1086.3二项检验6.3.2二项检验的SPSS过程步骤2:依次选择【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【二项式(B)】命令。6.3二项检验6.3.2二项检验的SPSS过程1096.3二项检验6.3.2二项检验的SPSS过程步骤3:单击【二项式(B)】进入二项式对话框,在其对话框中,将“智能手机使用情况”置入【检验变量列表(T)】框中,因为2015年我国智能手机平均使用率达74%,我们要检验的是样本数据是否符合这个比例,因此在检验比例处输入0.74,其他选项默认系统设置,得到如图6-23所示的对话框。6.3二项检验6.3.2二项检验的SPSS过程1106.3二项检验步骤4:结果解释。
从表中的“渐进显著性(单侧)”一栏的p值可以看出,该社区70岁以上的老年男性智能手机使用率与74%有显著差异,该被试群体使用手机的观测比例是0.59,所以可以认为该群体收集使用率小于我国的基本水平。6.3二项检验步骤4:结果解释。1116.4两独立样本非参数检验6.4.1两独立样本非参数检验的一般原理两独立样本来自于非正态总体时,不能用t检验。通过对两个独立样本的均值、中数、离散趋势、偏度等进行差异性检验,分析它们是否来自相同分布的总体。6.4两独立样本非参数检验6.4.1两独立样本非参1126.4两独立样本非参数检验6.4.2Mann-WhitneyU检验Mann-WhitneyU检验又名Mann-Whitney-Wilcoxon秩和检验,适用于比例数据和顺序数据,它检验两样本的总体在位置上是否有差异。检验的基本原理是利用秩统计量,即将两样本合并、排列后每个观测值所处的顺序位置做为“秩”,通过比较两个样本的秩推断两样本所来自总体的位置信息(即总体的均值)。检验统计量U
在大样本(n1>10,n2>10)和小样本两种情形下计算方法不同,但都是以两样本的秩为出发点进行计算的。原假设下的U统计量的分布为已知,小样本时为精确概率,样本量大时趋于正态分布。6.4两独立样本非参数检验6.4.2Mann-Whi1136.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程案例6-4:数据“电暖气月销量.sav”(见表6-11)为某企业某款电暖气2014和2015年度的月销售量数据,请分析这两年的月销量分布是否相同。1月2月3月4月5月6月7月8月9月10月11月12月20141351191068941322331409812112320151951751821507542921237181106表6-11某企业某款电暖气月销量(台)6.4两独立样本非参数检验6.4.2Mann-Whi1146.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程案例分析:数据的组织方式和进行两独立样本t检验时一样,只是月销量的数据并不服从正态分布,也不需要这样的假设。6.4两独立样本非参数检验6.4.2Mann-Whi1156.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程步骤1:打开数据,依次选择【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【2个独立样本(2)】命令。6.4两独立样本非参数检验6.4.2Mann-Whi1166.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程步骤2:单击【2个独立样本(2)】进入其主对话框。将“电暖气月销量”置入【检验变量列表(T)】框中,将“年份”置入【分组变量(G)】框中,定义组的方式与两独立样本t检验过程相同,这里通过单击【定义组(D)】进入对话框定义比较的组别,即2014和2015年6.4两独立样本非参数检验6.4.2Mann-Whi1176.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-WhitneyU检验的SPSS过程步骤3:这里选择系统默认的Mann-WhitneyU检验法,由于此例中两个样本量都大于10,因此不需要使用精确检验法。6.4两独立样本非参数检验6.4.2Mann-Whi1186.4两独立样本非参数检验6.4.2Mann-WhitneyU检验2.Mann-Whitney
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 青岛科技大学《数学分析V》2023-2024学年第一学期期末试卷
- 幼儿种植物课程设计
- 大班讨论探究式课程设计
- 幼儿园里的人物课程设计
- 情绪abc课程设计
- 择业概论课程设计
- 微喷灌溉系统课程设计
- 推土机驱动桥课程设计
- 怎样做好英语培训课程设计
- 青岛黄海学院《培训理论与实务》2023-2024学年第一学期期末试卷
- 工程热力学智慧树知到期末考试答案章节答案2024年东北电力大学
- 西师大版2023-2024学年五年级数学上册期末测试卷含答案
- 中职班级建设方案课件
- 【良品铺子应收账款现状及其风险分析(论文10000字)】
- 山东省烟台市2023-2024学年高二上学期期末历史试题(解析版)
- TB-T 3356-2021铁路隧道锚杆-PDF解密
- (正式版)HGT 6313-2024 化工园区智慧化评价导则
- MOOC 基础生物化学-西北农林科技大学 中国大学慕课答案
- pfna手术术后护理
- 农村网格化矛盾纠纷
- 板材滚弯成形工艺
评论
0/150
提交评论