第8章非参数检验_第1页
第8章非参数检验_第2页
第8章非参数检验_第3页
第8章非参数检验_第4页
第8章非参数检验_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

会计学1第8章非参数检验8-2第八章非参数检验第一节非参数检验概述第二节符号检验与符秩检验第三节秩和检验与检验第四节等级相关检验第五节EXCEL在非参数检验中的应用第1页/共60页8-3第一节非参数检验概述一、什么是非参数检验二、非参数检验的优缺点第2页/共60页8-4一、什么是非参数检验

所谓非参数检验,又被称为自由分布检验,它是一种不需要事先对总体分布的形状加以限制而进行的假设检验。应当指出,这里所谓的“非参数”,只是指在检验的过程中,未对检验统计量服从的分布及参数做出限制,并不意味着在检验中“不涉及参数”或“不对参数进行检验”。第3页/共60页8-5二、非参数检验的优缺点优点:首先,检验条件比较宽松,适应性强。非参数检验对资料的要求不像参数检验那样严格,它适合于处理诸如非正态的、方差不等的或分布形状未知的资料。其次,自由分布检验的方法比较灵活,用途广泛。它不但可以应用于处理测量层次较高的定距、定比数据,也适用于处理层次较低的定类、定序数据。对于那些不能进行加、减、乘、除运算的定类数据与定序数据,也可进行检验。再次,自由分布检验的计算相对简单。由于自由分布的检验方法不用复杂计算,一般使用计数方法就可以了,它的计数过程与结果都比较简单、直观与明显。第4页/共60页8-6缺点:它对原始数据中包含的信息利用得不够充分,检验的功效相对较弱。

结论:参数检验与非参数检验是针对不同情况提出的两种统计方法,它们各有优缺点,可互为补充。

第5页/共60页8-7第二节符号检验与符秩检验一、单总体问题的符号检验二、两总体问题的符号检验三、威尔科克森配对符号秩检验第6页/共60页8-8一、单总体问题的符号检验单总体符号检验适用于检验总体中位数是否在某一指定位置。第7页/共60页8-9第8页/共60页8-10二、两总体问题的符号检验两总体符号检验适用于检验配对样本情形下,两总体分布在位置特征上是否有差异。所谓配对样本,是指对每一个观测单元(个体)作两次观测。第9页/共60页8-11第10页/共60页8-12第11页/共60页8-13第12页/共60页8-14三、威尔科克森配对符号秩检验

以上所介绍的两总体情形下符号检验方法,仅仅用配对观测之间差别的符号进行检验,而不注重差别的大小,因此对资料的利用不够充分。当配对观测之间的差别可以从数量上来测定时,威尔科克森(Wilcoxon)配对符号秩检验比符号检验更有效。第13页/共60页8-15第14页/共60页8-16第15页/共60页8-17第16页/共60页8-18第三节秩和检验与检验一、秩和检验二、皮尔逊统计量三、分布拟合检验第17页/共60页8-19一、秩和检验

秩和检验可用于检验两个独立样本是否来自具有相同位置特征的总体。这里要求两个总体具有相同的分布形状(不论是何种分布形状)。第18页/共60页8-20第19页/共60页8-21第20页/共60页8-22第21页/共60页8-23第22页/共60页8-24二、皮尔逊统计量第23页/共60页8-25第24页/共60页8-26第25页/共60页8-27三、分布拟合检验

在理论研究和实际应用中,常常根据所作随机试验的特点,认定无限总体的分布符合某种概率分布模型,这时,说该无限总体具有已知的分布。但是,有许多时候,无法根据所作随机试验认定无限总体符合何种概率分布模型。这时,便需要根据统计数据提供的信息,为总体选配一个合适的概率分布模型。第26页/共60页8-28一般作法是:首先,对样本数据作分组整理,计算各组的频率,称所得到的分布列为经验分布;其次,根据有关理论和实际知识以及经验分布的特点,猜测无限总体的分布符合某种概率模型,称所选择的概率模型为理论分布;然后,用显著性检验的方法,将经验分布与理论分布作比较,检验观察到的差异能否显著地表明两种分布的真实差异存在,如果表明真实差异存在的证据不足,则可以期望所选理论分布能较好地描述所研究的无限总体的分布规律。这类显著性检验称作分布拟合检验。分布拟合检验的方法很多,我们只介绍分布拟合的皮尔逊检验。第27页/共60页8-29第28页/共60页8-30第29页/共60页8-31表8-1 钟表走时误差的经验分布与理论分布的比较第30页/共60页8-32第31页/共60页8-33第32页/共60页8-34第四节等级相关检验一、斯皮尔曼等级相关系数二、斯皮尔曼等级相关系数的统计检验三、两点说明第33页/共60页8-35一、斯皮尔曼等级相关系数

第七章所讨论的两变量之间相关系数的前提是:两随机变量的联合分布是二维正态分布。当随机变量的分布不能满足正态性要求时,或者所要研究的变量不是数量型变量时,通常的相关分析方法不宜使用,而需要利用斯皮尔曼等级相关系数进行考察。第34页/共60页8-36第35页/共60页8-37第36页/共60页8-38二、斯皮尔曼等级相关系数的统计检验第37页/共60页8-39第38页/共60页8-40三、两点说明(一)等级相关检验适用于变量值表现为等级的变量。不过,对于变量值表现为数值而不是等级的变量,有时也可以把它划分为若干等级,用等级相关的方法来研究。这样做是出于下面的一些理由:(1)无法假定总体的分布;(2)其中有一个变量是只能用等级来反映的;(3)把测量值划分为等级更能反映事物的本质(例如,把年龄按生命过程阶段划分比用实际年龄更便于研究生命过程的统计规律)。把测量值转换为等级的方法是:首先,按实际观察值大小排序,并赋予每个观察值秩次;其次,把测量值的取值范围划分为若干等级区间。第39页/共60页8-41(二)斯皮尔曼等级相关系数是以变量没有相同等级为前提的。但有时,观察结果出现了相同的等级,这时,须计算这几个观察结果所在位置秩次的简单算术平均数作为它们相应的等级。在这种情形下应用斯皮尔曼等级相关系数计算公式所得之结果显然只是近似的。若相同等级不是太多,可以近似应用上述公式,否则应加以修正。第40页/共60页8-42第五节EXCEL在非参数检验中的应用一、符号检验二、威尔科克森配对符号秩检验三、分布拟合的皮尔逊卡方检验第41页/共60页8-43一、符号检验第42页/共60页8-44利用Excel求解步骤如下:(一)输入数据,见图8-1。A、B列为原始输入数据,样本数据存放在A2:A29单元格区域,图中未完全显示出来,D、E列为计算得出的结果。(二)计算样本观察值大于中位数的个数(即正号的个数)。在E1中输入公式如下的公式=COUNTIF(A2:A29,">90")COUNTIF函数计算区域中满足给定条件的单元格的个数。(三)计算样本容量n(不含0差数)。在E2中输入公式=COUNT(A2:A29)-COUNTIF(A2:A29,"=90")第43页/共60页8-45(四)使用公式8.1计算检验统计量Z。在E3中输入公式=(E1-0.5*E2)/SQRT(0.25*E2)(五)计算临界值Zα/2。在E4中输入公式“=ABS(NORMSINV(B2/2))”。图8-1(六)结论。由于-4.54<-1.96,检验统计量的样本值落在拒绝域,故否定原假设。总体中位数不是90。第44页/共60页8-46二、威尔科克森配对符号秩检验【例8-4】从某专业学生中简单随机抽取20人,先后两次组织某种测验。两次测验结果如下:试用威尔科克森配对符号秩检验法检验,该专业学生在两次测验的时间上,该项成绩水平有无改变。(显著水平0.05)

第一次3271353142101764410264第二次685717524781624311870第一次21484557723587507238第二次40303980796477368938第45页/共60页8-47第46页/共60页8-48第47页/共60页8-49图8-2第48页/共60页8-50(二)计算|di|的秩。

1.按|di|大小进行升序排位(由于第20个学生的成绩差为0,所以该同学的|di|不参加排位)。在F2中输入公式“=RANK(E2,E$2:E$20,1)”,再次公式复制到F3:F20区域即可。

RANK函数返回一个数字在数字列表中的排位,第2个参数指定参与排位的所有数字,第1个参数则是数字列表中需要找到排位的某个数字,第3个参数指定数字列表排序的方式,1为升序,0为降序。

RANK函数对重复数的排位相同。但重复数的存在将影响后续数值的排位。例如,本例是升序排位,6出现两次,其排位为3,则大于6的最小的数字7的排位是5(没有排位为4的数字)。

第49页/共60页8-512.求重复数字的秩次。此处需要考虑重复数字的排位次序。如本例,有两个同学的|di|为6,其秩次应是3.5。此时,必须计算一个修正数。在G2单元格中输入如下公式:

=(COUNT(F$2:F$20)+1-RANK(F2,F$2:F$20)-RANK(F2,F$2:F$20,1))/2

并将该公式复制到G3:G20区域即可。从计算结果可以看出,如果某个数字是唯一的,则它的修正数为0。第50页/共60页8-523.求秩。将F列与G列相加即可。在H2中输入公式“=F2+G2”,并将公式复制到H3:H20区域。最终结果见图8-2。第51页/共60页8-53(三)计算正秩与负秩的和。在图8-2所示的工作表上继续这一工作,后续的工作表见图

8-3。图中L1、M1中的内容就是D1的内容(即成绩差的字段名),只要在L1、M1中输入公式“=D1”即可。在J2和K2分别输入如下公式,便可得到正秩和与负秩和。

=DSUM(D1:H20,"秩",L1:L2)=DSUM(D1:H20,"秩",M1:M2)第52页/共60页8-54DSUM是数据库函数,第一个函数指定数据库区域,第二个参数指定是对哪一列数据进行求和,最后一个参数指定求和的条件。具体用法请查阅Excel帮助。图8-3第53页/共60页8-55(四)结论。检验统计量T=74.5,查附表知,n=19,单侧0.025显著水平的临界值为T0.025=46,由于74.5>46,检验统计量的样本值落在拒绝域,故否定原假设。所以说,该专业学生在两次测验的时间上,该项成绩水平有改变。第54页/共60页8-56三、分布拟合的皮尔逊卡方检验【例8-5】用Excel实现本章例8-1的计算过程。解:主要操作步骤如下。(一)构造工作表,见图8-4。图中方框之内为计算所得结果,方框之外为原始的输入数据。图8-4第55页/共60页8-57第56页/共60页8-58第57页/共60页8-59

本章小结1.非参数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论