版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析
(方法与案例)
作者贾俊平统计学统
计
学
Statistics*对正确问题的近似答案,赛过对错的问题的精确答案。
——JohnW.Tukey统计名言第14章非参数检验14.1
单样本的检验14.2两个及两个以上样本的检验14.3秩相关及其检验
nonparametrictest*学习目标非参数检验及其用途单样本的非参数检验方法两个及以上样本的非参数检验方法秩相关及其检验方法用SPSS进行非参数检验非参数检验与参数检验的比较*不同商圈的报纸发行量是否有差异?华夏时报》自称是中国第一份商圈社区报,精准覆盖北京636座写字楼(公寓)70000实名精英读者的精神咖啡2005年8月29日的华夏时报公布了该报最新的发行量数据,并声明是“最新发行数据诚信公告”国贸—京广建国门—王府井燕莎西单—金融街中关村亚奥990592912181067201012642196604450250898522653911828918111252210340182547853201719243304777355748814421717116016810151151109144181341819051150512078364395481811139133026102318621216159330925340*不同商圈的报纸发行量是否有差异?要检验不同商圈的发行量是否有显著差异,可以接受方差分析方法。但该方法假定每个商圈在不同发行点的发行量应听从正态分布,且方差相等事实上,这些假定很难得到满足。比如,对上述数据所做的正态分布检验表明,亚奥商圈的发行量就不满足正态分布(P=0.018<0.05)非参数方法就不须要这些假定,照样可以得到比较满足的检验结果。比如,对上述数据所做的Kruskal-Wallis检验得到的(P=0.355>0.05),没有证据表明不同商圈的报纸发行量之间存在显著差异
14.1单样本的检验
14.1.1总体分布类型的检验
14.1.2中位数的符号检验
14.1.3Wilcoxon符号秩检验第14章非参数检验14.1.1总体分布类型的检验14.1单样本的检验*二项分布检验(binomialtest)是通过考察二分类变量的每个类别中视察值的频数与特定二项分布下的期望频数之间是否存在显著差异,来推断抽取样本所依靠的总体是否听从特定概率为P的二项分布二项分布检验的原假设是:抽取样本所依靠的总体与特定的二项分布无显著差异依据二项分布学问,一个听从二项分布的随机变量,在n次试验中,出现“成功”的次数的概率为若“成功”的次数的概率小于给定的显著性水平,则拒绝原假设,表明抽取样本所依靠的总体与特定概率为p的二项分布有显著差异(样本数据不是来自某个特定概率为p的二项分布)总体分布类型的检验
(二项分布检验)*【例14-1】依据以往的生产数据,某种产品的合格率为90%。现从中随机抽取25个进行检测,合格品为20个。检验该批产品的合格率是否为90%?(产品合格率X~B(n,0.9))SPSS的数据格式表中的“1”表示合格品;“0”表示不合格品总体分布类型的检验
(二项分布检验)合格品频数12005*第1步:指定“频数”变量:点击【数据】【加权个案】,将“频数”选入【频率变量】【确定】第2步:选择【分析】【非参数检验】选项进入主对话框第3步:将待检验的变量选入【检验变量列表】第4步:在【检验比例】中输入检验的概率
(本例为0.9),点击【确定】二项分布检验总体分布类型的检验
(SPSSbinomialtest)SPSS*【例14.1】输出结果表中的合格品的视察比例为0.8,检验比例为0.9。精确单尾概率为0.098,它表示假如该批产品的合格率为0.9,那么25个产品中合格品数量小于等于20个的概率为0.098。P>0.05,不拒绝原假设,没有证据表明该批产品的合格率不是0.9总体分布类型的检验
(SPSSbinomialtest)二项分布检验SPSS*单样本的K-S检验(Kolmogorov-Smirnov检验)是用来检验抽取样本所依靠的总体是否听从某一理论分布其方法是将某一变量的累积分布函数与特定的分布函数进行比较。设总体的累积分布函数为F(x),已知的理论分布函数为F0(x),则检验的原假设和备择假设为H0:F(x)=F0(x);H1:F(x)≠F0(x)原假设所表达的是:抽取样本所依靠的总体与指定的理论分布无显著差异SPSS供应的理论分布有正态分布、Poisson分布、匀整分布、指数分布等总体分布类型的检验
(K-S检验)*【例14-2】沿用第6章的例6-7。对某汽车配件供应商供应的10个样本进行检测,得到其长度数据如下(单位:cm)
检验该供货商生产的配件长度是否听从正态分布?(=0.05)总体分布类型的检验
(K-S检验)12.210.812.011.811.912.411.312.212.012.3*第1步:选择【分析】【非参数检验】【1-样本K-S】进入主对话框第2步:将待检验的变量选入【检验变量列表】(本例为“配件长度”)第3步:点击【精确】,并在对话框中选择
【精确】,点击【确定】K—S检验总体分布类型的检验
(SPSSK-S检验)SPSS*【例14-2】输出结果精确双尾概率为0.602>0.05,不拒绝原假设。没有证据表明该供货商供应的汽车配件长度不听从正态分布总体分布类型的检验
(SPSSK-S检验)K—S检验SPSS14.1.2中位数的符号检验14.1单样本的检验*检验总体中位数是否等于某个假定的值设一个随机样本有n个数据,总体中位数的实际值为M,假设的总体中位数值为M0。当样本中的数据大于假设的中位数时,用“+”号表示,小于假设的中位数时,用“-”表示;对于恰好等于假设的中位数的数据予以剔出若关切实际的M与假设的M0是否有差别,应建立假设H0:M=M0;H1:M≠M0计算检验统计量S+和S-。S+表示每个样本数据与M0与差值符号为正的个数;S-表示每个样本数据与M0差值符号为负的个数计算P值并作出决策。若P<,拒绝原假设中位数的符号检验
(signtest)*【例14-3】某企业生产一种零件,规定其长度的中位数为15厘米,现从某天生产的一批零件中随机抽取16只,测得其长度(单位:cm)如下
检验该企业生产零件的中位数与15cm是否有显著差异?(=0.05)中位数的符号检验
(signtest)15.114.514.814.615.214.814.814.614.815.115.314.715.015.215.114.7*第1步:选择【分析】【非参数检验-二项式】选项进入主对话框第2步:将待检验的变量选入【检验变量列表】(本例为“零件长度”)第3步:点击【定义二分法】,中在【割点】框中输入总体中位数的假设值15,在【检验比例】框内输入二项分布的参数0.5,点击【确定】符号检验中位数的符号检验
(SPSSsigntest)SPSS*【例14-3】输出结果零件长度小于等于中位数的有10个,大于中位数的只有6个。而参数为(16,0.5)的二项分布变量大于等于15的概率为0.227。精确双尾概率为P=0.454>0.05,不拒绝原假设。没有证据表明该企业生产零件的实际中位数与15cm有显著差异(运用SPSS中的【NonparametricTests-2RelatedSamples】选项也可以作上述检验)中位数的符号检验
(SPSSsigntest)符号检验SPSS14.1.3Wilcoxon符号秩检验14.1单样本的检验*秩就是一组数据依据从小到大的依次排列之后,每一个观测值所在的位置用一般符号R来表示,假定一组数据,依据从小到大的依次排列,在全部观测值中排第位,那么的秩即为也是一个统计量,它测度的是数据观测值的相对大小,大多数非参数检验方法正是利用秩的这一性质来解除总体分布未知的障碍的。当然,也有一些非参数方法并不涉及秩的性质秩的概念
(rank)*很多状况下,数据中会出现相同的观测值,那么对它们进行排序后,这些相同观测值的排名明显是并列的,也就是说它们的秩是相等的,这种状况被称为数据中的“结”对于结的处理,通常是以它们排序后所处位置的平均值作为它们共同的秩当一个数据中结比较多时,某些非参数检验中原假设下检验统计量的分布就会受到影响,从而须要对统计量进行修正(一般状况下,软件会自动作出修正)结的处理
(ties)*检验总体参数(如中位数)是否等于某个假定的值。它是对符号检验的一种改进,弥补了符号检验的不足,要比单纯的符号检验更精确一些(对应的参数检验—单样本均值检验)检验步骤计算各样本视察值与假定的中位数的差值,并取确定值将差值的确定值排序,并找出它们的秩计算检验统计量和P值,并作出决策Wilcoxon符号秩检验
(Wilcoxonsignedrankstest)*第1步:选择【分析】【非参数检验-2个相关样本】主对话框第2步:将两个变量同时选入【检验对】,(“零件长度”和“假设中位数”)第3步:在【检验类型】下选择【Wilcoxon】,点击【精确】并选择【精确】,返回主对话框,点击【确定】Wilcoxon符号秩检验Wilcoxon符号秩检验
(SPSSWilcoxontest)SPSS*【例14-4】输出结果
精确的双尾概率为0.126,不拒绝原假设。没有证据表明零件的实际中位数与15cm有显著差异Wilcoxon符号秩检验
(SPSSWilcoxontest)Wilcoxon符号秩检验SPSS
14.2两个及两个以上样本的检验
14.2.1两个配对样本的Wilcoxon符号秩检验
14.2.2两个独立样本的Mann-Whitney检验
14.2.3k个独立样本的Kruskal-Wallis检验
第14章非参数检验14.2.1两个配对样本的Wilcoxon符号秩检验14.2两个及两个以上样本的检验*检验两个总体的分布是否相同,或者说两个总体的中位数是否相同对应的参数方法—两个配对样本的t检验提出的假设为H0:Md=0;H1:Md≠0(Md表示差值的中位数)检验步骤计算各数据对的差值di,并取确定值,排序后求出秩计算检验统计W或z依据P值作出决策两个配对样本
Wilcoxon符号秩检验*检验统计量小样本状况下,统计量
听从Wilcoxon符号秩分布大样本状况下,统计量近似听从正态分布两个配对样本
Wilcoxon符号秩检验*【例14-5】一家制造企业准备接受一种新的方法生产产品,为确定新方法与旧方法生产的产品数量是否相同,随机抽取10个工人,每个工人分别运用新旧两种方法生产产品。10个工人接受两种生产的产品数量如下。检验新旧两种方法所生产的产品数量是否有显著差异?(=0.05)
两个配对样本
Wilcoxon符号秩检验工人12345678910旧方法1214131117910111716新方法16171419161517161518*第1步:选择【分析】【非参数检验-2个相关样本】主对话框第2步:将两个变量同时选入【检验对】,(“旧方法”和“新方法”)第3步:在【检验类型】下选择【Wilcoxon】,点击【精确】并选择【精确】,返回主对话框,点击【确定】Wilcoxon符号秩检验两配对样本Wilcoxon符号秩检验
(SPSSWilcoxontest)SPSS*【例14-5】输出结果
统计量为-2.296,精确的双尾P=0.021<0.05,拒绝H0,两种方法生产的产品数量有显著差异两配对样本Wilcoxon符号秩检验
(SPSSWilcoxontest)Wilcoxon符号秩检验SPSS14.2.2两个独立样本的Mann-Whitney检验14.2两个及两个以上样本的检验*也称为Mann-WhitneyU检验(Mann-WhitneyUtest),或称为Wilcoxon秩和检验用于确定两个总体间是否存在差异的一种非参数检验方法(对应的参数方法—两个独立样本的t检验或z检验)Mann-Whitney检验不须要诸如总体听从正态分布且方差相同等之类的假设,但要求是两个独立随机样本的数据至少是依次数据与Wilcoxon符号秩检验不同,它不是基于相关样本,而是运用两个独立样本两个独立样本
Mann-Whitney检验*设X、Y是两个连续的总体,其累积分布函数为Fx和Fy,从两个总体中分别抽取两个独立样本:(x1,x2,…,xm)和(y1,y2,…,yn)若要检验两个总体是否相同,提出如下假设
H0
:两个总体相同,H1
:两个总体不相同或等价于
H0:Mx=My
;H1:Mx≠My两个独立样本
Mann-Whitney检验*检验步骤把两组数据混合在一起,得到m+n=N个数据,并找出N个数据的秩分别对样本(x1,x2,…,xm)和(y1,y2,…,yn)的秩求出平均秩,得到两个平均秩和,并对平均秩的差距进行比较:若二者相差甚远,意味着一组样本的秩普遍偏小,另一组样本的秩普遍偏大,此时原假设有可能不成立计算样本(x1,x2,…,xm)中每个秩大于样本(y1,y2,…,yn)的每个秩的个数,以及样本(y1,y2,…,yn)中每个秩大于样本(x1,x2,…,xm)中每个秩的个数两个独立样本
Mann-Whitney检验*检验步骤计算Wilcoxon统计量W和Mann-Whitney统计量U分别求出两个样本的秩的和,Wx和Wy。若m<n,检验统计量W=Wx;若m>n,统计量W=Wy;若m=n,统计量为第一个变量值所在样本组的W值Mann-Whitney统计量定义为小样本状况下,统计量听从Mann-Whitney分布,大样本状况下,近似听从正态分布,检验统计量为依据P值作出决策两个独立样本
Mann-Whitney检验(k为W对应样本组的样本数据个数)*【例14-6】8亚洲国家和8个欧美国家2005年的人均国民收入数据如下。检验亚洲国家和欧美国家的人均国民收入是否有显著差别?(=0.05)
两个独立样本
Mann-Whitney检验亚洲国家人均国民总收入欧美国家人均国民总收入
中国1740
美国43740
日本38980
加拿大32600
印度尼西亚1280
德国34580
马来西亚4960
英国37600
泰国2750
法国34810
新加坡27490
意大利30010
韩国15830
墨西哥7310
印度720
巴西3460*第1步:选择【分析】【非参数检验-2个独立样本】主对话框第2步:将待检验变量选入【检验变量列表】,
(本例为“人均国民收入”);将分类变量选入的
【分组变量】框内(本例为“国家”),点击进入【定义范围】分别输入类别代码“1”和“2”,返回主对话框第3步:在【检验类型】下选择【Mann-WhitneyU】,点击【精确】并选择【精确】,返回主对话框,点击【确定】Mann-Whitney检验两个独立样本
(SPSSMann-Whitneytest)SPSS*【例14-6】输出结果
统计量为-2.100,精确的双尾0.038,拒绝H0,亚洲国家和欧美国家的人均国民收入有显著差别两个独立样本
(SPSSMann-Whitneytest)Mann-Whitney检验SPSS14.2.3k个独立样本的Kruskal-Wallis检验14.2两个及两个以上样本的检验*用于检验多个总体是否相同(对应的参数方法—方差分析)Kruskal-Wallis检验不须要总体听从正态分布且方差相等这些假设该检验可用于依次数据,也可用于数值型数据要检验k个总体是否相同,提出如下假设H0:全部总体都相同,H1:并非全部总体都相同或等价于H0:M1=M2=…=MkH1:M1,M2,…,Mk不全相同k个独立样本
Kruskal-Wallis检验*检验步骤将全部样本的视察值混合在一起,找出每个视察值在N个数据中的秩计算检验统计量当每个样本的容量均大于等于5时,检验的统计量H的抽样分布近似自由度为k-1的2分布。若P<,则拒绝H0,表明k个总体是不全相同的k个独立样本
Kruskal-Wallis检验*
k个独立样本
Kruskal-Wallis检验大学A大学B大学C617589856263787680669865708677957371698458【例14-7】为比较3所高校的英语教学质量,分别从高校A抽取7名学生、高校B抽取6名学生、高校C抽取8名学生,接受同一份试题进行考试,得到考试分数的数据如表。试评价3所高校的英语教学质量是否有显著差异?(=0.05)*第1步:选择【分析】【非参数检验-k个独立样本】主对话框第2步:将待检验的变量选入【检验变量列表】,(本例为“考试成果”),将分类变量选入【分组变量】框内(本例为“高校”),点击进入【定义范围】,将代码最小值1输入【最小值】,最大值3输入【最大值】,返回主对话框第3步:在【检验类型】下选择【Kruskal-Wallis】,点击【确定】Kruskal-Wallis检验k个独立样本
(SPSSKruskal-Wallis)SPSS*【例14-7】输出结果渐进的双尾P值为0.778,不拒绝H0,没有证据表明3所高校的英语考试成果之间存在显著差异k个独立样本
(SPSSKruskal-Wallis)Kruskal-Wallis检验SPSS14.3秩相关及其检验
14.3.1Spearman秩相关及其检验
14.3.2Kendall秩相关及其检验
第14章非参数检验14.3.1Spearman秩相关及其检验14.3秩相关及其检检验*对两个依次变量之间相关程度的一种度量Spearman秩相关系数也称等级相关系数,记为rs,计算公式为Spearman秩相关检验rs的取值范围为[-1,1]rs=1,两种排序之间完全相关;若-1<rs<0,两种排序之间为负相关;若0<rs<1,两种排序之间为正相关;若rs=0,两种排序之间不相关
|rs|越趋于1,相关程度越高;越趋于0,相关程度越低*
Spearman秩相关检验【例14-8】在一项关于职业声望和可信任程度的调查中,列举了12种职业,要求被调查者分别按声望凹凸和值得信任程度进行排序,调查数据如表计算两种排序之间的Spearman秩相关系数,并进行检验。(=0.01)职业声望排序信赖程度排序科学家医生工程师政府官员中小学教师大学教师新闻记者律师企业管理人员银行管理人员建筑设计人员会计师126345789101112124735861210911*第1步:选择菜单:【分析】【相关】【双变量】第2步:将两个变量选入【变量】在【相关系数】下选择【Spearman】在【检验显著性】下选择双侧检验【双侧检验】或单侧检验【单侧检验】(在此我们以:声望排序与信任程度排序之间不存在显著相关,进行双侧检验),点击【确定】Spearman秩相关检验Spearman秩相关检验
(SPSS
Spearman)SPSS*【例14-8】输出结果Spearman秩相关系数为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 聊城职业技术学院《的分层开发技术》2023-2024学年第一学期期末试卷
- 丽江师范高等专科学校《工程制图Ⅱ》2023-2024学年第一学期期末试卷
- 江西司法警官职业学院《学术论文写作(1)》2023-2024学年第一学期期末试卷
- 江汉艺术职业学院《健身俱乐部经营与管理》2023-2024学年第一学期期末试卷
- 湖北大学知行学院《山地户外运动》2023-2024学年第一学期期末试卷
- 自贡职业技术学院《商业银行与业务经营》2023-2024学年第一学期期末试卷
- 周口师范学院《教育历史与比较研究》2023-2024学年第一学期期末试卷
- 重庆科技学院《工程管理软件与BM技术应用》2023-2024学年第一学期期末试卷
- 浙江树人学院《图像处理软件应用》2023-2024学年第一学期期末试卷
- 长江大学文理学院《材料力学B(外)》2023-2024学年第一学期期末试卷
- 2024版塑料购销合同范本买卖
- 【高一上】【期末话收获 家校话未来】期末家长会
- GB/T 44890-2024行政许可工作规范
- 有毒有害气体岗位操作规程(3篇)
- 儿童常见呼吸系统疾病免疫调节剂合理使用专家共识2024(全文)
- 《华润集团全面预算管理案例研究》
- 2024-2025高考英语全国卷分类汇编之完型填空(含答案及解析)
- 2024年露天煤矿地质勘查服务协议版
- 两人退股协议书范文合伙人签字
- 2024年资格考试-WSET二级认证考试近5年真题附答案
- 2024年重庆南开(融侨)中学中考三模英语试题含答案
评论
0/150
提交评论