《商务统计分析 第2版》 课件 第13章 非参数检验_第1页
《商务统计分析 第2版》 课件 第13章 非参数检验_第2页
《商务统计分析 第2版》 课件 第13章 非参数检验_第3页
《商务统计分析 第2版》 课件 第13章 非参数检验_第4页
《商务统计分析 第2版》 课件 第13章 非参数检验_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第13章

非参数检验1第13章非参数检验——目录利用二项分布对两类数据以及中位数进行推断第1节符号检验利用秩-顺序数据对两个或多个总体进行推断第2节威尔科克森符号秩检验第3节威尔科克森秩和检验第4节克鲁斯卡尔-沃利斯检验利用秩-顺序数据对两个变量计算等级相关系数第5节斯皮尔曼秩相关系数2符号检验:用于检验两个相关样本的观测值之差的正负号频次是否存在显著差异多用途的非参数方法对总体分布没有假定的要求既能分析分类型数据,也能分析数量型数据313.1符号检验符号检验应用:总体中位数假设检验(独立样本)匹配样本的假设检验为了进行符号检验,从总体中随机抽取样本。将抽取的随机样本中大于中位数的值标记为加号,小于中位数的值标记为减号。如果一个值等于中位数,则在进一步分析中将其删除。令p表示加号的概率。若中位数实际值和假设值相等的假设成立,那么样本数据中每个观测值大于或小于假定值的概率都是0.5。抽样分布:p=0.5的二项分布:413.1符号检验中位数总体中位数假设检验:考虑一个总体,其中没有任何一个数值恰好等于中位数,则中位数是中心趋势的度量,它将总体分为两个部分,其中50%的值大于中位数,另外50%的值小于中位数。当总体是偏斜分布时,中位数是总体中心位置的最佳度量。513.1符号检验——总体中位数假设检验总体中位数假设检验的原假设和备择假设的一般形式如下:总体中位数的检验统计量如下:H0:总体中位数的实际值与假定值一致H1:总体中位数的实际值与假定值不一致:观测值与假定的中位数的差值为正的个数613.1符号检验——总体中位数假设检验例:某地产商想要确认城市平均楼盘价格的中位数与媒体公布的7600元/m2是否有显著差异,故对某城市16座预出售的楼盘均价进行调研,结果如下所示(单位:百元/m2)。试检验该城市平均楼盘价格的中位数与媒体公布的7600元/m2是否有显著差异。72 73 76 77 87 90 70 7168 80 83 76 82 89 78 79解:设该城市平均楼盘价格假定的中位数为7600元/m2,依题意提出如下假设:H0:该城市平均楼盘价格的中位数等于7600元/m2H1:该城市平均楼盘价格的中位数等于7600元/m2713.1符号检验——总体中位数假设检验二项式检验

类别数字观测到的比例检验比例精确显著性水平(双尾)楼盘价格组1<=76007.44.50.804组2>76009.56

总计

161.00

SPSS输出检验结果如表13-1所示:表13-1楼盘均价的中位数符号检验从表13-1中可以看出楼盘价格小于等于中位数的有7个,大于中位数的有9个。SPSS给出的精确双尾概率为

,所以不能拒绝原假设。也就是说该城市楼盘价格的实际中位数与7600元/m2有显著差异,媒体公布的数据不准确。813.1符号检验——匹配样本的假设检验匹配样本:可以是同一研究对象分别给于两种不同处理的效果比较的观察值;或者同一研究就对象处理前后的效果比较的观察值。匹配样本的符号检验要求两个样本的观测值之差服从对称分布匹配样本假设检验的原假设和备择假设的一般形式如下:H0:两个总体的分布相同H1:两个总体的分布不相同匹配样本的检验统计量如下::两个匹配样本数据对的差值为正的个数9例:为了研究放松(如听音乐)对于入睡时间的影响,随机选择了11名志愿者,分别记录他们未进行放松时的入睡时间及放松后的入睡时间,数据如下表13-2。检验该放松方法对睡眠时间的影响是否有显著差异。13.1符号检验——匹配样本的假设检验表13-2

经历放松前后两种方式的入睡时常(单位:min)编号1234567891011放松前2315171819302214132821放松后181017141524201872218解:这里有两个匹配总体。为了检验放松对入睡时长的影响是否存在显著差异,提出如下假设:H0:两个总体分布相同H1:两个总体分布不同10从表13-3中,可以看出有9个志愿者放松前的入睡时长高于放松后的入睡时长,有1个志愿者放松后的入睡时长高于放松前的入睡时长,有1个志愿者的入睡时长在放松前后没有变化,样本容量为10。13.1符号检验——匹配样本的假设检验SPSS输出检验结果如表13-3和表13-4所示:表13-3频率

数字放松前的入睡时长-放松后的入睡时长负差分a1正差分b9结c1总计11a.放松前的入睡时长<放松后的入睡时长

b.放松前的入睡时长>放松后的入睡时长

c.放松前的入睡时长=放松后的入睡时长

1113.1符号检验——匹配样本的假设检验SPSS输出检验结果如表13-3和表13-4所示:表13-4检验统计a

放松前的入睡时长-放松后的入睡时长精确显著性水平(双尾).021ba.符号检验b.使用了二项分布。

从表13-4中可以看出,SPSS给出的精确双尾概率为所以拒绝原假设,认为放松对入睡时长有显著差异。威尔科克森符号秩检验:检验两个匹配总体的位置(中位数)是否存在显著差异匹配样本观测值之差具有对称分布可以同时考虑样本差异大小和差异方向上的信息。13.2威尔科克森符号秩检验威尔科克森符号秩检验的原假设和备择假设的一般形式如下:H0:两个总体的分布相同H1:两个总体的分布不相同匹配样本的检验统计量计算步骤如下:设X,Y是具有对称分布的两个匹配连续总体。从两个总体中分别抽取两个独立的随机样本分别为,;组成数据对;计算;秩(rank):一组数据按照从小到大顺序排列以后,每个观测值所在的位置。13.2威尔科克森符号秩检验计算;将从小到达排列,并找出它们的秩。最小的

秩为1,最大的

秩为n,如果有相同的,则取各点秩的平均值;计算正的秩的总和,负的

秩的总和

。小样本情况下::统计量W服从威尔科克森符号秩分布:统计量W近似服从正态分布大样本情况下:13.2威尔科克森符号秩检验例:根据例13.2的数据,检验放松对入睡时长是否有显著影响。解:依题意给出如下假设:H0:两个总体的分布相同;H1:两个总体的分布不相同。SPSS输出的结果如表13-5和表13-6所示:表13-5列组

数字等级平均值等级之和放松前的入睡时长-放松后的入睡时长负秩1a4.004.00正秩9b5.6751.00结1c

总计10

a.放松前的入睡时长<放松后的入睡时长b.放松前的入睡时长>放松后的入睡时长c.放松前的入睡时长=放松后的入睡时长从表13-5可知,有8个志愿者放松前入睡时长高于放松后的入睡时长,有1个志愿者放松后的入睡时长高于放松前的入睡时长,有1个志愿者的入睡时长在放松前后没有变化,样本容量为9。13.2威尔科克森符号秩检验从表13-6可知

,SPSS给出的精确双尾概率为所以拒绝原假设,认为放松对入睡时长有显著差异。

表13-6检验统计a

放松前的入睡时长-放松后的入睡时长Z-2.409b渐近显著性(双尾).016a.Wilcoxon带符号等级检验b.基于负秩。13.3曼-惠特尼秩和检验曼-惠特尼秩和检验:检验两个独立总体间是否存在显著差异独立样本不要求两个样本总体服从正态分布可使用顺序型数据,也可以使用数量型数据曼-惠特尼秩和检验的原假设和备择假设的一般形式如下:H0:两个总体的分布相同H1:两个总体的分布不相同独立样本的检验统计量计算步骤如下:设X,Y是两个相互独立的连续总体。从两个总体中分别抽取两个独立的随机样本分别为,;混合两组数据,并将新样本按照从小到大的顺序排列,得到它们的秩,新样本的样本容量为;13.3曼-惠特尼秩和检验分别对样本、对应的秩求出秩和、;若,检验统计量

;若,检验统计量

若,检验统计量W为第一个变量所在样本组的W值。小样本情况下::统计量U服从曼惠特尼分布:统计量U近似服从正态分布大样本情况下:13.3曼-惠特尼秩和检验例:市盈率指的是某公司股票当前价格除以12个月的每股收益。下表列出了北京的10家公司和上海的12家公司的市盈率。检验北京公司和上海公司的市盈率之间是否存在显著差异?

表13-7北京和上海公司市盈率北京12345678910

市盈率1522118243121364583367

上海ABCDEFGHIJKL市盈率29932445125172114122391419解:将北京的公司看作一个整体,上海的公司看作另一个整体,要检验北京的公司和上海的公司的市盈率是否存在显著差异,做出如下假设:H0:北京公司总体和上海公司市盈率总体分布相同H1:北京公司总体和上海公司市盈率总体分布不同13.3曼-惠特尼秩和检验SPSS输出的结果如表所示13-8和表13-9所示:表13-8列组

城市数字等级平均值等级之和市盈率1.001013.35133.502.00129.96119.50总计22

表13-9检验统计a

市盈率Mann-WhitneyU41.500WilcoxonW119.500Z-1.221渐近显著性(双尾).222精确显著性[2*(单尾显著性)].228ba.分组变量:城市b.未修正结。表13-9中给出的统计量

,精确双尾

所以不能拒绝原假设,北京公司和上海公司的市盈率没有显著差异。13.4克鲁斯卡尔-沃利斯检验克鲁斯卡尔-沃利斯检验(KW检验):检验多个独立总体间是否存在显著差异的一种非参数检验方法不要求多个样本总体服从正态分布可使用顺序型数据,也可以使用数量型数据KW检验的原假设和备择假设的一般形式如下:H0:所有总体的分布相同H1:所有总体的分布不相同独立样本的检验统计量计算步骤如下:设存在k个相互独立的连续总体,从这k个总体中分别随机抽取样本,每个样本的样本容量分别为

;混合k组数据,并将新样本按照从小到大的顺序排列,得到它们的秩,新样本的样本容量为;13.4克鲁斯卡尔-沃利斯检验分别第i个样本的秩和统计量H近似服从自由度为k-1的卡方分布:13.4克鲁斯卡尔-沃利斯检验例:W公司从3所不同的大学招聘销售经理。最近该公司试图确定毕业于这3所大学的销售经理的业绩评分是否存在差异。A大学毕业的7名销售经理、B大学毕业的6名销售经理、C大学毕业的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论