第4章假设检验非参数假设检验_第1页
第4章假设检验非参数假设检验_第2页
第4章假设检验非参数假设检验_第3页
第4章假设检验非参数假设检验_第4页
第4章假设检验非参数假设检验_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

当前第1页\共有41页\编于星期三\8点4.2参数假设检验假设检验一个正态总体均值的假设检验s未知1、s已知2、大样本3、小样本两个正态总体均值差的假设检验总体方差的假设检验当前第2页\共有41页\编于星期三\8点假设检验5、配对样本独立样本两个正态总体均值差的假设检验1、已知

2、未知,大样本未知s,小样本3、4、、、当前第3页\共有41页\编于星期三\8点假设检验的内容假设检验总体均值的假设检验总体方差的假设检验两个总体方差比单一总体两个总体均值差的假设检验当前第4页\共有41页\编于星期三\8点4.3

非参数假设检验*4.3.1符号检验法:通过两个相关样本的每对数据之差的符号进行检验,比较两个样本的显著性配对资料的符号检验样本中位数与总体中位数比较的符号检验*4.3.2秩和检验法:一种用样本秩来代替样本值的检验法,可用于检验两个总体的分布函数是否相等的问题配对试验资料符号秩和检验非配对试验资料符号秩和检验4.3.3非参数假设检验。卡方检验柯尔莫哥洛夫-斯米诺夫检验

当前第5页\共有41页\编于星期三\8点配对资料的符号检验提出原假设与备择假设H0:/计算差值并赋予符号d>0,记为“+”,“+”个数记为n+d<0,记为“-”,“-”个数记为n-d=0,记为“0”,“0”个数记为n0统计量K=min{n+,n-}当前第6页\共有41页\编于星期三\8点统计推断令n=n++n-K>K0.05(n),P>0.05,不能否定H0,两个处理差异不显著K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理差异显著K≤K0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著

当前第7页\共有41页\编于星期三\8点某数据分析公司研究加薪对数据分析员工作准确度的影响。结果如下表所示,问加薪对工作精确度有没有影响K0.05(15)=3,K0.05(10)=1?No123456789101112131415加薪前0.050.060.070.050.040.020.080.010.050.020.030.020.060.070.05加薪后0.040.060.060.050.030.020.070.010.040.030.020.020.050.080.06差值0.0100.0100.0100.0100.01-0.010.0100.01-0.01-0.01符号+0+0+0+0+-+0+--当前第8页\共有41页\编于星期三\8点提出原假设与备择假设H0:样本所在的中位数=已知总体的中位数H1:样本所在的中位数≠已知总体的中位数进行单尾检验,把“≠”换成“<”或者“>”计算差值,确定符号及其个数样本各观测值中大于已知总体中位数的,记为“+”,“+”个数记为n+样本各观测值中小于已知总体中位数的,记为“-”,“-”个数记为n-样本各观测值中等于已知总体中位数的,记为“0”,“0”个数记为n0统计量K=min{n+,n-}样本与总体中位数比较的符号检验当前第9页\共有41页\编于星期三\8点统计推断令n=n++n-K>K0.05(n),P>0.05,不能否定H0,样本中位数与已知总体中位数差异不显著K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,样本中位数与已知总体中位数差异差异显著K≤K0.01(n),P≤0.01,否定H0,接受H1,样本中位数与已知总体中位数差异差异极显著当前第10页\共有41页\编于星期三\8点配对试验资料符号秩和检验提出原假设与备择假设H0:差值d总体中位数=

0H1:差值d总体中位数≠0进行单尾检验,把“≠”换成“<”或者“>”编秩次,定符号求配对数据的差值d按d的绝对值从小到大编秩次根据原差值正负,在各秩次前标正负号d=0,舍去不记d的绝对值相等,取其平均秩次当前第11页\共有41页\编于星期三\8点确定统计量TT为正秩次及负秩次和中绝对值较小者统计推断令正负差值的总个数为nT>T0.05(n),P>0.05,不能否定H0,两个处理差异不显著T0.01(n)<T≤T0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理差异显著T≤T0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著

当前第12页\共有41页\编于星期三\8点非配对试验资料符号秩和检验提出原假设与备择假设H0:甲样本所在的总体中位数=乙样本所在的总体中位数H1:甲样本所在的总体中位数≠乙样本所在的总体中位数进行单尾检验,把“≠”换成“<”或者“>”求两个样本合并数据的秩次两个样本的含量为n1和n2,合并后为n1+n2合并后的数据按从小到大的顺序排列,序号即为数据的秩次不同样本的观测值相同,取原秩次的平均秩次同一样本的观测值相同,不必改动当前第13页\共有41页\编于星期三\8点确定统计量T秩和较小的样本含量记为n1,秩和为T统计量统计推断T在T0.05(n1)-T0.05(n2–n1)之内,P>0.05,不能否定H0,两个处理差异不显著T在T0.05(n1)-T0.05(n2–n1)之内外,在T0.01(n1)-T0.01(n2–n1)

之内,0.01<P≤0.05,否定H0,接受H1,两个处理差异差异显著T在T0.01(n1)-T0.01(n2–n1)

之外,P≤0.01,否定H0,接受H1,两个处理差异差异极显著当前第14页\共有41页\编于星期三\8点卡方分布拟合检验当前第15页\共有41页\编于星期三\8点χ2检验的原理与方法χ2检验的基本原理χ2检验统计量的基本形式χ2检验的基本步骤χ2检验的注意事项当前第16页\共有41页\编于星期三\8点

χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其χ2值的大小。理论值与实际值之间偏差越大,χ2值就越大,越不符合;偏差越小,χ2值就越小,越趋于符合;若两值完全相等时,χ2值就为0,表明理论值完全符合。当前第17页\共有41页\编于星期三\8点性别观察值(O)理论值(E)O-E公母428448438438-10+10合计8768760876只羔羊性别调察当前第18页\共有41页\编于星期三\8点

要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度。

判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。当前第19页\共有41页\编于星期三\8点性别观察值(O)理论值(E)O-E公母428448438438-10+10合计876876羔羊性别观察值与理论值

由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。0当前第20页\共有41页\编于星期三\8点

为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(O-E)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(O-E)2

的比重,最后将各组求和,这个总和就是χ2

。当前第21页\共有41页\编于星期三\8点羔羊性别观测值与理论值性别观测值(O)理论值(E)O-E(O-E)2/E公母428448438438-10+100.22830.2283合计87687600.4566χ2=∑(Oi-Ei)2

Ei

χ2值就等于各组观测值和理论值差的平方与理论值之比,再求其和。皮尔逊证明了这个样本统计量服从自由度为k-1的卡方分布。当前第22页\共有41页\编于星期三\8点

在用卡方时,若分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验.(注意,估计了几个参数,就要在相应的卡方估计量的自由度上减去相应的个数)当前第23页\共有41页\编于星期三\8点在使用卡方检验时要注意两点:n要足够大,以及npi

不太小这两个条件.

根据计算实践,要求n不小于50,以及npi

都不小于5.否则应适当合并区间,使npi满足这个要求.当前第24页\共有41页\编于星期三\8点例题1:自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震共162次,统计如下:(X表示相继两次地震间隔天数,Y表示出现的频数)试检验相继两次地震间隔天数X服从指数分布.解所求问题为:在水平0.05下检验假设当前第25页\共有41页\编于星期三\8点由最大似然估计法得X为连续型随机变量,(见下页表)当前第26页\共有41页\编于星期三\8点503126171086680.27880.21960.15270.10620.07390.05140.03580.02480.056845.165635.575224.737417.204411.97188.32685.79964.01769.20164.8344-4.57521.2626-0.2044-1.9718-0.32680.20041.9824-1.20160.5174607080.5884002070.0644432620.0024284110.3247627960.0128258440.0069246430.9781734770.15691212拟合检验计算表当前第27页\共有41页\编于星期三\8点在H0

为真的前提下,X的分布函数的估计为当前第28页\共有41页\编于星期三\8点故在水平0.05下接受H0,认为样本服从指数分布.当前第29页\共有41页\编于星期三\8点例2:医学家研究心脏病人猝死人数与日期的关系时发现,一周之中星期一心脏病人猝死者较多,其他日子基本相同。每天的比例近似为2.8:1:1:1:1:1:1.

现在收集到168个观察数据,其中星期一至星期日的死亡人数分别为:55,23,18,11,26,20,15。现在利用这批数据,推断心脏病人猝死人数与日期的关系是否成立?当前第30页\共有41页\编于星期三\8点解:该问题可以转化为检验心脏病猝死人数在一周时间内的分布是否同预期分布相同,可以使用卡方检验进行处理,过程如下:(1)建立零假设和备择假设

零假设:每天心脏病猝死人数分布同预期分布相同备择假设:每天心脏病猝死人数分布同预期分布不同当前第31页\共有41页\编于星期三\8点(2)构造和计算统计量怎么计算得到的呢?当前第32页\共有41页\编于星期三\8点3.2卡方检验的例题(3)设定显著性水平和确定否定域给定显著性水平0.05,在原假设成立时,统计量服从自由度为7-1=6的卡方分布,否定域为:当前第33页\共有41页\编于星期三\8点3.2卡方检验的例题(4)做出统计决策统计量=7.752,没有落在否定域中,接受零假设零假设:每天心脏病猝死人数分布同预期分布相同因此,医学家的研究结论是正确的。当前第34页\共有41页\编于星期三\8点K-S检验与KS统计量一、适用范围Kolmogorov-Smirnov检验常译为柯尔莫哥洛夫-斯米尔诺夫检验,简写为K-S检验,亦称D检验法,也是一种拟合优度检验法。主要用来检验一组样本数据的实际分布是否与某一指定的理论分布相符合。二、基本原理和方法1、基本原理:这种检验主要是将理论分布下的累计频数分布与观察到的累计频数分布相比较,找出它们间最大的差异点,并参照抽样分布,定出这样大的差异是否处于偶然。当前第35页\共有41页\编于星期三\8点K-S检验的步骤用Fn(x)表示样本量为n的随机样本观察值的累计分布函数,且Fn(x)=i/n(i是等于或小于x的所有观察结果的数目,i=1,2,…,n)。F(x)表示理论分布的累计概率分布函数。K-S单样本检验通过样本的累计分布函数Fn(x)和理论分布函数F(x)的比较来做拟合优度检验。检验统计量是F(x)与Fn(x)间的最大偏差Dn:若对每一个x值来说,Fn(x)与F(x)都十分接近,则表明实际样本的分布函数与理论分布函数的拟合程度很高。当前第36页\共有41页\编于星期三\8点1.建立假设组:H0:Fn(x)=F(x)H1:Fn(x)≠F(x)2.计算样本累计频率与理论分布累计概率的绝对差,令最大的绝对差为Dn;3.用样本容量n和显著水平a查出临界值Dna;4.通过Dn与Dna的比较做出判断,若Dn<Dna,则认为拟合是满意的。当前第37页\共有41页\编于星期三\8点例:正态拟合。某织布厂的工人产值情况如下表所示,试检验这些样本数据能否作正态拟合?产值工人数3.75~4.25204.25~4.753724.75~5.254985.25~5.751035.75~6.2571000当前第38页\共有41页\编于星期三\8点解:首先,由于做正态拟合的均值、标准差未知,因此,先计算样本均值和标准差,再做正态拟合。通过对样本资料的计算得:=4.85;s=0.352,分别作为均值Û和的估计值,建立假设:H0:样本数据服从均值为4.85,标准差为0.35

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论