应用统计学第五章假设检验_第1页
应用统计学第五章假设检验_第2页
应用统计学第五章假设检验_第3页
应用统计学第五章假设检验_第4页
应用统计学第五章假设检验_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章参数估计与假设检验参数估计点估计区间估计假设检验参数检验非参数检验参数估计和假设检验参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。一、假设检验的一般问题1、什么是假设检验2、假设检验的基本思想3、双侧检验和单侧检验4、假设检验中的拒绝域和接受域5、假设检验的两类错误6、假设检验的步骤1、什么是假设检验例1:根据1989年的统计资料,某地女性新生儿的平均体重为3190克。为判断该地

1990年的女性新生儿体重与1989年相比有无显著差异,从该地1990年的女性新生儿中随机抽取30人,测得其平均体重为3210克。究竟是否存在显著差异?这是一个关于总体均值的假设检验问题。参数假设检验举例例2:某种大量生产的袋装食品,按规定每袋重量不得少于250克,现从一批该种食品中任意抽取50袋,发现有6袋重量低于

250克。若规定食品不符合标准的比例达到5%就不得出厂,问该批食品能否出厂?这是一个关于总体比例的假设检验问题。可以先假设该批食品的不合格率不超过5%,然后用样本不合格率来检验假设是否正确。2、假设检验的基本思想所谓假设检验,就是事先对总体的参数

(或分布形式)提出一个假设,然后利用抽取的样本信息来判断这个假设(原假设)是否合理。假设检验又被称为显著性检验。假设检验采用逻辑上的反证法,它所依赖的原理是“小概率事件在一次试验中是几乎不可能发生的”。利用统计量的抽样分布及其分位点来构造小概率事件假设检验的基本思想0临界值临界值a

/2a

/2样本统计量拒绝H0拒绝H0抽样分布:1

-

a置信水平3、假设检验的步骤提出假设,包括原假设H0和备择假设H1

,(单边检验,双边检验);确定检验统计量及其分布,在原假设成立的条件下利用样本数据计算统计量的值;给定显著性水平a

,利用统计量分布的分位点确定拒绝域(构造小概率事件);做出判断:看统计量的值是否落入拒绝域(小概率事件是否发生)。举例:单正态总体均值的检验z

=

x

-

m0~

N

(0,1)s

n(1)s

已知:设x1

,x2

,,xn

是来自正态总体X的一个简单随机样论,选用统计量ini

=1n本,样本均值为x

=1

x

,根据单个总体的抽样分布结(2)s

未知:选用统计量:t

=

x

-

m0s

/

n~

t(n

-1)假设双边检验单边检验左侧检验右侧检验原假设H0

:m

=

m0H0

:m

m0H0

:m

£

m0备择假设H1

:m

≠m0H1

:m

<

m0H1

:m

>

m0双侧检验与单侧检验的假设形式假设检验中的拒绝域和接受域给定检验的显著性水平α后,根据统计量的概率分布及其分位点构造小概率事件。与该小概率事件相对应的样本统计量的取值范围即为拒绝域;在统计量的取值范围中,处于拒绝域以外的区域称为接受域;对于正态总体,总体均值的假设检验可有如下图示:双侧检验示意图(显著性水平与拒绝域)抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域1

-

a置信水平左侧检验左侧检验示意图(显著性水平与拒绝域)H0值临界值样本统计量抽样分布拒绝域1

-

aa接受域置信水平右侧检验示意图(显著性水平与拒绝域)H0值临界值样本统计量抽样分布拒绝域1

-

aa接受域置信水平总体均值的检验假设双侧检验 左侧检验右侧检验假设形式H0

m

=m0H1:

m

„m0H0:

m

‡m0H1:

m

<m0H0:

m

£

m0H1:

m

>m0统计量s

已知:s

未知:拒绝域P值检验拒绝H0s

nz

=

x

-

m0z

>

z1-a

/

2t

<

-t1-az

>

z1-aP

<at

>

t1-a

/

2t

=

x

-

m0s

nz

<

-z1-at

>

t1-a假设检验的两类错误根据假设检验做出判断有下述四种情况:1、原假设真实, 并接受原假设,判断正确;2、原假设不真实,且拒绝原假设,判断正确;3、原假设真实, 但拒绝原假设,判断错误;4、原假设不真实,却接受原假设,判断错误。错误有两种类型:第一类错误:原假设H0为真时,检验结果把它拒绝了。犯这种错误的概率用α表示,也称作弃真错误。第二类错误:原假设H0不为真时,检验结果把它接受了。犯这种错误的概率用β表示,也称作取伪错误。假设检验的两类错误正确决策和犯错误的概率可以归纳为下表:假设检验中各种可能结果的概率接受H0拒绝H0,接受H1H0

为真1-α(正确决策)α(弃真错误)H0

为伪β(取伪错误)1-β(正确决策)a

错误和b

错误的关系在样本容量n一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。若减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小只有增大样本容量。因此需要慎重考虑对两类错误进行控制的问题。两类错误的控制准则假设检验中普遍执行准则:首先把犯第一类错误(弃真错误)的概率控制在很低的水平α;然后再尽量控制犯第二类错误(取伪错误)的概率β。(根据两类错误提原假设!)假设检验的步骤中以α为显著性水平就体现了这一准则。假设检验中经常把1-β(弃伪的概率),称为检验的功效(Power).总结:假设检验的步骤提出假设,包括原假设H0和备择假设H1

,(单边检验,双边检验);确定检验统计量及其分布,在原假设成立的条件下利用样本数据计算统计量的值;给定显著性水平a

,利用统计量分布的分位点确定拒绝域(构造小概率事件);做出判断:看统计量的值是否落入拒绝域(小概率事件是否发生)。【例】某机床厂加工一种零件,根据经验知道,以前加工零件的椭圆度近似服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度均值为0.076mm。试问新机床加工零件的椭圆度均值与以前有无显著差异?(a=0.05)Z01.96-1.96解:已知:m0

=0.081mm,s=0.025,n=200,x

=

0.076提出假设:假定椭圆度与以前无显著差异H0:

m

=

0.081H1:

m

0.081a=0.05双侧检验a/2=0.025查表得临界值:Z0.025=±1.96拒绝

H0

拒绝

H00.025

0.025得两个拒绝域:(-∞,-1.96)和(1.96,∞)计算检验统计量值:Z=x-m0

=

0.076

-

0.081

=

-2.83s/

n

0.025

200决策:∵Z值落入拒绝域,∴在a=0.05的水平上拒绝H0结论:有证据表明新机床加工的零件的椭圆度与以前有显著差异【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( =0.05)得拒绝域:(-∞,-1.7291)计算检验统计量值:t

=

41000

-

40000

=

0.8945000

20决策:∵t值落入接受域,∴在a=0.05的显著性水平上接受H0结论:有证据表明轮胎使用寿命显著地大于40000公里,可以认为该制造商的声称是可信的。-1.7291t0解:已知:m0=40000公里,s=5000,n=20,x

=

41000提出假设:假定平均寿命不低于40000公里H0:

m

40000H1:

m

<

40000a=0.05

左检验临界值为负df=20-1=19得临界值:-t0.05(19)=-1.7291拒绝域0.05【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200个家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(

在0.05的显著水平下)Z01.96-1.960.025拒绝H0p

=

68

/

200

=

0.34np

=

200

·0.34

=

68

>

5,n(1

-

p)

=

200

·0.66

=132

>

5提出假设:假定估计可信H0:

P0=0.3H1:

p0„0.3a=0.05双侧检验a/2=0.025得临界值:

Z0.025=±1.96拒绝H00.025解:已知:P0=0.3,n=200,得两个拒绝域:(-∞,-1.96)和(1.96,∞)计算检验统计量值:z

=

0.34

-

0.3

=1.2340.3·0.7200决策:∵Z值落入接受域,∴在a=0.05的水平上接受H0结论:有证据表明研究者的估计可信【例】某公司估计有75%以上的消费

者满意其产品的质量。某调查公司受该公司委托调查此估计是否属实。现随机抽查了625位消费者,其中表示对该公司产品满意的有500人。试问该公司的估计是否属实?(显著水平=0.05)解:已知:P0=0.75,n=625,p

=

500

/

625

=

0.8,np

=

625·0.8

=

500

>

5,

n(1

-

p)

=

625·0.2

=125

>

5提出假设:假定满意者不超过75%H

:

P£0.750H1:

P>0.75a=0.05

右检验临界值为正得拒绝域:(1.645,∞)计算检验统计量值:Z0得临界值:Z0.05=1.645拒绝域0.051.645z=

0.8

-

0.75

=

2.8870.75·

0.25625决策:∵Z值落入拒绝域,∴在a=0.05的水平上拒绝H0,接受H1结论:有证据表明该公司的估计属实P-值检验法:P-值:检验统计量取到比观测到的统计量的值更为极端的数值的概率。以正态性检验为例:双边检验的p-值:p

-

value

=

P(|

Z

|>|

z*

|)任何一种检验都有对应的p-值;P-值越小(<a

),拒绝原假设的理由越充分。中央财经大学统计学院

30根据p值进行假设检验:双侧检验a

/2拒绝拒绝1.96-1.960Z1/2

p-值1/2

p-值双侧检验中p值

=

PH

(|

Z

|>

Z

)0

obs决策规则:p值<a时拒绝H0。使用统计软件进行假设检验时通常会给出p值。或PH

(|

t

|>

t

)0

obs-

ZobsZ

o

bs中央财经大学统计学院

31根据p值进行假设检验:右侧检验0tap-值右侧检验中p值

=

PH

(t

>

t )

或P

(z

>

z

)0

obs

H0

obs拒绝决策规则:p值<a时拒绝H0。t

atobs非参数检验非参数检验概述单样本非参数检验两个和多个样本的非参数检验非参数检验概述非参数检验(nonparametrictests)也称为与总体分布无关的检验(distribution

free

tests)与参数检验相比,在非参数检验中不需要对总体分布的具体形式作出严格假设,或者只需要很弱的假设。大部分非参数检验都是针对总体的分布进行的检验,但也可以对总体的某些参数进行检验。非参数检验的特点非参数检验不需要严格假设条件,因而比参数检验有更广泛的适用范围。非参数检验几乎可以处理包括定类数据和定序数据在内的所有类型的数据,而参数检验通常只能用于定量数据的分析。在参数检验和非参数检验都可以使用的情况下,非参数检验的功效(power)要低于参数检验方法。以下情况下应当首选非参数方法参数检验中的假设条件不满足,从而无法应用。例如总体分布为偏态或分布形式未知,且样本为小样本时。检验中涉及的数据为定类或定序数据。所涉及的问题中并不包含参数,如判断某样本是否为随机样本,判断某样本是否来自正态分布等。对各种资料的初步分析。常用的非参数检验方法用于单个样本的c2拟合优度检验、K-S拟合优度检验、中位数的符号检验;用于两个匹配样本的Wilcoxon符号秩检验;用于两个独立样本的Wlicoxon秩和检验用于多个独立样本的Kruskal-Wallis检验。单样本的非参数检验方法c2拟合优度检验K-S拟合优度检验中位数的符号检验1.1

单组分类变量的拟合优度检验一种饮料的容器材料可以选择玻璃、塑料或者金属。为了比较消费者对包装材料的偏好,抽样调查了120名消费者发现,最喜欢玻璃、塑料和金属容器的分别有55、25和40人。根据调查结果,能否认为消费者对3种材料的偏好程度是无差异的(显著性水平a=0.05)?c2拟合优度检验的基本原理如果消费者对3种材料的偏好程度是无差异的,也就是说消费者对材料的偏好服从均匀分布,则理论上来说,调查120名消费者,偏好每种材料的人数应该是相等的,也就是40人。各组观测到的人数与理论人数(期望值)之间的差异应该都是由于抽样的随机性造成的,因此不应该太大。如果二者之间的差异特别大,则说明我们所作的假设(消费者对3种材料的偏好程度是无差异的)很可能不成立。检验统计量

k是样本分类的个数,Oi

表示实际观察到的频数,

Ei

表示理论频数。观察频数与期望频数越接近,则c

2

值越小。根据皮尔逊定理,当n充分大时,c

2统计量渐近服从于k-1个自由度的c

2分布。2i=1kEi(O

-

E

)2=

i

i

c1.2两组分类变量的独立性检验列联表:“If

you

could

have

only

one

of

the

following,

which

would

you

pick:

money,

health,or

love?”H0:行变量与列变量是独立的检验统计量:Oi:观测频数

Ei:期望频数~

c2

((r-1)(c-1))2.单样本K-S检验单样本K-S检验是以两位苏联数学家Kolmogorov和Smirnov命名的。K-S检验通过对两个分布差异的分析确定能否认为样本的观察值来自所设定的理论分布总体。基本原理和检验统计量对每一个x值来说,如果经验分布函数与特定分布函数的拟合程度很高,则有理由认为样本数据来自具有该理论分布的总体。检验统计量:Dmax

=

max

Fn

(x)

-

F

(x)根据检验统计量的精确分布或渐进分布,可以根据假设检验的p值,得出检验的结论。定义D

=Fn

(x)-F

(x),ni其中:ni

=1I(x

£

x

)1nF

(x

)

=3.单样本中位数的符号检验在数据呈偏态分布的情况下,我们可能对总体的中位数更感兴趣,希望对总体的中位数作出推断,这时可以使用符号检验(sign

test)的方法。在非正态总体小样本的情况下,如果要对总体分布的位置进行推断,由于t检验不适用,也可使用符号检验的方法。【例】在某地区随机调查了60个家庭的月收入(数据文件:家庭月收入.sav)。根据样本数据能否认为总体中家庭月收入的中位数等于6000元(显著性水平a=0.05)?„

6000H1

:

M

e=

6000

«H

0

:

M

e符号检验的基本思想检验统计量S=

min(S+

,

S-

)在原假设成立的条件下,检验统计量S服从二项分布。按照这个概率可以根据二项分布计算得到,从而得出检验的结论。当正号和负号个数之和大于25时,可以按照正态分布进行近似计算。两个样本和多个样本的非参数检验两个匹配样本的Wilcoxon符号秩检验两个独立样本的Wlicoxon秩和检验多个独立样本的Kruskal-Wallis检验秩(rank)秩就是一组数据按照升序排列之后,每个观测值的位置。下面一行Ri就是上面一行数据Xi的秩。Xi159183178513719Ri75918426310秩(rank)的计算数据中有相同的数值,称为结(tie)。结中数字的秩为它们所占位置的平均值Xi159173178513719Ri758.518.542631028

+

9

=

8.54.

匹配样本的符号秩检验【例】从实施适时管理(JIT)的企业中随机抽取9家进行效益分析,得到它们在实施JIT前后三年的平均资产报酬率如表所示:在5%的显著性水平下企业在实施JIT前后的资产报酬率是否有显著差异?用样本数据中对应的数值相减得到新的序列:零假设:差值总体的中位数=0;备择假设:差值总体的中位数≠0。JIT前15.814.915.215.814.615.014.014.915.4JIT后14.615.515.514.714.815.214.815.015.5差值:-1.20.60.3-1.10.20.20.8-0.10.1Wilcoxon符号秩检验:基本原理分别计算出差值序列中正数的秩和W+以及负数的秩和W-。显然,如果零假设成立,W+与W-应该比较接近。如果二者过大或过小,则说明零假设不成立。将正数的秩和或者负数的秩作为检验统计量,根据其统计分布计算p值,从而可以得出检验的结论。特别说明Wilcoxon符号秩检验既考虑差值的符号,又考虑差值的大小,因此在所需的假设条件满足时其功效比符号检验高。Wilcoxon符号秩检验也可以用于单样本中位数的非参数检验,这时只需要将第二个样本的值设为零假设中的数值即可。5.两个独立样本的Wlicoxon秩和检验在两个独立样本的t检验不适用时,

Wlicoxon秩和检验可以作为一种替代的非参数检验方法使用。这一检验可以用来对两个总体的中位数进行检验。零假设:两个总体的中位数相等;备择假设:两个总体的中位数不相等。基本原理如果两个总体具有相似的分布形状,并且中位数相同,那么由m个x、n个y组成的m十n=N个观察值可以被看作来自同一总体的一个随机样本。将全部x和y从小到大排序确定每个数值的秩,然后计算m个x的秩的和、n个y的秩的和。由于抽样的随机性,x、y应较均匀地分布在混合排列的样本中。如果零假设成立,在样本量相同的情况下两个秩和应该比较接近;样本量不同的情况下平均秩和的平均秩应该比较接近。否则就说明两个总体的中位数是不相等的。检验统计量由于对称性,两个秩和都可以用作Wilcoxon符号秩检验的检验统计量。SPSS软件中使用的是平均秩较小的一组的秩和。统计量W的统计分布可以精确推导出来在样本量较大时(m和n都不小于10)可以用正态分布来进行近似。得到p值之后,再通过比较p值和a的大小得出结论。相关说明由于Wilcoxon符号秩检验与Mann和Whitney提出的U检验完全等价,因此这种方法也被称为

Wlicoxon-Mann-Whitne

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论