版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章假设检验作者:中国人民大学统计学院贾俊平PowerPoint统计学第6章假设检验6.1根本概念和步骤6.2总体均值检验6.3总体比例的检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验假设检验问题6.1根本概念和步骤什么是假设检验?原假设与备择假设拒绝域和检验统计量两类错误和显著性水平单侧检验与双侧检验根本步骤总结P值方法什么是假设检验什么是假设?
(hypothesis)
对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!什么是假设检验?
(hypothesistest)先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理什么是假设检验?某厂商宣称其次品率只有1%,如果随机抽取10件产品,其中有2件是次品,那么如何进行假设检验?要检验的假设:全部产品的次品率为1%。来自总体的次品数服从二项分布b〔10,0.01〕,容易计算得到“抽取10件产品中有2件次品〞的概率只有0.42%。就是说,小概率事件发生了。在一次试验中小概率事件是不应该发生的,这就让人不得不疑心原有的“假设〞。假设检验的根本思想...因此我们拒绝假设
=500...如果这是总体的真实均值样本均值m=500抽样分布H0这个值不像我们应该得到的样本均值...450总体
假设检验的过程抽取随机样本均值
x
=450
规定的平均容量为500ml提出假设拒绝假设别无选择!作出决策原假设与备择假设原假设
(nullhypothesis)研究者想收集证据予以拒绝的假设又称“0假设〞总是有符号,或4. 表示为H0H0:=某一数值指定为符号=,或例如,H0:10cm研究者想收集证据予以支持的假设也称“研究假设〞总是有符号,或表示为H1H1:某一数值,或<某一数值,或某一数值例如,H1:10cm备择假设(alternativehypothesis)【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,那么说明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常〞。建立的原假设和备择假设为H0:10cmH1:10cm【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为
H0:
500H1:
<500500g绿叶洗涤剂【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%〞。建立的原假设和备择假设为H0:30%H1:30%原假设和备择假设是一个完备事件组,而且相互对立先确定备择假设,再确定原假设等号“=〞总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)双侧检验与单侧检验备择假设没有特定的方向性,并含有符号“〞的假设检验,称为双侧检验或双尾检验(two-tailedtest)备择假设具有特定的方向性,并含有符号“>〞或“<〞的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<〞,称为左侧检验备择假设的方向为“>〞,称为右侧检验双侧检验与单侧检验双侧检验与单侧检验
(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m
=m0H0:m
m0H0:m
m0备择假设H1:m
≠m0H1:m
<m0H1:m
>m0两类错误与显著性水平冤枉好人与放过坏人无罪推定原那么:在证明被告有罪之前先假设他无罪。原假设:被告无罪。备选假设:被告有罪。法官可能犯两类错误:第一类错误是被告无罪却被判有罪,这就“冤枉好人〞;第二类错误是被告有罪却被判无罪,这就“放过坏人〞在一定的证据下,犯两类错误的概率是相互消长的。假设检验中的两类错误1. 第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率为
被称为显著性水平2. 第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率为
H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决真实情况无罪有罪无罪正确错误有罪错误正确H0检验决策真实情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好似一场审判过程统计检验过程
错误和
错误的关系
你不能同时减少两类错误!
和
的关系就像翘翘板,
小
就大,
大
就小显著性水平
(significantlevel)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为
(alpha)常用的
值有0.01,0.05,0.104. 由研究者事先确定假设检验中的小概率原理
什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定检验统计量与拒绝域根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)标准化的检验统计量显著性水平和拒绝域
(双侧检验)抽样分布0临界值临界值a/2a/2
样本统计量拒绝H0拒绝H01-
置信水平显著性水平和拒绝域
(双侧检验)0临界值临界值a/2
a/2
样本统计量拒绝H0拒绝H0抽样分布1-
置信水平显著性水平和拒绝域
(双侧检验)0临界值临界值
a/2a/2
样本统计量拒绝H0拒绝H0抽样分布1-
置信水平显著性水平和拒绝域
(双侧检验)0临界值临界值a/2
a/2
样本统计量拒绝H0拒绝H0抽样分布1-
置信水平显著性水平和拒绝域
(单侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平显著性水平和拒绝域
(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平观察到的样本统计量显著性水平和拒绝域
(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平显著性水平和拒绝域
(右侧检验)0临界值a样本统计量拒绝H0抽样分布1-
置信水平观察到的样本统计量显著性水平和拒绝域
(右侧检验)0临界值a样本统计量抽样分布1-
置信水平拒绝H0决策规那么给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:I统计量I>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H0假设检验结论的表述假设检验结论的表述假设检验的目的在于找到拒绝原假设依据,而不在于证明什么是正确的拒绝原假设时结论是清楚的例如,H0:=10,拒绝H0时,我们可以说10当不拒绝原假设时并未给出明确的结论不能说原假设是正确的,也不能说它不是正确的例如,当不拒绝H0:=10,我们并未说它就是10,但也未说它不是10。我们只能说样本提供的证据还缺乏以推翻原假设假设检验步骤的总结陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否那么不拒绝H0也可以直接利用P值作出决策什么是P值?
(P-value)是一个概率值如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量局部的面积右侧检验时,P-值为曲线上方大于等于检验统计量局部的面积被称为观察到的(或实测的)显著性水平H0能被拒绝的最小值双侧检验的P值
/
2
/
2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值H0值临界值a样本统计量拒绝域抽样分布1-
置信水平计算出的样本统计量P值右侧检验的P值H0值临界值a拒绝域抽样分布1-
置信水平计算出的样本统计量P值利用P值进行检验
(决策准那么)单侧检验假设p值>,不拒绝H0假设p值<,拒绝H0双侧检验假设p值>,不拒绝H0假设p值<,拒绝H06.2总体均值的检验大样本情形下总体均值的检验小样本情形下总体均值的检验总体均值的检验
(作出判断)
是否已知小样本容量n大
是否已知否t检验否z检验是z检验
是z检验总体均值的检验
(大样本)总体均值的检验
(大样本)1. 假定条件正态总体或非正态总体大样本(n30)使用z检验统计量2:2未知:总体均值的检验(2)
(例题分析)双侧检验绿色健康饮品绿色健康饮品255255总体均值的检验(2)
(例题分析)H0
:
=255H1
:
255
=
0.05n
=
40临界值(c):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:
不拒绝H0样本提供的证据还缺乏以推翻“该天生产的饮料符合标准要求〞的看法总体均值的检验(
2未知)
(例题分析)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(
=0.01)
左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验(
2未知)
(例题分析)H0
:
1.35H1
:
<1.35
=
0.01n
=
50临界值(c):检验统计量:拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01总体均值的检验(
2未知)
(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改进以期提高产量。为检验改进后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改进后的新品种产量是否有显著提高?(=0.05)右侧检验总体均值的检验(
2未知)
(例题分析)H0
:
5200H1
:
>5200
=
0.05n
=
36临界值(c):检验统计量:拒绝H0改进后的新品种产量有显著提高决策:结论:z0拒绝H00.051.645总体均值的检验
(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:
m
m0H0:m
m0H1:m<m0H0:
m
m0
H1:
m>m0统计量
已知:
未知:拒绝域P值决策拒绝H0总体均值的检验
(小样本)总体均值的检验
(小样本)1. 假定条件总体服从正态分布小样本(n<30)检验统计量2:2未知:总体均值的检验
(小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:
m
m0H0:m
m0H1:
m<m0H0:
m
m0
H1:
m>m0统计量
已知:
未知:拒绝域P值决策拒绝H0注:的拒绝域同大样本总体均值的检验
(例题分析)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3总体均值的检验
(例题分析)H0
:
=12H1
:
12
=0.05df=10-1=9临界值(c):检验统计量:不拒绝H0样本提供的证据还缺乏以推翻“该供货商提供的零件符合要求〞的看法决策:结论:t02.262-2.2620.025拒绝H0拒绝H00.0256.3总体比例的检验总体比例检验假定条件总体服从二项分布可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论