《假设检验》讲义_第1页
《假设检验》讲义_第2页
《假设检验》讲义_第3页
《假设检验》讲义_第4页
《假设检验》讲义_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《假设检验》讲义客观现象数量表现统计总体数量特征统计研究的程序统计研究目的统计设计统计调查统计整理推断分析描述分析2008-2009假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验2008-2009学习目标假设检验的基本思想和原理

假设检验的步骤总体均值的检验总体比例的检验

P值的计算与应用用Excel进行检验2008-20096.1假设检验的基本问题假设的陈述两类错误与显著性水平统计量与拒绝域利用P值进行决策2008-2009什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!假设的陈述2008-2009什么是假设检验?(hypothesistest)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理2008-2009原假设(nullhypothesis)研究者想收集证据予以反对的假设又称“0假设”总是有符号

,或表示为H0H0:

=某一数值

指定为符号=,或

例如,H0:

10cm2008-2009研究者想收集证据予以支持的假设也称“研究假设”总是有符号

,

或表示为

H1H1:

<某一数值,或某一数值例如,H1:

<10cm,或10cm备择假设(alternativehypothesis)2008-2009【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:

10cmH1:

10cm2008-2009【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g2008-2009【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为

H0:

30%H1:

30%2008-2009原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设的结论与建议2008-2009备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

双侧检验与单侧检验2008-2009假设的形式假设双侧检验单侧检验左侧检验右侧检验原假设H0:m=m0H0

:m

m0H0:m

m0备择假设H1:m≠m0H1

:m<m0H1:m>m02008-2009假设检验中的两类错误第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)两类错误与显著性水平2008-2009H0:

无罪陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程决策结果2008-2009错误和

错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小2008-2009影响错误的因素1. 总体参数的真值随着假设的总体参数的减少而增大2. 显著性水平当减少时增大3. 总体标准差

当增大时增大4. 样本容量n当n

减少时增大2008-2009显著性水平

(significantlevel)1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为(alpha)常用的值有4. 由研究者事先确定2008-2009假设检验中的小概率原理什么是小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3. 小概率由研究者事先确定2008-2009根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)统计量与拒绝域标准化的检验统计量2008-2009拒绝域能够拒绝原假设的检验统计量的所有可能取值的集合。由显著性水平围成的区域。如果检验统计量的具体数值落在了拒绝域内,就拒绝原假设,否则就不拒绝原假设。根据给定的显著性水平确定的拒绝域的边界值,称为临界值。(查表所得)2008-2009显著性水平和拒绝域抽样分布0临界值临界值a/2a/2样本统计量拒绝H0拒绝H01-置信水平双侧检验

2008-20090临界值临界值a/2

a/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平双侧检验2008-20090临界值临界值

a/2a/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平2008-2009单侧检验

0临界值a样本统计量拒绝H0抽样分布1-置信水平2008-2009左侧检验

0临界值a样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量2008-20090临界值a样本统计量拒绝H0抽样分布1-置信水平2008-2009右侧检验

0临界值a样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量2008-20090临界值a样本统计量抽样分布1-置信水平拒绝H02008-2009决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:I统计量I>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H02008-2009什么是P值(P-value)在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设H0之间不一致的程度被称为观察到的(或实测的)显著性水平决策规则:若p值<,拒绝H0利用P值进行决策2008-2009双侧检验的P值/

2/

2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值P

值1/2P

值1/22008-2009左侧检验的P值0临界值a样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P

值2008-2009右侧检验的P值0临界值a拒绝H0抽样分布1-置信水平计算出的样本统计量P值2008-2009假设检验步骤的总结陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策2008-20096.2总体均值的检验大样本的检验方法小样本的检验方法2008-2009一个总体参数的检验z检验(单尾和双尾)t检验(单尾和双尾)z检验(单尾和双尾)

2检验(单尾和双尾)均值一个总体比例方差2008-2009总体均值的检验(作出判断)是否已知小样本容量n大是否已知否t检验否z检验是z检验

是z检验2008-2009总体均值的检验(大样本)假定条件正态总体或非正态总体大样本(n30)使用z检验统计量2已知:2未知:大样本的检验方法)1,0(~0Nnxzsm-=)1,0(~0Nnsxzm-=2008-2009总体均值的检验(2

已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为。取显著性水平,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品2552552008-2009由题已知H0

:=255H1

255n

=40σ=5临界值(c):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:

不拒绝H0样本提供的证据表明:该天生产的饮料符合标准要求01.14052558.2550=-=-=nxzsm2008-2009

用Excel计算P值第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“NORMSDIST”,然后确定第3步:将z

的绝对值录入,得到的函数值为

P值=2(1-)=

P值远远大于,故不拒绝H02008-2009【例】(2未知)

一种机床加工的零件尺寸绝对平均误差允许值为。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)

左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验(2

未知)2008-2009由题已知H0

H1

n=50临界值(c):检验统计量:拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.016061.250365749.035.13152.1-=-=z2008-20090-2.33a=0.05z拒绝H0抽样分布1-计算出的样本统计量=-2.6061P值P=0.004579

2008-2009用Excel计算P值(z检验)第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“ZTEST”,然后确定第3步:在所出现的对话框Array框中,输入原始数据所在区域;在X后输入参数的某一假定值(这里为);在Sigma后输入已知的总体标准差(若未总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值即为P值

P值=1-0.995421023=

P值<,拒绝H02008-2009【例】(2未知)

某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改良后的新品种产量是否有显著提高?(=0.05)右侧检验2008-2009H0

5200H1

:>5200n=36临界值(c):检验统计量:拒绝H0

(P

=0.000088<=0.05)改良后的新品种产量有显著提高决策:结论:z0拒绝H00.051.64575.33612052005275=-=z2008-2009抽样分布P=0.000088

01.645a=0.05拒绝H01-计算出的样本统计量=3.75P值2008-2009总体均值(大样本)的检验方法的总结假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0统计量已知:未知:拒绝域P值决策拒绝H02008-2009总体均值的检验(小样本)假定条件总体服从正态分布小样本(n<

30)检验统计量2已知:2未知:小样本的检验方法)1,0(~0Nnxzsm-=)1(~0--=ntnsxtm2008-2009总体均值(小样本)检验方法的总结假设双侧检验左侧检验右侧检验假设形式H0

:m=m0H1:

mm0H0:mm0H1:

m<m0H0:

mm0

H1:

m>m0统计量已知:未知:拒绝域P值决策拒绝H0注:已知的拒绝域同大样本2008-2009【例】

一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.32008-2009由题已知H0

:=12H1

12df=10-1=9临界值(c):检验统计量:不拒绝H0该供货商提供的零件符合要求决策:结论:t02.262-2.2620.025拒绝H0拒绝H00.0257035.0104932.01289.11-=-=t2008-2009用Excel计算P值(t检验)第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“TDIST”,然后确定第3步:在出现对话框的X栏中输入计算出的t的绝对值,在Deg-freedom(自由度)栏中输入本例的自由度9,在Tails栏中输入2(表明是双侧检验,如果是单侧检验则在该栏输入1)第4步:P值=

P值>,故不拒绝H0

2008-20096.3总体比例的检验大样本的检验方法2008-2009总体比例检验假定条件总体服从二项分布可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论