第六章 假设检验_第1页
第六章 假设检验_第2页
第六章 假设检验_第3页
第六章 假设检验_第4页
第六章 假设检验_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章假设检验6.1假设检验的基本问题6.2一个总体参数的假设检验一、假设的陈述1、假设和假设检验

假设是对总体参数的具体数值所作的陈述.总体参数包括总体均值、比率等分析之前必须陈述假设检验:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程;有参数检验和非参数检验;逻辑上运用反证法,统计上依据小概率原理;小概率原理什么小概率?1. 在一次试验中,一个几乎不可能发生的事件发生的概率;2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设;2、原假设与备择假设原假设(nullhypothesis):研究者想收集证据予以反对的假设。表示为H0H0:

=,或某一数值例如,H0:

10cm备择假设(alternativehypothesis):研究者想收集证据予以支持的假设。表示为H1H1:≠,

某一数值

例如,

H1:

≠10cm,<10cm,或10cm【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为

H0:

10cmH1:

10cm【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为

H0:

500H1:

<500500g备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“<”,称为左侧检验

备择假设的方向为“>”,称为右侧检验

3、双侧检验与单侧检验双侧检验与单侧检验

(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:m

=m0H0:m

m0H0:m

m0备择假设H1:m

≠m0H1:m

<m0H1:m

>m0显著性水平

(significantlevel)1. 常用的

值有0.01,0.05,0.102. 由研究者事先确定3.拒绝原假设,则表明检验的结果是显著的不拒绝原假设,表明检验的结果是不显著的根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量;三、检验统计量与拒绝域2.标准化的检验统计量显著性水平和拒绝域

(双侧检验)0临界值临界值a/2

a/2

样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域

(左侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域

(右侧检验)0临界值a样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量决策规则给定显著性水平,查表得出相应的临界值z或z/2,t或t/2将检验统计量的值与水平的临界值进行比较作出决策双侧检验:│统计量│>临界值,拒绝H0左侧检验:统计量<-临界值,拒绝H0右侧检验:统计量>临界值,拒绝H06.2一个总体参数的检验一、总体均值的检验二、总体比率的检验一个总体参数的检验z检验(单尾和双尾)t检验(单尾和双尾)z检验(单尾和双尾)均值一个总体比率一、总体均值的检验检验统计量确定的因素:1、样本容量的大小2、总体分布形状3、总体方差是否已知总体均值检验统计量主要有:1、z检验统计量2、t检验统计量总体均值的检验

(大样本)1. 假定条件正态总体或非正态总体大样本(n30)使用

z检验统计量2

已知:2

未知:总体均值的检验(2已知)

(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?绿色健康饮品绿色健康饮品255255总体均值的检验(2已知)

(例题分析)H0

:=255H1

255=0.05n

=40临界值(Zc):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:

不拒绝H0样本提供的证据表明:该天生产的饮料符合标准要求

总体均值的检验(2未知)

(例题分析)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验(2未知)

(例题分析)H0

1.35H1

:<1.35=0.01n

=50临界值(c):检验统计量:

拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:-2.33z0拒绝H00.01总体均值的检验(2未知)

(例题分析)【例】某一小麦品种的平均产量为5200kg/hm2。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2。试检验改良后的新品种产量是否有显著提高?(=0.05)总体均值的检验(2未知)

(例题分析)H0

5200H1

:>5200=0.05n

=36临界值(c):检验统计量:拒绝H0改良后的新品种产量有显著提高决策:结论:z0拒绝H00.051.645总体均值的检验

(大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:

mm0H0:mm0H1:m<m0H0:

m

m0

H1:

m>m0统计量已知:未知:拒绝域总体均值的检验

(小样本)1.假定条件总体服从正态分布小样本(n<

30)检验统计量2

已知:2

未知:总体均值的检验

(小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:m=m0H1:

mm0H0:mm0H1:

m<m0H0:

mm0

H1:

m>m0统计量已知:未知:拒绝域注:

已知的拒绝域同大样本总体均值的检验

(例题分析)【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3总体均值的检验

(例题分析)H0

:=12H1

12=0.05N=10检验统计量:

不拒绝H0该供货商提供的零件符合要求

决策:结论:t02.262-2.2620.025拒绝H0拒绝H00.025是否已知小样本容量n大是否已知否t检验否z检验是z检验

是z检验二、总体比率检验检验的z统计量0为假设的总体比率总体比率的检验

(检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0:=0H1:

0H0:0H1:

<0H0

0

H1:

>0统计量拒绝域决策拒绝H0总体比率的检验

(例题分析)【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01,检验该杂志读者群中女性的比率是否为80%?它们的值各是多少?双侧检验总体比率的检验

(例题分析)H0

:=80%H1

80%

=0.05n

=200临界值(c):检验统计量:拒绝H0该杂志的说法并不属实

决策:结论:z01.96-1.960.025拒绝H0拒绝H00.025总体比率的检验

(例题分析)H0

:=80%H1

80%=0.01n

=200临界值(c):检验统计量:不拒绝H0该杂志的说法属实

决策:结论:z02.58-2.580.025拒绝H0拒绝H00.025抽样调查的组织形式

通常有以下四种组织形式:一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位,保证总体中每个单位都有同等的中选机会。随机抽样的抽样平均误差

(一)随机抽样的抽样平均误差1.重复抽样取得σ的途径有:用过去全面调查或抽样调查的资料;2.用样本标准差S代替全及标准差σ;3.在大规模调查前,先搞个小规模的试验性的调查来确定S,代替σ;4.用估计的方法。

某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:σ=20小时,若σ=200小时,例2.不重复抽样:(二)成数的抽样平均误差

已证明得:成数的方差为p(1-p)

某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。

类型的划分:一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例;三是分类型的数目不宜太多。类型抽样的好处是:

样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。两种类型:1.等比例类型抽样(类型比例抽样);样本各组结构比例与总体各组结构比例完全一致。2.不等比例类型抽样(类型适宜抽样)。样本结构与总体结构不一致的抽样。由于样本机构与总体结构的不一致,可导致样本分布与总体分布不同,所以误差会比较大。类型抽样的抽样平均误差

在重复抽样情况下:某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷,现用类型抽样法调查1200公顷,以各种麦田占全农场面积的比重分配抽样面积数量。

麦田类型抽样的平均误差计算表类型全场播种面积(公顷)抽样调查面积(公顷)单位面积产量不均匀程度指标(千克)符号Niniσi丘陵地区6000600750337500000平原地区3600360840254016000山地24002401000240000000合计120001200-831516000例高产麦田比重的平均误差计算表类别高产田比重(%)非高产田比重(%)麦田不均匀程度指标(%)抽样调查面积(公顷)pi(1-pi)ni符号pi1-pipi(1-pi)ni丘陵80201660096.0平原9010936032.4山地60402424057.6合计---1200186三、机械抽样(等距抽样)

先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。排列次序用的标志有两种:1.选择标志与抽样调查所研究内容无关,称无关标志排队。2.选择标志与抽样调查所研究的内容有关,称有关标志排队。研究工人的平均收入水平时,按工号排队。例研究工人的生活水平,按工人月工资额高低排队。例机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等距抽样kkkk+a2k+a(n-1)k+aak(k为抽取间隔)示意图:2.半距起点等距抽样kkkk(k为抽取间隔)示意图:3.对称等距抽样示意图:kkk2k-a2k+a4k-a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论