第七章 假设检验_第1页
第七章 假设检验_第2页
第七章 假设检验_第3页
第七章 假设检验_第4页
第七章 假设检验_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1教师:陈新宏单位:数学与统计学院概率论与数理统计

2第七章假设检验

《统计学》编委制作3主要内容第一节假设检验的基本原理第二节总体均值的检验第三节总体方差和比例的检验4第一节假设检验的基本原理一、假设检验的意义和依据二、假设检验的基本形式三、假设检验的两类错误四、检验统计量的构造五、假设检验的一般步骤51、小概率原理:指发生概率很小的随机事件在一次试验中是几乎不可能发生的。小概率指p<5%。

2、假设检验的基本思想是应用小概率原理。例如:某厂产品合格率为99%,从一批(100件)产品中随机抽取一件,恰好是次品的概率为1%。随机抽取一件是次品几乎是不可能的,但是这种情况发生了,我们有理由怀疑该厂的合格率为99%.这时我们犯错误的概率是1%。一、假设检验的意义和依据63.显著性水平用样本推断H0是否正确,必有犯错误的可能。原假设H0正确,而被我们拒绝,犯这种错误的概率用表示。把称为假设检验中的显著性水平(Significantlevel),即决策中的风险。显著性水平就是指当原假设正确时人们却把它拒绝了的概率或风险。通常取=0.05或=0.01或=0.001,那么,接受原假设时正确的可能性(概率)为:95%,99%,99.9%。7二、假设检验的基本形式8双侧检验临界值和拒绝域使用临界值临界值临界值拒绝域拒绝域(一)双侧检验(双尾)

关心的是要检验总体参数与假定值有没有显著差异,而不问差异的方向是正或负。9例:=0.05时的接受域和拒绝域10【例】一个著名的医生声称有75%的女性所穿鞋子过小,一个研究组织对356名女性进行了研究,发现其中有313名妇女所穿鞋子的号码至少小一号。你对这个医生的论断有何看法?

分析:这是一个双侧检验的问题。我们所关心的是:穿鞋子过小的女性比例与75%是否有显著差异。此时,可做如下假设:11(二)单侧检验(单尾)关心的是要检验总体参数与假定值是否有特定方向的显著差异。1.下侧检验下侧检验临界值和拒绝域使用临界值临界值拒绝域12【例】已知番茄罐头中,维生素C含量服从正态分布。按照规定,维生素C的含量不得少于21mg。现从一批罐头中抽取17罐,计算得维生素C含量的平均值为23mg,标准差为3.98mg。问该批罐头维生素C的含量是否合格?

分析:这个题目中,我们关心的是罐头中维生素C的含量是否合格,即维生素C的含量是否低于规定标准21mg,因此属于下侧检验的问题。应提出如下假设:

132.上侧检验上侧检验临界值和拒绝域临界值拒绝域使用临界值14【例】某厂有一批产品,须经检验合格才能出厂。按照规定,次品率不能超过2%。今从这批产品中任意抽取10件,发现有1件次品。问:这批产品是否合格?分析:题目关心的是:这批产品是否合格,等同于检验该批产品的次品率是否高于规定值2%,因此属于上侧检验的问题。应做如下假设:

15注释:双侧检验与单侧检验假设检验根据实际的需要可以分为:双侧检验(双尾):指只强调差异而不强调方向性的检验。单侧检验(单尾):强调某一方向性的检验。左侧检验右侧检验16假设检验中的两类错误假设检验是依据样本提供的信息进行推断的,即由部分来推断总体,因而假设检验不可能绝对准确,是可能犯错误的。两类错误:

错误(I型错误):H0为真时却被拒绝,弃真错误;

错误(II型错误):H0为假时却被接受,取伪错误。

假设检验中各种可能结果的概率:接受H0,拒绝H1拒绝H0,接受H1H0为真

1-(正确决策)(弃真错误)H0为伪

(取伪错误)1-(正确决策)三、假设检验的两类错误1718(1)与是两个前提下的概率。即是拒绝原假设H0时犯错误的概率,这时前提是H0为真;是接受原假设H0时犯错误的概率,这时前提是H0为伪。所以+不等于1。

(2)对于固定的n,与一般情况下不能同时减小。对于固定的n,越小,Z/2越大,从而接受假设区间(-Z/2,Z/2)越大,H0就越容易被接受,从而“取伪”的概率就越大;反之亦然。即样本容量一定时,“弃真”概率和“取伪”概率不能同时减少,一个减少,另一个就增大。

与19

(3)要想减少与,一个方法就是要增大样本容量n。与20四、检验统计量的构造根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量,称为检验统计量。与参数估计相同,需要考虑:总体是否正态分布;大样本还是小样本;总体方差已知还是未知。21五、假设检验的一般步骤(一)临界值法的检验步骤提出与应用相适应的原假设

和备择假设

。指定检验中的显著性水平

。确定适当的检验统计量。确定临界值和拒绝域。利用样本数据计算检验统计量的值。利用拒绝规则,作出决策:若统计量的值落在拒绝域,则拒绝

;否则不能拒绝。22第二节总体均值的检验一、单个总体均值的假设检验(一)大样本的检验方法(二)小样本的检验方法(正态总体)23一、单个总体均值的假设检验(一)大样本的检验方法1.总体方差已知【例】一种袋装牛奶采用自动生产线包装生产,按照标准,每袋牛奶的容量为221ml,标准差为5ml。质检人员在某批包装的牛奶中随机抽取了50袋进行检验,测得样本平均容量为220.5ml。要求:在显著性水平为0.05的条件下检验该批袋装牛奶是否符合标准要求。24解:这里,我们关心的是总体均值与221ml是否有显著差异的问题,所以属于双侧检验的问题。按照假设检验的步骤(临界值法):(1)依据题意设立假设(2)指定显著性水平(3)确定适当的检验统计量25(4)确定临界值和拒绝域在的显著性水平下,对应查标准正态分布表可得:临界值为=1.96;拒绝域为:(5)利用样本数据计算检验统计量的值(6)根据规则作出决策由于-0.71>-1.96,统计量没有落在拒绝域,因此不能拒绝原假设。即:没有足够证据表明该批产品不符合标准。

262.5%2.5%-1.961.96拒绝域拒绝域0-0.7127[例7-2]某市历年来对7岁男孩的统计资料表明,他们的身高服从均值为1.32米、标准差为0.12米的正态分布。现从各个学校随机抽取25个7岁男学生,测得他们平均身高1.36米,若已知今年全市7岁男孩身高的标准差仍为0.12米,问与历年7岁男孩的身高相比是否有显著差异(取=0.05)。

解:从题意可知,=1.36米,=1.32米,=0.12米。

(1)建立假设:H0:=1.32,H1:1.32

(2)确定统计量:

28

(3)Z的分布:Z~N(0,1)

(4)对给定的=0.05确定临界值。因为是双侧备择假设所以查表时要注意。因概率表是按双侧排列的,所以应查1-0.05=0.95的值,查得临界值=1.96。

(5)检验准则。|Z|<1.96,接受H0,反之,拒绝H0。

(6)决策:因Z=1.67<1.96;落在了接受域,因此认为今年7岁男孩平均身高与历年7岁男孩平均身高无显著差异,即不能拒绝零假设。

29

例2:设某厂生产一种灯管,其寿命X~N(,2002),由以往经验知平均寿命

=1500小时,现采用新工艺后,在所生产的灯管中抽取25只,测得平均寿命1675小时,问采用新工艺后,灯管寿命是否有显著提高。(=0.05)解:这里拒绝H030(一)大样本的检验方法2.总体方差未知例3糖厂用自动打包机打包,已知包重服从正态分布。每天开工后需要检验一次打包机工作是否正常。每包标准重量为100公斤。某日开工后,随机抽取30包测得平均重量是99.7公斤,标准差为0.2公斤。问该日打包机工作是否正常?31解:这个题目属于大样本且总体方差未知的情形。打包机对糖进行打包,少于或多于100公斤都不正常,所以此题属于双侧检验的问题。假设检验过程如下(临界值法):(1)设立假设(2)指定显著性水平(3)构造检验统计量

32(4)确定临界值和拒绝域在的显著性水平下,对应查标准正态分布表可得:临界值为

=1.96;拒绝域为:(5)计算检验统计量的样本观测值(6)利用规则作出决策由于-8.22<-1.96,统计量落在了拒绝域内,因此拒绝原假设。即:有足够证据表明,该日糖厂自动打包机工作不正常。332.5%2.5%-1.961.96拒绝域拒绝域0-8.2234(二)小样本的检验方法(正态总体)

1.总体方差已知【例】设某产品的某指标服从正态分布,总体标准差为100个单位。今抽取了一个容量为17的样本,计算得平均值为1650个单位。问在显著性水平0.05下,能否认为这批产品的指标的期望值不低于1600?35解:(1)提出原假设和备择假设

(2)确定显著性水平(3)构造检验统计量由于题目给定是正态总体,所以同样使用Z统计量36(4)确定临界值和拒绝域单侧检验下,对应查标准正态分布表可得:临界值为=1.645;拒绝域为:(5)利用样本信息计算统计量的值(6)利用规则作出决策由于2.06>1.645,统计量的观测值落入了拒绝域内,因此有充分证据拒绝原假设。即这批产品的指标的期望值不低于1600。371.645拒绝域02.065%38·双边检验:对于假设H0:=0;H1:0由p{|T|t/2(n1)}=,得水平为的拒绝域为|T|t/2(n1),(二)小样本的检验方法(正态总体)2.总体方差未知39t检验法是使用服从t分布的统计量检验正态总体平均值的方法。当正态总体标准差未知时,检验零假设H0:。可以证明,在H0成立的前提下,有:(其中,样本标准差)40例3用热敏电阻测温仪间接温量地热勘探井底温度,重复测量7次,测得温度(℃):112.0113.4111.2112.0114.5112.9113.6而用某种精确办法测得温度为112.6(可看作真值),试问用热敏电阻测温仪间接测温有无系统偏差(设温度测量值X服从正态分布,取=0.05)?解:H0:=112.6;H1:112.6由p{|T|t0.025(n1)}=0.05,得水平为=0.05的拒绝域为|T|t0.025(6)=2.4469这里接受H041

[例7-5]某制药厂试制某种安定神经的新药,给10个病人试服,结果各病人增加睡眠量如表7-2所示。

表7-1病人服用新药增加睡眠量表

试判断这种新药对病人有无安定神经的功效(=0.05)。

解:(1)建立假设H0:(没有功效);

H1:(有功效)(单侧备择假设)

(2)计算统计量:

=1.24=1.45

病人号码12345678910增加睡眠(小时)0.7-1.1-0.21.20.13.43.70.81.82.042

=2.57

(3)确定统计量分布。本例中,。

(4)对于给定的显著性水平0.05,查自由度为9的t分布表,单侧临界值为1.833。

(5)建立检验规则。|t|1.833,接受H0,否则,拒绝H0。

(6)结论。因为本例t=2.57﹥1.833,所以,拒绝H0,即,认为这种新药对病人有安定神经的功效。

43【例】某公司年度财务报表的附注中声明,其应收账款的平均计算误差不得超过50元。审计师从该公司年度内应收账款账户中随机抽取15笔进行调查,发现样本平均计算误差为55元,标准差为9元。假设该公司应收账款的误差服从正态分布,试以0.05的显著性水平评估该公司应收账款的平均计算误差是否超过了规定的标准。44解:题目满足正态总体、小样本、总体方差未知的条件,应使用t检验。且题目关心的方向是“>”,属于上侧检验的问题。(1)设立原假设和备择假设(2)确定显著性水平(3)构造t统计量45(4)确定临界值和拒绝域,由于此题是上侧检验问题,所以查t分布表得:拒绝域为:(5)计算统计量的值(6)决策因为2.15>1.761,样本统计值落在了拒绝域,应该拒绝原假设。即该公司应收账款的平均计算误差超过了规定的标准。

461.761拒绝域02.155%47例4已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N(4.55,0.112).某日测得5炉铁水含碳量如下:4.28,4.40,4.42,4.35,4.37.如果标准差不变,该日铁水的平均含碳量是否显著偏低?(取=0.05)解:得水平为的拒绝域为这里拒绝H048注:上题中,用双边检验或右边检验都是错误的.若用双边检验,H0:=4.55;H1:4.55,则拒绝域为由|U|=3.78>1.96,故拒绝H0,说明可以认为该日铁水的平均含碳量显著异于4.55.但无法说明是显著高于还是低于4.55.不合题意若用右边检验,H0:4.55;H1:>4.55,则拒绝域为由U=-3.78<-1.96,故接受H0,说明不能认为该日铁水的平均含碳量显著高于4.55.但无法区分是等于还是低于4.55.不合题意.49假定未知,·双边检验:对于假设501.总体均值已知时,检验总体方差是否等于已知常数时检验步骤:建立假设:H0:(已知数),H1:(或、)。计算统计量

三、总体方差的检验51确定统计量的分布。当H0成立,可证明

服从自由度为n的分布。对给定的显著性水平,查分布表,得到检验临界值。确定判别标准。若﹥或﹤(双侧备择假设),或﹥(右单侧)或﹤(左单侧)

则拒绝H0;否则,接受H0

。进行统计决策。52

2.总体均值未知时,在检验总体方差是否等于已知常数时,必须通过样本,求得样本平均数,用来代替总体均值,这时统计量

服从自由度为n-1的分布。

有时候样本平均数未知,但已知样本方差,则可用统计量

仍然服从自由度为n-1的分布。

53[例7-11]根据过去实验.某产品的某种质量指标服从正态分布,其方差=7.5。现在,从这种产品中随机抽取25件,测得样本方差=10,试判断产品质量变异程度是否增大了(=0.05)

解:(1)建立假设:H0:(已知数),H1:﹥。

(2)计算统计量

(3)确定统计量的分布。当H0成立,可证明

服从自由度df为25-1=24的分布。54(4)对给定的显著性水平,查分布表,得到检验临界值。因为是右单侧备择假设,对应于=0.05,df=24,

=36.415

(5)确定判别准则。若﹥=36.415,则拒绝H0;否则,接受H0。

(6)作结论。因为=44﹥36.415,所以,拒绝原假设,接受H1,认为产品质量变异程度增大了。

55例5电工器材厂生产一批保险丝,取10根测得其熔化时间(min)为42,65,75,78,59,57,68,54,55,71.问是否可以认为整批保险丝的熔化时间的方差小于等于80?(=0.05),熔化时间为正态变量.)得水平为=0.05的拒绝域为这里接受H056设保险丝的融化时间服从正态分布,取9根测得其熔化时间(min)的样本均值为62,标准差为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论