概率统计第七章_第1页
概率统计第七章_第2页
概率统计第七章_第3页
概率统计第七章_第4页
概率统计第七章_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率统计第七章第1页,共76页,2023年,2月20日,星期五§7.1

假设检验的基本思想与概念

7.1.1假设检验问题

某产品出厂检验规定:次品率p不超过4%才能出厂.现从一万件产品中任意抽查12件发现1件次品,问该批产品能否出厂?若抽查结果发现3件次品,问能否出厂?

引例1

抽查12件发现1件按理不能出厂.分析直接算第2页,共76页,2023年,2月20日,星期五求检验准则:

——抽取的12个产品中至少有几个次品则判断不合格?思路:假定p<=4%,约定α=0.01(小概率),记12件样品中的次品数为X,检验准则为一次试验中,“Xk”发生为小概率事件时,则不能出厂。第3页,共76页,2023年,2月20日,星期五这不是小概率事件,则该批产品可以出厂.解这是小概率事件

,一般在一次试验中是不会发生的,现一次试验竟然发生,故认为该批产品次品率p>4%,该批产品不能出厂.第4页,共76页,2023年,2月20日,星期五对总体提出假设要求利用样本观察值对提供的信息作出接受(可出厂),还是接受(不准出厂)的判断.出厂检验问题的数学模型第5页,共76页,2023年,2月20日,星期五(1)小概率原理:认为概率很小的事件在一次试验中实际上不会出现,并且小概率事件在一次试验中出现了,就被认为是不合理的.(2)基本思想:先对总体的参数或分布函数的作出某种假设,然后找出一个在假设下发生可能性甚小的小概率事件.如果试验或抽样的结果使该小概率事件发生了,这与小概率原理相违背,表明原来的假设有问题,应拒绝这个假设.若该小概率事件在一次试验或抽样中并未出现,表明试验或抽样结果支持这个假设,则接受原来的假设.统计检验的基本思想第6页,共76页,2023年,2月20日,星期五需要根据实际问题的需要,对总体参数或分布函数的表达式做出某种假设(称为统计假设),再利用从总体中获得的样本信息来对所作假设的真伪做出判断或进行检验.这种利用样本检验统计假设真伪的过程叫做统计检验(假设检验)第7页,共76页,2023年,2月20日,星期五7.1.2假设检验的基本步骤

一、建立假设

在假设检验中,常把一个被检验的假设称为原假设,用

表示,通常将不应轻易加以否定的假设作为原假设。

被拒绝时而接收的假设称为备择假设,用

表示,它们常常成对出现。在引例1中,我们可建立如下两个假设:

第8页,共76页,2023年,2月20日,星期五二、选择检验统计量由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量。

找出在原假设

成立条件下,该统计量所服从的分布。第9页,共76页,2023年,2月20日,星期五三、选择显著性水平,给出拒绝域形式小概率原理中,关于“小概率”的值通常根据实际问题的要求而定,如取α=0.1,0.05,0.01等,

α为检验的显著性水平(检验水平).根据所要求的显著性水平α,描写小概率事件的统计量的取值范围称为该原假设的拒绝域(否定域),一般用W表示;一般将称为接受域。拒绝域的边界称为该假设检验的临界值.第10页,共76页,2023年,2月20日,星期五

α/2

α/2Xφ(x)接受域P(|U|>u1-α/2)=α拒绝域拒绝域u1-α/2-u1-α/2第11页,共76页,2023年,2月20日,星期五例7.1.1

某厂生产的合金强度服从,其中的设计值为不低于110(Pa)。为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行,即该合金的平均强度不低于

110(Pa)。某天从生产中随机抽取25块合金,

测得强度值为x1,x2

,

…,x25,其均值为

(Pa),问当日生产是否正常?

H0:

>=110

原假设原假设的对立面:H1:

<110

备择假设提出假设:第12页,共76页,2023年,2月20日,星期五若原假设正确,则不应该小于110太多,故比110小到一定程度是小概率事件.可以确定一个临界值c使得因此,取,则第13页,共76页,2023年,2月20日,星期五由为检验的接受域即区间(,108.648

)为检验的拒绝域称的取值区间(108.648,+)第14页,共76页,2023年,2月20日,星期五四、作出判断

在有了明确的拒绝域后,根据样本观测值我们可以做出判断:

或时,则拒绝

即接收

时,则接收

在例7.1.1中,由于因此拒绝原假设,即认为该日生产不正常。第15页,共76页,2023年,2月20日,星期五由例7.1.1可见,在给定的前提下,接受还是拒绝原假设完全取决于样本值,因此所作检验可能导致以下两类错误的产生:

第一类错误拒真错误第二类错误受伪错误第16页,共76页,2023年,2月20日,星期五正确正确假设检验的两类错误犯第一类错误的概率通常记为,拒真概率犯第二类错误的概率通常记为,受伪概率H0为真H0为假真实情况所作判断接受H0拒绝H0第一类错误(拒真)第二类错误(受伪)第17页,共76页,2023年,2月20日,星期五

α/2

α/2Xφ(x)

增大样本容量n时,可以使α和β同时减小.注意:

uα/2

-uα/2β原假设真:μ=μ0备择假设真:μ≠μ0(μ>μ0)当样本容量一定时,小,就大,反之,小,就大.第18页,共76页,2023年,2月20日,星期五在进行假设检验时,我们采取的原则是:控制犯第一类错误(即事先给定且很小)的同时使犯第二类错误的概率达到最小.关于原假设与备择假设的选取H0与H1地位应平等,但在控制犯第一类错误的概率的原则下,使得采取拒绝H0的决策变得较慎重,即H0得到特别的保护.因而,通常把有把握的、有经验的结论作为原假设,或者尽可能使后果严重的错误成为第一类错误.第19页,共76页,2023年,2月20日,星期五犯第一类错误的概率

和犯第二类错误的概率

可以用同一个函数表示,即所谓的势函数。势函数是假设检验中最重要的概念之一,定义如下:

定义7.1.1

设检验问题的拒绝域为W,则样本观测值落在拒绝域内的概率称为该检验的势函数,记为(7.1.3)第20页,共76页,2023年,2月20日,星期五势函数

是定义在参数空间

上的一个函数。犯两类错误的概率都是参数的函数,并可由势函数算得,即:对例7.1.1,其拒绝域为,由(7.1.3)可以算出该检验的势函数第21页,共76页,2023年,2月20日,星期五这个势函数是的减函数

vvg第22页,共76页,2023年,2月20日,星期五同时可得如下结论:

利用这个势函数容易写出犯两类错误的概率分别为和思考:吗?第23页,共76页,2023年,2月20日,星期五

减小时,c也随之减小,必导致的增大;

减小时,c会增大,必导致

的增大;说明:在样本量一定的条件下不可能找到一个使和

都小的检验。

英国统计学家

Neyman和

Pearson提出水平为

的显著性检验的概念。

第24页,共76页,2023年,2月20日,星期五则称该检验是显著性水平为的显著性检验,简称水平为的检验。

定义7.1.2

对检验问题对如果一个检验满足对任意的

,都有

第25页,共76页,2023年,2月20日,星期五求势函数例:见P334NO.2第26页,共76页,2023年,2月20日,星期五§7.2正态总体参数假设检验

参数假设检验常见的有三种基本形式(1)(2)(3)当备择假设

在原假设

一侧时的检验称为单侧检验;当备择假设

分散在原假设

两侧时的检验称为双侧检验。

第27页,共76页,2023年,2月20日,星期五2)确定检验统计量:①H0:μ=μ0(已知);H1:μ≠μ0(双侧检验)1)提出原假设和备择假设:H0:μ=μ0;H1:μ≠μ0,3)对给定α,由原假设成立时P(|u|>u1-α/2)=α得拒绝条件为|u|>u1-α/27.2.1

单个正态总体均值的检验一、已知时

的检验设总体X~N(μ,σ2),X1,X2,…,Xn为一组样本,第28页,共76页,2023年,2月20日,星期五

α/2

α/2Xφ(x)接受域P(|U|>u1-α/2)=α否定域否定域u1-α/2-u1-α/2双侧统计检验U检验该检验用u检验统计量,故称为u检验。

第29页,共76页,2023年,2月20日,星期五2)对统计量:1)提出原假设和备择假设:H0:μ≤μ0;H1:μ>μ0,3)故拒绝条件为U>u1-α对给定的α有在H0下有所以②H0:μ≤μ0(已知);H1:μ>μ0(右侧检验)第30页,共76页,2023年,2月20日,星期五αXφ(x)接受域否定域u1-α单侧(右侧)统计检验P(>u1-α)≤α第31页,共76页,2023年,2月20日,星期五2)选择统计量:1)提出原假设和备择假设:H0:μ≥μ0;H1:μ<μ0,3)对给定α,否定域为U<-u1-α,③H0:μ≥μ0(已知);H1:μ<μ0(左侧检验)

第32页,共76页,2023年,2月20日,星期五αXφ(x)接受域否定域-u1-α单侧(左侧)统计检验P(<-u1-α)≤α第33页,共76页,2023年,2月20日,星期五由可推出具体的拒绝域为该检验的势函数是的函数,它可用正态分布写出,具体为

对右侧检验第34页,共76页,2023年,2月20日,星期五势函数是的增函数(见图),只要

就可保证在

时有7.2.1(a)的图形第35页,共76页,2023年,2月20日,星期五对左侧检验是类似只是拒绝域变为:其势函数为对双侧检验问题(7.2.3),拒绝域为其势函数为第36页,共76页,2023年,2月20日,星期五7.2.1(b)(c)的图形第37页,共76页,2023年,2月20日,星期五例7.2.1

从甲地发送一个讯号到乙地。设乙地接受到的讯号值服从正态分布

其中

为甲地发送的真实讯号值。现甲地重复发送同一讯号5次,乙地接收到的讯号值为

8.058.158.28.18.25设接受方有理由猜测甲地发送的讯号值为8,问能否接受这猜测?第38页,共76页,2023年,2月20日,星期五解:这是一个假设检验的问题,总体X~N(,0.22),检验假设:这个双侧检验问题的拒绝域为取置信水平=0.05,则查表知u0.975=1.96。用观测值可计算得u值未落入拒绝域内,故不能拒绝原假设,即接受原假设,可认为猜测成立。第39页,共76页,2023年,2月20日,星期五二、未知时的t检验由于

未知,一个自然的想法是将(7.2.4)中未知的替换成样本标准差s,这就形成t检验统计量(7.2.9)三种假设的检验拒绝域分别为第40页,共76页,2023年,2月20日,星期五例7.2.2

某厂生产的某种铝材的长度服从正态分布,其均值设定为240厘米。现从该厂抽取5件产品,测得其长度为(单位:厘米)239.7239.6239240239.2试判断该厂此类铝材的长度是否满足设定要求?

解:这是一个关于正态均值的双侧假设检验问题。采用t检验,拒绝域为:第41页,共76页,2023年,2月20日,星期五现由样本计算得到:t==2.7951由于2.7951>2.776,故拒绝原假设,认为该厂生产的铝材的长度不满足设定要求。

若取=0.05,则t0.975(4)=2.776.故第42页,共76页,2023年,2月20日,星期五检验法条件检验统计量拒绝域u

检验已知t

检验未知原假设备择假设表7.2.1单个正态总体的均值的检验问题第43页,共76页,2023年,2月20日,星期五单正态总体均值假设检验的步骤第一,根据题意,提出原假设和备择假设;两者在逻辑上是对立的.第二,确定显著性水平α,并计算出临界值;确定统计量的拒绝域和接受域,注意是单边还是双边检验;第三,确定适当的检验统计量,并计算其取值;(比如单总体均值检验中,当已知总体方差时,用U统计量;总体方差未知时,用t统计量)第四,将检验统计量的值与临界值进行比较,作出接受还是拒绝原假设的统计决策第44页,共76页,2023年,2月20日,星期五三、假设检验与置信区间的关系

这里用的检验统计量与6.5.5节中置信区间所用的枢轴量是相似的。这不是偶然的,两者之间存在非常密切的关系。设

是来自正态总体

的样本,现在未知场合讨论关于均值的检验问题。考虑双侧检验问题:第45页,共76页,2023年,2月20日,星期五它可以改写为并且有若让0

在(-)内取值,就可得到的1-置信区间:

这里0并无限制.则水平为的检验接受域为

第46页,共76页,2023年,2月20日,星期五关于的水平为的显著性检验。是一一对应的。

类似地,“参数的1-置信上限”与“关于

的单侧检验问题的水平的检验”反之若有一个如上的1-置信区间,也可获得所以:“正态均值的1-置信区间”与“关于

的双侧检验问题的水平的检验”参数的1-置信下限与另一个单侧检验也是一一对应的。是一一对应的。

第47页,共76页,2023年,2月20日,星期五

假设检验与置信区间对照接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布

00(2

已知)(2

已知)原假设

H0备择假设

H1待估参数第48页,共76页,2023年,2月20日,星期五接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布原假设

H0备择假设

H1待估参数

0

0(

2未知)(

2未知)第49页,共76页,2023年,2月20日,星期五接受域置信区间假设检验区间估计统计量枢轴量对偶关系相似函数假设检验与区间估计的联系第50页,共76页,2023年,2月20日,星期五7.2.2两个正态总体均值差的检验检验法条件原假设备择假设检验统计量拒绝域u检验已知t检验未知第51页,共76页,2023年,2月20日,星期五大样本检u

未知m,n充分大近似t

检验未知m,n不很大第52页,共76页,2023年,2月20日,星期五例7.2.3

某厂铸造车间为提高铸件的耐磨性而试制了一种镍合金铸件以取代铜合金铸件,为此,从两种铸件中各抽取一个容量分别为

8和9的样本,测得其硬度为

镍合金:76.4376.2173.5869.6965.2970.8382.7572.34铜合金:73.6664.2769.3471.3769.7768.1267.2768.0762.61根据经验,硬度服从正态分布,且方差保持不变。试在显著性水平下判断镍合金的硬度是否有明显提高。第53页,共76页,2023年,2月20日,星期五解:用X表示镍合金的硬度,Y表示铜合金的硬度,则由假定,

要检验的假设是:

经计算,

从而第54页,共76页,2023年,2月20日,星期五查表知由于故拒绝原假设,可判断镍合金硬度有显著提高。第55页,共76页,2023年,2月20日,星期五7.2.3正态总体方差的检验一、单个正态总体方差的检验

是来自

的样本,对方差亦可考虑如下三个检验问题:

通常假定未知,它们采用的检验统计量是第56页,共76页,2023年,2月20日,星期五相同的,均为

若取显著性水平为,则对应三个检验问题的拒绝域依次分别为第57页,共76页,2023年,2月20日,星期五例7.2.4

某类钢板每块的重量X服从正态分布,其一项质量指标是钢板重量的方差不得超过

0.016(kg2)。现从某天生产的钢板中随机抽取

25块,得其样本方差S2=0.025(kg2),问该天生产的钢板重量的方差是否满足要求。解:原假设为备择假设为此处n=25,若取=0.05,则查表知第58页,共76页,2023年,2月20日,星期五由此,在显著性水平0.05下,我们拒绝原假设,认为该天生产的钢板重量不符合要求。现计算可得第59页,共76页,2023年,2月20日,星期五接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布原假设

H0备择假设

H1待估参数2022=022(未知)(未知)第60页,共76页,2023年,2月20日,星期五二、两个正态总体方差比的F检验

是来自

的样本,

是来自

的样本。考虑如下三个假设检验问题

通常,均未知,记,分别是由算得的

的无偏估计和由

算得的

的无偏估计.第61页,共76页,2023年,2月20日,星期五可建立检验统计量:三种检验问题对应的拒绝域依次为}。

或第62页,共76页,2023年,2月20日,星期五例7.2.5

甲、乙两台机床加工某种零件,零件的直径服从正态分布,总体方差反映了加工精度,为比较两台机床的加工精度有无差别,现从各自加工的零件中分别抽取7件产品和8

件产品,测得其直径为

X(机床甲)16.216.415.815.516.715.615.8Y(机床乙)15.916.016.416.116.515.815.715.0第63页,共76页,2023年,2月20日,星期五这就形成了一个双侧假设检验问题,原假设是

备择假设为此处m=7,n=8,经计算查表知于是

,若取

=0.05,其拒绝域为由此可见,样本未落入拒绝域,即在0.05水平下可以认为两台机床的加工精度一致。

第64页,共76页,2023年,2月20日,星期五

问题母亲嗜酒是否影响下一代的健康

美国的Jones医生于1974年观察了母亲在妊娠时曾患慢性酒精中毒的6名七岁儿童(称为甲组).以母亲的年龄,文化程度及婚姻状况与前6名儿童的母亲相同或相近,但不饮酒的46名七岁儿童为对照租(称为乙组).测定两组儿童的智商,结果如下:第65页,共76页,2023年,2月20日,星期五甲组67819乙组469916人数智商平均数样本标准差智商组别由此结果推断母亲嗜酒是否影响下一代的智力?若有影响,推断其影响程度有多大?提示前一问题属假设检验问题后一问题属区间估计问题第66页,共76页,2023年,2月20日,星期五智商一般受诸多因素的影响.从而可以本问题实际是检验甲组总体的均值是否比乙组总体的均值偏小?若是,这个差异范围有多大?前一问题属假设检验,后一问题属区间估计.解假定两组儿童的智商服从正态分布.第67页,共76页,2023年,2月20日,星期五由于两个总体的方差未知,而甲组的样本容量较小,因此采用大样本下两总体均值比较的U—检验法似乎不妥.故当为真时,统计量采用方差相等(但未知)时,两正态总体均值比较的t—检验法对第一个问题作出回答.为此,利用样本先检验两总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论