第五章假设检验_第1页
第五章假设检验_第2页
第五章假设检验_第3页
第五章假设检验_第4页
第五章假设检验_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节假设检验的基本问题第二节几种常见的假设检验第三节假设检验的两类错误与功效

第七章假设检验第一节假设检验的基本问题一、假设检验的概念与种类二、原假设和备择假设三、显著性水平和拒绝域四、假设检验的基本步骤所谓假设检验,就是事先对总体参数或总体分布形态做出一个规定或假设,然后利用样本提供的信息,以一定的概率来检验假设是否成立(或是否合理),或者说判断总体的真实情况是否与原假设存在显著的系统性差异。

在统计中,常见的统计假设有:总体均值(或总体成数、总体方差等)等于(或大于、小于)某一数值,总体相关系数等于0,两总体均值(或两总体成数、两总体方差)相等,总体分布服从正态分布等。

根据检验的目的不同,假设检验可以分为双侧检验和单侧检验两类。双侧检验是指同时注意总体参数估计值与其假设值相比的偏高和偏低倾向的检验。单侧检验是指只注意总体参数估计值比其假设值偏高或偏低倾向的检验,它是单方向的。要进行假设检验,必须设立原假设和备择假设。原假设也称零假设或虚无假设,是研究者对总体参数值事先提出的假设,是被检验的假设。备择假设也称对立假设,是研究者通过检验希望能够成立的假设,是当原假设不成立时供选择的假设。

设总体参数的假设值为,那么原假设记为:它表示总体参数值与其假设值之间没有显著差异。备择假设记为:(双侧检验时)或(右单侧检验时)或(左单侧检验时)假设检验的实质就是样本信息是否有充分的理由来否定原假设。一方面原假设H0受到保护而不被轻易否定,使它处于有利地位;另一方面当原假设H0被接收时,又认为它不一定正确。还须指出,备择假设的表达式中是不含有等号的,即等号一定存在于原假设中。进行假设检验,概率论中关于小概率事件在一次试验中是不可能事件的原则是其所要遵循的基本原则。由抽样分布理论可知,若原假设成立,则样本统计值与总体参数假设值偏差很大的事件是一个小概率事件。倘若在一次抽样中,样本统计值与总体参数假设值相差很大,那么在原假设成立的条件下,就是出现了一个小概率事件。一旦出现小概率事件,就要怀疑原假设的正确性,从而否定原假设。若一次抽样的样本统计值与总体参数假设值相差不大,那么就没有理由拒绝原假设,也就只好接受原假设。现在的问题是,概率小到多少的事件为小概率事件?这个概率是在假设检验之前由人们事先主观选定的,用表示。究竟取多大为宜,应视具体情况而定,通常取0.05或0.01,有时也取0.10,而把概率小于上述值的事件称为小概率事件。越大,样本统计值与总体参数假设值之间的差异成为显著性差异的可能性越大;越小,这种差异成为显著性差异的可能性越小。因此的大小就成了判定这种差异是否显著的一个标准,故称为显著性水平。1-,则是样本统计值与总体参数假设值之差不超过一定范围的概率。接受或拒绝原假设,最终要以显著性水平为依据确定评判的规则。评判规则有两种;临界值规则和P-值规则。所谓临界值规则,就是先把值转化为一定分布下的临界值,然后计算检验统计值,最后把检验统计值与临界值相比较来判断是否拒绝原假设。所谓P-值规则,就是先计算检验统计值,然后求出统计量分布曲线图中与检验统计值相对应的、称之为观测到的显著性水平P-值,最后把P-值与事先给定的显著性水平值相比较来判断是否拒绝原假设。检验统计量是样本统计量的标准化形式,其构造公式为或。凡是检验统计量之值的绝对值小于临界值的绝对值,那么就接受原假设;若检验统计量之值的绝对值大于或等于临界值的绝对值,那么就拒绝原假设。这样,临界值就把样本统计量的概率分布区域分成了两部分(即把检验统计量的取值分成了两个区域):不超过临界值的区域和超过临界值的区域。我们把不超过临界值的区域称为接受域,把超过临界值的区域(含临界值点)称为拒绝域。标准正态分布的拒绝域如图5-1、图5-2所示。接受域拒绝域拒绝域

0

图5-1正态分布双侧检验接受域与拒绝域示意图

(a)左单侧检验(b)右单侧检验

图5-2正态分布单侧检验接受域与拒绝域示意图接受域拒绝域

0接受域拒绝域

0假设检验的基本原理

(一)提出原假设和备择假设;(二)确定检验的显著性水平;(三)根据样本统计量的概率分布确定出与相对应的临界值,即确定接受域和拒绝域;(四)构造检验统计量,并根据样本观测数据计算出检验统计值;(五)比较检验统计值与临界值,做出接受或拒绝原假设的判断。

第二节几种常见的假设检验一、总体均值的检验二、两个总体均值之差的检验三、总体成数的检验四、两总体成数之差的检验五、总体方差的检验六、两总体方差之比的检验总体均值检验的目的是总体均值是否等于(或大于,或小于)。我们可以建立假设如下:(双侧检验)或(左单侧检验)或(右单侧检验)下面我们分几种情况加以介绍。(一)总体服从正态分布且方差已知根据抽样分布原理,当总体服从正态分布时,那么从中抽取容量为n的样本,其样本均值服从正态分布(为了简便,只讨论重复抽样情况),而统计量服从标准正态分布。所以,当原假设为真时,我们可以构造检验统计量为:

对于双侧检验,针对给定的显著性水平,当时,要接受H0;当时,则要拒绝H0而接受H1。(二)总体分布及其方差均未知但大样本根据中心极限定理,当样本容量足够大时(n>30),样本均值也趋于服从数学期望为,方差为的正态分布。但由于未知,要以样本方差来估计,这时统计量趋于服从标准正态分布。所以,如果原假设成立,我们也可以构造检验统计量为:根据与(一)相同的规则,通过比较值与临界值或,可以做出接受H0或拒绝H1的判断,唯一不同之处,就是以代替了。(三)总体为正态分布,但方差未知且小样本若总体服从正态分布,但未知而要用样本方差估计,那么当时,统计量服从自由度为n-1的t分布。如果原假设成立,则检验统计量为:根据规定的显著性水平来确定临界值或,通过比较t和(或),来做出接受或拒绝原假设的判断。这种检验称为小样本t检验。对于双侧检验,当,接受原假设而拒绝备择假设;若,则要拒绝H0而接受H1。同理,对于左单侧检验,当时,拒绝而接受;若。则接受H0。对于右单侧检验,当时,拒绝而接受若,则接受H0。

设两个总体的均值分别为和,两个总体的方差分别为和,来自两个总体的样本容量分别为n1和n2,样本均值分别为和。检验的目的是两个总体的均值是否相等,或两个总体的均值之差是否为零。我们可以建立假设如下:(双侧检验)或(左单侧检验)

或(右单侧检验)下面分几种情况加以介绍。

(一)两个总体服从正态分布且方差已知根据抽样分布原理,统计量服从标准正态分布。如果原假设成立,我们可构造检验统计量为:对于双侧检验,当时拒绝H0,当时接受H0。对于左单侧检验,当时拒绝H0,当时接受H0。对于右单侧检验,当时拒绝H0,当时接受H0。

(二)两个总体方差未知但大样本若两个总体方差和未知且不相等,要分别以样本方差和来估计,那么当n1和n2都足够大时,统计量

趋于服从标准正态分布。当原假设成立时,我们可构造检验统计量为:

(三)两个总体服从正态分布,但方差未知且小样本若两个总体服从正态分布,方差未知且相等,那么当n1和n2都不够大时,那么下列统计量服从自由度为n1+n2-2的t分布,即:

其中为合并标准差。

当原假设成立时,检验统计量为:对于双侧检验,当时要拒绝H0,当要接受H0。对于左单侧检验,当时要拒绝H0,当时要接受H0。对于右单侧检验,当时要拒绝H0,当要接受H0。

检验的目的是判断总体成数P是否等于P0,我们可以建立假设如下:(双侧检验)

或(左单侧检验)或(右单侧检验)根据抽样分布定理可知,当样本容量足够大,即nP和n(1-P)都大于5时,样本成数p的抽样分布近似服从正态分布,而统计量服从标准正态分布。其中,由于N一般都很大,因此总体方差简化为。因此,当原假设为真时,我们可以构造检验统计量为:

对于给定的显著性水平,可查得临界值或。通过比较与或,可做出拒绝原假设H0或接受原假设H0的判断。判断规则与总体均值检验相同。设两个总体成数分别为P1和P2,来自两个总体的样本容量分别为n1和n2,样本成数分别为p1和p2。检验两个总体成数是否相等,或两个总体成数之差是否为零,我们可以建立假设如下:(双侧检验)或(左单侧检验)或(右单侧检验)

当n1和n2都足够大时(即n1P1、n1P1

(1-P1)、n2P2、n2P2(1-P2)均大于5),两个样本成数之差的抽样分布渐近服从正态分布,即:由于P1、P2未知,要以p1和p2来估计,因此在原假设H0为真时,我们要以两个样本的合并成数作为两个总体成数的共同的估计值,即:

这样,当原假设成立时,检验统计量就成为:

检验目的是判断正态总体方差S2是否S02等于,我们可建立假设为:(双侧检验)或(左单侧检验)或(右单侧检验)当原假设为真时,我们可构造服从自由度为n-1的分布的检验统计量:

对于给定的显著性水平,在双侧检验时,分布的左临界值为,右临界值为。当,就接受原假设H0;若或,就要拒绝原假设H0。在左单侧检验时,临界值为,当时,就接受原假设H0;若,就拒绝原假设H0。在右单侧检验时,临界值为,当,就接受原假设H0;若,就拒绝原假设H0。分布检验的拒绝域如图5-3、图5-4所示。

拒绝域接受域

拒绝域图5-3分布双侧检验接受域与拒绝域示意图拒绝域接受域接受域拒绝域(a)左单侧检验

(b)右单侧检验图5-4分布单侧检验接受域与拒绝域示意图设两个总体方差分别为S12和S22,相应的样本方差分别s12为和s22,检验目的是判断两个总体方差是否相等,我们可建立假设为:(双侧检验)或(左单侧检验)或(右单侧检验)

如果原假设成立,那么来自两个总体的两个样本方差之比应接近于1。因此当两个总体为正态总体时,我们可构造检验统计量为:它服从分子自由度为n1-1,分母自由度为n2-1的F分布。对于给定的显著性水平,在双侧检验时,分布的左临界值为右临界值为。当时,接受原假设H0;若或,则要拒绝原假设H0而接受H1。在左单侧检验时,临界值为,若,要接受原假设H0;若,则拒绝原假设H0而接受H1。在右单侧检验时,临界值为,若,要接受H0;若,要拒绝H0而接受H1。分布检验的拒绝域于图5-3、图5-4相似。第三节假设检验的两类错误与功效一、假设检验的两类错误二、犯第二类错误的概率的计算三、假设检验的功效第一类错误是“以真为假”的错误,即原假设正确但却被拒绝的错误,也称为“弃真”错误。产生第一类错误的概率是由假设检验的显著性水平给出的,即是,因此它又称为错误。

第二类错误是“以假为真”的错误,即原假设不正确却被接受的错误,也称为“纳伪”错误。犯第二类错误的概率是当备择假设成立时,检验统计值落入接受域的概率,一般用表示,因此它又称为错误。

假设检验的两类错误

接受域

图5-5双侧检验两类错误的关系

接受域

图5-6单侧检验两类错误的关系

(一)在双侧检验中的计算先求出当原假设为真时的两个临界值:和其中抽样标准误通常要以来估计。然后求出当备择假设

为真时,样本均值落入区间内的概率,此即为,计算公式为:

(二)在单侧检验中的计算对于左单侧检测,先求出原假设为真时的临界值,然后求出当备择假设为真时,样本均值落入区间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论