《统计学》第七章 假设检验_第1页
《统计学》第七章 假设检验_第2页
《统计学》第七章 假设检验_第3页
《统计学》第七章 假设检验_第4页
《统计学》第七章 假设检验_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第七章

假设检验第七章 假设检验假设检验:

也称显著性检验。 是抽样推断中运用甚广的一种统计推断方法。基本步骤:对研究总体的参数或分布形式提出假设根据抽样分布原理,利用样本实际资料计算相关统计量的取值检验所作假设是否合理分类:参数假设检验,简称参数检验;非参数检验或者自由分布检验。第七章 假设检验§1假设检验基本问题

§2一个总体参数的检验

§3二个总体参数的检验

§1假设检验基本问题§1.1假设检验的统计思想§1.2基本概念及检验步骤

§1.3关于值

§1.4两类错误

§1.5假设的建立问题

§1.1假设检验的统计思想统计思想:小概率原理反证法思想主要表现:1、主要理论依据是“小概率事件在现实中是不可能发生的”这一概率思想。2、采用的逻辑推理方法是反证法。§1.2基本概念及检验步骤1.原假设与备择假设原假设:待检验的假设,也称为零假设。备择假设:原假设的对立面,否定原假设后可供选择的假设。

例:某种饮料包装上注明“净含量500ml”,是否可信?该假设可以表达为:其中,字母表示假设,下标0表示原假设,下标1表示备择假设。§1.2基本概念及检验步骤零假设与备择假设并不一定完全对称。假设的形式:双侧检验:单侧检验左侧检验:(或者≥;)右侧检验:(或者≤;)§1.2基本概念及检验步骤2.检验统计量检验使用的统计量称为检验统计量检验统计量的构造形式为:§1.2基本概念及检验步骤3.显著性水平与临界值

显著性水平是为真却被拒绝的概率,它也是假设检验统计思想中所指的小概率。给定了显著件水平,可由统计量的概率分布确定其临界值,临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。§1.2基本概念及检验步骤4.接受域与拒绝域接受域:使原假设不能被拒绝的统计量所在区域。拒绝域:使原假设能够被拒绝的统计量所在区域。也称否定域。这两个区域是互补的关系,即检验统计量的实际值必落入且只能落入其中一个区域,它们之间的分界线即临界值。对于不同形式的假设,的接受域和拒绝域不同。§1.2基本概念及检验步骤如果是只需判断有无显著差异的情况,则采用双侧检验。双侧检验的接受域为检验统计量分布曲线上两临界值之间的区域,而拒绝域分别位于两端;§1.2基本概念及检验步骤左侧检验右侧检验左侧检验的拒绝域位于接受域的左侧;右侧检验的拒绝域位于接受域的右侧。如果需要判断参数是否偏大(偏小)的情况,则采取左侧(右侧)检验。§1.2基本概念及检验步骤5.假设检验的具体步骤

(1)建立假设。(2)确定检验统计量,并确定该统计量的分布情况,然后依据样本信息计算该检验统计量的实际值。(3)设定检验的显著性水平,并确定临界值。(4)将检验统计量的实际值与临界值进行比较,做出是否拒绝原假设的决策。§1.3关于p值

值:当零假设为真时,所得到样本观察结果或更极端结果的概率。值越小,样本观测结果出现的可能性越小,拒绝原假设理由就越充分。值能够反映出某一样本观测结果与原假设不一致的的精确程度。利用值进行假设检验的准则:将值与事先确定的检验显著性水平进行比较,若值小于,小概率事件发生,拒绝原假设;若值大于,小概率事件未发生,不能拒绝原假设。§1.4两类错误

进行假设检验时会犯两种错误:①零假设正确却被拒绝,称之为“第I类错误”;②零假设不正确却没有被拒绝,称之为“第II类错误”。

§1.4两类错误犯第I类错误的概率记为,即前面提到的显著性水平。犯第II类错误的概率记为。在一定样本容量下,减少会引起增大,减少会引起的增大。假设检验中人们普遍执行同一准则:

首先控制弃真错误(错误)。§1.5假设的建立问题实践中一般采取“原假设处于被保护地位”的原则,即将没有充分理由便不能拒绝的命题作为原假设,其对立面作为备择假设。一般将已有的、固有的、经验的命题作为原假设,将想要证明成立的命题作为备择假设,这样做可以有效减小犯第一类错误的概率。§2一个总体参数的检验§2.1总体均值的检验

§2.2总体比例的假设检验

§2.3正态总体的方差检验§2.1总体均值的检验§2.1.1.大样本情况下样本均值的抽样分布均为正态分布,其数学期望为总体均值,方差为,其中为总体方差。检验统计量服从标准正态分布,即:§2.1总体均值的检验根据检验统计量计算公式计算检验统计量样本值,当显著水平为时,查分布表:在双侧检验中,如果≥,则拒绝原假设;反之,则不能拒绝原假设。在左侧检验中,如果,则拒绝原假设;反之,则不能拒绝原假设。在右侧检验中,如果,则拒绝原假设;反之,则不能拒绝原假设。§2.1总体均值的检验【例7.1】某车间用一台包装机包装成品食盐,已知袋装食盐的净重服从正态分布,且当机器正常时,其均值为0.5公斤,标准差为0.005公斤。某日开工后要检验包装机是否正常运作,随机抽取了40袋,称得净重如下(单位:公斤):请检验机器是否处于正常运作状态?()§2.1总体均值的检验解:首先设立原假设与备择假设:;已知该总体服从正态分布及总体的标准差,故本题可以采用检验。由题中样本数据及已知条件得到:,,,,,本题属于双侧检验,根据正态分布,有:不能拒绝原假设,即认为包装机器运作正常。§2.1总体均值的检验【例7.2】某灯具厂生产一种白炽灯泡,根据长期观察,得知该灯泡使用寿命服从正态分布,平均使用时间为1500小时,标准差为10小时。现准备采用新技术延长灯泡寿命,引用该生产技术后抽检了16个灯泡进行试验,使用寿命分别为:试以0.05的显著性水平判断该种新技术是否显著提高灯泡的使用寿命。§2.1总体均值的检验解:显然,本题属于单侧检验(右侧检验),首先设立原假设与备择假设:;由题中样本数据及已知条件得到:,,,,检验统计量因此,拒绝原假设,即认为该种新技术显著提高灯泡的使用寿命。§2.1总体均值的检验§2.1.2.小样本情况下1.正态总体,已知

采用统计量对样本均值进行检验

2.正态总体,未知

检验统计量服从自由度为()的分布,由于未知,一般用样本标准差来代替总体标准差,即:

§2.1总体均值的检验对于给定的显著性水平,查分布表:在双侧检验中,当时,拒绝原假设;反之,则不能拒绝原假设。在左侧检验中,当时,拒绝原假设;反之,则不能拒绝原假设。在右侧检验中,当时,拒绝原假设;反之,则不能拒绝原假设。§2.1总体均值的检验【例7.3】(续例7.1)若其它条件不变,但抽查样本量减为10,且事先并不知道机器正常时的标准差信息。试检验机器是否处于正常运作状态?()解:首先设立原假设与备择假设:;由题中样本数据及已知条件得到:,,,,因此,不能拒绝原假设,即不能认为包装机器运作不正常。§2.1总体均值的检验【例7.4】(续例7.2)若没有灯泡寿命标准差的经验数据,试检验判断该种新技术是否显著提高灯泡的使用寿命。()解:首先确定原假设与备择假设不变,但检验统计量换为。由题中样本数据及已知条件得到:,,,,检验统计量拒绝原假设,即认为该种新技术显著提高灯泡的使用寿命。§2.1总体均值的检验§2.1.3.选择统计量的总结如何选择检验统计量大样本(§2.1总体均值的检验§2.1.4.计算机实现结果

例:SPSSSPSS软件中对原始数据(样本数据)是否服从正态分布、方差是否已知并没有太多的条件限制,对于均值检验采用的统计量均为t统计量。§2.2总体比例的假设检验总体服从二项分布,样本量足够大且满足时,比例的抽样分布可用正态分布近似。

的数学期望为, 的方差为,样本比例经标准化后的随机变量则服从标准正态分布,即

§2.2总体比例的假设检验检验未知的总体比例等于某一假设值设;(或;)检验统计量逼近正态分布,因未知的真实值,用样本比例来代替,因此检验统计量调整为:

其中,为待检验的总体比例。§2.2总体比例的假设检验【例7.5】某研究机构估计本市居民家庭的电脑拥有率为75%。现随机抽查了200个家庭,其中157个家庭拥有电脑。试问估计的该市居民家庭电脑拥有率是否可信?()解:首先根据题意建立原假设与备择假设:;(),,,

不能拒绝原假设,即认为该研究机构估计的该市居民家庭电脑拥有率是可信的。

§2.3正态总体的方差检验

检验方法——检验法。原假设形式为:双侧检验:;左侧检验:;(或者≥;)右侧检验:;(或者≤;)检验统计量为:其中,为样本方差,为待检验的假设方差。§2.3正态总体的方差检验对于给定的显著性水平,查分布表:在双侧检验中,首先确定临界值和,当或者时,拒绝原假设;反之,则不能拒绝原假设。在左侧检验中,确定临界值,当时,拒绝原假设;反之,则不能拒绝原假设。在右侧检验中,确定临界值,当时,拒绝原假设;反之,则不能拒绝原假设。§2.3正态总体的方差检验【例7.6】根据某饮料厂长期生产资料可知:该厂饮料灌装线灌装的饮料净含量服从正态分布,标准差为0.20ml。某天进行生产线检查,从灌装线上随机抽取20瓶饮料,测得样本标准差为0.35ml。试判断该条灌装线的波动与平日有无显著差异?()解:本题为双侧检验,首先设立原假设与备择假设:;根据条件已知:,,则检验统计量查分布表,由于,拒绝原假设,即该条灌装线的波动与平日有显著差异。§3二个总体参数的检验

根据前提条件不同、检验目标不同等因素,两总体参数假设检验的统计量选择情况可以由下图来示意:§3二个总体参数的检验§3.1两独立样本的均值检验

§3.2两独立样本的方差检验§3.3两独立样本比例之差的检验

§3.4两匹配样本的检验

§3.1两独立样本的均值检验§3.1.1.不同情形下的检验方法三种情形:原假设:或备择假设:或基于这个假设下,分别讨论各种情形下的检验过程。§3.1两独立样本的均值检验1.、已知情况下(检验法)检验统计量:

其中,、分别为两个总体的样本均值;、分别为两个总体的方差;、分别为两个总体的样本量。§3.1两独立样本的均值检验【例7.7】为比较甲、乙两种降血糖药物的药效,将20名病情相仿的患者分成两组,每组10人,设服药后维持的药效时间分别服从正态分布和,检测数据如下(单位:小时),问两种降血糖药物的疗效有无显著差异?()§3.1两独立样本的均值检验解:本题中、已知,且两组样本是独立的。提出原假设与备择假设:或或

已知:,,,,,,

计算得到检验统计量的样本值:由于,不能拒绝原假设,即在显著性水平条件下,甲药物与乙药物药效时间均值之间无显著性差异。§3.1两独立样本的均值检验2.、未知,但(检验法)检验统计量:其中,、分别为两个总体的样本均值;、分别为两个总体的样本量;、分别为两个总体的样本方差。§3.1两独立样本的均值检验【例7.8】若已知A、B两种降血压药物维持的药效时间服从正态分布和,其中具体值未知。问在显著性水平下,这两种降血压药物的疗效时间有无显著差异?§3.1两独立样本的均值检验解:本题中、未知,但,且两组样本是独立的。原假设与备择假设不变,由于总体方差未知,所以选用统计量,由题中样本数据:,,,,,,计算得到检验统计量值:由于,因此不能拒绝原假设,即在显著性水平条件下,A药物与B药物药效时间均值之间无显著性差异。§3.1两独立样本的均值检验3.、未知,样本量充分大(检验法)检验统计量:注:用样本标准差来代替总体标准差。其中,、分别为两个总体的样本均值;、分别为两个总体的样本量;、分别为两个总体的样本方差。§3.1两独立样本的均值检验4.、未知,小样本(检验法)检验统计量:其中,、分别为两个总体的样本均值;、分别为两个总体样本量;、分别为两个总体的样本方差。§3.1两独立样本的均值检验§3.1.2.计算机实现结果统计软件SPSS分组统计量表(表7—4)两样本均值分别为7.9610和7.4560标准差分别为0.86964和0.89617§3.1独立样本的均值检验独立样本检验表(表7—5)§3.1独立样本的均值检验表7—5中,“Levene‘sTestforEqualityofVariances”列即Levene’s方差齐性检验,该列可以看到值为0.054,Sig.为0.819,显然大于设定的置信度水平0.05,因此可以认为两样本方差是齐性的,即方差相等。由于已经通过方差齐性检验,因此接下来的均值检验要在方差相等的情况下判定,即参照“Equalvariancesassumed”行进行检验,该行中,样本统计量等于1.279,Sig.(2-tailed)(双尾概率值)为0.217,因此不能拒绝原假设,即在显著性水平条件下,A药物与B药物药效时间均值之间无显著性差异。§3.2两独立样本的方差检验用于检验两总体的某项指标波动幅度即方差是否相等,采用检验法,此类假设检验的原假设与备择假设为:原假设:或者备择假设:或者§3.2两独立样本的方差检验检验两个总体方差是否相等,选用统计量:其中,、分别为两个总体的方差;、分别为两个总体的样本方差;、分别为两个总体的样本量。根据样本数据计算检验统计量的值,其计算的基本公式为:§3.2两独立样本的方差检验规定显著性水平后,将与临界点值相比较,根据比较结果进行决策:

在双侧检验中,若或者,则拒绝原假设,即两个总体的方差存在显著差异;反之,则不能拒绝原假设,即两总体方差不存在显著差异。在左侧检验中,若,则拒绝原假设;反之,则不能拒绝原假设。在右侧检验中,若,则拒绝原假设;反之,则不能拒绝原假设。§3.2两独立样本的方差检验【例7.9】(续例7.8)样本保持不变,问在显著性水平下,这两种降压药物疗效时间的方差有无显著差异?解:本题中两组样本试验是独立的,由题意,原假设与备择假设为:或或由题中样本数据及已知条件:,,,,计算得到检验统计量值:由于,因此不能拒绝原假设,即在显著性水平条件下,A药物与B药物药效时间方差之间无显著性差异。§3.3两独立样本比例之差的检验

§3.3.1.检验两个总体比例是否相等检验两总体比例是否相等等价于检验两总体比例之差是否为零,因此,该类检验的原假设与备择假设为:(或)(或)检验统计量为:§3.3两独立样本比例之差的检验用公共比例来近似替代真实值,即:其中,和分别是在两样本中具有某种特征单位的个数,和分别表示两样本量。因此,检验统计量就转换为:其中,。§3.3两独立样本比例之差的检验【例7.10】现要比较两小区电脑普及情况,某调查公司通过抽样调查得到下列数据:在甲小区被调查的160户中有80户拥有电脑;在乙公司被调查的180户中有93户拥有电脑。此外,该调查公司在每个小区的抽样比都小于5%。在的置信水平下,可以判定两个小区电脑普及率不同吗?§3.3两独立样本比例之差的检验解:首先建立原假设与备择假设:,根据已知条件得到:,检验统计量值为:当时,临界值为,显然,因此不能拒绝原假设,即不能拒绝两个小区电脑普及率相同这个假设。§3.3两独立样本比例之差的检验§3.3.2.检验两个总体比例之差为非零常数检验两总体比例之差为一非零常数,则原假设与备择假设变为:,()检验统计量为:由于现实中真正的总体比例和往往是未知的,因此在这样的情况下需要用样本数据来近似替代真实值,此时检验统计量调整为:§3.3两独立样本比例之差的检验【例7.11】某厂质验人员认为该厂A车间产品优质品率比B车间高5%,现从A车间和B车间分别抽取两个独立随机样本进行检验,很到如下数据:在A车间抽检的150个产品中有120个优质品,在B车间抽检的150个产品中有115个优质品。问根据这些数据,能否相信质检人员的说法。()解:首先建立原假设与备择假设:,根据已知条件得到:,本题属于右侧检验,当时,临界值为,显然,因此不能拒绝原假设,不能支持该厂质检人员的说法。§3.4两匹配样本的检验

§3.4.1检验理论及实例

匹配样本的检验的思

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论