本章主要内容.doc_第1页
本章主要内容.doc_第2页
本章主要内容.doc_第3页
本章主要内容.doc_第4页
本章主要内容.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

“假设检验”-统计学第七章讲稿 本章主要内容 第一节:假设检验的一般问题;第二节:总体均值的参数检验;第三节:总体成数的参数检验;第四节:总体方差的参数检验假设检验与参数估计一齐构成推断统计学的主要内容第一节 假设检验的一般问题主要讨论:假设检验的概念、假设检验的步骤、假设检验中的小概率原理、假设检验中的两类错误和双侧检验单侧检验所谓假设检验就是对一个关于总体参数或总体分布形式的假设,利用样本资料来检验其真或伪的可能性。对总体参数(平均数、成数、方差等)所作的假设进行检验称为参数假设检验,简称参数检验(parametric tests);对总体分布形式的假设进行检验一般称为非参数检验或自由分布检验。这里只讨论总体参数的假设检验,即参数检验。例 某品牌饮料纸包装上标明的容量为250毫升,标准差为4毫升。消费者协会从市场上随机抽取50盒该饮料,发现其平均含量仅为248毫升。据此,可否断定饮料厂商欺骗了消费者?解:样本均值低于厂商声称的平均含量,其原因有两种:一是由抽样误差引起的,这时样本均值与总体均值之差不会超出一定的抽样误差范围(以抽样平均误差的若干倍度量);二是由饮料厂商短斤少两引起,这时样本均值与总体均值之差就会超出一定的抽样误差范围。抽样误差范围是与概率保证程度相联系的。对于正态分布总体,若取概率保证程度为99%,则样本均值与总体均值之差大于抽样平均误差的-2.58倍即发生的概率只有1%,这是个小概率事件。对于一次抽样而言,可认为小概率事件实际上不会发生。若假设本例总体均值=250也就是说,对于一次抽样的结果,小概率事件却发生了,这是不合常理的。从样本信息看应拒绝这一假设,即纸包装饮料的容量不足250毫升,厂商有欺诈故意。 假设检验的基本思想是:先做出一个假设,然后依据小概率事件在一次抽样中实际上不会发生的推断原则,看这一假设是否会导致不合理的结果,从而判断是否拒绝原假设。假设检验的步骤:1. 提出原假设(Null Hypothesis)和备择假设(Alternative Hypothesis)原假设又称零假设,是对未知总体参数做出的、正待检验的假设。备择假设是对立假设,其含义是,一旦否定原假设,这个假设供你选择。根据具体问题,备择假设可由三种选择:(1)备择假设:,这种类型的假设检验称为双侧检验。(2)备择假设:,这种类型的假设检验称为右侧检验。(3)备择假设:,这种类型的假设检验称为左侧检验。2. 设计检验统计量所设计的检验统计量应与原假设相关即与待检验的参数相关,且能够知道当原假设为真时该统计量的具体分布。3. 给定显著性水平和确定相应的临界值显著性水平表示假设为真时拒绝原假设的概率,也就是拒绝原假设所冒的风险,用表示。一般取值很小,常取0.1、0.05、0.01。给定了显著性水平,也就确定了原假设的接受区域和拒绝区域。这两个区域的交界点就是临界值。4. 依据假设检验的规则,由样本资料计算出检验统计量的实际值,与临界值比较,视实际值落入接受区域还是拒绝区域,做出接受或拒绝原假设的结论。假设检验中,拒绝原假设是在认为小概率事件在一次抽样中实际上不会发生的前提下做出的,事实上小概率事件有时也可能发生;接受原假设,是因为拒绝它的理由还不充分,并非认为它绝对正确。因此,由假设检验做出的判断不可能百分之百正确。一般来说,决策结果可归纳以下四种情况:假设检验决策结果表是真实的是不真实的拒绝第类错误()正确接受正确第类错误()由假设检验做出的决策既可能犯“弃真错误”又可能犯“取伪错误”。“弃真错误”称作假设检验的“第类错误”,“取伪错误”称作假设检验的“第类错误”。假设检验犯第类错误的原因是,在原假设为真的情况下,检验统计量不巧刚好落入小概率的拒绝区域。因而,第类错误发生的概率就是显著性水平。第类错误发生的概率记为。概率与是密切相关的,在样本一定的条件下,减小,就增大了;反之,亦然。这里用法庭对被告进行审判的实例来说明。由于法庭采用无罪推定的审判准则,在证明被告有罪之前先假定他是无罪的,即原假设:被告无罪,备择假设:被告有罪。法庭可能犯的第类错误是:被告无罪但判他有罪,即冤枉了好人;第类错误是:被告有罪但判他无罪,即放过了坏人。为了减少冤枉好人的概率,应尽可能接受原假设,判被告无罪,而这有可能增大了放过坏人的概率;反过来,为了不放过坏人,减少放过坏人的概率,相应地就又增加了冤枉好人的可能性。当然,这只是在一定的证据下的两难选择。如果进一步收集有关的证据,在充分的证据下,就有可能做到既不冤枉好人,又不放过坏人。鉴于犯第类与第类错误的概率与的相互关系,在一定的样本容量下,期望两者都非常小是困难的。从而,在假设检验中,内曼(J. Neyman)和皮尔生(Egon S. Pearson)提出了一个原则,即在控制犯第类错误的概率的条件下,尽可能使犯第类错误的概率减小。在假设检验实践中,该原则的含义是,原假设要受到维护,使它不致被轻易否定,若要否定原假设,必须有充分的理由。第二节 总体均值的参数检验一、单个正态总体均值的检验样本来自正态总体(一) 如果总体方差已知-检验构造检验统计量: 当时,服从。给定显著性水平,则有(1) 检验规则为:当时,拒绝;当时,不能拒绝(2) 检验规则为:当时,拒绝;当时,不能拒绝(3) 检验规则为:当时,拒绝;当时,不能拒绝【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为m0=0.081mm,总体标准差为s = 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(a0.05)【解】依题意建立假设:0.081 :0.081根据检验统计量 =0.05,则由标准正态分布表,得。从而拒绝。有证据表明新机床加工的零件的椭圆度与以前有显著差异【例】某企业职工上月平均奖金为402元,本月随机抽取50人来调查,其平均奖金为412.4元。现假定本月职工收入服从正态分布,问在0.05的显著性水平下,能否认为该企业职工平均奖金本月比上月有明显提高?【解】依题意建立假设:402 :402检验统计量 显著性水平=0.05,则由标准正态分布表,得。从而拒绝,即认为该企业职工平均奖金本月比上月有明显提高。(二) 如果总体方差未知-检验构造检验统计量: 其中是样本标准差 (7.2)当时,根据抽样分布理论,统计量服从。给定显著性水平,则有(1) 检验规则为:当时,拒绝;当时,不能拒绝(2) 检验规则为:当时,拒绝;当时,不能拒绝(3) 检验规则为:当时,拒绝;当时,不能拒绝【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?【解】依题意建立假设: :根据检验统计量 显著性水平=0.05,则由分布表,得。从而不能拒绝,没有证据表明这天自动包装机工作不正常。t检验一般用于小样本检验,往往是已知服从正态总体但方差未知。随着样本容量n(30)的增大,t分布趋近于标准正态分布。所以在大样本情形下,总体方差未知时对总体均值的假设检验可近似采用z检验。对于非正态总体,大样本的情况下,在对总体均值假设检验时,也可采用z检验,如果未知,可以用s替代。二、两个正态总体均值之差的检验样本来自正态总体,来自正态总体(一) 如果两个总体方差和已知构造检验统计量: 当时,服从。因此,采用检验。【例】 假设某种羊毛的含脂率服从正态分布,且处理前后的方差均为36。处理前采10个样,测得平均含脂率为27.3,处理后采8个样,测得平均含脂率为13.75,问处理前后羊毛含脂率有无显著变化()?解 依题意建立假设: :根据检验统计量(7.3) 由标准正态分布表,得。从而拒绝,即认为处理前后羊毛含脂率有显著变化。(二) 如果两个总体方差和未知但相等构造检验统计量: (7.4)其中:当时,服从。因此,采用检验。【例】某废水中的镉含量服从正态分布,现用标准方法与新方法同时测定该样本中镉含量。其中新方法测定10次,平均测定结果为5.28ug/L,标准差为1.11ug/L;标准方法测定9次,平均测定结果为4.03ug/L,标准差为1.04ug/L。问两种测定结果有无显著性差异?【解】依题意建立假设: :根据检验统计量(7.4) 取显著性水平=0.05,。从而,拒绝,即认为两种测定结果有显著性差异。三、两个非正态总体均值之差的检验样本和来自两个非正态总体,当样本容量和较大()时构造检验统计量:或 当时,服从或近似服从。因此,两个非正态总体均值之差的检验可采用检验。第三节 总体成数的参数检验一、单个总体成数的检验所谓成数是指具有某一特征的总体单位在总体中所占的比重,用表示。如果将具有该特征的总体单位赋值“1”,不具有该特征的总体单位赋值“0”,则成数为总体均值,相应的总体方差为(1-)。同理,样本成数是一种样本均值。在大样本情况下,并且、,根据中心极限定理,样本成数服从。构造检验统计量 当时,服从标准正态分布,因此,总体成数的检验采用检验。【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(a = 0.05)【解】依题意建立假设:=30% :30%根据检验统计量 因为,从而不能拒绝,即没有证据表明研究者的估计不可信。【例】某公司负责人发现开出去的发票有大量笔误,而且断定这些发票中,错误的发票占20%以上。随机检查400张,发现错误的发票占25%。这是否可以证明负责人的判断正确(显著性水平为0.05)?【解】依题意建立假设:0.2 :0.2根据检验统计量(7.6) 因为,从而拒绝,即认为负责人的判断正确。二、两个总体成数之差的检验在大样本条件下,两个样本成数之差的抽样分布近似为正态分布。若令由于含有未知参数和,所以不能成为检验统计量。当=时,和的联合估计值为,故标准差的估计值为:取检验统计量 于是,在大样本条件下,当=时,近似服从标准正态分布。因此,两个总体成数之差的检验可采用检验。【例7.10】为了研究地势对小麦锈病发病率的影响,调查了低洼地麦田小麦378株,其中锈病株342株,还调查了高坡地麦田小麦396株,其中锈病株313株。若取显著性水平为0.01,比较两块麦田小麦锈病发病率是否有显著差异。【解】依题意建立假设 , 根据检验统计量(7.7) 取=0.01,=2.58,从而拒绝,即认为两块麦田小麦锈病发病率有显著差异。第四节 总体方差的参数检验一、一个正态总体方差的检验总体方差是用样本方差来估计的。根据抽样分布理论,检验统计量 服从。给定显著性水平,则有:(1) 检验规则为:当或时拒绝,否则不能拒绝(2) 检验规则为:当时拒绝,否则不能拒绝(3) 检验规则为:当拒绝,否则不能拒绝【例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?(显著性水平为0.05)?【解】依题意建立假设 根据检验统计量显著性水平,接受域为8.907,32.852,因此,不能拒绝原假设。二、两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论