项目5抽样推断和假设检验 课件(共46张 )- 《统计学基础》同步教学(重庆大学版 )_第1页
项目5抽样推断和假设检验 课件(共46张 )- 《统计学基础》同步教学(重庆大学版 )_第2页
项目5抽样推断和假设检验 课件(共46张 )- 《统计学基础》同步教学(重庆大学版 )_第3页
项目5抽样推断和假设检验 课件(共46张 )- 《统计学基础》同步教学(重庆大学版 )_第4页
项目5抽样推断和假设检验 课件(共46张 )- 《统计学基础》同步教学(重庆大学版 )_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学基础抽样推断和假设检验4描述统计分析321用图表展示数据收集统计数据走近统计5相关与回归分析7认识事物发展趋势指数分析数据分析报告689任务一抽样及抽样分布任务二

单一总体的参数估计项目五抽样推断和假设检验任务三必要样本容量的确定任务四

单一总体参数假设检验知识目标1.能掌握抽样推断的含义、组织形式和作用。4.能了解影响样本容量的主要因素,掌握必要样本容量的确定方法。2.能掌握几种常用样本统计量的抽样分布。3.能了解参数估计的方法和单一总体均值、比例及方差的区间估计方法。5.能了解假设检验的基本原理和基本形式,掌握假设检验的基本步骤。技能目标1.能够根据抽样调查所获得的样本数据对总体参数进行点估计和区间估计。3.能根据抽样调查所获得的样本数据对总体参数进行假设检验。2.能够对必要的样本容量进行计算。四抽样方法和样本可能数目三二一有关抽样推断的基本概念抽样推断的应用范围抽样推断的含义任务一抽样及抽样分布八抽样分布理论七六五抽样极限误差抽样平均误差抽样推断的组织形式任务5.1抽样及抽样分布抽样推断又称抽样调查,是按照随机原则,从研究对象的全部单位中抽取一部分单位进行的调查,并用调查所得到的数据资料推断总体数量特征的一种非全面调查方式。特点:1)按随机原则抽取调查单位2) 用样本指标推断总体的数量特征3)抽样调查的误差可以事先计算和控制1、抽样推断能完成其他调查方式不能完成的调查任务。2、利用抽样推断结果对已取得的全面调查资料进行检验和修正。3、利用抽样推断原理和结果进行假设检验,以对事物做出正确的判断和认识4、利用抽样推断方法可用于产品的质量控制和管理。任务5.1抽样及抽样分布抽样推断的应用范围任务5.1抽样及抽样分布有关抽样推断的基本概念1、总体和样本2、总体参数和样本统计量表5-1相应总体参数及样本统计量的计算公式任务5.1抽样及抽样分布抽样方法和样本的可能数目表5-2重复、不重复抽样情况下样本可能的抽取数目表5-3重复、不重复抽样情况下样本可能的抽取数目例:

考虑顺序不考虑顺序重复抽样AA、AB、AC、ADBA、BB、BC、BDCA、CB、CC、CDDA、DB、DC、DDAA、AB、AC、AD

BB、BC、BDCC、CDDD不重复抽样AB、AC、ADBA、BC、BDCA、CB、CDDA、DB、DCAB、AC、ADBC、BDCD1、简单随机抽样简单随机抽样,又称纯随机抽样。这种抽样方式是不对总体做任何处理,直接按随机原则抽取调查。2、类型抽样类型抽样,又叫分层抽样或分类抽样。它是将总体中的所有单位先按某一主要标志分成若干类(或组),使组内各单位标志表现比较接近,然后从各组中随机抽取一部分单位,共同组成样本。任务5.1抽样及抽样分布抽样推断的组织形式3、等距抽样等距抽样,又叫机械抽样。它是先将总体各单位按某一标志进行排队,根据既定的抽样比例确定抽样间距,然后按一定顺序等间隔抽取一个样本单位。4、整群抽样整群抽样是先将总体分为若干个群(组),每一群内包含若干个单位,然后随机抽取一部分群作为样本群,对样本群中的所有总体单位进行全面调查的调查方式。任务5.1抽样及抽样分布抽样推断的组织形式5、多阶段抽样多阶段抽样是把抽取样本单位的过程分成两个或更多阶段进行。先从统计总体中抽取若干大的样本单位,也叫第一阶段单位,再从第一阶段单位中抽取较小的样本单位,也叫第二阶段单位,以此类推,直到最后阶段抽出最终的样本单位,即需要登记标志值的单位。任务5.1抽样及抽样分布抽样推断的组织形式1、抽样误差的概念2、抽样误差的来源

从误差产生的来源来讲,抽样误差可分为登记性误差和代表性误差两类。

(1)登记性误差

登记性误差是指在调查过程中,由于主客观原因在登记、汇总、计算、记录中所产生的差错。

(2)代表性误差

代表性误差又可分为系统性误差和随机性误差。

抽样误差即指这种随机误差,它是抽样调查所固有的。抽样误差的大小反映着抽样调查的准确性。一

抽样平均误差抽样平均误差是反映抽样误差一般水平的一个指标。抽样平均误差是指抽样平均数的标准差或抽样成数的标准差。设以表示样本平均数的抽样平均误差,以μp表示样本成数的抽样平均误差,M表示全部可能的样本数目,则

由计算还可看出,不重复抽样的抽样平均误差小于重复抽样的抽样平均误差。在简单随机重复抽样条件下在简单随机不重复抽样条件下近似公式【例5.1.】设有4位工人每月的工资分别为1160元、1200元、1280元和1320元,方差为4000元。现在从中随机抽取两位工人的工资,用以代表四人总体的平均工资水平,其抽样平均误差为多少?【例5.2】某机械厂产生一批零件共5000件,随机抽查250件,发现其中有8件不合格,求合格率的平均误差。影响抽样平均误差的因素(1)总体变异的程度。(2)样本容量的大小。(3)抽样方法。(4)抽样组织形式。总体方差(标准差)资料的替代问题(1)用样本方差替代总体方差。(2)用过去已经进行过的全面调查(或抽样调查)的方差替代。(3)用实验性调查所获得的方差资料替代。二

抽样极限误差抽样极限误差是指样本指标和总体指标之间误差的可能范围。样本指标变动的上限或下限与总体指标的绝对值就可以表示误差的可能范围,这种以绝对值形式表示的抽样误差的可能范围称为抽样极限误差。上述不等式可得到和P的取值范围,也叫置信区间。抽样理论已经证明:样本平均数服从以总体平均数为中心的正态分布,该正态分布的标准差就是抽样平均误差μ。

因此,由正态分布中变量取值区间与概率的关系可知:样本平均数落在()的范围内的可能性为68.27%;落在以()范围内的可能性为95.45%;落在以()范围内的可能性为99.73%,如下图在抽样估计中,表示这个可能性大小的概念叫置信度,习惯上也称之为可靠程度、把握程度或概率保证程度等,用F(Z)表示。上述结论也就等价于:在68.27%的置信度下,平均数的抽样极限误差就等于其抽样平均误差;在95.45%的置信度下,抽样极限误差等于抽样平均误差的两倍;在99.73%的置信度下,抽样极限误差等于抽样平均误差的3倍。可见,平均数的抽样极限误差可以用抽样平均误差的倍数来度量,其计算公式为Z值是由抽样估计时给定的置信度F(Z)所决定的,其对应关系可查标准正态分布概率表。常用概率面积、概率度对应表F(Z)ZF(Z)Z0.68271.000.95452.000.79951.280.992.580.86641.500.99733.000.901.640.99944.000.95001.960.9999995.00任务5.2单一总体的参数估计参数估计的概念

参数估计就是用样本统计量去估计总体的参数。

参数估计有点估计和区间估计两种方法。点估计

点估计又称定值估计,它是直接以样本资料计算样本指标,再以样本指标值直接作为相应的总体指标的估计值。

点估计是不考虑抽样误差的参数估计。区间估计区间估计是在点估计的基础上给出总体参数的一个估计区间。

进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量,这一概率保证度我们称为置信水平或置信度。在这种情况下,由样本统计量所构造的总体参数的估计区间称为置信区间。【例5.3】某种零件的长度服从正态分布,从某天产生的一批零件中按重复抽样方法随机取9个,测得其平均长度为。已知总体标准差为。试估计该批零件平均长度的置信区间,置信水平为95%。【例5.4】在某天生产的500袋食品中,按重复抽样方法随机抽取25袋进行检查,测得平均每袋的重量为996克。已知该种袋装食品的重量服从正态分布,且标准差为20克。试估计该种食品平均重量的置信区间,置信水平为95%【例5.6】某城市想要估计下岗职工中女性所占的比例,采取重复抽样方法随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。【例5.7】某企业共有职工1000人。企业准备实行一项改革,在职工中征求意见,采取重复抽样方法随机抽取200人作为样本,调查结果显示,有150人表示赞成该项改革,50人表示反对。试以95%的置信水平确定赞成改革人数比例的置信区间。任务5.3必要样本容量的确定一、估计总体平均数时的必要样本容量在重复抽样条件下

在不重复抽样条件下二、估计总体比例时的必要样本容量任务5.3必要样本容量的确定在重复抽样条件下

在不重复抽样条件下【例5.8】对某型号电子元件10000只进行耐用性能检查,根据以往抽样测定,求得耐用时数的标准为600小时,置信水平为95.45%,元件平均耐用时数的误差范围不超过150小时,要抽取多少元件做检查?【例5.9】对某型号电子元件10000只进行耐用性能检查,根据以往抽样检验知道,元件合格率为95%。要求在99.73%的置信水平下,允许误差不超过4%,试确定所需要抽取的元件数目是多少?任务5.3必要样本容量的确定三、影响样本容量的主要因素1、总体的变异程度2、概率保证度(置信水平)3、精度(抽样极限误差)4、抽样方法5、抽样组织形式任务5.4单一总体参数假设检验5.4.1假设检验的基本内容1、假设检验的基本思想假设检验(hypothesistesting)是除参数估计之外的另一类重要统计推断问题。它的基本思想可以用小概率原理来解释。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。也就是说,如果对于总体的某个假设是真实的,那么不利于或不可能支持这一假设的小概率事件A在一次试验中几乎是不可能发生的,要是一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,从而拒绝这一假设。假设

这是两个对立的假设,我们称为原假设和备择假设。2、假设检验的双侧、单侧检验在假设检验中,如果只关心备择假设是否不同于原假设,称为双边备择假设(双侧检验)。假设这种检验我们称为右边检验(右侧检验)。假设这种检验我们称为左边检验(左侧检验)。设为总体均值,为假设参数的具体数值,则假设检验的基本形式见表5-9。3、假设检验中的相关定义

(1)假设检验中的两类错误肯定意味着放弃;拒绝意味着接受。但实际上当为真时,我们仍有可能做出拒绝的判断(这种可能性是无法消除的),这是一种错误。由于抽样的随机性,我们利用样本对两个对立的假设进行推断,有可能出现两种情况:犯这种错误的概率记为:我们无法排除犯这种错误的可能性,但是希望将犯这类错误的概率控制在一定限度之内,因此,给出一个较小的数,使犯这类错误的概率不超过,即使得:决策结果实际情况为真不为真接受

正确决策第II类错误拒绝

第I类错误正确决策(2)显著性水平与拒绝域发生第I类错误的概率也常被用于评价检验结论的可靠程度,假设检验中犯第I类错误的概率被称为显著性水平,记为。即:常用的显著性水平有。当检验统计量取某个区域C中的值时,我们拒绝原假设,则称区域C为拒绝域,拒绝域的边界点称为临界点。4、假设检验的基本步骤综上所述,总体参数的假设检验问题的步骤可归纳如下:(1)根据实际问题的要求,提出原假设和备择假设。(2)给定显著性水平以及样本容量n。(3)选择适当的检验统计量以及拒绝域的形式。(4)根据求出拒绝域。5.4.2单一总体的参数检验1、总体均值的检验(1)正态总体、方差已知、小样本【例5.10】某味精厂生产的味精每袋重量(克)服从正态分布,质检要求每袋重100克。根据以往生产经验知该味精重量的标准差为基本稳定。现从某天包装的味精中随机抽取9袋,测得它们的重量分别为99.3,98.7,100.5,101.2,99.3,99.7,99.5,102.1,100.5。试问这天包装的味精是否合格?(2)正态总体、方差已知、大样本【例5.11】某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中抽取100只灯泡,测得样本均值为960小时。问批发商是否应该购买这批灯泡?(3)正态总体、方差未知、小样本【例5.12】灯泡的使用寿命服从分布,假定灯泡的额定寿命是960小时,从某生产厂家生产的某批灯泡中随机抽验了10只,测得寿命为:950,960,960,950,950,9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论