第7章:抽样推断_第1页
第7章:抽样推断_第2页
第7章:抽样推断_第3页
第7章:抽样推断_第4页
第7章:抽样推断_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章抽样推断学习目标主要内容本章小结学习目标

掌握利用样本统计资料来推断总体相应数量特征的原理及方法;深刻理解抽样推断的概念及特点;了解抽样误差产生的原因,并对抽样误差、抽样平均误差、抽样的极限误差加以区别,并掌握他们的计算方法;掌握点估计和区间估计的方法和必要样本单位数的确定方法。主要内容:第一节抽样推断概述第二节抽样的组织形式第三节抽样误差第四节抽样估计第五节假设检验本章小结思考题参考书目第一节抽样推断概述1.1抽样推断的概念、特点和作用抽样推断是在抽样调查的基础上,利用样本的实际资料计算出样本的数据,并运用概率估计方法推断出总体相应数量特征值的一种统计分析方法。概念:1)按照随机原则,抽选调查单位,是抽样推断的前提;2)运用概率估计法是抽样推断的特有估计方法;3)抽样推断的误差可以事先计算并加以控制;抽样推断的特点:抽样推断的作用:1)对有些不可能或不必要进行全面调查,但有需要了解其全面数量情况的社会经济现象,可以运用抽样推断实现调查的目的;2)抽样调查与全面调查同时进行,可以发挥互相补充和检查调查质量的作用;3)抽样推断可以用于工业企业生产过程的质量控制;4)利用抽样推断方法还可以对某种总体的假设进行检验,判断其真伪,以作出正确的决策。1.2抽样的几个基本概念样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量。一般用n表示,它表明一个样本中所包含的单位数。样本个数又称为样本可能数目,是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样的方法有关。1/3样本容量与样本个数:样本容量:样本个数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总体参数有总体的平均数指标、总体比重指标、总体分布的方差、总体标准差,等等。与总体参数对应的是样本统计量。常见的样本统计量有样本平均数指标、样本比重指标、样本方差、样本标准差,等等。2/3总体参数与样本统计量总体参数:样本统计量:从总体N单位中抽取一个容量为n的样本,每次从总体抽取一个,连续抽取n个,每次抽出的一个单位将其结果登记后放回,重新参加下一次抽选。从总体N单位中抽取一个容量为n的样本,每次从总体抽取一个,连续抽取n个,但每次抽出的一个单位将其结果登记后,不再放回参加下一次抽选。3/3重复抽样与不重复抽样重复抽样:不重复抽样:第二节抽样的组织形式1.纯随机抽样2.类型抽样3.等距抽样4.整群抽样5.多阶段抽样和多重抽样1/5纯随机抽样也叫简单随机抽样,是指按照随机原则直接从总体N个单位中抽取n个单位作为样本,然后对样本单位进行观测,计算出样本指数,并据以推算总体相应数量指标的抽样组织形式,适用于均匀分布的总体。概念:抽签法、计算机模拟法、随机数表达法等。方法:符合随机抽样、设计其他抽样的基础、衡量其他抽样方式的基础。优势:需要编码(可能很难办到)、误差较大、适用于较均匀的分布。劣势:2/5类型抽样先将全集总体中的所有单位按某一主要标志分组,然后在个组中采用随机抽样和机械抽样的方式,抽取一定数目的调查单位构成所需的样本,又叫分层抽样或分类抽样。概念:1)提高样本代表性;2)减少抽样平均误差。优点:1)将统计分组与随机随机原则结合起来;2)能保证分布的均匀性,提高样本的代表性;3)能同时推断总体指标和各子总体的指标;4)抽样误差来源于每组内部。特点:3/5等距抽样等距抽样又叫机械抽样或系统抽样,是指将总体各单位按某一标志排列,然后按固定的顺序或间隔抽取调查单位的一种组织形式。概念:1)按有关标志排序等距抽样2)按无关标识排序等距抽样种类:4/5整群抽样是指现将总体各单位划分为R群,以群为单位,从中随机抽取r群,然后对中选群的全部单位进行全面调查,并据以推算总体相应指标的抽样组织形式。概念:1)抽样组织方便、节约调查费用;2)调查单位集中,误差较大;3)直接抽取的不是总体单位而是群;4)影响抽样误差的是群间方差;5)一般不采用重复抽样。特点:5/5多阶段抽样和多重抽样多阶段抽样是只把抽取样本单位的过程分为两个或更多阶段来进行的抽样组织形式。多重抽样是指根据对不同调查目标的不同要求,从总体中已抽取的样本中再抽样的组织形式。概念:1)目的不同。总体范围较大,不便于直接抽取最终调查单位时采用多阶段抽样;为适应不同调查项目的不同要求,达到节省人力、物力的目的时,采取多重抽样。2)多阶段抽样的每个阶段,抽样单位的大小是不同的;多重抽样每次抽取的单位大小是相同的。区别:抽样误差是指由于随机抽样的偶然因素使样本各单位的结构的代表性存在差别,而引起的抽样指标和总体指标之间的绝对离差。A.概念:抽样误差是抽样所产生的误差;调查误差是指在调研过程中,由于测量、登记、计算上的差错所引起的误差;系统偏误是指由于随机原则,有意地选择较好或较差的单位进行调查,造成样本代表性不足所引起的误差。甄别:第三节抽样误差3.1抽样误差B.影响抽样误差大小的因素1)总体单位标志值的差异程度;2)样本单位数的多少;3)抽样方法;4)抽样调查的组织形式。抽样平均误差是指所有抽样平均数(或抽样成数)与总体平均数(或总体成数)的标准差。它反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。概念:从同一总体中,按随机原则抽取同样单位数的多个样本,每个样本可以计算各自样本平均数(或抽样成数),计算一系列样本平均数(或样本成数)与总体平均数(或总体成数)的平均误差程度。计算:3.2抽样平均误差抽样平均误差的计算1/2当总体为N,样本容量为n时,抽样平均误差的计算公式如下:1)平均数的抽样平均误差的计算公式重复抽样的情况下:不重复抽样的情况下:抽样平均误差的计算2/2当总体为N,样本容量为n时,抽样平均误差的计算公式如下:1)成数的抽样平均误差的计算公式重复抽样的情况下:不重复抽样的情况下:A类型抽样(重复OR不重复)B等距抽样(重复OR不重复)C整群抽样(不重复)3.3各种组织形式下抽样平均误差的计算3.4抽样的极限误差抽样平均误差说明了某一抽样方案的误差情况,但在实际进行抽样调查时,只抽取一个样本,那么这个样本的误差可能大于或小于平均误差。对于该项抽样调查,一定会要求有一个允许误差的范围,这一允许误差的范围,就称作抽样极限误差,又称抽样误差范围。概念:又称为抽样推断,也称为参数估计。它是在抽样调查的基础上所进行的数据推测,即用抽样调查所得到的一部分单位的数量特征来估计和推算总体的数量特征。概念:在逻辑上运用归纳推理,而不是演绎推理;在方法上运用不确定的概率估计法而不是运用确定的数学分析法;估计的结论存在一定的抽样误差。特点:第四节抽样估计4.1抽样估计的特点4.2抽样估计的理论基础4.3抽样估计的方法点估计是以点带面的估计方法,其特点是根据总体指标的结构形式设计样本指标(统计量)作为总体参数的估计两,并且以样本指标的实际数值直接作为相应总体参数的估计值。1/2点估计:样本均值估计总体均值样本成数估计总体成数样本方差估计总体方差估计方法:衡量优良估计的三个基本指标:1.无偏性:无偏性是指用样本指标估计总体指标时,要求样本指标的平均数等于被估计总体指标的平均数。2.有效性:有效性是指用样本指标估计总体指标时,要求样本指标的方差最小。3.一致性:一致性是指用样本指标估计总体指标,当样本容量增加时,样本指标越来越接近总体指标,则称样本指标为总体指标的一致估计量。区间估计就是指总体参数的区间范围,并要求给出区间估计成立的概率值。2/2区间估计:设θ是未知参数,X1,X2,…,Xn是来自总体的样本,构造两个统计量θ1=T1(X1,X2,…,Xn)和θ2=T2(X1,X2,…,Xn),对于给定的α(

0<α<1),若θ1、θ2满足:P﹛θ1≤θ≤θ2﹜=1-α则称随机区间[θ1、θ2]是参数θ的置信水平为1-α的置信区间,而1-α称为[θ1、θ2]的置信度,

θ1、θ2称为置信区间的下限和上限。定义:概念:区间估计的类型1/2:1)平均数的区间估计情况A:正态总体且方差已知,或非正态总体、方差未知、大样本情况下,总体均值的区间估计。在此情况下,样本均值的抽样分布呈正态分布,其数学期望为总体均值,方差为。则称为总体均值在置信水平下的置信区间。

P129T5—2案例分析:情况B:

正态总体、方差未知,小样本情况下,总体均值的区间估计。如果总体服从正态分布,无论样本容量大小,样本均值的抽样分布都服从正态分布。只要总体方差已知,即使在小样本情况下,也可以计算总体均值的置信区间。如果总体方差未知,需用样本修正方差代替,在小样本情况下,应用分布来建立总体均值的置信区间。

P130T5—5案例分析:在大样本(一般经验规则:和)条件下,样本比例的抽样分布可用正态分布近似。在这种情况下,数理统计已经证明如下结论:置信水平为的置信区间为:(重复抽样条件下)(不重复抽样条件下)2)成数的区间估计样本容量是指一个样本中包含单位数的个数。样本容量取得比较大,收集的信息就比较多,从而估计精度比较高,但进行观测所投入的费用、人力及时间就比较多;样本容量取得比较小,则投入的费用、人力及时间就比较少,但收集的信息也比较少,从而估计精度比较低。这说明精度和费用对样本容量的影响是矛盾的,不存在既使精度最高又使费用最省的样本容量。一个常用的准则是在使精度得到保证的前提下寻求使费用最省的样本容量。4.4样本容量的确定意义:1、总体方差的大小。总体方差越大,为保证一定的准确度,需要抽取更多的样本;反之,总体方差越小,可以抽取较少的样本。2、允许误差范围的大小。允许误差范围越小,需要抽取更多的样本;反之,允许误差范围越大,可以抽取较少的样本。3、概率保证程度。概率保证程度越高,需要抽取更多的样本;反之,概率保证程度越低,可以抽取较少的样本。4、抽样方法。在同样的准确度要求下,重复抽样的抽样单位数多于不重复抽样。5、抽样的组织方式。不同的组织方式,由于产生的误差不同,所以,要抽取的样本容量也各有差别。影响因素:假设检验就是事先对总体参数或总体分布形式做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定接受或拒绝原假设。概念:第五节假设检验(一)假设检验的基本思想(二)假设检验的步骤1.提出原假设和备择假设。

2.选择适当的统计量,并确定其分布形式。

3.选择显著性水平α,确定临界值。

4.做出结论。(三)假设检验的小概率原理所谓小概率原理,是指发生概率很小的随机事件在一次实验中是几乎不可能发生的。根据这一原理,可以做出是否接受原假设的决定。5.1假设检验一般问题1/2总体方差已知时对正态总体均值的假设检验设总体X~N(μ,σ2),总体方差σ2

为已知,(x1,x2,…,xn)为总体的一个样本,样本平均数为。现在的问题是对总体均值μ进行假设检验,H0:μ=μ0

(或μ≤μ0

、μ≥μ0

)。根据抽样分布定理,样本平均数服从N(μ,σ2/n),所以,如果H0成立时,检验统计量U及其分布为:5.2总体的均值、比例的假设检验利用服从正态分布的统计量U进行的假设检验称为U检验法。根据已知的总体方差、样本容量n和样本平均数,计算出检验统计量U的值。对于给定的检验水平,查正态分布表可得临界值,将所计算的U值与临界值比较,便可做出检验结论。双侧检验时,若|U1|>Uα/2,则拒绝H0,接受H1左侧检验时,若U<–Uα,则拒绝H0,接受H1。右侧检验时,若U>Uα,则拒绝H0,接受H1。P123例7-8(显著性水平0.01)案例分析:

设总体X~N(μ,),但总体方差未知,此时对总体均值的检验不能用上述U检验法,因为此时的检验统计量U中包含了未知参数。为了得到一个不含未知参数的检验统计量,很自然会用总体方差的无偏估计量–––样本方差S2

来代替,于是得到T统计量。根据上节内容已知道,检验统计量T及其分布为:T2/2总体方差未知时对正态总体均值的假设检验利用服从t分布的统计量去检验总体均值的方法称为T检验法。其具体做法是:根据题意提出假设(与U检验法中的假设形式相同);构造检验统计量T并根据样本信息计算其具体值;对于给定的检验水平α,由t分布表查得临界值;将所计算的t值与临界

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论