第五章抽样和抽样分布_第1页
第五章抽样和抽样分布_第2页
第五章抽样和抽样分布_第3页
第五章抽样和抽样分布_第4页
第五章抽样和抽样分布_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习目的学习目的: 了解抽样的概率抽样方法;了解抽样的概率抽样方法;理解抽样分布的意义;了解抽样理解抽样分布的意义;了解抽样分布的形成过程;理解中心极限分布的形成过程;理解中心极限定理;理解抽样分布的性质。定理;理解抽样分布的性质。3/19/20221 第一节第一节 常用的抽样方法常用的抽样方法 第三节第三节 抽样分布抽样分布 第三节第三节 抽样分布的性质抽样分布的性质3/19/20222简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽

2、样样抽抽样样方方式式3/19/20224根据一个已知的概率来抽取样本单位,也根据一个已知的概率来抽取样本单位,也称随机抽样称随机抽样特点特点按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会抽取样本时使每个单位都有一定的机会被抽中被抽中每个单位被抽中的概率是已知的,或是可每个单位被抽中的概率是已知的,或是可以计算出来的以计算出来的 当用样本对总体目标量进行估计时,要考当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率虑到每个样本单位被抽中的概率3/19/202251.从总体从总体N个单位中随机地抽取个单位中随机地抽取n个单位作为样本,个

3、单位作为样本,使使得每一个总体单位都有相同的机会得每一个总体单位都有相同的机会( (概率概率) )被抽中被抽中 2.抽取元素的具体方法有重复抽样和不重复抽样抽取元素的具体方法有重复抽样和不重复抽样3.特点特点简单、直观,在简单、直观,在抽样框抽样框完整时,可直接从中抽取样本完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便4.4.局限性局限性当当N很大时,不易构造抽样框很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率3/19/

4、20226将总体单位按某种特征或某种规则划分为将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机不同的层,然后从不同的层中独立、随机地抽取样本地抽取样本优点优点保证样本的结构与总体的结构比较相近,从保证样本的结构与总体的结构比较相近,从而提高估计的精度而提高估计的精度组织实施调查方便组织实施调查方便既可以对总体参数进行估计,也可以对各层既可以对总体参数进行估计,也可以对各层的目标量进行估计的目标量进行估计3/19/20227将总体中的所有单位将总体中的所有单位(抽样单位抽样单位)按一定顺按一定顺序排列,在规定的范围内随机地抽取一个序排列,在规定的范围内随机地抽取一个单位作

5、为初始单位,然后按事先规定好的单位作为初始单位,然后按事先规定好的规则确定其他样本单位规则确定其他样本单位先从数字先从数字1到到k之间随机抽取一个数字之间随机抽取一个数字r作为作为初始单位,以后依次取初始单位,以后依次取r+k,r+2k等单位等单位优点:操作简便,可提高估计的精度优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难3/19/20228将总体中若干个单位合并为组将总体中若干个单位合并为组(群群),抽样时抽样时直接抽取群,然后对中选群中的所有单位直接抽取群,然后对中选群中的所有单位全部实施调查全部实施调查特点特点抽样时只需群的抽样框,可简

6、化工作量抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,调查的地点相对集中,节省调查费用,方便调查的实施方便调查的实施缺点是估计的精度较差缺点是估计的精度较差3/19/20229 把握以下问题:把握以下问题: 1、概念;、概念; 2、抽样框的形式;、抽样框的形式; 3、对抽样框的要求。、对抽样框的要求。3/19/202210 抽样框:指包括全部抽样单位的名单框架。抽样框:指包括全部抽样单位的名单框架。 调查目的确定后,总体随之确定,总体又叫目调查目的确定后,总体随之确定,总体又叫目标总体,即理论上的抽样范围,与实际抽样的标总体,即理论上的抽样范围,与实际抽样的总体范围有时不

7、一致。此外抽样单位可以是个总体范围有时不一致。此外抽样单位可以是个总体单位,也可以是若干总体单位的集合。如总体单位,也可以是若干总体单位的集合。如某省进行农户收支调查,目标总体是全省所有某省进行农户收支调查,目标总体是全省所有农户,抽样单位可以是每个农户,也可以是每农户,抽样单位可以是每个农户,也可以是每个乡或村。所以,有目标总体后还必须明确实个乡或村。所以,有目标总体后还必须明确实际进行抽样的总体范围和抽样单位。际进行抽样的总体范围和抽样单位。3/19/202211 (1)名单抽样框:列出全部总体单位的名录)名单抽样框:列出全部总体单位的名录一览表,如职工名单、企业名单等。一览表,如职工名单

8、、企业名单等。 (2)区域抽样框:按地理位置将总体范围划)区域抽样框:按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。如分为若干小区域,以小区域为抽样单位。如某市居民住房调查,将全市居民户划分为若某市居民住房调查,将全市居民户划分为若干街道或片区。(干街道或片区。(3)时间表抽样框:将总体)时间表抽样框:将总体全部单位按时间顺序排列,把总体的时间过全部单位按时间顺序排列,把总体的时间过程分为若干小的时间单位,以时间单位作为程分为若干小的时间单位,以时间单位作为抽样单位。如对流水线上抽样单位。如对流水线上24小时内生产的产小时内生产的产品进行质量抽检。品进行质量抽检。3/19/2022

9、12 (1)应与目标总体一致,即包括全部)应与目标总体一致,即包括全部总体单位,不重不漏,否则破坏随机总体单位,不重不漏,否则破坏随机原则。例如,对某市居民进行抽查,原则。例如,对某市居民进行抽查,以电话号码本为抽样框不科学。以电话号码本为抽样框不科学。 (2)尽可能利用与所研究变量高度相)尽可能利用与所研究变量高度相关的辅助变量的信息,设计最佳的抽关的辅助变量的信息,设计最佳的抽样组织方式和抽样估计方法。样组织方式和抽样估计方法。3/19/202213样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布在重复选取容量为在重复选取容量为n的样本时,由该统计量的样本时,由该统

10、计量的所有可能取值形成的相对频数分布的所有可能取值形成的相对频数分布 随机变量是样本统计量随机变量是样本统计量样本均值样本均值, , 样本比例,样本方差等样本比例,样本方差等结果来自容量相同的所有可能样本结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的行推断的理论基础,也是抽样推断科学性的重要依据重要依据 3/19/2022163/19/202217在重复选取容量为在重复选取容量为n的样本时,由样的样本时,由样本均值的所有可能取值形成的相对频本均值的所有可能取值形成的相对频数分布数分布一种理论概率分

11、布一种理论概率分布推断总体均值推断总体均值 的理论基础的理论基础3/19/20221925. 1)(122NxNii3/19/2022203,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)3/19/2022213.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)3/19/20222

12、25 . 2x625. 02x3/19/202223x5x50 x5 . 2x3/19/202225nxx3/19/2022263/19/202227 设总体共有设总体共有N个单位,其均值为个单位,其均值为 而样本均值的方差与抽样方法有关:而样本均值的方差与抽样方法有关:重复抽样重复抽样不重复抽样不重复抽样)(xE)(xEnx22122NnNnx2x3/19/202228为样本数目MnMxnixix222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 45 . 10 . 11Mxniix3/19/2022293/19/202230设总体单位数为

13、设总体单位数为N,具有某种属性特征的单位数为,具有某种属性特征的单位数为N0,不具有某种属性特征的单位数为,不具有某种属性特征的单位数为N1,则有,则有N0+N1=N, =N0/ N,N1/N=1- ,相应的样本比率,相应的样本比率用用p表示。表示。在重复抽选容量为在重复抽选容量为n的样本时,由样本比率的所有可的样本时,由样本比率的所有可能取值形成的相对频数分布,称为样本比率的抽样能取值形成的相对频数分布,称为样本比率的抽样分布。分布。P的抽样分布是样本比率的抽样分布是样本比率p的所有可能值的概率分布。的所有可能值的概率分布。当样本容量很大时,样本比率当样本容量很大时,样本比率p的抽样分布可用

14、正态的抽样分布可用正态分布近似。对于一个具体的样本比率分布近似。对于一个具体的样本比率p,若,若n(1-p)和和np均大于等于均大于等于5,就可以认为样本容量足够大。,就可以认为样本容量足够大。3/19/202232样本比率的数学期望样本比率的数学期望样本比率的方差样本比率的方差 重复抽样重复抽样 不重复抽样不重复抽样)(pEnp12112NnNnp3/19/2022333/19/202234在在重复抽选容量为重复抽选容量为n的样本时,由样本方差的所的样本时,由样本方差的所有可能取值形成的相对频数分布,称为样本方差有可能取值形成的相对频数分布,称为样本方差的抽样分布。的抽样分布。对来自正态总体

15、的简单随机样本,比值对来自正态总体的简单随机样本,比值 的抽样分布服从自由度为(的抽样分布服从自由度为(n-1)的)的 分布。即分布。即221sn2112222nsn3/19/202236 分布具有如下性质和特点:分布具有如下性质和特点:(1)变量值始终为正。)变量值始终为正。(2)其分布形状取决于其自由度)其分布形状取决于其自由度n的大小,通常为的大小,通常为不对称的右偏分布,但随着自由度的增大逐渐不对称的右偏分布,但随着自由度的增大逐渐趋于对称。趋于对称。(3)(4)具有可加性。若)具有可加性。若U和和V为两个独立的分布随机为两个独立的分布随机变量,自由度分别为变量,自由度分别为n1和和n

16、2,则,则U+V这一随机变这一随机变量服从自由度为(量服从自由度为(n1+n2)的)的 分布。分布。为自由度其中:,方差为:其期望为:nnDnE2)(22223/19/202237正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布3/19/202238 无偏性:估计量抽样分布的数学期望等于无偏性:估计量抽样分布的数学期望等于被估计的总体参数被估计的总体参数 3/19/202240123/19/202241 一致性:随着样本容量一致性:随着样本容量n的增大,估计量的的增大,估计量的值越来越接近被估计的总体参数值越来越接近被估计的总体参数3/19/202242了解抽样的概率抽样方法了解抽样的概率抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论