抽样与抽样分布培训课程(共44页).ppt_第1页
抽样与抽样分布培训课程(共44页).ppt_第2页
抽样与抽样分布培训课程(共44页).ppt_第3页
抽样与抽样分布培训课程(共44页).ppt_第4页
抽样与抽样分布培训课程(共44页).ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学统计学STATISTICS4 - 15.1.3 抽样与抽样分布抽样与抽样分布n1 常用的抽样方法常用的抽样方法 n2 抽样分布抽样分布n3 中心极限定理的应用中心极限定理的应用统计学统计学STATISTICS4 - 2学习目标n了解抽样的概率抽样方法了解抽样的概率抽样方法n理解抽样分布的意义理解抽样分布的意义n了解抽样分布的形成过程了解抽样分布的形成过程n理解中心极限定理理解中心极限定理n理解抽样分布的性质理解抽样分布的性质统计学统计学STATISTICS常用的抽样方法常用的抽样方法一、简单随机抽样一、简单随机抽样二、分层抽样二、分层抽样三、系统抽样三、系统抽样四、整群抽样四、整群抽样统

2、计学统计学STATISTICS4 - 4抽样方法抽样方法简简单单随随机机抽抽样样分分层层抽抽样样整整群群抽抽样样系系统统抽抽样样多多阶阶段段抽抽样样概概率率抽抽样样方方便便抽抽样样判判断断抽抽样样自自愿愿样样本本滚滚雪雪球球抽抽样样配配额额抽抽样样非非概概率率抽抽样样抽抽样样方方式式统计学统计学STATISTICS4 - 5概率抽样概率抽样(probability sampling)n根据一个已知的概率来抽取样本根据一个已知的概率来抽取样本单位,也称随机抽样单位,也称随机抽样n特点特点n按一定的概率以随机原则抽取样本按一定的概率以随机原则抽取样本n抽取样本时使每个单位都有一定的机抽取样本时使每

3、个单位都有一定的机会被抽中会被抽中n每个单位被抽中的概率是已知的,每个单位被抽中的概率是已知的,或是可以计算出来的或是可以计算出来的 n当用样本对总体目标量进行估计时,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概要考虑到每个样本单位被抽中的概率率统计学统计学STATISTICS4 - 6简单随机抽样简单随机抽样(simple random sampling)n从总体从总体N个单位中随机地抽取个单位中随机地抽取n个单位作为样本,个单位作为样本,使得每一个容量为样本都有相同的机会使得每一个容量为样本都有相同的机会( (概率概率) )被抽被抽中中 n抽取元素的具体方法有重复抽样和不

4、重复抽样抽取元素的具体方法有重复抽样和不重复抽样n特点特点n简单、直观,在抽样框完整时,可直接从中抽取样本简单、直观,在抽样框完整时,可直接从中抽取样本n用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便n局限性局限性n当当N很大时,不易构造抽样框很大时,不易构造抽样框n抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难n没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率统计学统计学STATISTICS4 - 7分层抽样分层抽样(stratified sampling)n将总体单位按某种特征或某种规则划分为将总体单位按某种特

5、征或某种规则划分为不同的层,然后从不同的层中独立、随机不同的层,然后从不同的层中独立、随机地抽取样本地抽取样本n优点优点n保证样本的结构与总体的结构比较相近,从保证样本的结构与总体的结构比较相近,从而提高估计的精度而提高估计的精度n组织实施调查方便组织实施调查方便n既可以对总体参数进行估计,也可以对各层既可以对总体参数进行估计,也可以对各层的目标量进行估计的目标量进行估计统计学统计学STATISTICS4 - 8系统抽样系统抽样 (等距抽样等距抽样) (systematic sampling)n将总体中的所有单位将总体中的所有单位(抽样单位抽样单位)按一定顺按一定顺序排列,在规定的范围内随机地

6、抽取一个序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的单位作为初始单位,然后按事先规定好的规则确定其他样本单位规则确定其他样本单位n先从数字先从数字1到到k之间随机抽取一个数字之间随机抽取一个数字r作为作为初始单位,以后依次取初始单位,以后依次取r+k,r+2k等单等单位位n优点:操作简便,可提高估计的精度优点:操作简便,可提高估计的精度n缺点:对估计量方差的估计比较困难缺点:对估计量方差的估计比较困难统计学统计学STATISTICS4 - 9整群抽样整群抽样(cluster sampling)n将总体中若干个单位合并为组将总体中若干个单位合并为组(群群),抽样抽样时

7、直接抽取群,然后对中选群中的所有单时直接抽取群,然后对中选群中的所有单位全部实施调查位全部实施调查n特点特点n抽样时只需群的抽样框,可简化工作量抽样时只需群的抽样框,可简化工作量n调查的地点相对集中,节省调查费用,方便调查的地点相对集中,节省调查费用,方便调查的实施调查的实施n缺点是估计的精度较差缺点是估计的精度较差统计学统计学STATISTICS抽样分布与中心极限定理抽样分布与中心极限定理一、抽样分布的概念一、抽样分布的概念二、样本均值抽样分布的形式二、样本均值抽样分布的形式三、样本均值抽样分布的特征三、样本均值抽样分布的特征四、中心极限定理四、中心极限定理统计学统计学STATISTICS4

8、 - 11n样本统计量的概率分布,样本统计量的概率分布,是一种理论分布是一种理论分布n在重复选取容量为在重复选取容量为n的样本时,由该统计量的所有的样本时,由该统计量的所有可能取值形成的相对频数分布可能取值形成的相对频数分布 n随机变量是随机变量是 样本统计量样本统计量n样本均值样本均值, 样本比例,样本方差等样本比例,样本方差等n结果来自结果来自容量相同容量相同的的所有所有可能样本可能样本n提供了样本统计量长远而稳定的信息,是进行提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要推断的理论基础,也是抽样推断科学性的重要依据依据 抽样分布 (sampling di

9、stribution)统计学统计学STATISTICS4 - 12抽样分布的形成过程 (sampling distribution)计算样本统计计算样本统计量量如:样本均值如:样本均值、比例、方差、比例、方差统计学统计学STATISTICS样本均值的抽样分布统计学统计学STATISTICS4 - 14n在重复选取容量为在重复选取容量为n的样本时,由样本均的样本时,由样本均值的所有可能取值形成的相对频数分布值的所有可能取值形成的相对频数分布n一种理论概率分布一种理论概率分布n推断总体均值推断总体均值 的理论基础的理论基础样本均值的抽样分布统计学统计学STATISTICS4 - 15样本均值的抽样

10、分布(例题分析)5 . 21NxNii25. 1)(122NxNii统计学统计学STATISTICS4 - 16样本均值的抽样分布 (例题分析)n3,4n3,3n3,2n3,1n3n2,4n2,3n2,2n2,1n2n4,4n4,3n4,2n4,1n4n1,4n4n1,3n3n2n1n1,2n1,1n1n第二个观察值第二个观察值n第一个第一个n观察值观察值n所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)统计学统计学STATISTICS4 - 17样本均值的抽样分布 (例题分析)3.53.02.52.0n33.02.52.01.5n24.03.53.02.5n42.5n42.0

11、n3n2n11.51.0n1n第二个观察值第二个观察值第一第一个个观察值观察值n16个样本的均值(个样本的均值(x)统计学统计学STATISTICS4 - 18样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)n根据表中数据求得根据表中数据求得 样本均值的均值为:样本均值的均值为: 样本均值的方差为:样本均值的方差为:5.2160.45.10.11Mxxniix为样本数目MnMxxniix222122625. 016)5 . 20 . 4()5 . 20 . 1 ()(1. 样本均值的均值等于总体均值样本均值的均值等于总体均值 2. 样本均值的方差等于总体方差的样本均值的方差等于总体方差

12、的1/n统计学统计学STATISTICS4 - 19样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)5.2x625.02xP(X)X比较总体分布和比较总体分布和统计学统计学STATISTICS4 - 20样本均值抽样分布的形式与特征样本均值抽样分布的形式与特征总体分布总体分布抽样分布抽样分布x5x50 x5 . 2xP(X)样本均值样本均值样本均值样本均值的的n若若 统计学统计学STATISTICS4 - 21中心极限定理中心极限定理(central limit theorem) xn x 统计学统计学STATISTICS4 - 22中心极限定理 (central limit theo

13、rem)统计学统计学STATISTICS4 - 23抽样分布与总体分布的关系抽样分布与总体分布的关系正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布统计学统计学STATISTICS4 - 24n样本均值的数学期望样本均值的数学期望n样本均值的方差样本均值的方差n重复抽样重复抽样n不重复抽样不重复抽样样本均值的抽样分布(数学期望与方差)(xEnx22122NnNnx统计学统计学STATISTICS4 - 25样本比例的抽样分布在工程以及商务与经济管理中,许多情况下要用到比率估计;需要用到样本的比例去估计总体的比例。举例:在一批抽样的产品中,有合格的产品和不

14、合格的产品,其中合格产品和不合格产品的比率就是一个值得关注的统计量。适用于研究分类或定型的变量。统计学统计学STATISTICS4 - 26n比例比例(proportion)是是总体或样本中具有某种属性的单总体或样本中具有某种属性的单位数与全部单位总数之比。位数与全部单位总数之比。n总体比例可表示为总体比例可表示为n样本比例可表示为样本比例可表示为n总体或样本中具有某种特征的单位数服从二项分布。总体或样本中具有某种特征的单位数服从二项分布。样本比例的抽样分布样本比例的抽样分布NNNN101或nnpnnp101或统计学统计学STATISTICS4 - 27n样本比例的抽样分布是容量相同的所有可样

15、本比例的抽样分布是容量相同的所有可能样本的样本比例的概率分布能样本的样本比例的概率分布n当样本容量很大时,样本比例的抽样分布当样本容量很大时,样本比例的抽样分布可用正态分布近似可用正态分布近似n是一种理论概率分布是一种理论概率分布n是推断总体比例的理论基础是推断总体比例的理论基础样本比例抽样分布的性质及特点样本比例抽样分布的性质及特点统计学统计学STATISTICS4 - 28n样本比例的数学期望样本比例的数学期望n样本比例的方差样本比例的方差重复抽样重复抽样不重复抽样不重复抽样样本比例的数学期望与方差样本比例的数学期望与方差 (简单随机样本简单随机样本))(pEnP)1 (2NnnNnNnP

16、1)1 (1)1 (2统计学统计学STATISTICS4 - 29样本方差的抽样分布22/) 1(sn 用样本方差去推断总体方差,就必须知道样本用样本方差去推断总体方差,就必须知道样本方差的分布。方差的分布。 在重复选取容量为在重复选取容量为n的样本时,由样本方查所的样本时,由样本方查所有可能值形成的频数分布就是样本方差的抽样分有可能值形成的频数分布就是样本方差的抽样分布。统计证明:对于来自正态总体的简单随机样布。统计证明:对于来自正态总体的简单随机样本,比值:本,比值:的抽样分布服从自由度为的抽样分布服从自由度为(n-1)的的 2的分布的分布) 1() 1(222nsn统计学统计学STATI

17、STICS4 - 30 分布由阿贝分布由阿贝( (AbbeAbbe) ) 于于18631863年首先给出,后来年首先给出,后来由海尔墨特由海尔墨特( (HermertHermert) )和卡和卡皮尔逊皮尔逊( (KPearsonKPearson) ) 分别于分别于18751875年和年和19001900年推导出来年推导出来u设设 x x N(N( , 2 2),则,则u令令 Y=ZY=Z2 2 ,则,则 Y Y 服从自由度为服从自由度为1 1的的 2 2分布,即分布,即 u当总体当总体 X X N(N( , 2 2), ,从中抽取容量为从中抽取容量为n n的样本,则的样本,则 2分布分布) 1

18、 , 0(2NxZ) 1 (2Y) 1(2212nxxnii)(2统计学统计学STATISTICS4 - 312分布 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2 = (n-1)s2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布总体总体统计学统计学STATISTICS五、两个总体的抽样分布五、两个总体的抽样分布两个总体的样本均值之差的抽样分布两个总体的样本均值之差的抽样分布两个总体的样本比例之差的抽样分布两个总体的样本比例之差的抽样分布两个总体的样本方差比的抽样分布(略)两个总体的样本方差比的抽样分布

19、(略)统计学统计学STATISTICS4 - 33问题的提出问题的提出n实际问题中实际问题中, ,我们需要研究两个总体的我们需要研究两个总体的比较问题比较问题, ,这就需要进一步研究两总体这就需要进一步研究两总体均值之差,两总体比例之差,两总体方均值之差,两总体比例之差,两总体方差之比。差之比。n研究两总体均值之差,需要了解样本均研究两总体均值之差,需要了解样本均值的分布。值的分布。n设从两个总体中分别独立地抽取样本容设从两个总体中分别独立地抽取样本容量为量为n1n1和和n2n2的样本,由两个样本均值之的样本,由两个样本均值之差的所有可能取值形成的相对频数分布。差的所有可能取值形成的相对频数分

20、布。统计学统计学STATISTICS4 - 34n 若两个总体都为正态分布,即若两个总体都为正态分布,即 则可以证明,抽自两个总体的两个样本的均值之差则可以证明,抽自两个总体的两个样本的均值之差 的抽样分布服从正态分布的抽样分布服从正态分布n其分布的数学期望为两个总体均值之差其分布的数学期望为两个总体均值之差1.1.其方差为各自的方差之和其方差为各自的方差之和 两个总体的样本均值之差的抽样分布两个总体的样本均值之差的抽样分布),(NX2111),(NX222221xx 2121)xx(E222121221nnxx统计学统计学STATISTICS4 - 35两个样本均值之差的抽样分布两个样本均值

21、之差的抽样分布 总体总体1 总体总体2抽取简单随机样抽取简单随机样本,样本容量本,样本容量 n1计算计算x1抽取简单随机样抽取简单随机样本,样本容量本,样本容量 n2计算计算x2计算每一对样本计算每一对样本的的x1-x2所有可能样本所有可能样本的的X1-X2 1 1 2 2统计学统计学STATISTICS4 - 36n若两个总体都服从二项分布,若两个总体都服从二项分布,则可以证明,则可以证明,分别从分别从两个总体中抽取容量为两个总体中抽取容量为n1和和n2的独立样本,当两个的独立样本,当两个样本都为大样本时,两个样本比例之差样本都为大样本时,两个样本比例之差p1-p2的抽样的抽样分布可用正态分

22、布来近似分布可用正态分布来近似n其分布的数学期望为总体比例之差其分布的数学期望为总体比例之差1.其方差为各自的方差之和其方差为各自的方差之和 两个总体的样本比例之差的抽样分布两个总体的样本比例之差的抽样分布2121)pp(E22211121121n)(n)(pp统计学统计学STATISTICS4 - 37两个样本均值之差的抽样分布两个样本均值之差的抽样分布u 两个总体都为正态分布,即:两个总体都为正态分布,即: u 两个样本均值之差两个样本均值之差 的抽样分布服从正的抽样分布服从正态分布,其分布的数学期望为两个总体均值态分布,其分布的数学期望为两个总体均值之差:之差:u 方差为各自的方差之和方差为各自的方差之和 21XX ),(),(22222111NXNX,2121)( xxE222121221nnxx统计学统计学STATISTICS4 - 38 总体总体1 总体总体2计算每一对样本的计算每一对样本的 1 1 2 2xx21xx21抽取简单随机样本抽取简单随机样本x2、样本容量、样本容量 n2 计算计算抽取简单随机样本抽取简单随机样本x1、样本容量、样本容量 n1 计算计算所有可能样本的所有可能样本的两个样本均值之差的抽样分布两个样本均值之差的抽样分布统计学统计学STATISTICS4 - 39即:),(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论