




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 7 章 抽样与估计 (1)7.1 概率抽样方法7.2 三种不同性质的分布 7.3 一个总体参数推断时样本统计量分布7.4 两个总体参数推断时样本统计量分布学习目的了解抽样的概率抽样方法区分总体分布、样本分布、抽样分布了解抽样分布与总体分布的关系掌握单总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布7.1 概率抽样方法7.1.1 简单随机抽样7.1.2 分层抽样7.1.3 系统抽样7.1.4 整群抽样抽样方法概率抽样(probability sampling)根据一个知的概率来抽取样本单位,也称随机抽样特点按一定的概率以随机原那么抽取样本抽取样本时使每个单位都有一定的时机被
2、抽中每个单位被抽中的概率是知的,或是可以计算出来的 当用样本对总体目的量进展估计时,要思索到每个样本单位被抽中的概率简单随机抽样(simple random sampling)从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为样本都有一样的时机(概率)被抽中 抽取元素的详细方法有反复抽样和不反复抽样特点简单、直观,在抽样框完好时,可直接从中抽取样本用样本统计量对目的量进展估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查添加了困难没有利用其他辅助信息以提高估计的效率分层抽样(stratified sampling)将总体单位按某种特征或某种规那么划分为不同的层,
3、然后从不同的层中独立、随机地抽取样本优点保证样本的构造与总体的构造比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进展估计,也可以对各层的目的量进展估计系统抽样(systematic sampling)将总体中的一切单位(抽样单位)按一定顺序陈列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规那么确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,可提高估计的精度缺陷:对估计量方差的估计比较困难整群抽样(cluster sampling)将总体中假设干个单位合并为组(群),抽样时直接抽取群,然后对中选
4、群中的一切单位全部实施调查特点抽样时只需群的抽样框,可简化任务量调查的地点相对集中,节省调查费用,方便调查的实施缺陷是估计的精度较差多阶段抽样(multi-stage sampling)先抽取群,但并不是调查群内的一切单位,而是再进展一步抽样,从选中的群中抽取出假设干个单位进展调查群是初级抽样单位,第二阶段抽取的是最终抽样单位。将该方法推行,使抽样的段数增多,就称为多阶段抽样具有整群抽样的优点,保证样本相对集中,节约调查费用需求包含一切低阶段抽样单位的抽样框;同时由于实行了再抽样,使调查单位在更广泛的范围内展开在大规模的抽样调查中,经常被采用的方法 非概率抽样(non-probability
5、sampling)相对于概率抽样而言抽取样本时不是根据随机原那么,而是根据研讨目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查有方便抽样、判别抽样、自愿样本、滚雪球抽样、配额抽样等方式 方便抽样调查过程中由调查员根据方便的原那么,自行确定入抽样本的单位调查员在街头、公园、商店等公共场所进展拦截调查厂家在出卖产品柜台前对路过顾客进展的调查优点:容易实施,调查的本钱低缺陷:样本单位确实定带有随意性,样本无法代表有明确定义的总体,调查结果不宜推断总体判别抽样研讨人员根据阅历、判别和对研讨对象的了解,有目的选择一些单位作为样本有重点抽样,典型抽样,代表抽样等方式判别抽样是客观的,样本选择
6、的好坏取决于调研者的判别、阅历、专业程度和发明性抽样本钱比较低,容易操作样本是人为确定的,没有根据随机的原那么,调查结果不能用于对推断总体自愿样本被调查者自愿参与,成为样本中的一分子,向调查人员提供有关信息例如,参与报刊上和互联网上刊登的调查询卷活动,向某类节目拨打热线等,都属于自愿样本自愿样本与抽样的随机性无关样本是有偏的不能根据样本的信息推断总体滚雪球抽样先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研讨总体的调查对象,调查人员根据所提供的线索,进展以后的调查。这个过程继续下去,就会构成滚雪球效应适宜于对稀少群体和特定群体研讨优点:容易找到那些属于特定群体的被调查者,调查的
7、本钱也比较低配额抽样先将体中的一切单位按一定的标志(变量)分为假设干类,然后在每个类中采用方便抽样或判别抽样的方式选取样本单位操作简单,可以保证总体中不同类别的单位都能包括在所抽的样本之中,使得样本的构造和总体的构造类似抽取详细样本单位时,不是根据随机原那么,属于非概率抽样 概率抽样与非概率抽样的比较概率抽样根据随机原那么抽选样本样本统计量的实际分布存在可根据调查的结果推断总体非概率抽样不是根据随机原那么抽选样本样本统计量的分布是不确定的无法运用样本的结果推断总体7.2 三种不同性质的分布7.2.1 总体分布7.2.2 样本分布7.2.3 抽样分布总体中各元素的察看值所构成的分布 分布通常是未
8、知的可以假定它服从某种分布 总体分布(population distribution)总体一个样本中各察看值的分布 也称阅历分布 当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布(sample distribution)样本样本统计量的概率分布,是一种实际分布在反复选取容量为n的样本时,由该统计量的一切能够取值构成的相对频数分布 样本统计量是随机变量样本均值, 样本比例,样本方差等结果来自容量一样的一切能够样本提供了样本统计量长久而稳定的信息,是进展推断的实际根底,也是抽样推断科学性的重要根据 抽样分布 (sampling distribution)抽样分布的构成过程 (sampl
9、ing distribution)总体计算样本统计量如:样本均值、比例、方差样本7.3 样本统计量的抽样分布 (一个总体参数推断时)7.3.1 样本均值的抽样分布7.3.2 样本比例的抽样分布7.3.3 抽样方差的抽样分布样本均值的抽样分布在反复选取容量为n的样本时,由样本均值的一切能够取值构成的相对频数分布一种实际概率分布推断总体均值的实际根底样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差样本均值的抽样分布
10、 (例题分析) 现从总体中抽取n2的简单随机样本,在反复抽样条件下,共有42=16个样本。一切样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个察看值第一个察看值一切能够的n = 2 的样本共16个样本均值的抽样分布 (例题分析) 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个察看值第一个察看值16个样本的均值xx样本均值的抽样分布1.000.10.20.3P ( x )1.53.04.03.
11、52.02.5样本均值的分布与总体分布的比较 (例题分析) = 2.5 2 =1.25总体分布14230.1.2.3抽样分布P ( x )1.00.1.2.31.53.04.03.52.02.5x样本均值的抽样分布与中心极限定理 = 50 =10X总体分布n = 4抽样分布xn =16当总体服从正态分布N(,2)时,来自该总体的一切容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n)中心极限定理(central limit theorem)当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为,方差为 2的一个恣意总体中
12、抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布一个恣意分布的总体x中心极限定理 (central limit theorem)x 的分布趋于正态分布的过程抽样均值的抽样分布与 总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布样本均值的数学期望样本均值的方差反复抽样不反复抽样样本均值的抽样分布(数学期望与方差)样本均值的抽样分布(数学期望与方差)比较及结论:1. 样本均值的均值(数学期望) 等于总体均值 2. 样本均值的方差等于总体方差的1/n均值的抽样规范误差一切能够的样本均值的规范差,测度一切样本均值的离散程度也称规范
13、误差小于总体规范差计算公式为样本比例的抽样分布总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为比例(proportion)在反复选取容量为的样本时,由样本比例的一切能够取值构成的相对频数分布一种实际概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似 np 5, n(1-p) 5推断总体比例的实际根底样本比例的抽样分布样本比例的数学期望样本比例的方差反复抽样不反复抽样样本比例的抽样分布(数学期望与方差)样本方差的抽样分布样本方差的分布在反复选取容量为的样本时,由样本方差的一切能够取值构
14、成的相对频数分布对于来自正态总体的简单随机样本,那么比值 的抽样分布服从自在度为 (n -1) 的2分布,即由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson) 分别于1875年和1900年推导出来设 ,那么令 ,那么 Y 服从自在度为1的2分布,即 当总体 ,从中抽取容量为n的样本,那么2分布(2 distribution)2分布(2 distribution)分布的变量值一直为正 分布的外形取决于其自在度n的大小,通常为不对称的正偏分布,但随着自在度的增大逐渐趋于对称 期望为:E(2)=n,方差为:D(2)=2n(n为自在度) 可加性:假
15、设U和V为两个独立的2分布随机变量,U2(n1), V2(n2),那么U+V这一随机变量服从自在度为n1+n2的2分布 2分布(性质和特点)c2分布(图示) 选择容量为n 的简单随机样本计算样本方差s2计算卡方值2 = (n-1)s2/2计算出一切的 2值不同容量样本的抽样分布c 2n=1n=4n=10n=20 ms总体样本统计量的抽样分布样本统计量的抽样分布样本统计量样本均值样本比例 p样本方差 s2正态总体或非正态总体大样本非正态总体 小样本大样本 2分布正态分布正态分布非正态分布7.4 样本统计量的抽样分布 (两个总体参数推断时)7.4.1 两个样本均值之差的抽样分布7.4.2 两个样本
16、比例之差的抽样分布7.4.3 两个样本方差比的抽样分布两个样本均值之差的抽样分布两个总体都为正态分布,即 , 两个样本均值之差 的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差 方差为各自的方差之和 两个样本均值之差的抽样分布两个样本均值之差的抽样分布 m 1s 1总体1s 2 m 2总体2抽取简单随机样样本容量 n1计算x1抽取简单随机样样本容量 n2计算x2计算每一对样本的x1-x2一切能够样本的x1-x2m1 -m2抽样分布两个样本比例之差的抽样分布两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为方差为各自的方差之和 两个样本比例之差的抽样分布两个样本方差比的抽样分布两个样本方差比的抽样分布 两个总体都为正态分布,即X1N(1 ,12),X2N(2 ,22 )从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布,服从分子自在度为(n1-1),分母自在度为(n2-1) 的F分布,即 由统计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025珠海房屋租赁合同样本
- 采取多渠道营销拓展客户计划
- 增强教师的实践与创新能力计划
- 农村供水施工合同样本
- 提升团队灵活性与适应能力计划
- 写租赁合同标准文本
- 2025年合同履行中的附随义务版参考
- 儿子借款合同样本
- l工程劳务合同标准文本
- 企业间借款及担保合同样本
- 第四讲 坚持以人民为中心PPT习概论2023优化版教学课件
- 2023年新修订的事业单位工作人员考核规定课件PPT
- 小学社会主义核心价值观教育工作总结
- 礼仪课件 -仪态礼仪
- 情绪管理(中国人民大学)超星尔雅学习通章节测试答案
- 2023年安全质量的表态发言稿5篇
- 腰椎ODI评分完整版
- 长输管道施工工序
- 教学设计 《分数的基本性质》教学设计 全国公开课一等奖
- 骨盆与髋臼骨折
- 江苏码头工程防洪影响评价报告
评论
0/150
提交评论