版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、抽样与抽样分布讲义第1页,共53页,2022年,5月20日,14点28分,星期三学习目标了解抽样的概率抽样方法理解抽样分布的意义了解抽样分布的形成过程理解中心极限定理理解抽样分布的性质第2页,共53页,2022年,5月20日,14点28分,星期三3.1 常用的抽样方法 3.2 抽样分布3.3 中心极限定理的应用第3页,共53页,2022年,5月20日,14点28分,星期三抽样估计在统计方法中的地位统计方法描述统计推断统计抽样估计假设检验第4页,共53页,2022年,5月20日,14点28分,星期三 抽样推断: 按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征
2、作出具有一定可靠程度的估计和判断。抽样推断的特点:它是由部分推断整体的一种认识方法抽样推断建立在随机取样的基础上抽样推断运用概率估计的方法。抽样推断的误差可以事先计算并加以控制第5页,共53页,2022年,5月20日,14点28分,星期三 参数估计 参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。 假设检验 假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。抽样推断的内容第6页,共53页,2022年,5月20日,14点28分,星期三3.1 常用的抽样方法一、简单随机抽样二、分层抽样三、系统抽样四、整群抽样五、
3、多阶抽样第7页,共53页,2022年,5月20日,14点28分,星期三抽样的方式方法第8页,共53页,2022年,5月20日,14点28分,星期三概率抽样(probability sampling)根据一个已知的概率来抽取样本单位,也称随机抽样特点按一定的概率以随机原则抽取样本 抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率第9页,共53页,2022年,5月20日,14点28分,星期三抽样框与抽样单位 抽样框:为便于抽样工作的组织,在抽样前在可能条件下编制的用来进行抽样的记录或表明总体所
4、有抽样单元的框架。抽样框可以是一份清单(名单抽样框)、一张地图(区域抽样框),它是设计和实施随即抽样所必备的基础条件。 一个理想的抽样框的要求是,它应该尽可能地与目标总体相一致。 一般而言,如果总体中的每个元素在清单上分别只出现一次,且清单上又没有总体以外的其他元素出现,则该清单就是一个完备的抽样框。在完备的抽样框中,每个元素必须且只能同一个号码对应。第10页,共53页,2022年,5月20日,14点28分,星期三简单随机抽样(simple random sampling)从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为样本都有相同的机会(概率)被抽中 抽取元素的具体方法有重复抽样
5、和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率第11页,共53页,2022年,5月20日,14点28分,星期三分层抽样(stratified sampling)将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计第12页,共53页,2022年,5月20日,14点28分,星期三系统抽样
6、(systematic sampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难第13页,共53页,2022年,5月20日,14点28分,星期三整群抽样(cluster sampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施
7、缺点是估计的精度较差第14页,共53页,2022年,5月20日,14点28分,星期三二阶抽样与多阶段抽样(two&multi-stage sampling)将整个抽样过程分为两个或几个阶段,一个阶段一个阶段地将一种或多种抽样方式结合起来进行抽样的方式。特点适用于总体范围大,分布范围广,单位数目多;许多全国性的大规模抽样都采用,便于组织抽样方式灵活,有利于提高估计效率实际上是多种方式的组合抽样第15页,共53页,2022年,5月20日,14点28分,星期三3.2 抽样分布一、抽样分布的概念二、样本均值抽样分布的形式三、样本均值抽样分布的特征四、样本比率的抽样分布五、样本方差的抽样分布六、两个样本
8、统计量的抽样分布第16页,共53页,2022年,5月20日,14点28分,星期三抽样分布的概念 抽样调查的必要性告诉人们,在许多情况下不必要或不可能进行全面调查,这时,要了解总体的情况,只能由样本统计量估计总体参数。 第17页,共53页,2022年,5月20日,14点28分,星期三抽样分布的形成过程 (sampling distribution)总体计算样本统计量如:样本均值、比例、方差样本第18页,共53页,2022年,5月20日,14点28分,星期三统计量与抽样分布抽样分布:某一统计量所有可能的样本的取值形成的分布。性 质数字特征0P(Xi)1P(Xi)=1均值E(X) 方差Ex-E(x)
9、2第19页,共53页,2022年,5月20日,14点28分,星期三1、抽样分布: 全部可能样本统计量的频率分布叫做抽样分布。2、样本均值的抽样分布: 全部可能样本的平均数的概率分布。3、样本成数(比例)的抽样分布: 全部可能样本的成数的概率分布。抽样分布 (sampling distribution)第20页,共53页,2022年,5月20日,14点28分,星期三抽样分布 (sampling distribution)4、抽样分布的特征值统计量:即样本指标第21页,共53页,2022年,5月20日,14点28分,星期三 全部可能样本的平均数的概率分布 注意:1)在重复选取容量为n的样本时,由样
10、本均值的所有可能取值形成的相对频数分布2)一种理论概率分布3)推断总体均值的理论基础样本均值的抽样分布第22页,共53页,2022年,5月20日,14点28分,星期三样本均值的抽样分布(简称均值的分布)抽样总体样本 均值X,(N)均值=Xi/Nx,(n)样本均值是样本的函数,故样本均值是一个统计量,统计量是一个随机变量,它的概率分布称为样本均值的抽样分布。第23页,共53页,2022年,5月20日,14点28分,星期三样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下总
11、体分布14230.1.2.3均值和方差第24页,共53页,2022年,5月20日,14点28分,星期三样本均值的抽样分布 (例题分析) 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)第25页,共53页,2022年,5月20日,14点28分,星期三样本均值的抽样分布 (例题分析) 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.
12、524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P ( x )1.53.04.03.52.02.5第26页,共53页,2022年,5月20日,14点28分,星期三样本均值的分布与总体分布的比较 (例题分析) = 2.5 2 =1.25总体分布14230.1.2.3抽样分布P ( x )1.00.1.2.31.53.04.03.52.02.5x第27页,共53页,2022年,5月20日,14点28分,星期三x 的分布趋于正态分布的过程样本均值抽样分布的形式第28页,共53页,2022年,5
13、月20日,14点28分,星期三样本均值的抽样分布(数学期望与方差)比较及结论:1. 样本均值的均值(数学期望)等于总体均值 2. 样本均值的方差等于总体方差的1/n式中:M为样本数目第29页,共53页,2022年,5月20日,14点28分,星期三样本均值的数学期望1.根据平均数的定义2、在放回抽样条件下,各样本指标值相互独立,每个中选机会相等,概率均为/N第30页,共53页,2022年,5月20日,14点28分,星期三样本均值的数学期望样本均值的方差重复抽样不重复抽样样本均值的抽样分布(数学期望与方差)第31页,共53页,2022年,5月20日,14点28分,星期三抽样分布与总体分布的关系总体
14、分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布方差已知方差未知第32页,共53页,2022年,5月20日,14点28分,星期三抽 样 方 法 均 值 方 差 标 准差(1)从无限总体抽 样和有限总体放回抽样(2)从有限总体不放回抽样抽样误差抽样误差样本均值抽样分布的特征第33页,共53页,2022年,5月20日,14点28分,星期三样本比率的抽样分布 当总体中各元素只能以“成功”和“失败”表示时,用P表示“成功”的比率,(1-P)表示“失败”的比率。适用于品质变量样本比率(即成数)的抽样分布,简称比率的抽样分布(或成数的分布)。第34页,共53页,2022年,5月20日,14点2
15、8分,星期三总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比率可表示为样本比率可表示为比率(比例)(proportion)第35页,共53页,2022年,5月20日,14点28分,星期三抽样总体样本比率X,(N)比率x,(n) 所有可能的样本的比率( )所形成的分布,称为样本比率(成数)的抽样分布。样本比率(成数)的抽样分布的形成第36页,共53页,2022年,5月20日,14点28分,星期三在重复选取容量为的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时,样本比例的抽样分布可用正态
16、分布近似 推断总体比例的理论基础样本比例的抽样分布第37页,共53页,2022年,5月20日,14点28分,星期三样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比率的抽样分布(数学期望与方差)第38页,共53页,2022年,5月20日,14点28分,星期三 某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯的合格率和样本比率的方差。例题第39页,共53页,2022年,5月20日,14点28分,星期三样本方差的分布设总体服从正态分布N (,2 ), X1,X2,Xn为来自该正态总体的样本,则
17、样本方差 s2 的分布为将2(n 1)称为自由度为(n-1)的卡方分布第40页,共53页,2022年,5月20日,14点28分,星期三一个样本方差的抽样分布抽样总体样本从一个正态总体中抽样所得到的样本方差的分布n,S2则 当 第41页,共53页,2022年,5月20日,14点28分,星期三卡方 (c2) 分布 选择容量为n 的简单随机样本计算样本方差S2计算卡方值2 = (n-1)S2/2计算出所有的 2值不同容量样本的抽样分布c2n=1n=4n=10n=20 ms总体第42页,共53页,2022年,5月20日,14点28分,星期三T 统计量的分布 设X1,X2,Xn1是来自正态总体N(1,1
18、2 )的一个样本, 称为统计量,它服从自由度为(n-1)的t 分布Xt 分布与正态分布的比较正态分布t 分布t不同自由度的t分布标准正态分布t (df = 13)t (df = 5)Z第43页,共53页,2022年,5月20日,14点28分,星期三3.3 中心极限定理的应用第44页,共53页,2022年,5月20日,14点28分,星期三中心极限定理(central limit theorem)当样本容量足够大时(n 30) ,样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正
19、态分布一个任意分布的总体x第45页,共53页,2022年,5月20日,14点28分,星期三样本均值的抽样分布与中心极限定理 = 50 =10X总体分布n = 4抽样分布xn =16当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n)第46页,共53页,2022年,5月20日,14点28分,星期三中心极限定理 (central limit theorem)x 的分布趋于正态分布的过程第47页,共53页,2022年,5月20日,14点28分,星期三概率论证明:(结论)(1)当总体很大时,无论它呈现何种分布,只要样本容量n足够大,那么样本平均数的抽样分布,必定趋近于正态分布;(2)从正态总体中抽取的全部可能样本,无论样本容量有多大,样本平均数的抽样分布必定遵从于正态分布;即使是非正态总体,只要n30,其抽样分布必定趋近于正态分布;第48页,共53页,2022年,5月20日,14点28分,星期三(3)抽样分布的平均数等于总体平均数:(4)抽样分布的标准差比总体标准差小,仅为总体标准差的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多档定时器课程设计
- 课程设计发动机连杆
- 2024至2030年中国双色沾塑园林剪数据监测研究报告
- 2024至2030年中国EVA/ECB共挤防水板数据监测研究报告
- 社会保障课课程设计
- 高中英语微课程设计
- 培训班装饰绘画课程设计
- 工程水文课程设计文萍
- 2024年带灯按钮项目可行性研究报告
- 2024年全球卫星定位车载终端项目可行性研究报告
- 建设银行员工劳动合同
- 浙江大学学生社团手册(08)
- 水利水电工程专业毕业设计(共98页)
- 医院医用气体管路的设计计算(2014)
- 人教版统编高中语文“文学阅读与写作”学习任务群编写简介
- SQE质量月报参考格式
- 初中物理实验室课程表
- CTQ-2型支线接触网故障智能切除装置概述
- 砂石料取样试验标准与规范
- 运营管理已完毕第七讲库存
- 罗马数字对照表
评论
0/150
提交评论