版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章简单随机抽样
2.1定义和符号2.2简单估计量及其性质2.3比率估计量及其性质2.4回归估计量及其性质2.5简单随机抽样的实施简单随机抽样用于估计总体均值的统计量是样本均值。-两者同形同构之意直接从总体(而不是层之间的子总体)抽取单元(而不是一群个体的大单元)-单纯之意在任何其他概率抽样方式或多或少包含简单随机抽样的成分,如分层抽样在每层内部均采用简单随机抽样,整群抽样以群为单位进行简单随机抽样。-基本之意许多日常场合,采用的抓阄摇号等都是简单随机抽样。-操纵简单之意2.1定义和符号所讨论的总体是抽样总体(实查总体):(1)具体总体(2)有限总体(3)与抽样框存在一一对应关系单元:指构成抽样总体的抽样单元。抽样单元并不总是等于个体,有时可能包括几个或很多个个体,个体为最小的不可再分的单元2.1定义和符号书上,简单随机抽样三个等价定义:设有限总体共有N个单元,一次整批取n各单元,使每个单元被抽中的概率相等,任何n个单元被抽中的概率也相等逐个不放回抽取单元,每次抽取到尚未入群的任何一个单元的概率都相等,直到抽足n个单元为止抽取n个单元的所有不同组合构造所有可能的
个样本,从这个样本中随机抽取1个样本,使每个样本被抽中的概率都等于2.1定义和符号简单随机抽样设有限总体共有N个单元,从中抽取容量为n个单元组成样本,使得每一个可能的样本都有相同的概率被抽中,这种抽样方法就是简单随机抽样(simplerandomsampling)。具体抽样时,通常是逐个抽取样本单元,直到抽满n个单元为止。简单随机抽样分为:有放回抽样和无放回抽样(with/withoutreplacement)放回简单随机抽样在每次抽取样本单元时,都将前一次抽取的样本单元放回总体,因此,总体的结构不变,抽样是相互独立进行的,每个样本被抽中的概率为1/N.在不放回简单随机抽样中,每个被抽中的单元不再放回总体,而是从总体剩下的单元中进行抽样,因此,每次抽样时总体中单元个数不同,抽样是不独立的,但可以证明每个单元被抽中的概率仍然为1/N。2.1定义和符号2.1定义和符号设总体有5个单元(1、2、3、4、5),按放回简单随机抽样的方式抽取2个单元,则所有可能的样本为个(考虑样本单元的顺序):1,12,13,14,15,11,22,23,24,25,21,32,33,34,35,31,42,43,44,45,41,52,53,54,55,5例1:放回简单随机抽样2.1定义和符号
设总体有5个单元(1、2、3、4、5),按不放回简单随机抽样的方式抽取2个单元,则所有可能的样本为个1,22,33,44,51,32,43,5
1,42,5
1,5
例2.不放回简单随机抽样2.1定义和符号简单随机抽样的抽取原则:(1)按随机原则取样;(2)每个抽样单元被抽中的概率都是已知的或事先确定的;(3)每个抽样单元被抽中的概率都是相等的不放回简单随机抽样的样本量要受总体大小的限制。在实际工作中,更多的采用不放回简单随机抽样。2.1定义和符号-约定大写表示总体-小写表示样本
2.2简单估计量及其性质总体均值样本均值总体均值的简单估计量总体总值样本总值总体总值的简单估计量为
简单估计量总体方差样本方差修正总体方差修正样本方差
简单估计量总体比例(rate)样本比例总体比率(ratio)样本比率简单估计量某一类特征的单元占总体单元数中的比例P
总体中具有研究特征的单元总数总体中具有研究特征的比例总体比例P的估计为(比例估计化为均值估计)简单估计量判断下面要估计的总体目标量分别属于什么类型?调查城市居民家庭平均用电量。估计湖中鱼的数量。估计居民家庭用于做饭菜及饮用的用水量占家庭总用水量的比重。检测食盐中碘含量。估计婴儿出生性别比。
简单估计量例3.设总体为{0,1,3,5,6},计算总体均值=3、总体方差和;给出全部的样本
验证及。
1010.5-2.50.52031.5-1.54.53052.5-0.512.540630185132-126153087163.50.512.58354129364.51.54.510平均565.52.50.5
306.5
方差1.95
样本编号单元1单元2样本均值样本方差简单估计量
一、对总体均值的估计引理2.1:从N个总体中抽取n个简单随机样本,则总体中每个特定单元人样的概率为n/N,两个特定单元人样的概率为简单估计量的性质
引理2.2:在简单随机抽样中,引入随机变量则
样
样
2.2简单估计量及其性质
一、对总体均值的估计以样本均值作为总体均值的估计定理2.1:对于简单随机抽样,是的无偏估计。
2.2简单估计量及其性质证法1:对于固定的有限总体,估计量的期望是对所有可能样本求平均得到的,因此总体中每个特定的单元在不同的样本中出现的次数。
2.2简单估计量及其性质证法2:由于每个单元出现在总体所有可能样本中的次数相同,因此一定是的倍数,且这个倍数就是,
2.2简单估计量及其性质推论2.1:对于简单随机抽样,
的期望推论2.2:对于简单随机抽样,
的期望推论2.3:对于简单随机抽样,n较大时,
的期望为2.2简单估计量及其性质对于有限总体的方差定义:定理2.2:对于简单随机抽样,的方差式中:为抽样比(例),为有限总体校正系数。
2.2简单估计量及其性质证明(对称论证法):
中的求和是对项的,中的求和是对项的2.2简单估计量及其性质
证法三:
其中
样
样
2.2简单估计量及其性质2.2简单估计量及其性质法二:总体方差修正总体方差
简单估计量推论2.4:对于简单随机抽样,
的方差为:推论2.5:对于简单随机抽样,
的方差为:推论2.6:对于简单随机抽样,n较大时,
的方差为2.2简单估计量及其性质对于有限总体的两个指标的协方差定理2.3:对于简单随机抽样,的方差式中:
为总体协方差。(证略)2.2简单估计量及其性质简单随机抽样下,简单估计量估计精度影响因素:
-估计量的方差是衡量估计量精度的度量。影响估计量方差的因素主要是样本量n,总体大小N和总体方差。通常N很大,当f<0.05时,可将近似取为1。总体方差是我们无法改变的;因此,在简单随机抽样的条件下,只有通过加大样本量来提高估计量的精度。
2.2简单估计量及其性质定理2.4:简单随机样本的方差,
是总体方差S2的无偏估计.
证明:2.2简单估计量及其性质推论2.7:对于简单随机抽样,是的无偏估计推论2.8:对于简单随机抽样,是的无偏估计2.2简单估计量及其性质推论2.9:对于简单随机抽样,是的无偏估计推论2.10:对于简单随机抽样,n较大时,有
2.2简单估计量及其性质大样本下,抽样调查估计量渐进正态
总体均值的置信度为
置信区间其中为标准误差2.2简单估计量及其性质例4:我们从某个=100的总体中抽出一个大小为=10的简单随机样本,要估计总体平均水平并给出置信度为95%的区间估计。序号12345678910452046615082.2简单估计量及其性质由置信度95%对应的,因此,可以以95%的把握说总体平均水平大约在之间,即2.4295和7.5705之间。2.2简单估计量及其性质例5:某学院共有1200名学生,现欲调查学生平均每月的伙食支出,采用了简单随机抽样的方法抽取了65名学生作调查,得到数据如下:要求以95%的置信度估计出该学院学生平均每月伙食费支出的置信区间2.2简单估计量及其性质有放回简单随机抽样2.2简单估计量及其性质二、对总体总(值)量的估计
总体总值总体总值的样本估计量总体总值的样本估计量的方差用样本代替2.2简单估计量及其性质例6:续例4.估计总体总量,并给出在置信度95%的条件下,估计的极限相对误差。在置信度95%下,的极限相对误差为:2.2简单估计量及其性质三、对总体比例的估计
某一类特征的单元占总体单元数中的比例P.
2.2简单估计量及其性质总体方差:
2.2简单估计量及其性质例:某超市新开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度,该超市与附近几个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个大小为=200人的样本,调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%下,给出估计的近似置信区间、极限绝对误差。假定这时的抽样比可以忽略。2.2简单估计量及其性质95%近似置信区间为〔58.37%,71.63%〕2.2简单估计量及其性质2.3比率估计量及其性质主要变量的总体均值的比率估计量:主要变量的总体均值Y的比率估计量:引理2.3:对于简单随机抽样,n较大时,的期望为:例:设所有可能样本数为8个不是无偏的I11112240.53250.44350.65360.56360.57480.586130.46平均360.562.3比率估计量及其性质定理2.6:对于简单随机抽样,n较大时,的期望为:推论2.11:对于简单随机抽样,n较大时,的期望为2.3比率估计量及其性质引理2.4:对于简单随机抽样,n较大时,的方差为:其中,2.3比率估计量及其性质定理2.7:对于简单随机抽样,n较大时,的方差为推论2.12:对于简单随机抽样,n较大时,的方差为2.3比率估计量及其性质很难比较哪种方法好两套公式2.3比率估计量及其性质2.5简单随机抽样的实施方法
样本容量的确定原理当n越接近于N,则抽样误差就越接近于零。公式影响样本容量n的三个基本因素:总体规模N,目标抽样误差和总体方差S2未知另一方面,目标抽样误差与总体方差S2有关估计的精度水平,误差限度(绝对误差限度d或相对误差限度r)和置信度有关系:即:于是影响样本容量n的因素:总体规模N,置信度绝对误差限度d和总体方差S22.5简单随机抽样的实施方法例:表:例:表:d0.140.100.040.03n4995566964S200.090.160.210.240.25n1136243133563702.5简单随机抽样的实施方法例:表:不同抽样方式会影响样本容量–设计效应一般地,不能得到有效信息的原因有:抽样框存在缺陷受访者调查期间不在访问员的疏失设计和管理上的缺陷(不总是可以完全避免)N501005001000n44792172782.5简单随机抽样的实施方法样本量的确定步骤:确定估计的精度水平,包括误差限度(绝对误差限度d或相对误差限度r)和置信度按照保守(样本容量宁大勿小),预估S2
利用先前的调查结果和经验利用预调查结果利用同类或相似或有关的二手数据的结果利用某些理论上的结论(总体比例p(1-p)=0.25)利用有经验的专家的判断2.5简单随机抽样的实施方法最大绝对误差(绝对误差限)或最大相对误差(相对误差限)
相对误差限度r样本量:2.5简单随机抽样的实施方法初始样本量n0计算:确定抽样方式,调整样本容量,设计效应deff=任意抽样方式抽样方差/简单随机抽样的抽样方差简单随机抽样:deff=1分层抽样:deff<1--效率高整群抽样:deff>1--效率低
系统抽样:deff≈12.5简单随机抽样的实施方法
Deff(基什L.Kish提出)的作用:评价抽样设计的一个依据,如果deff<1--比简单随机抽样的效率高;如果deff>1--比简单随机抽样的效率低计算样本量如多阶段抽样的Deff大约在2~2.5之间。
n=n’(deff)n’为简单随机抽样所需样本量。
2.5简单随机抽样的实施方法放回简单随机抽样的deff为:常用于复杂抽样样本量的确定;在一定精度条件下,简单随机抽样所需的样本量比较容易得到,复杂抽样的样本量为,
2.5简单随机抽样的实施方法5.判定回答率,调整样本容量6.对分组数据分别计算样本量,再相加得到总样本容量。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 劳动仲裁调解协议书7篇
- 商业合伙人的协议书
- 传统民间工艺品-捏面人简介
- (参考模板)三通项目立项报告
- 第三次月考试卷-A4
- 重庆2020-2024年中考英语5年真题回-教师版-专题08 阅读理解之记叙文
- 电能表安06课件讲解
- 2023年抗甲状腺药项目融资计划书
- 国华电力危险化学品安全管理培训课件
- PLC控制技术试题库(附参考答案)
- 李商隐诗歌《锦瑟》课件
- 世界文化遗产-乐山大佛课件
- 2022小学一年级数学活用从不同角度解决问题测试卷(一)含答案
- 博尔赫斯简介课件
- 2021年山东交投矿业有限公司招聘笔试试题及答案解析
- 施工单位资料检查内容
- 大气课设-酸洗废气净化系统
- 学校校庆等大型活动安全应急预案
- 检测公司检验检测工作控制程序
- 高血压病例优秀PPT课件
- 精密电主轴PPT课件
评论
0/150
提交评论