版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、抽样的类型3(一)非概率抽样31.非随机抽样的含义3(二)概率抽样52.概率抽样的程序5(三)多段抽样7二、简单随机抽样(SRS)8(四)抽样方案设计8(五)抽选方法8三、分层随机抽样11四、比率估计的性质14(六)比率估计的近似方差15(七)分层随机抽样下的比率估计16(八)比估计量与回归估计量的比较:19五、样本量在各层的分配19(九)比例分配19(十)最优分配20(十一)Neyman(内曼)分配21(十二)样本量的确定21一、 抽样的类型(一) 非概率抽样 主要依据研究者的主观意愿、判断或是否方便等因素抽取样本;误差大,难以估计,代表性小,适合探索性研究。主要有:偶遇抽样、判断抽样、
2、定额抽样、雪球抽样1. 非随机抽样的含义 它是在不确定总体中,按照非随机原则选取样本,并用这部分样本指标的调查结果,来判断总体指标的一种抽样类型。 非随机抽样的范围.当对调查的总体不够清楚,或者太复杂,不适于采取随机抽样时,那么,就需要用非随机抽样来抽出样本; .适用于经常性的调查和方便灵活的调查。a) 偶遇抽样方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。或者说研究可以得到的一组个体.适用范围(1)可用于经常性的市场调查;(2)可用于正式市场调查之前 的试验调查;(3)任意调查适用于同质总体。 优点:方便
3、、灵活,简便易行,及时取得所需资料,节约时间和费用成本低缺点:因为个体差异性,抽样误差很大,结果不够可靠,应用价值较低b) 判断抽样研究者根据研究目标和自己的主观分析来选择和确定他们认为可以提供所需要信息的人作为样本。含义:又称立意抽样法,它是指由市场调查的专家依据自己的判断来选取样本的一种方法。适用范围:总体的构成单位差异较大而样本数又很小的情况 优点:因为是按照调查人员的需要来选定样本,所以较好地满足了特殊的调查需要。 缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。采用判断抽样法应注意的问题:一要选好专家,二要应极力避免挑选极端情况的样本,“多数型”、“
4、平均型”两种具体做法 专家判断选择样本 : 平均型 统计判断选择样本: 多数型利用调查总体的全面统计资料,按照一定的标准选择样本如进行现场访问,任意选择一群消费者或者营业人员进行谈话,了解他们对商品质量的看法或购买动向。举例:在街头向过路行人做访问调查;上门对一栋大楼内的每个公司进行访问式调查;在柜台销售商品过程中向购买者做询问调查等(样本的选取完全随调查人员的方便而定)理论依据:认为被调查的母体中的每一个个体都是相同的注意:适用于非正式的探测性调查,或调查前的准备工作。配额抽样法和判断抽样法既有联系又有区别二者的联系是:配额抽样实质是一种“分层”判断抽样。二者的区别是:抽取样本的方式不同:
5、a配额抽样是分别从各个控制特征的层次抽取若干个样本 b判断抽样是从总体中的某一层次中抽取若干个符合条件的典型样本二者的侧重点不同; a配额注重“量”的分配 b判断抽样注重“质”的分配复杂程度不同: a配额抽样方法复杂精密 b判断抽样方法简便易行2.适用范围:通常适用于小型的市场调查3.步骤: (1)选择“控制特征”作为细分总体的标准; (2)将总体按“控制特征”组成 若干子总体; (3)决定各子总体样本的大小; (4)选择样本单位。c) 雪球抽样在无法了解总体情况时,从少数成员入手调查并询问其他符合条件的人,再找这些人所知道的人。(二) 概率抽样 依据概率论的基本原理,按照随机原则进行抽样;主
6、要有:简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样2. 概率抽样的程序1。界定总体:范围与界限2。制定抽样框:收集总体中全部抽样单位的名单,并对名单统一编号。分段、分层抽样时则要分别建立起几个不同的抽样框3。决定抽样方案:确定抽样方法、样本规模、主要目标量的精确程度4。实际抽取样本:按照选定方法从抽样框中抽取一个个抽样单位,构成样本5。评估样本质量:质量、代表性、偏差将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标进行对比。d) 简单随机抽样单纯随机抽样:按照等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(Nn)。常用的方法:抽签、随机数字表优点:可能产
7、生代表性样本缺点:不容易做1.编号难2.必须能够接触到被选中的个体3.成分比例难e) 分层抽样将总体中的所有单位按照某种特征或标志划分为若干类型或层次,在每个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本,共同构成研究的样本.优点:1.在不增加样本规模的前提下降低抽样误差,提高抽样精度,增大代表性2.便于了解总体内不同层次的情况,以及对总体中的不同层次进行单独研究或者进行比较.注意:1.分层的标准问题2.分层的比例问题f) 系统抽样等距抽样或机械抽样,将总体的单位编号排序后,按照固定的间隔抽取个体组成样本的方法.步骤:1.制定抽样框2.计算抽样间隔:K=N/n3.在第一组K个个体中
8、随机抽取一个个体A.4.在抽样框中每隔K个个体抽取一个个体.5.将n个个体合起来构成样本.优点:简便易行条件:抽样框应该是随机排列的.注意2种情况:1.抽样框中的个体排列具有某种次序或等级2.抽样框中的个体排列具有与抽样间隔对应的周期性分布.整群抽样从总体中随机抽取一些小群体,将小群体的所有元素构成样本.对小群体的抽取可采用简单随机抽样、系统抽样、分层抽样的方法。优点:1。简化抽样过程2。降低收集资料的费用3。扩大抽样范围缺点:代表性比较差(三) 多段抽样g) 多阶段抽样多级抽样或分段抽样,按照抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。步骤:1。以大群为单位编制抽样框2。抽取若
9、干大群3。以小群为单位给每个大群编制抽样框4。分别从每个大群中抽取小群5。根据需要重复3、4步骤6。得到基本元素,构成研究样本优点:方便易行二、 简单随机抽样(SRS)(四) 抽样方案设计 n 第一、确定抽样调查的目的、任务和要求;n 第二、确定调查对象的范围和抽样单位;n 第三、确定抽取样本方法;n 第四、对主要抽样指针的精度提出要求;确定必 要的样本数;n 第五、确定总体目标量的估算方法;n 第六、制订实施总体方案的办法和步骤。 n 简单随机抽样的抽取原则:n (1)按随机原则取样;n (2)每个抽样单元被抽中的概率都是已知的或事先确定的;n (3)每个抽样单元被抽中的概率都是相等的。n
10、在实际工作中,更多的采用不放回简单随机抽样。符号 n 大写符号表示总体的标志值,n 用小写符号表示样本的标志值 (五) 抽选方法n 1抽签法n 2随机数法随机数表、随机数骰子、摇奖机、计算机产生的伪随机数 随机数表法:N=327 n5讨论: (1) 总体编号为135,在0099中产生随机数,若=00或>35,则抛弃重抽。 (2) 总体编号为135,在0099中产生随机数,以除以35,余数作为被抽中的数,如果余数为0,则被抽中的数为35。A. 对总体均值的估计以样本均值作为总体均值的估计n 性质1:对于简单随机抽样,是无偏估计。 对于有限总体的方差定义 :n 性质2:对于简单随机抽样, 的
11、方差式中: 为抽样比, 为有限总体校正系数。 n 性质3: 的样本无偏估计为: 大样本下,抽样调查估计量渐进正态 B. 对总体总量的估计 C. 三、对总体比例的估计 n 某一类特征的单元占总体单元数中的比例P.n 将总体单元按是否具有这种特征划分为两类,设总体中有个单元具有A这个特征,如果对每个单元都定义指标值n 总体方差: 估计量 n 性质5:对于简单随机抽样, 是 P 的无偏估计。 的方差为三、 分层随机抽样 分层原则:n 1.估计:层内单元具有相同性质,通常按调查对象的不同类型进行划分。n 2.精度:尽可能使层内单元的指标值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。n
12、 3.估计和精度:既按类型、又按层内单元指标值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。n 4.实施:抽样组织实施的方便,通常按行政管理机构设置进行分层。符号说明 (关于第h层的记号 )单元总数样本单元数第 个单元的值层权抽样比总体均值样本均值总体方差样本方差第 I 条 对总体均值的估计n 分层样本,总体均值 的估计n分层随机样本,总体均值 的简单估计 估计量的性质 n 性质1:对于一般的分层抽样,如果是的无偏估计( ),则是 的无偏估计。的方差为: 性质2:对于分层随机抽样, 是 的无偏估计, 的方差为: 性质3:对于分层随机抽样, 的一个无偏估计为:第 II 条
13、对总体总量的估计总体总量 的估计为如果得到的是分层随机样本,则总体总量的简单估计为: 性质4:对于一般的分层抽样,如果是的无偏估计,则 是 的无偏估计。 的方差为:n 性质5:对于分层随机抽样, 的方差为n 性质6:对于分层随机抽样, 的一个无偏估计为: 第 III 条 对总体比例的估计 总体比例P的估计为: 性质7:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计的方差为:n 性质8:对于分层随机抽样, 是 的无偏估计, 因而 的方差为:n 性质9:对于分层随机抽样, 的一个无偏估计为:四、 比率估计的性质偏倚量会小,如果:· 样本量n 很大·抽样比n/N很大
14、183; 很大· S x很小· 相关系数R接近于1 (六) 比率估计的近似方差 1.与简单估计的比较简单估计量无偏,而比率估计量渐近无偏。因此这里只比较当比较大的情形。比率估计量优于简单估计量的条件是: (七) 分层随机抽样下的比率估计 如果各层的样本量不小的话,则可以采用各层分别进行比率估计,将各层加权汇总得到总体指标的估计,这种方式称为分别比率估计量。separate ratio estimator .(h=1,2,.L)n 分别比率估计量要求每一层的样本量都比较大,如果达不到这个要求,则它的偏倚可能比较大,这时使用联合比率估计量。 combined ratio est
15、imator 方差的比较如果每一层样本量都比较大,各层R相差较大,则分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。回归估计应用的两种情况: 事先确定设的确定值为,是一常数,则: (1)有样本估计分层抽样中的回归估计a) 分别回归估计当可以事先确定时,与都是无偏估计的,且在时达到最小值 当不能事先确定时,当 较大时,b) 联合回归估计 当事先设定 当不能事先设定无法事先设定时,(八) 比估计量与回归估计量的比较:已知: 五、 样本量在各层的分配 n 确定样本量:总的样本量,各层样本量n 估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。n 实际工作中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可以采用使估计量总方差达到最小、费用最小。 (九) 比例分配 n 按各层单元数占总体单元数的比例,也就是按各层的层权进行分配. n 对于分层随机抽样,这时总体均值的估计是n 总体比例的估计是 (十) 最优分配 一)最优分配n 在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差达到最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论