版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章抽样设计相关基本的概念制定抽样计划的步骤概率抽样方法非概率抽样方法第十章抽样设计相关基本的概念本章学习目的了解抽样过程掌握各种抽样方法本章学习目的了解抽样过程本章学习重点与难点如何定义总体、确定抽样框科学确定样本容量恰当地选择抽样方法进行抽样本章学习重点与难点如何定义总体、确定抽样框一、相关基本概念(一)、总体(或全域)总体是统计研究对象的全体,它有许多元素(总体单位)构成,特点是:各个总体单位都有某种相同的特征把他们联系在一起,同时各个个体的某个特征之间又存在差异,这种统一和差异就构成了总体分布。抽样调查的目的往往是对总体分布的一些特征作出估计,因此抽样调查中首先遇到的是确定总体的问题。一、相关基本概念(一)、总体(或全域)1、
全及总体:目标总体。
所需研究的全部单位的集合体无论认识与否,所有符合规定属性或数量特征的单位合在一起就构成了一个全及总体。它是抽样调查推断的目标包括u有限总体与无限总体1、
全及总体:目标总体。
2、作业总体N:抽样总体即已被掌握和了解的,能按某一标志排列或已经编号的总体单位的集合,是抽取样本的来源和依据。
2、作业总体N:抽样总体
显然它是有限总体,它在范围上比全及总体受到较多的限制。可以等于,但一般小于全及总体。
由于样本来自于作业总体,因此结论也只适用于作业总体,因此要求作业总体尽可能接近全及总体。显然它是有限总体,它在范围上比全及总体受到较3、变量总体:总体单位的标志的性质为数量,如身高、收入、销售额、需求量等。属性总体:研究标志为品质、类别等属性,如质量、等。3、变量总体:总体单位的标志的性质为数量,如身高、收同一总体,既可以是变量总体,也可以是属性总体,取决于研究标志的属性,有时两者都研究,两者都是。如企业总体,研究标志是职工人数、产值、税、利等,为变量总体。研究标志为所有制形式,就是属性总体。同一总体,既可以是变量总体,也可以(二)、抽样与普查普查这一概念用于描述获取同质总体中每个成员的信息。抽样指一个相对较小、但精心选择的样本能准确地反映出所抽签的总体的特征。一个样本是总体所有成员的一个子集。从总体中子集获得的有关信息,可以用来估测总体的特征。理想的状况是,子集能够代表总体的各个部分。(二)、抽样与普查(三)、样本:X从作业总体中抽取出来进行观察的一部分总体单位的集合。又称为子集。样本容量:n
抽样比:n/N
(三)、样本:X样本与总体的关系:
全及总体是唯一的,但样本不是
作业总体不一定是唯一的,作业总体小于全及总体时就不是唯一的。
样本是总体的缩影与代表,抽样调查的目的就是以对样本的观察结果来推断总体的特征分布。样本与总体的关系:样本不是唯一的。不同的抽样方法产生不同的样本,同样的抽样方法每次获得的样本也不一定是相同的,如概率抽样。
如果说总体是要研究推断的对象,样本就是要观察的对象。样本不是唯一的。不同的抽样方法产生不同的样本(四)、总体指标与样本指标总体指标:根据总体单位标志值计算出的,唯一的。样本指标:根据样本计算出的,用于估计总体的。常用指标:平均数、期望、成数(比例)方差(四)、总体指标与样本指标(五)调查单位与抽样单位调查单位:总体单位,家庭、个人、企业、与抽样单位:便于抽样的中介单位
两者可以相同,也可不同。有时一个抽样单位包含多个调查单位,如以家庭为抽样单位,以个人为调查单位;有时一个调查单位又包括多个抽样单位。
(五)调查单位与抽样单位单位可以自然形成,如个人、家庭、村庄、城镇,也可以人为划分。如居委会、班级等。单位之间不能重合交叉、且完备能形成总体。
单位可以自然形成,如个人、家庭、村庄、城镇,也可以人为划分。(六)抽样框:编制抽样单位的目录
其范围与作业总体一致。但单位是抽样单位,有时与作业总体在形式上是有区别的。如:作业总体:全体在校生,以学号排列。抽样框:学生宿舍队列。
(六)抽样框:编制抽样单位的目录抽样框几种形式:名单抽样框区域抽样框(地图)时间表抽样框抽样框几种形式:二、抽样调查有关特征1、特点经济性效率高,时效性强准确性(在可接受误差范围内):如:总体指标均值=80,样本指标:80+-0.5二、抽样调查有关特征1、特点2、抽样调查适用情况无限总体
范围过大、分布过散的有限总体:水库中鱼苗数量、森林木材储量。
动态总体:连续生产的产品性能,物价监测、河流污染2、抽样调查适用情况不适于全面调查又必须了解总体特征的事物。如产品寿命、汽车性能、血液检验不必全面调查的总体:居民收支、儿童身高、体重、等,有其内在相似性和规律性。时效性强的总体不适于全面调查又必须了解总体特征的事物。如产品寿命、汽车性能用于对总体特征的某种假设进行检验,判断真伪,为决策提供依据,如某项新工艺是否值得推广。
用于对总体特征的某种假设进行检验,判断真伪,为决策提供依据,3、关于抽样调查的准确性
人们对事物特征认识准确性的要求是相对的:载人航天、一般性的设备加工精度。
精度与费用直接相关,却又不是线性相关,也有一个边际效用递减,假设100%精度对应100%费用,20%费用即可达到50%的精度,50%的费用即可达到98%的精度。3、关于抽样调查的准确性第十章抽样设计课件三、抽样原理和抽样设计研究的主要问题(一)、抽样原理1、抽样科学性基于理由:部分来自于总体,带有反映全体的信息。构成总体的个体之间在性质上必定有相似或相近。不管原始分布如何,样本特征的分布总可视为正态分布,而且由此得到总体参数的概率极大。三、抽样原理和抽样设计研究的主要问题(一)、抽样原理如以一个总体分布已知的例子说明:N=6,原始分布为均匀分布,如下表,试通过容量为2的样本估计总体的均值。
如以一个总体分布已知的例子说明:第十章抽样设计课件第十章抽样设计课件同时:均值分布于3~4之间的概率是(5+6+5)/36=16/36=4/9均值位于2.5~4.5之间的概率是(4+5+6+5+4)/36=24/36=6/9如果增加样本容量为3,精度就更高。同时:均值分布于3~4之间的概率是(5+6+5)/36=16(二)、抽样设计主要问题样本是用来代表并以此推断总体的,故而样本的代表性就是抽样设计的主要问题,需要多少容量、如何抽样、分布如何、误差大小,都关系到样本的代表性。如前文中样本数量为3可以提高精度,不放回抽样也可提高精度。又如估计全班的成绩均值,概率抽样、等距抽样、非概率抽样都可以,容量大小也可以,但精度不同。(二)、抽样设计主要问题同时不同的抽样方法和样本容量对应着不同的成本费用。因此,抽样设计就是要在保证样本的充分代表性前提下,力求取得最经济最有效的效果。往往在预算一定情况下,抽样设计须在精度与与预算之间求得平衡。或者在既定精度要求下力求经济性。另外,抽样设计须与甄别问卷、数据处理相适应。还要取得委托方的认可。同时不同的抽样方法和样本容量对应着不同的成本费用。四、制定抽样计划的步骤1.定义同质总体详细说明可提供信息或与所需信息有关的个体或实体所具有的特性。可从以下几方面进行描述:地域特征、人口统计学的特征、产品或服务使用情况、认知程度等。四、制定抽样计划的步骤1.定义同质总体2、选择资料收集方法3、选择抽样框抽样框是指总体的数据目录或单位的名单,从中可以抽出样本单位。理想的完整和准确的名单通常是不存在的,因而需要依据能够产生具有希望特征的样本个体的程序来反映抽样框。2、选择资料收集方法4、选择抽样方法取决于研究目的、经济实力、时间限制、欲调查问题的性质。4、选择抽样方法1)概率抽样概率抽样指在总体中的每个单位都具有同等可能性被抽中。概率抽样的优点:信息全面、能估算出抽样误差、调查结果可以用来推断总体。概率抽样的弊病:费用高、策划和实施时间长。1)概率抽样2)非概率抽样非概率抽样指从总体中非随机地选择特定的要素(单位)。非概率抽样的弊病:不能估计出抽样误差、难以确定样本代表性的程度、难以推及总体。非概率抽样的固有优势:费用低、实施时间少、若合理运用也能产生极具代表性的合理的抽样结果。2)非概率抽样5、确定样本量考虑可得预算的重要性、各种各样的抽选规则、子集量的分析和传统的统计样本量的计算。5、确定样本量对非概率抽样,通常依靠可得预算、抽选规则(凭经验确定)、子集量分析来决定样本量。对概率抽样,需要在允许误差的目标水平和置信水平)下,计算样本量。对非概率抽样,通常依靠可得预算、抽选规则(凭经验确定)、子集确定样本量通常考虑这样一些因素:A个体差异大小:大则多些B调查项目多少:多则多些C控制质量情况:差则多些D抽样组织方式:不严密则多些确定样本量通常考虑这样一些因素:6、制定选择样本单位的操作程序示例:抽样的操作程序可以如下:以下指南是有关你在某个街区访问时应走的路径。在城市中,这可能是一个城市街区;在农村,街区可能是一块被道路包围的土地。6、制定选择样本单位的操作程序1)、如果在你的路线当中遇到死胡同,继续沿这条路或街道的另一面向反方向走。在可能的地方又拐,每隔两户住家访问一户。2)、如果你沿街区走了一圈,又回到了出发点而没有完成列出的电话簿上家庭的四个访问,那么可以试着访问起点的那一家。1)、如果在你的路线当中遇到死胡同,继续沿这条路或街道的另一3)、如果你调查了整个街区,还是没有完成所要求的访问,则继续从街区(或乡间小路)对面附近的第一个住户开始。只要这个地址在你的纸上的一个“*”旁出现就把它当作你所在区域的接到中的另一个地址,并访问这一家。如果不是,就访问左边的一家。永远遵守右手法则……3)、如果你调查了整个街区,还是没有完成所要求的访问,则继续7、描样计划的实施之前,应先对抽样进行讨论研究,检查、确定是否要根据拟好的详细程序来实施计划。7、描样计划的实施五、概率抽样方法简单随机抽样系统抽样(等距抽样)分层抽样整群抽样五、概率抽样方法简单随机抽样1、简单随机抽样总体中每个单位在抽选时有相等的被抽中机会抽样概率公式为:抽样概率=样本单位数/总体单位数
例如,如果总体单位数为10000,样本单位数为400,那么抽样概率为4%,计算过程为:0.04=400/100001、简单随机抽样总体中每个单位在抽选时有相等的被抽中机会如果一个抽样框是可以得到的,简单随机抽样方式步骤如下:(1)对总体的每个单位进行编号,总体单位数为10000的总体可编号为1~10000。(2)在随机数表中从任意的一个编号数开始向上数或向下数或跳跃数选编号,在00001和10000之间选出400个(样本单位数)。(3)在有明确总体单位的数字表中选出的数字将包括在样本中。如果一个抽样框是可以得到的,简单随机抽样方式步骤如下:优点:简单,并且满足概率抽样的一切必要的要求。缺点:编制完整的表极其困难。可通过电话随机拨号功能完成这个步骤。亦可从电脑档案中挑选调查对象。优点:简单,并且满足概率抽样的一切必要的要求。2、等距抽样按随机方法决定第一个样本,之后按等距抽取其余(n-1)个样本。在不失等概的原则下,将大大简化抽样工作。2、等距抽样按随机方法决定第一个样本,之后按等距抽取其余(n
实施1)
编号1~N(抽样框)2)
确定样本容量n,计算间隔k= N/n3)
随机确定起点r:1<r<k4)
等距抽取其余(n-1)个样本:n1=r+0k,n2=r+1k,n3=r+2k……..实施优缺点1简便、高效、成本低2标志排队复杂3效率和样本代表性取决于排队使用的标志。若与所研究特征无关,较易,如按电话本;这时代表性与简单抽样结果差别不大,只是在获取样本手段上有区别。若相关,则复杂,如按资金额、销售量等排序;但这时样本代表性增强,可以覆盖大中小各类样本。优缺点1简便、高效、成本低4、如果排序呈现周期性规律,样本代表性难以保证。5、误差计算较复杂。4、如果排序呈现周期性规律,样本代表性难以保证。3、分层抽样1、含义:类型抽样,先将总体单位按照某些重要标志分类(分层),然后在各层(各类)中按照简单抽样或等距抽样抽取样本单位的方法。3、分层抽样1、含义:类型抽样,先将总体单位按照某些重要标志2、分层指标的选择:标准:分层后层内差异最小,层间差异最大选择:同质性:层内尽量同质异质性:层间异质相关性:与所感兴趣的特性密切相关费用:易于测量和应用,以减少分层费用2、分层指标的选择:常用指标:人口统计特征:性别、年龄、种族、文化程度生活方式:媒介接触行为、运动偏好、娱乐类型等消费者类型单位规模行业类型:常用指标:精度:分层指标的选择与精度直接相关,保障层内差异小(抽样),层间差异大(普查,各层都抽)。分层数要适当,过度会使精度的增益由于风层费用的增加和抽样难度增加而被抵消。
精度:分层指标的选择与精度直接相关3、抽样方式比例分层:
等比例分层:各层样本数量比例与各层总体单位数量比例一致。ni/n=Ni/N
不等比例分层:比如当某层标准差较大时,可以多抽样。当某层规模大而差异小、均匀时,可以少抽。
3、抽样方式最优分层:ni=n×(NiSi/∑NiSi)式中:ni:各层应抽取的样本量n:样本总量Ni:各层调查单位总数Si:各层调查单位平均数(成数)的样本标准差。Ci:各层的抽样费用最优分层:ni=n×(NiSi/∑NiSi)4、分层抽样优缺点:精确:在对总体推断时,还可以对各层推断复杂,操作困难度大,对各层的特征、大小都要有较精确的了解。5、适用场合:
要对总体和各层推断要保证样本的代表性:各层都有,可以提高代表性各层可以独立调研4、分层抽样优缺点:4、整群抽样1、含义:把整体按照某种标准划分为一组子群,整体由许多子群体组成(自然或人为行成),各群之间特征相似。以群为抽样单位,从群中随机抽取,并对所选子群内部进行普查。这时所选中的各个子群的所有个体组成总体样本。
可以理解为以子群为单位的随机抽样。
4、整群抽样1、含义:把整体按照某种标准划分为一组子群,整体2、分群与精度:分群特征的选择要保证群间差异小,群内差异大。一般选择与待研究内容无关的特征作为分群指标。群间差异越小(抽样),群内差异越大(普查),则精度越高。
2、分群与精度:3、采用原因:抽样框易于获得当缺少基本单位名单难以从总体中直接抽取基本单位,而各个子群界限明显,易于操作,避免了编织基本单位抽样框问题。即使基本总体单位名单可获得,但由于直接从基本单位名单抽样获得样本较分散,会增加调查难度和费用。而按照整群抽样较集中,方便调查,费用也低。当各个子群之间差异不大时,整群抽样不会降低精度。3、采用原因:4、注意问题:群间互斥对子群的抽样为随机抽样。以利于后期数据处理和误差估计。先部分后全部,与分层(先全部后部分)相反误差取决于群间差异(群间抽样),而不受群内差异影响(群内普查)4、注意问题:5、多阶段抽样1、含义:复杂的、大规模调查中,调查单位一般不是直接抽取到,而采用多阶段抽取,先按大的抽样单位抽大的调查单元,再在大的样本单位中按照小的抽样单位抽取小的单元,以此类推。这种抽样组织形式叫做对阶段抽样。
5、多阶段抽样1、含义:例如,全国城市住户调查,先抽出城市,再抽出街道,再选择家庭。2、二级抽样:两阶段抽样。
例如,全国城市住户调查,先抽出城市,再抽出街道,再选择家庭。第十章抽样设计课件六、非概率抽样1、即非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员主观判断或仅按方便的原则抽选样本。由于各个个体入样的概率是未知,而且排除不了主观影响,因而无法无法说明是否体现了总体的结构,用这样的样本来推断总体是极
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度石油化工材料供应与施工合同
- 2024年度成都商业购房合同
- 留学中介退费解除合同范本
- 二零二四年房产买卖及拆迁补偿协议书范本
- 2024年度版权许可出版协议
- 2024年度企业环保设施运营维护合同
- 质保维修合同范本
- 2024版婚礼配音及策划合同
- 2024年度虫草电子商务平台建设合同:网站、APP与在线销售
- 二零二四年度农业机械化生产流程优化合作协议
- 放射科专科护理模拟题含参考答案
- 家政培训讲师课件
- 2024年大型科学仪器共享与服务合作协议
- 2024-2025学年苏科版七年级数学上册期中复习试卷
- 露天矿安全生产年度总结
- 生态文明学习通超星期末考试答案章节答案2024年
- 2023秋部编版四年级语文上册第2单元大单元教学设计
- (完整版)新概念英语第一册单词表(打印版)
- 2025届四川省新高考八省适应性联考模拟演练政治试卷(含答案)
- 中国民用航空局信息中心招聘笔试题库2024
- 【核心素养目标】第4课 日本明治维新教案(含反思)
评论
0/150
提交评论