中国妇女社会地位调查-抽样方案设计课件_第1页
中国妇女社会地位调查-抽样方案设计课件_第2页
中国妇女社会地位调查-抽样方案设计课件_第3页
中国妇女社会地位调查-抽样方案设计课件_第4页
中国妇女社会地位调查-抽样方案设计课件_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三期中国妇女社会地位调查

抽样设计方案

2010年7月15日中国人民大学统计学院

中国人民大学统计学科始建于1950年,目前拥有统计学全国重点学科,教育部人文社会科学重点研究基地“应用统计科学研究中心”。统计学和风险管理与精算学两个博士点,统计学、概率论与数理统计、风险管理与精算学、流行病与卫生统计学四个硕士点,应用经济学下设统计学博士后流动站金勇进教授本次抽样设计团队近年来承担全国性重大抽样设计项目

(1)中国公众科学素养调查设计与数据分析,中国科协,2001-2010年共计五次。(2)中国儿童青少年心理发育特征调查抽样设计及数据分析,北京师范大学,2008年(3)2009学生国际能力测评中国试测研究抽样设计与数据分析,教育部考试中心,2009年抽样设计的原则(二)抽样设计既有利于提高抽样效率,也为开展妇女社会地位与层间经济社会综合发展水平差异的相关性研究奠定基础;同时,还保证本期调查结果能够满足多领域分析的需求,如从城乡差异、不同地区经济发展水平差异等多角度进行对比分析。抽样设计的原则(三)本期调查仍然采用分层多阶段不等概率抽样,在各层内,采用与人口规模成比例的不等概率抽样。对于北京、天津、上海三个直辖市,选择街道、乡镇作为初级抽样单元;对于其他省(自治区、直辖市),选择区、县级市、县作为初级抽样单元。初级单元抽样框的划分

根据国家统计局现行的统计上有关我国区域的划分标准,全国31个省、直辖市、自治区(港、澳、台地区除外)按照东中西的地域概念划分为三类地区(东、中、西部地区)。将北京、天津、上海单独作为直辖市域处理

重庆位于我国西部地区,直辖市区划设立较晚,作为省对待初级单元抽样框的划分北京、天津、上海街道、乡镇总计773个初级抽样单元其他28个省(自治区、直辖市)共有县级行政单位(区、县级市、县)2803个初级抽样单元甘肃省的酒泉市、广东省的中山市和东莞市、海南省的三亚市都为不设县级行政单位的地级市,这4个地级市与以上2803个县级行政单位等同视为一级抽样单元据此,全国共有初级抽样单元3580个初级单元抽样框直辖市域初级单元组成抽样框一,含773个初级抽样单元东部域初级单元组成抽样框二,含836个初级抽样单元中部域初级单元组成抽样框三,含894个初级抽样单元;西部域初级单元组成抽样框四,含1077个初级抽样单元抽样框的分层依据同一抽样框内初级抽样单元之间由于所属行政地区的经济发展水平、城乡差距等原因仍然具有较大的差异。为了提高估计效率,需要在各域内进行再分层。一方面,人口的聚集程度与社会发展水平紧密联系另一方面,城市化水平(非农业人口占总人口比重)这一指标能够反映我国各地区的经济发展差异直辖市域抽样框一的分层

域大类初级单元数量小层初级单元数量直辖市街道343北京135天津107上海101乡镇430北京182天津136上海112合计773————773东中西部域抽样框的分层对于以区县(区、县级市和县)为初级抽样单元的其他三个抽样框,先将各抽样框内的初级抽样单元根据各自人口密度划分。人口密度较高的为一类层,较低的为二类层。在此基础上,根据上述两个大类内初级单元的城市化水平,将区县进一步细分为若干小层东部域抽样框二的分层

域人口密度大类初级单元数量城市化水平小层初级单元数量东部域大于等于600人/平方千米人口密度一类39895%及以上一类区县12665%~95%二类区县6535%~65%三类区县6620%~35%四类区县8120%及以下五类区县60小于600人/平方千米人口密度二类43880%及以上一类区县2550%~80%二类区县2330%~50%三类区县10820%~30%四类区县11620%及以下五类区县166合计—836————836西部域抽样框四的分层

域人口密度大类初级单元数量城市化水平小层初级单元数量中部域大于等于200人/平方千米人口密度一类39275%及以上一类区县6045%~75%二类区县5325%~45%三类区县6215%~25%四类区县7510%~15%五类区县9010%及以下六类区县52小于200人/平方千米人口密度二类61270%及以上一类区县2440%~70%二类区县6025%~40%三类区县9715%~25%四类区县16210%~15%五类区县15610%及以下六类区县113——西藏73————7373合计10771077各级抽样单元的确定第一阶段抽样单元:区、县级市、县(抽样框一为街道、乡镇)。第二阶段抽样单元:居委会、村委会;第三阶段抽样单元:家庭户。家庭户中15岁及以上的家庭成员,随机抽出一人填答个人主问卷;如果被抽中的是60岁及以上的老年人,还需要填答老年人附卷;针对入选家庭户中年龄在9~14岁的儿童,随机抽出一人填答儿童附卷。各级抽样单元的抽取方法第一阶段抽样中,采用与初级抽样单元人口规模成比例的系统PPS抽样,在四个抽样框抽取初级抽样单元;第二阶段抽样采用与入选区、县级市、县(北京、天津、上海为街道、乡镇)内居委会或村委会人口规模成比例的系统PPS抽样,在入选初级单元内抽取居委会或村委会;第三阶段抽样在入选的居委会或村委会内采用简单系统抽样抽取相同数量的家庭户。抽样框一的样本量首先单独确定直辖市域抽样框的样本量,其他三个域再按与人口规模成比例分配剩余样本量。我们以估计简单随机抽样比例P时的样本量为基础,在95%的置信度下按抽样绝对误差不超过4%的要求进行计,设计效应取为2.5,所需样本量为1500人。如果进行分性别或分城乡对比分析,直辖市层抽样框主问卷的最终样本量确定为1500*2=3000人抽样框一的样本量对于北京、天津、上海三个直辖市的街道、乡镇初级抽样单元总计773个。为了使抽取的样本初级单元相对分散,提高该层的抽样效率,按照每个样本初级单元抽2个居委会(村委会)、每个样本居委会(村委会)抽15个家庭户的原则,计算出抽样框一需抽取100个初级抽样单元(街道、乡镇)。其他三个抽样框样本量除去直辖市域的样本量3000人,剩余的27000人则作为其他三个域抽样框的样本量。根据各域的人口规模按比例进行分配。

在每个中选样本初级抽样单元抽取5个居委会或村委会,每个样本居委会或村委会抽取15户,每户抽1人的原则;折算出东部域抽样框二需抽取9450人、126个初级单元,中部域抽样框三需抽取9450人、126个初级单元,西部域抽样框四需抽取8100人、108个初级样本单元。抽样框一的样本抽取

域大类小层人口规模初级单元数样本单元数直辖市街道北京13527天津10721上海10127乡镇北京18210天津1368上海1127合计——35975969773100直辖市抽样框一的样本初级单元分配

抽样框一的样本抽取在各小层层内分别采用与各个街道(乡镇)人口规模成比例的系统PPS抽样抽取街道(乡镇)在入选的街道内采用与居委会人口规模成比例的系统PPS抽样抽取2个的居委会;在入选的乡镇内采用与村委会人口成比例的系统PPS抽样抽取2个村委会在每个入选居委会或村委会内采用随机起点的等概率系统抽样抽取15户抽样框二的样本抽取域人口密度大类城市化水平小层样本居委会样本村委会东部域大于等于600人/平方千米人口密度一类95%及以上一类区县5065%~95%二类区县4135%~65%三类区县3220%~35%四类区县2320%及以下五类区县14小于600人/平方千米人口密度二类80%及以上一类区县5050%~80%二类区县4130%~50%三类区县3220%~30%四类区县2320%及以下五类区县14东部域样本居委会和村委会抽取数量的分配标准

抽样框三的样本抽取抽样框三的样本初级单元分配

域人口密度大类城市化水平小层人口规模初级单元数量样本单元数量中部域大于等于400人/平方千米人口密度一类80%及以上一类区县991650%~80%二类区县821030%~50%三类区县26415%~30%四类区县881210%~15%五类区县871610%及以下六类区县337小于400人/平方千米人口密度二类75%及以上一类区县39545%~75%二类区县38525%~45%三类区县1111415%~25%四类区县1842210%~15%五类区县47725797921310%及以下六类区县6698841152合计­———————448637299894126抽样框三的样本抽取在每一小层内,采用与各区、县人口规模成比例的系统PPS抽样抽取样本单元

在每个入选的初级抽样单元内,分别采用与各居委会、村委会人口规模成比例的系统PPS抽样抽5个居委会或村委会

在每个入选居委会或村委会内采用随机起点的等概率系统抽样抽取15户抽样框三的样本抽取中部域样本居委会和村委会抽取数量的分配标准

域人口密度大类城市化水平小层样本居委会样本村委会中部域大于等于400人/平方千米人口密度一类80%及以上一类区县5050%~80%二类区县4130%~50%三类区县3215%~30%四类区县2310%~15%五类区县1410%及以下六类区县05小于400人/平方千米人口密度二类75%及以上一类区县5045%~75%二类区县4125%~45%三类区县3215%~25%四类区县2310%~15%五类区县1410%及以下六类区县05抽样框四的样本抽取抽样框四的样本初级单元分配

域人口密度大类城市化水平小层人口规模初级单元数量样本单元数量西部域大于等于200人/平方千米人口密度一类75%及以上一类区县601045%~75%二类区县53825%~45%三类区县62715%~25%四类区县751010%~15%五类区县59753724901410%及以下六类区县35536581526小于200人/平方千米人口密度二类70%及以上一类区县24340%~70%二类区县60625%~40%三类区县97715%~25%四类区县1621210%~15%五类区县399780361561310%及以下六类区县3924853811310——————西藏732合计­————————3821649811077108抽样框四的样本抽取在每一小层内,采用与各区、县人口规模成比例的系统PPS抽样抽取样本单元

在每个入选的初级抽样单元内,分别采用与各居委会、村委会人口规模成比例的系统PPS抽样抽5个居委会或村委会

在每个入选居委会或村委会内采用随机起点的等概率系统抽样抽取15户抽样框四的样本抽取西部域样本居委会和村委会抽取数量的分配标准

域人口密度大类城市化水平小层样本居委会样本村委会西部域大于等于200人/平方千米人口密度一类75%及以上一类区县5045%~75%二类区县4125%~45%三类区县3215%~25%四类区县2310%~15%五类区县1410%及以下六类区县05小于200人/平方千米人口密度二类70%及以上一类区县5040%~70%二类区县4125%~40%三类区县3215%~25%四类区县2310%~15%五类区县1410%及以下六类区县05最终样本构成全国共抽取460个初级抽样单元,2000个二级抽样单元,30000个家庭户。直辖市域共抽取75个街道和25个乡镇,150个居委会和50个村委会,共计3000户。东部域最终抽取126个初级单元,其中人口密度一类层62个,二类层64个;共计349个居委会和281个村委会,9450户。最终样本构成中部域最终抽取126个初级单元,其中人口密度一类层65个,二类层61个;共计216个居委会和314个村委会,9450户。西部域最终抽取108个初级单元,其中人口密度一类层55个,二类层51个,共计234个居委会和296个村委会;西藏抽取初级单元2个,6个居委会和4个村委会。西部域共计抽取8100户全国基本方案样本中居委会1055个,村委会945个,城乡比约为1:1

省级样本追加方案原则

为便于后期数据的分析处理,省级样本的追加设计独立于全国样本抽样设计,独立实施省级追加方案和全国方案的抽样设计定义相同的各阶段抽样单元,采用与各阶段抽样单元相对应的抽样方法追加层级采用一阶追加,即只在第一阶段抽样中追加初级单元的个数,初级单元以下的抽样与全国方案相同各省样本量视各省人口规模、估计精度要求和组织方的经费预算而定,但各省的样本量应不低于2000人

省级样本追加方案原则省级追加方案需要在全国方案的基础上,根据各省(区、市)的人口结构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论