社会调查研究方法4抽样-王强_第1页
社会调查研究方法4抽样-王强_第2页
社会调查研究方法4抽样-王强_第3页
社会调查研究方法4抽样-王强_第4页
社会调查研究方法4抽样-王强_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第4讲抽 样 抽样与抽样调查 抽样的术语与程序 概率抽样 非概率抽样 样本大小 年份总统竞选人盖洛普预测实际选举结果1936罗斯福、蓝敦55.7:44.360.8:36.51940罗斯福、威尔基52:4854.7:44.81944罗斯福、杜威51.5:48.553.4:45.91848杜鲁门、杜威44.5:49.549.5:45.11952艾森豪威尔、史蒂文森51:4955.1:44.41956艾森豪威尔、史蒂文森59.5:40.557.4:42.01960肯尼迪、尼克松51:4949.7:49.61964约翰逊、戈德华特64:3661.1:38.51968尼克松、汉弗莱、华莱士43:42:1

2、543.4:42.7:13.51972尼克松、麦戈文62:3860.7:37.51976卡特、福特48:4950.1:48.0第一节抽抽样样与抽样样调查抽样是一种选选择调查查对象的的程序和和方法;即由总总体中选选取一部部分代表表的过程程。选取样本本的方法法分为两两大类:一类是非非概率抽抽样。另一类概概率抽样样。抽样调查查的成功首先要求求所选取取的样本本能够代代表总体体。所谓代表表,也就就是抽取取出来的的样本从从调查所所要研究究的总体体特征来来看,能能够再现现总体的的结构。概率抽样样最具科科学性。第二节抽抽样样的术语语与程序序一、抽样样的术语语1.总体体是指调查查研究对对象全体体所构成成的集合合

3、;2.样本本是指按照照一定方方法从总总体中抽抽取出来来进行调调查的那那部分对对象的集集合;3.抽样样指的是从从某个总总体的集集合中,按一定定的方式式选择或或抽取一一部分元元素的过过程。4.抽样样单位是指抽样样过程中中使用的的基本单单位。 5.样本本框是指抽样样过程中中抽取样样本的所所有抽样样单位的的名单。6.参数数值也称总体体值,是是关于总总体中某某一变量量的综合合描述。7.统计计值也称样本本值,样样本值是是从样本本的所有有元素中中计算出出来的,它是相相应的总总体值的的估计量量。8.抽抽样误差差在用样本本的统计计值去推推论总体体的参数数值时,总会存存在着偏偏差,这这种偏差差就是抽抽样误差差。9

4、.置信水平平是指总体体参数值值落在样样本统计计值某一一正负区区间内的的概率;10.置信区间间是指在某某一置信信水平下下,样本本统计值值与总体体参数值值间的误误差范围围。二、抽样样的基本本程序1.界定定总体是对从中中抽取样样本的总总体范围围和界限限作明确确的界定定。2.制定定抽样框框在确定了了总体范范围和抽抽样单位位以后,收集总总体中全全部抽样样单位的的名单,并通过过对名单单进行统统一编号号来建立立起供抽抽样使用用的抽样样框。3.设计计和抽取取样本4.对样样本进行行评估。就是对样样本的质质量、代代表性、偏差等等进行初初步的检检验和衡衡量。第三节概概率率抽样一、简单单随机抽抽样二、等距距抽样三、分

5、层层随机抽抽样四、整群群抽样五、多阶阶段抽样样一、简单单随机抽抽样按等概率率原则直直接从含含有N个个元素的的总体中中随机抽抽取n个个元素组组成样本本(Nn)。1、抽签签法2、随机机数码法法概率抽样样的最基基本形式式。随机数字字表一部部分行123456780133993412497612316507573997792236198802390410577974278753010177960768220238035601126839385010332143259731484361500407397958534S764438037665957736448018057499853337138608943

6、09582S65893965728065957295893697e543597905706090906479807746451394028640001270426117650340508084276523855384511148232671521262380080966561561303035654034539969887478001810506701317231460202243429359458244108115397108701383563614910891051785565381247177030853743294053870576185996943813414948927048063

7、122530038396010414578140740932874035148484374421867084326781503097122124309346224144311506518267具体步骤骤(1)先先取得抽抽样框框;(2)将将总体中中所有元元素按顺顺序编号号;(3)确确定随机机数表中中选取得得数码位位数;(4)用用随机机方法抽抽取第一一个号码码;(5)按按照任任意规则则逐个抽抽取与样样本单位位顺序号号码相符符的号码码与个数数;(6)依依据从随随机数表表中选出出的数码码,到抽抽样框中中去找出出它所对对应的元元素。例:在某某个5000人人的企业业中抽取取1000人进进行问卷卷调查,如何

8、操操作?如果是10人如何抽抽取?优点:简简单易行行缺点:只只适用于于总体数数量不大大,而且且抽样框框容易定位位的调查查;样本代表表性差,误差大大。二、系统统抽样把总体的的单位进进行编号号排序后后,再计计算出某某种间隔隔,然后后按这一一固定的的间隔抽抽取个体体的号码码来组成成样本的的方法。1、具体步步骤(1)制定出抽抽样框。(2)计算抽样样间距K=N/n(3)在最前面面的K个个体中中,采用用简单随随机抽样样的方法法抽取一一个个体体,记下下个体编编号(A)。(4)在抽样框框中,自自A开始,每每隔K个个体抽抽取一个个个体,编号分分别为A,A+K,A+2K,A+(n1)K。(5)将这n个个体合合起来,

9、就构成成一个样样本。2、课堂堂作业要在某大大学总共共3000名名学生中中,抽取取一个容容量为100的的大学生生样本。我们先将将3000名名学生的的名单依依次编上上号码;然后按上上述公式式可求得得抽样间间距为:30;在130的数数码中,采用简简单随机机抽样的的方法抽抽取一个个数字,假如抽抽到12,就以以12为为第一个个号码;每隔30名再抽抽一个。这样,我们便便可得到到12,42,72,2972总共共100个号码码。再根据这这100个号码码,从总总体中对对应地找找出100名学学生,这这100名学生生就构成成本次的的一个样样本。3、注意意两种情情况一是总体体名单中中,个体体的排列列具有某某种次序序上

10、的先先后、等等级上的的高低情情况。二是总体体名单中中,个体体的排列列上有与与抽样间间隔相对对应的周周期性分分布的情情况。4、评价价优点:样样本的分分布比较较均匀,抽样误误差小于于简单随随机抽样样。缺点:总总体不能能太多,要有完完整的登登记册;三、分层层抽样分层抽样样:将总总体按某某种特征征划分成成若干类型型,然后再再根据各类型所所包含的的抽样单单位数与与总体单单位数的的比例,确定从从各类型型中抽取取样本单单位的数数量。然然后按照照简单随机机和等距距抽样的方法抽抽取样本本。例如:了解某市市800个企业的的生产经经营,第第一产业业80个,第二二产业320个,第三三产业400个,需选选择100个调查

11、,如何做做?计算比率率:第一一产业:10%,第二产产业:40%,第三产产业:50%;下一步步是多少少?相应的个个数:第第一产业业:10,第二产产业:40,第三产产业:50然后抽取取具体的的样本2分层层抽样的的优点总体单位位数量较较多,单单位之间间差异较较大的对对象。样样本代表表性大,误差较较小。缺点:必必须充分分了解总总体,否否则无法法分类;3分层层抽样的的运用(1)分分层的标标准。第一,以以所要分分析和研研究的主主要变量量或相关关的变量量作为分分层的标标准。第二,以以保证各各层内部部同质性性强、各各层之间间异质性性强的变变量作为为分层变变量。第三,以以那些已已有明显显层次区区分的变变量作为为

12、分层变变量;(2)分分层的比比例问题题。按比例分分层抽样样是指按按各种类类型或层层次中的的单位数数目同总总体单位位数目间间的比例例来抽取取样本。例:某地地区有百百货商店店1000个,其中大大型百货货商店100个个,中型型百货商商店300个,小型百百货商店店600个。如如果总样样本数定定为20个,则则各层应应抽取的的样本数数为多少少?四、整群抽样样先将总体体各单位位按一定定标准分分成若干群体体,并将每一个群群体看作作一个抽抽样单位位,然后按按照随机机原则从从这些群群体中抽抽取若干群体体作为样本本。例如,某某大学共共有100个班班级,每每班都是是30名名学生,总共有有3000名学学生,抽抽300名

13、学生生作为样样本,如如何抽取取?从全校100个个班级中中,采取取简单随随机抽样样的方法法(或是是系统抽抽样,分分层抽样样的方法法)抽取取10个个班级,然后由由这10个班级级的全部部学生(300名)构构成样本本;优点:抽抽样单位位集中,它可以以降低收收集资料料的费用用,。缺点:样样本的分分布面不不均匀、样本对对总体的的代表性性相对较较差等。和以上几几种相比比较,在在样本数数量相同同的情况况下抽样样误差较较大课堂练习习假设总体体是全国国所有城城市的集集合(600),我们们要抽取取一个规规模为40的样样本,按按照前面面所介绍绍的方法法如何抽抽取?1、简单单随机抽抽样或系系统抽样样?2、分层层抽样(特

14、大、大、中中等、小小城市)3、整群群抽样(以省为为抽样单单位)五、多段段抽样多段抽样样是按抽抽样元素素的隶属属关系或或层次关关系,把把抽样过过程分为为两个或或以上阶阶段进行行。在社会研研究中,当总体体的规模模特别大大,或者者总体分分布的范范围特别别广时,研究者者一般采采取多段段抽样的的方法来来抽取样样本。具体步骤骤先从总体体中随机机抽取若若干大群群(组),再从从这几个个大群(组)内内抽取几几个小群群(组),这样样一层层层抽下来来,直至至抽到最最基本的的抽样元元素为止止。例如:某某市共有有6万名名员工,他们分分布在全全国20个城市市的400个单单位中。现在要要抽取一一个由1200名员工工组成样样

15、本。如果按照照三阶段段抽样的的方法,我们就就可以有有下列各各种不同同的抽样样选择(见表)。要在类别别和个体体之间保保持合适适的比例例。如何选择择方案?2、研究者者所拥有有的人力力和财力力同质性越越高,子子总体规规模越小小大的类别别较少,每一类类别的个个体较多多1、各抽样样阶段的的子总体同质质性程度度。总则:大大的类别别抽取单单元较多多,每一一单元抽抽取个体体较少考虑因素调查方案案例子子课堂练习习:例如,假假定某山山区县有有20个个乡镇(该县20个乡乡镇经济济发展状状况较好好的、一一般的和和较差的的3类分分别为4个、12个和和4个),平均均每个乡乡镇有10个行行政村,每个行行政村有有10个个自然

16、村村,每个个自然村村有50户。这这样,全全县共有有200个行政政村、2000个自然然村、10万户户。现决决定采用用多段随随机抽样样方法对对该县计计划生育育状况按按户做5的抽样调调查,共共抽取样样本500户.其具体做做法如下下:首先先,确定定抽样单单位。根根据该县县社会组组织的4个层次次,即乡乡镇、行行政村、自然村村和户,应采取取4段随随机抽样样方法抽抽取样本本,并确确定乡镇镇为第1级单位位,行政政村为第第2级单单位,自自然村为为第3级级单位,户为第第4级单单位然后后,采取取不同抽抽样方法法,分4段逐步步抽取样样本:一段抽样样,从县县抽到乡乡镇。由由于该县县乡镇之之间经济济发展状状况差异异较大,

17、因而应应采用宜宜于这类类抽样单单位的类类型分层抽样样。其具体做做法是:首先,编制抽抽样框。以经济济发展状状况为标标准,将将该县20个乡乡镇分为为经济发发展状况况较好的的、一般般的和较较差的3类(即即3个群群体),它们分分别为4个、12个和和4个。其次,确确定样本本数量。假定在在第1级级单位中中抽取25的的单位即即5个乡乡镇作为为样本。再次,简简单随机机抽取和和上述比比例,在在经济发发展状况况较好的的4个乡乡镇中抽抽1个乡乡镇,一一般的几几个乡镇镇中抽3个乡镇镇,较差差的4个个乡镇中中抽1个个乡镇,共5个个乡镇组组成第1级样本本。二段抽样样,从乡乡镇抽到到行政村村。为了了使样本本分布比比较均匀匀

18、,可考考虑采用用等距抽样样。具体做做法是:首先,编编制抽样样框。把把第1级级样本5个乡镇镇的50个行政政村编号号l50。其次,计计算抽样样间隔。假定从从第2级级单位中中抽取20的的单位即即10个个行政村村作为第第2级样样本,这这样抽样样间隔就就应该是是5010=5。再次,抽抽取第2级样本本。就是是先在第第1抽样样问隔内内随机抽抽取第1个样本本,假定定是编号号为2的的行政村村,然后后按照抽抽样间隔隔就可确确定编号号为2,7,12,17,22,27,32,37,42,47的10个行行政村为为第2级级样本。三段抽样样,从行行政村抽抽到自然然村。为为了便于于集中调调查,节节约人财财物力和和时间,可考虑

19、虑采取整群抽样样方法。其具体体做法是是:首先,划划分群体体,即将将第2级样本10个行政村村所属的的100个自然村村,按照照地理位位置把每每两个相相近自然然村划为为一个群群体,共共分为50个群体。其次,抽抽取第3级样本,即按照照随机原原则从50个群体中中抽出10个群体作作为第3级样本。四段抽样样,从自自然村抽抽到户。为了简简便易行行,可采采取简单随机机抽样方方法。其具体体做法是是:首先,编编制抽样样框,就就是编制制第3级级样本10个群群体、20个自自然村、1000户的的名单,并按照照一定标标准确定定每户的的编号。其次,抽抽取第4级样本本,即按按照简单单随机抽抽样方法法从每个个群体(即相近近的两个

20、个自然村村100户)中中抽取50户、10个个群体中中抽出500户户作为第第4级样样本即即最后实实施调查查的具体体对象。从上例可可以看出出,多段段随机抽抽样方法法的优点点:把各种抽抽样方法法的优点点综合起起来,达达到以最最小的人人财物力力消耗和和最短时时间获得得最佳效效果的目目的。特别适合合于调查查总体范范围大、单位多多、情况况复杂的的调查对对象。主要缺点点:抽样样误差较较大,是是各阶段段抽样误误差之和和。第四节户户内内抽样与与PPS抽样一、户内内抽样采取一种种被称做做“Kish选择法法”方式。具具体做法法:先将调查表分为(编编号为)A、B1、B2、C、D、E1、,E2、F八八种,每每种表的的数

21、目分分别占调调查表总总数的1/6、112、112、1/6、16、112、112、16。其次,印印制若干干套(一一套八种种)“选择卡”发给调查查员,每每人一套套。“选择卡”的形式如如表综合调查员首首先对家家庭中的的成年人人排序然后,调调查员按按照调查查表上的的编号找找出相同同的“选选择表”,确定该该选的个个体序号号,最后后对之进进行访谈谈。问题:当分子公公司的规规模大小小不一时时比如说,甲分子子公司比比较大,有1000员员工,乙乙分子公公司比较较小,只只有200员工工。那么么,当它它们在第第一阶段段都被抽抽中后,第二阶阶段分别别从它们们中抽取取50员员工。甲分子公公司中员员工被抽抽中的概概率为(2080) (501000)=180。乙分子公公司中员员工被抽抽中的概概率为(2080)(50200)=116。多段抽样样中,假假定:即即每一个个阶段抽样时,其元素素的规模模是相同同的。二、PPS抽样不等概率率抽样方方法,叫叫“概率与元元素的规规模大小小成比例例抽样”(SamplingwithProbabilityProportionaltoSize),简称PPS抽样。步骤:第一阶段段,每

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论