社会研究方法(第四版)第六章_第1页
社会研究方法(第四版)第六章_第2页
社会研究方法(第四版)第六章_第3页
社会研究方法(第四版)第六章_第4页
社会研究方法(第四版)第六章_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章抽样第六章抽样目目 录录 第一节抽样的意义与作用第一节抽样的意义与作用第二节概率抽样的原理与程序第二节概率抽样的原理与程序第三节概率抽样方法第三节概率抽样方法第四节户内抽样与抽样第四节户内抽样与抽样第五节非概率抽样方法第五节非概率抽样方法第六节样本规模与抽样误差第六节样本规模与抽样误差 问题导引问题导引问题问题1 1 浙江省今年高考考生达浙江省今年高考考生达3737万,为了调查了解万,为了调查了解这些考生数学试题的得分情况,将他们所有的考试这些考生数学试题的得分情况,将他们所有的考试卷加以统计,那将是十分麻烦的,怎样才能既科学卷加以统计,那将是十分麻烦的,怎样才能既科学又客观地了解这些考

2、生数学试题的得分情况呢?又客观地了解这些考生数学试题的得分情况呢?问题问题2 2 现有某灯泡厂生产的灯泡现有某灯泡厂生产的灯泡1000010000只只, ,怎样才能怎样才能了解这批灯泡的使用寿命呢了解这批灯泡的使用寿命呢? ?统计的核心问题统计的核心问题 是如何根据样本的情况对总体的情况作出是如何根据样本的情况对总体的情况作出一种推断。一种推断。这里包括两类问题:这里包括两类问题:一类是如何从总体中抽取样本;一类是如何从总体中抽取样本;另一类是如何根据对样本的整理、计算和分析,另一类是如何根据对样本的整理、计算和分析,对总体的情况作出推断对总体的情况作出推断 一、抽样概念1.总体:调查研究的全

3、部事物,是构成它的所有元素的集合。 人口普查全国人口 某省大学生择业观念调查某省全体大学生第一节 抽样的意义与作用o 样本sample:从总体中按一定方式抽取出来的一部分元素的集合,是总体的一个子集。o 从某省大学生总体中抽取1000名大学生,所抽取的1000名大学生就构成一个样本。o 抽样sampling:从总体中按一定方式抽取样本的过程。o 从17000名在校大学生构成的总体中,按照一定方式抽取200名学生的过程。 抽样单位sampling unit:一次直接的抽样所使用的基本单位。 从全国高校中抽取从全国高校中抽取100100个班级,抽样单位为个班级,抽样单位为班级班级 从全班从全班50

4、50人中抽取人中抽取1010人构成小样本,人构成小样本,个人个人(学生)是(学生)是抽样单位。抽样单位。 实际抽样中,抽样单位往往是多层次的。如调查家庭,通过县实际抽样中,抽样单位往往是多层次的。如调查家庭,通过县- -乡乡- -村三级抽样,抽样单位为乡、村、家庭三种,分别为初级抽样村三级抽样,抽样单位为乡、村、家庭三种,分别为初级抽样单位、次级抽样单位和终极抽样单位。单位、次级抽样单位和终极抽样单位。 抽样框sampling frame:也称抽样范围,指一次直接抽样时总体所有抽样单位抽样单位的名单。 从某校的全体在校生中,直接抽取200名大学生作为样本,该校全体学生名单就是该次抽样的抽样框。

5、 o 抽样框的数量抽样单位的层次相对应。o 如对家庭的抽样中,有三个层次的抽样单位:乡、村、家庭,则对应的抽样框也有三个:全部乡的名单、乡样本中所有村的名单、村样本中所有家庭的名单。参数值总体值 是对是对总体元素总体元素特征的综合数量表现。特征的综合数量表现。 例如:全国妇女平均受教育年限例如:全国妇女平均受教育年限 参数值只有通过总体的每一个元素都进行调查参数值只有通过总体的每一个元素都进行调查或测量才到。或测量才到。 7.统计值样本值 是关于是关于调查样本调查样本中的某一变量的综合描中的某一变量的综合描述。述。 例如从一个样本中得到的妇女平均受教育年例如从一个样本中得到的妇女平均受教育年限

6、。限。练习练习1:说明在下列问题中,总体、个体、样本、说明在下列问题中,总体、个体、样本、样本容量各指什么?样本容量各指什么?浙江省高考数学阅卷点,为了了解我省浙江省高考数学阅卷点,为了了解我省3737万考生万考生的高考数学平均成绩,从中抽取了的高考数学平均成绩,从中抽取了50005000名考生的名考生的成绩成绩. .练习练习2:为了解某班同学会考及格率为了解某班同学会考及格率,要从该班要从该班60个同学中抽取个同学中抽取30个进行考查分析个进行考查分析,则在这次考查则在这次考查中考查的总体数为中考查的总体数为 ,样本容量样本容量 . 用样本估计总体,即通常不直用样本估计总体,即通常不直接去研

7、究总体,而是通过从总体中接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去抽取一个样本,根据样本的情况去估计总体的相应情况估计总体的相应情况统计的基本思想方法:统计的基本思想方法:二、抽样的作用o 抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。o必要性:研究人员难以做到任何研究都进行全面调查,而抽样误差可以控制到很小,因而抽样调查成为最常用的研究方法之一。举例:美国的总统选举预测o总体:全体合法选民 o样本:部分选民 o推断:根据部分对整体做出归纳 o指标:1、全体合法选民的平均年龄 o 2、当前登记投票的全体合法

8、选民的百分比 o以上总体指标是不能精确测定的,仅能根据统计量和样本指标来估计 里根蒙代尔实际投票结果盖洛普民意测验美国广播公司哈里斯民意测验罗珀民意测验59595756554141434445三、抽样的类型o 根据抽取对象的根据抽取对象的具体方式具体方式,我们可以把抽样分,我们可以把抽样分为两个大的类型:为两个大的类型:概率抽样概率抽样和和非概率抽样非概率抽样。o 概率抽样概率抽样是依据是依据概率论概率论的基本原理,按照的基本原理,按照随机随机原则原则进行的抽样,它能够避免抽样过程中的人进行的抽样,它能够避免抽样过程中的人为误差,保证样本的代表性。为误差,保证样本的代表性。o 非概率抽样非概率

9、抽样则主要依据研究者的主观意愿,判则主要依据研究者的主观意愿,判断或是否断或是否方便方便等因素来抽取样本,它不考虑抽等因素来抽取样本,它不考虑抽样中的等概率原则,因而往往产生较大的误差样中的等概率原则,因而往往产生较大的误差,难以保证样本的代表性。,难以保证样本的代表性。概率抽样的方法o 简单随机抽样简单随机抽样o 系统抽样系统抽样o 分层抽样分层抽样o 整群抽样整群抽样o 多段抽样多段抽样非概率抽样o 1、偶遇抽样o 2、判断抽样o 3、定额抽样o 4、雪球抽样第二节概率抽样的原理与程序o 一、概率抽样的基本原理o 随机抽取就是保证总体中的每一个个体都有同等的机会入选样本。或者说,总体中的每

10、一个成员被抽中的概率相等(也即被抽中的机会相等)。而且,任何一个个体的入选与否,与其他个体毫不相关,互不影响。o在各种随机事件的背后,存在着事件发生的客观概率,这种概率决定着随机事件的发展变化规律。概率抽样能够很好地按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。二、抽样分布o 从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。o 在使用统计量进行统计推断时常需知道它的分布。当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的。本节介绍来自正态总体的几个常用统计量的分布

11、。今后,我们将看到这些分布在数理统计中有重要的应用。 拓展:三个重要分布为了讨论正态总体下的抽样分布,先引入由正态分布导出的统计中的三个重要分布,即 分布,分布,分布。 1、 分布设 是来自总体 的样本,则称统计量 (1)服从自由度为 的 分布,记为2tF2nXXX,211 , 0N222212nXXXn2 n22nNX2,1 , 0 NnXX2,N定理1 设总体 服从正态分布 ,即则niiniiXnXnX11111 , 0 NnXnXXX,21X2,N 因为随机变量 相互独立且与 体 服从相同的正态分布 证所以由正态分布的性质可知,它们的线性组合服从nN2,正态分布即这个定理的证明从略,我们

12、仅对自由度作一些说明2221Sn 1n2112222nSnX2,N定理2 设总体 服从正态分布 则X2S(1)样本均值 与样本方差 相互独立;(2)统计量 服从自由度 的 分布即二、抽样的一般程序1.界定总体 对抽取样本中的总体范围与界限作明确的界定。清楚地说明研究对象的范围(时间、地点、人物),如1998年4,北京市海淀区某街道15-45岁居民对计划生育的态度。 界定总体是达到良好的抽样效果的前提条件。如果不清楚明确界定总体的范围与界限,即使采用最严格的抽样方法,也可能抽出对总体严重缺乏代表性的样本来。 o 文学文摘是一本1890-1938年间美国颇为流行的新闻杂志。1920年文摘杂志通过邮

13、寄明信片的方式,正确预测了当年的总统大选的结果。在之后的1924、1928、1932年,也给出了准确的预测。 但该杂志1936年美国总统大选的民意年美国总统大选的民意测验,尽管调查了测验,尽管调查了200万人,但是却得出了错误的万人,但是却得出了错误的结果。但当年,盖洛普民意测验所只调查了结果。但当年,盖洛普民意测验所只调查了3000人,就对投票结果作出了准确的预测。人,就对投票结果作出了准确的预测。o 其中一个很重要的原因便是对抽取样本的总体缺乏其中一个很重要的原因便是对抽取样本的总体缺乏清楚认识和明确的界定。清楚认识和明确的界定。o 依据已经明确界定的总体范围,收集总体中全部抽样单位的名单

14、,并对名单进行统一编号,从而建立抽样框。o 当抽样是分几个阶段、在几个不同的抽样层次上进行时,要建立不同的抽样框。制定抽样框决定抽样方案o 对于具有不同研究目的、不同范围、不同对象和不同客观条件的社会研究来说,所适用的抽样方法也不一样。这就需要我们在具体实施抽样之前,依据研究的目的要求、依据各种抽样方法的特点,以及其他有关因素来决定具体采用哪种抽样方法。除了抽样方法的确定以外,还要根据要求确定样本的规模以及主要目标量的精确程度。实际抽取样本o 先抽好样本再调查o 边抽部分样本边调查 对样本的质量、代表性、偏差等等进行初步的检验和衡量,防止由于样本的偏差国大导致的失误。基本的方法是将可得到的反映

15、总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。差别小,则说明样本质量高。评估样本质量评估样本质量样本评估实例样本评估实例 1 用小学生中独生子女的比重这一指标来衡量。在现有资料,有两个结果与本研究所抽取的小学生样本口径一致成或相似,可用作比较的参考对象。 2 章永生1989年对北京两所小学1-6年级12个班及三所中学18个班的调查结果,独生子女在小学生中的比重为51.9%,非独生子女比重为48.1%,而在风笑天研究的小学生样本中,二者的比重分别为56.9%和43.1%,相差不大。四、抽样设计的原则o 1、目的性原则o 即要以课题研究的总体方案和研究目标为依据。o 2、可测性

16、原则o 指的是抽样设计能够从样本自身计算出有效的估计值或抽样变动的近似值。o 3、可行性原则o 研究者所设计的抽样方案必须在实践中切实可行。o 4、经济性原则o 抽样方案的设计要与研究的可的资源相适应。第三节概率抽样方法o 概率抽样是按照概率原理进行的,它要求样本的抽取具有随机性。o 前面已经提到,概率抽样有若干种不同的形式,每一种具体的形式有着各自不同的特点。一、简单随机抽样一、简单随机抽样o 又称纯随机抽样,是概率抽样的最基本形式。它是按照等概率原则,直接从含有N个元素中的总体中抽样n个元素组成样本。抽样时不进行任何分组排列,使总体中的任何个体都有同等被抽中的机会。o 常用的办法是抽签,但

17、对于总体元素很多的情形,采用随机数表来抽样。o 利用随机数表抽样的具体步骤:o (1)先取得一份总体所有元素的名单(抽样框);o (2)将总体中所有元素一一按顺序编号;o (3)根据总体规模是几位数来确定从随机量表中选几位数;o (4)以总体规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;o (5)根据总体规模的要求选择出足够的数码个数;o (6)依据从随机数表中选出的数码,到抽样框中找出它所对应的元素。随机数表的使用举例o从3000总体中抽取100人作为样本o1 取得总体名单;o2 从1到3000编号;o3 从随机数表中选择4位数;o具体选法是从随机数表中的任意一行和任意一列的某一个四

18、位数开始,按照从左到右,或者从上到下的顺序,以3000为标准,对随机数表中依次出现的每隔4位数进行取舍:选出3000以内的,直至选够100个。随机数表中的数码选用的数码不选原因84329909061053873020942741004101390225079361404310135986604263219126839420582507272565117609060041250726831176后4位大于3000后4位大于3000后4位大于3000与所选第3个数重.NnnN如如果果用用简简单单随随机机抽抽样样从从个个体体数数为为 的的总总体体中中抽抽取取一一个个容容量量为为 的的样样本本时时,每

19、每个个个个体体被被抽抽到到的的概概率率都都等等于于结结论论:简单随机抽样体现了抽样的客观性与公平性,简单随机抽样体现了抽样的客观性与公平性,由于这种抽样方法比较简单,所以成为其他更由于这种抽样方法比较简单,所以成为其他更复杂的抽样方法的基础复杂的抽样方法的基础. .等概率抽样等概率抽样. . 简单随机抽样的特点:简单随机抽样的特点:不放回抽样;不放回抽样; 逐个进行抽取;逐个进行抽取;练习: 对总数为对总数为N的一批零件抽取一个容量为的一批零件抽取一个容量为30的样本的样本,若每个若每个零件被抽取的概率为零件被抽取的概率为0.25,则则N= .二、系统抽样o 系统抽样又称等距抽样或机械抽样。它

20、是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。o 具体步骤o (1)给总体中的每一个个体按顺序编号,即制定出抽样框。o (2)计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式导出:o K= N no (3)在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号A,称为随机起点。o 三、分层抽样o 分层抽样又称类型抽样,它是先将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽

21、样的方法抽取一个子样本,最后,将这些样本合起来构成总体的样本。o 如对某大学的学生进行分层抽样,首先要将所有的学生按年级加以分类,然后再分别从一年级、二年级、三年级和四年级的学生中,各抽出适当数量的要素组成样本。分层抽样的优点o :在不增加样本规模的前提下降低抽样误差,提高样本的代表性,增强抽样的精度;同时也非常便于了解总体内不同层次的情况。o 运用分层抽样时,要注意:o (1)分层的标准o 第一,以所要分析和研究的主要变量或相关变量作为分层的标准。o 第二,以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。o 第三,以那些已有明显层次区分的变量作为分层变量。四、整

22、群抽样o 整群抽样是从总体中随机抽取一些小的群体,然后由所抽中的若干个小群体内的所有元素构成调查的样本。即只要该群被选中,该群中的所用成员都进入随后的子样本。o 例:从某大学3000名学生中抽取300个为样本,可以从该校的100个班级中,随机抽取10个班级,抽中的10个班级的全部300名学生就组成样本。(单选)o 整群抽样的抽样单位是成群个体,如居民家庭、班级、居委会、村庄、企业等o 整群抽样中对小群体的抽取可采用简单随机抽样、系统抽样或分层抽样的方法。五、多段抽样o 多段抽样又称多级抽样或分段抽样,它是把抽样过程分成几个阶段来进行。o 方法:先从总体随机抽取若干大群(组),然后再从这 几个大

23、群(组)内抽取几个小群(组),这样一层层抽下来,直至抽到最基本的抽样元素为止。o 举例:对某乡20000人抽样o 县20个乡-从中抽出-8个乡-从中抽出-15个村-从中抽出-500人o 注意:运用多段抽样方法时要注意在类别和个体之间保持合适的比例。第四节户内抽样与犘犘犛抽样o 一、户内抽样的方法o 户内抽样:o 从所抽中的每户家庭中抽取一个成年人,构成访谈对象的抽样过程。其基本要求是使得每户家庭中所有的成年人,都具有同等的概率被选中。 三种抽样方法的比较三种抽样方法的比较类别类别共同点共同点各自各自特点特点相互相互联系联系适用适用范围范围简单简单随机随机抽样抽样系统系统抽样抽样分层分层抽样抽样

24、抽样过程抽样过程中每个个中每个个体被抽取体被抽取的概率相的概率相等等.从总体中逐从总体中逐个抽取个抽取 .将总体均分成几将总体均分成几部分,按事先确部分,按事先确定的规则分别在定的规则分别在各部分中抽取各部分中抽取 .将总体分成几将总体分成几层,分层进行层,分层进行抽取抽取 .在起始部分在起始部分抽样时采用抽样时采用简单随机抽简单随机抽样样 .各层抽样时各层抽样时采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样. . 总体中的总体中的个数较少个数较少 总体中的总体中的个数较多个数较多 总体由差异总体由差异明显的几部明显的几部分组成分组成 二、抽样o PPS抽样调查法( Probabilit

25、Proportionate to Size Sampling)又称,按规模大小成比例的概率抽样。o PPS抽样的特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。o PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。o 具体可参见http:/ 非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其它条件来提取样本。因而,样本的代表性较小,误差有时相当大。这种方法一般只是探索性研究中采用。o 主要类型:偶遇抽样、判断抽样、定额抽样、滚雪球抽样偶遇抽样o 偶遇抽样又称方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的

26、形式抽取偶然遇到的人作为调查对象,或者仅仅选择那样离得最近的、最容易找到的人作为调查对象。“街头拦人”法即为一例。o 偶遇抽样的优点是方便省力,但不能保证总体中每一个成员都有同等的被抽中的概率,样本的代表性差,有很大的偶然性。判断抽样o 判断抽样又称主观抽样、立意抽样,它是调查者根据研究目标和自己主观的分析来选择和确定调查对象的方法。两层含义:(1)主观判断;(2)有目的的选择样本。o 判断抽样的优点:可以充分发挥研究人员的主观能动作用。缺点:样本的代表性难以判断。多用于总体规模小、涉及范围窄或时间、人力等条件有限而难以进行大规模抽样的情况。 o 举例: 研究者专找那些偏离总体平均水平者作为调

27、查对象,探寻有意义的变量和范围,研究是什么使他们发生偏离。定额抽样 1 又叫配额抽样,与分层抽样中的按比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层(类)所占的比例与他们在总体中所占的比例一样,但不同的是,分层抽样中各层样本是随机抽取的,而定额抽样中各层样本是非随机抽取的。2定额抽样是以代表总体为目的的,因此必须对总体的性质有充分的了解,如不同性别、年龄、教育水平的人在总体中各占多大比例等等,然后按此比例分配应抽定额。3定额抽样的假定: (1)只要类型划分较细,那么同一个类型中的每一个个体都是同质的,因而无需采用随机抽样。 (2)只要类型划分合理,且分配给各类的名额符合总体中各类人员的分布,那么样本就可以准确地反映总体。 从理论上这两个假设是成立的,但实施中很难做到。其一是分层是不可能同时兼顾总体的众多属性,其二在于 有关总体分布变化的最新信息不易得到,配额的合理性很难保证。研究者一般根据研究的主要目标来进行。第六节样本规模与抽样误差o 一、样本规模o 样本规模又称为样本容量,指的是样本中所含个案的多少。统计学中通常以30为界,把样本分为大样本(30个个案及以上)和小样本(30个个案以下)但社会学中样本规模与此不同,有很多因素影响着样本规模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论