社会研究方法10_第1页
社会研究方法10_第2页
社会研究方法10_第3页
社会研究方法10_第4页
社会研究方法10_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、社会研究方法(十)社会研究方法(十)第九章第九章 抽样抽样中国人民大学社会学系中国人民大学社会学系 王水雄王水雄社会研究方法(十)抽样2本章定位本章定位了解社会科学家如何通过选择一小部分了解社会科学家如何通过选择一小部分人进行研究,并将结论推及到千百万未人进行研究,并将结论推及到千百万未被研究的人。被研究的人。社会研究方法(十)抽样3主要内容主要内容1 导言导言2 抽样的历史抽样的历史3 非概率抽样非概率抽样4 概率抽样的逻辑概率抽样的逻辑5 概率抽样理论和抽样分布概率抽样理论和抽样分布6 抽样设计的类型抽样设计的类型社会研究方法(十)抽样41 导言导言19961996年,美国的民意调查机构通

2、过年,美国的民意调查机构通过2000样本,样本,正确预测正确预测9000万选民的行为。万选民的行为。社会研究方法(十)抽样51.1抽样的初步界定抽样的初步界定我们永远也不可能观察与研究对象我们永远也不可能观察与研究对象(社会现象社会现象)相关的所有行动和行动者。相关的所有行动和行动者。社会研究者一定得要进行选择观察,只有这样社会研究者一定得要进行选择观察,只有这样才能对不曾观察到的人与事进行总结。但这常才能对不曾观察到的人与事进行总结。但这常常涉及如何对观察对象进行选择。常涉及如何对观察对象进行选择。抽样就是选择观察对象的过程。抽样就是选择观察对象的过程。社会研究既是一门科学,也是一门艺术,而

3、抽样则社会研究既是一门科学,也是一门艺术,而抽样则更偏向于科学。更偏向于科学。 随机选择是一种精确而科学的过程,一点也随随机选择是一种精确而科学的过程,一点也随便不得。便不得。社会研究方法(十)抽样62 抽样的历史在美国抽样的历史在美国为什么需要抽样?为什么需要抽样?(1)总体内部的元素的异质性的存在。)总体内部的元素的异质性的存在。(2)存在对总体调查的约束因素。)存在对总体调查的约束因素。抽样技术发展的动力?抽样技术发展的动力?在社会科学研究中,抽样方法的发展是与在社会科学研究中,抽样方法的发展是与民主民主化和市场化化和市场化的发展相伴随。选举的竞争的加剧的发展相伴随。选举的竞争的加剧和市

4、场竞争的日趋激烈,是抽样技术日益精确和市场竞争的日趋激烈,是抽样技术日益精确化的现实动力。化的现实动力。中国的民意问题中国的民意问题社会研究方法(十)抽样72.1 2.1 民意调查与抽样技术民意调查与抽样技术样本是总体的一个具体子集,用以观察样本是总体的一个具体子集,用以观察并对总体的特征进行推论。并对总体的特征进行推论。民意抽样调查关注的是研究人员评估民民意抽样调查关注的是研究人员评估民意意(像投票倾向像投票倾向)的能力。的能力。社会研究者已发展出适合不同研究情境社会研究者已发展出适合不同研究情境的抽样技术。的抽样技术。虽然目前的技术已十分精确,仍然需要虽然目前的技术已十分精确,仍然需要关注

5、曾经有过的错误。关注曾经有过的错误。社会研究方法(十)抽样82.1.1 2.1.1 阿尔夫阿尔夫兰登总统兰登总统文学文摘文学文摘向各州被调查者发明信片的方式,让他向各州被调查者发明信片的方式,让他们把支持的候选人写上并寄回来。们把支持的候选人写上并寄回来。其其被调查者是从电被调查者是从电话簿和汽车牌照登记簿名单中随机选出来的。它曾成话簿和汽车牌照登记簿名单中随机选出来的。它曾成功地预测了功地预测了1920、24、28、32年的大选结果。年的大选结果。在在1936年,它对年,它对1,000万人进行调查,回收了万人进行调查,回收了200万人万人以上的回答。结果显示,有以上的回答。结果显示,有57%

6、的人支持共和党的候的人支持共和党的候选人阿尔夫选人阿尔夫兰登,而当时在任的总统兰登,而当时在任的总统富兰克林富兰克林罗斯罗斯福的支持率为福的支持率为43%43%。但两个星期之后正式投票的结果出来了,罗斯福以但两个星期之后正式投票的结果出来了,罗斯福以61%的得票率,获得了连任。为什么预测失败?的得票率,获得了连任。为什么预测失败?社会研究方法(十)抽样92.1.2 盖洛普的成功预测盖洛普的成功预测乔治乔治盖洛普(盖洛普(George Gallup)在)在1936年成功年成功地预测了罗斯福的当选。这也使得他在民意调地预测了罗斯福的当选。这也使得他在民意调查中崭露头角,后来他成立了大名鼎鼎的盖洛查

7、中崭露头角,后来他成立了大名鼎鼎的盖洛普民意测验中心。普民意测验中心。1936年的成功,主要归因于他采用了年的成功,主要归因于他采用了配额抽样配额抽样(quota samplingquota sampling)的方法)的方法。这种方法以对抽。这种方法以对抽样总体的性别、收入、年龄等特征的把握为基样总体的性别、收入、年龄等特征的把握为基础。通过充分了解全国各收入阶层的民众总数,础。通过充分了解全国各收入阶层的民众总数,盖洛普选择的样本就能保证从各个收入阶层中盖洛普选择的样本就能保证从各个收入阶层中选择出的人数具有正确的比例分布。选择出的人数具有正确的比例分布。社会研究方法(十)抽样102.1.3

8、 2.1.3 托马斯托马斯杜威总统杜威总统 盖洛普和美国民意测验中心利用配额抽样方法盖洛普和美国民意测验中心利用配额抽样方法在在1936、1940与与1944年,成功地预测了当年的年,成功地预测了当年的总统当选人。但在总统当选人。但在1948年他们错误地预测纽约年他们错误地预测纽约市长杜威市长杜威(Thomas Dewey)能击败当时在位的哈能击败当时在位的哈利利杜鲁门杜鲁门(Hany Tmman)而当选总统。而当选总统。1948年的预测失败包含了多种因素年的预测失败包含了多种因素十月初就停止了民意测验的工作十月初就停止了民意测验的工作不少选民在竞选阶段保持着尚未决定的态度不少选民在竞选阶段保

9、持着尚未决定的态度样本不具代表性,盖洛普的抽样依据的是样本不具代表性,盖洛普的抽样依据的是1940年的年的人口普查资料人口普查资料农村人口涌入城市。农村人口涌入城市。社会研究方法(十)抽样112.2 2.2 两种抽样方法两种抽样方法概率抽样概率抽样目前,概率抽样仍然是社会科学研究中选取目前,概率抽样仍然是社会科学研究中选取大型和具代表性样本的主要方式大型和具代表性样本的主要方式。非概率抽样非概率抽样很多研究情境经常使得概率抽样变得不可能很多研究情境经常使得概率抽样变得不可能或不适合。而非概率抽样或不适合。而非概率抽样(nonprobability sampling)技术倒经常是最适合的方式。技

10、术倒经常是最适合的方式。 社会研究方法(十)抽样123 非概率抽样非概率抽样非概率抽样不是按照概率均等的原则,非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其他条件来而是根据人们的主观经验或其他条件来抽取样本。抽取样本。有些时候非概率抽样技术更为适用。有些时候非概率抽样技术更为适用。就近法偶遇抽样就近法偶遇抽样目标式或判断抽样目标式或判断抽样滚雪球抽样滚雪球抽样配额抽样配额抽样社会研究方法(十)抽样133.1 就近法偶遇抽样就近法偶遇抽样有时你必须使用就近法有时你必须使用就近法(accidental sampling) ,或是依赖偶遇样本,但却,或是依赖偶遇样本,但却很难确定这些研

11、究对象的代表性。很难确定这些研究对象的代表性。比如:街头拦人、在商场里询问顾客、调查比如:街头拦人、在商场里询问顾客、调查大班学生等等。大班学生等等。没有保证总体中每个样本都具有同等的没有保证总体中每个样本都具有同等的被抽中的概率。被抽中的概率。社会研究方法(十)抽样143.2 目标式或判断抽样目标式或判断抽样目标式抽样是研究者用自己的判断来选目标式抽样是研究者用自己的判断来选择样本,有时也称为判断抽样。择样本,有时也称为判断抽样。其结果如何往往与研究者的理论修养、其结果如何往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很大实际经验以及对对象的熟悉程度有很大关系。关系。异常案例研究:通

12、过对异常案例的考察异常案例研究:通过对异常案例的考察加深对态度和行为规律的理解加深对态度和行为规律的理解社会研究方法(十)抽样153.3 滚雪球抽样滚雪球抽样滚雪球抽样常用于较小的总体,每个研滚雪球抽样常用于较小的总体,每个研究对象都被要求引见其他的研究对象。究对象都被要求引见其他的研究对象。挑选线人时应考虑他们是否能提供被研挑选线人时应考虑他们是否能提供被研究群体的广阔而多方面的信息。究群体的广阔而多方面的信息。比如,对获得无家可归者、流动劳工及非法移比如,对获得无家可归者、流动劳工及非法移民等的样本,此方法就十分适用。在实地调查民等的样本,此方法就十分适用。在实地调查中经常运用。中经常运用

13、。社会研究方法(十)抽样163.4 配额抽样配额抽样配额抽样也是一种非概率抽样方法。先配额抽样也是一种非概率抽样方法。先对整个总体对整个总体(配额矩阵配额矩阵)的特性进行详细描的特性进行详细描述,然后再挑出样本,以使它们反映总述,然后再挑出样本,以使它们反映总体内不同组合的侧面。体内不同组合的侧面。配额矩阵对总体特性的反映程度在相当配额矩阵对总体特性的反映程度在相当程度上影响配额抽样的代表性。程度上影响配额抽样的代表性。有些学者试图用配额和概率抽样相结合的方式有些学者试图用配额和概率抽样相结合的方式进行对象选择,这种方式的效果还有待观察。进行对象选择,这种方式的效果还有待观察。社会研究方法(十

14、)抽样173.5选择线人选择线人受访者:提供有关自身情况的人士受访者:提供有关自身情况的人士线人:直接谈论团体一切的某个成员线人:直接谈论团体一切的某个成员线人对于要了解某个领域情况的社会研线人对于要了解某个领域情况的社会研究者非常重要。究者非常重要。他的身份及与群体成员的互动情况他的身份及与群体成员的互动情况是否是该领域中具有代表性的人物是否是该领域中具有代表性的人物不能因为容易接触而忽视其他问题不能因为容易接触而忽视其他问题线人边缘性的危险线人边缘性的危险社会研究方法(十)抽样184.1.1 抽样概念和专有名词抽样概念和专有名词要素:人或一定类型的群体。分析单位要素:人或一定类型的群体。分

15、析单位总体:研究要素的特定集合体。总体:研究要素的特定集合体。研究总体:从中抽出样本的全体要素总和。研究总体:从中抽出样本的全体要素总和。抽样单位:抽样各阶段考虑选取的某个要素或抽样单位:抽样各阶段考虑选取的某个要素或者某组要素。者某组要素。抽样框:抽样单位的实际名单,样本或某些阶段的抽样框:抽样单位的实际名单,样本或某些阶段的样本从抽样框中选取。样本从抽样框中选取。观察单位:足以提供资料的一个或一组要素的观察单位:足以提供资料的一个或一组要素的集合。观察单位与分析单位。集合。观察单位与分析单位。社会研究方法(十)抽样194.1.2 抽样概念和专有名词抽样概念和专有名词变量:一组互斥的属性特征

16、集合。常量变量:一组互斥的属性特征集合。常量变异性变异性参数值:关于总体中某变量的综合描述参数值:关于总体中某变量的综合描述统计值:样本中某变量的综合描述统计值:样本中某变量的综合描述置信水平:样本统计值落在参数值某一置信水平:样本统计值落在参数值某一正负区间内的概率。置信区间是某个统正负区间内的概率。置信区间是某个统计值的扩展,可使我们的置信度提高。计值的扩展,可使我们的置信度提高。社会研究方法(十)抽样204.2 概率抽样的逻辑概率抽样的逻辑总体的异质性总体的异质性概率抽样方法对于从大的、已知总体中概率抽样方法对于从大的、已知总体中抽取有代表性的样本极为有用。抽取有代表性的样本极为有用。概

17、率抽样的基本原则是总体中的所有要概率抽样的基本原则是总体中的所有要素在抽样过程中都有非零的中选概率。素在抽样过程中都有非零的中选概率。社会研究方法(十)抽样214.2.1 难以意识的难以意识的抽样误差抽样误差 有意识的回避和疏漏、图书馆有意识的回避和疏漏、图书馆社会研究方法(十)抽样224.2.2 代表性与选择概率代表性与选择概率概率抽样的一个基本原则是,如果总体概率抽样的一个基本原则是,如果总体中的每一个体被抽取为样本的概率相同,中的每一个体被抽取为样本的概率相同,那么从这个总体中抽取的样本,就具有那么从这个总体中抽取的样本,就具有对该总体的代表性对该总体的代表性。即使最仔细的抽样也不可能提

18、供对总体的完即使最仔细的抽样也不可能提供对总体的完全代表性,一定程度的抽样误差总是存在的。全代表性,一定程度的抽样误差总是存在的。概率抽样能让研究者估测样本的抽样误差。概率抽样能让研究者估测样本的抽样误差。社会研究方法(十)抽样235.1 概率抽样理论概率抽样理论等概率抽样就是总体中每一个要素获选等概率抽样就是总体中每一个要素获选的概率都相同。的概率都相同。随机数表、电脑程序随机数表、电脑程序抽样框是总体所有要素的名单或是准名抽样框是总体所有要素的名单或是准名单表单表(quasi1ist),也是样本的选择来源。,也是样本的选择来源。一个样本的代表性,直接依赖于抽样框一个样本的代表性,直接依赖于

19、抽样框代表总体要素的程度。代表总体要素的程度。社会研究方法(十)抽样245.2.1 5.2.1 十个人的抽样分布十个人的抽样分布假设有假设有10个人个人社会研究方法(十)抽样255.2.2 5.2.2 十个人的抽样分布十个人的抽样分布图中点的分布为抽样分布图中点的分布为抽样分布社会研究方法(十)抽样265.2.3 5.2.3 十个人的抽样分布十个人的抽样分布样本量为样本量为2的话的话社会研究方法(十)抽样275.2.4 5.2.4 十个人的抽样分布十个人的抽样分布社会研究方法(十)抽样285.2.5 5.2.5 十个人的抽样分布十个人的抽样分布社会研究方法(十)抽样295.3.1 5.3.1

20、二项式抽样分布二项式抽样分布从从20000名学生中随机抽取名学生中随机抽取100名学生,看其对名学生,看其对学校某校规的赞成与反对程度(二分变量)。学校某校规的赞成与反对程度(二分变量)。数百组样本的抽样分布。数百组样本的抽样分布。社会研究方法(十)抽样305.3.2 二项式抽样分布二项式抽样分布首先,如果我们由总体内随机抽取许多独立的首先,如果我们由总体内随机抽取许多独立的样本,这些随机抽样所得到的统计结果将以一样本,这些随机抽样所得到的统计结果将以一种可知的方式分布在总体参数附近。种可知的方式分布在总体参数附近。 其次,概率理论也提供给我们计算公式,以估其次,概率理论也提供给我们计算公式,

21、以估计这些样本统计值与真实值的差距。计这些样本统计值与真实值的差距。 社会研究方法(十)抽样315.3.3 二项式抽样分布二项式抽样分布如果总体参数值已知,且进行了大量随机抽样,如果总体参数值已知,且进行了大量随机抽样,我们将可以预测有多少比例的样本统计值会落我们将可以预测有多少比例的样本统计值会落在参数值周围固定的分布范围内。在参数值周围固定的分布范围内。请注意,这里只是阐释了概率抽样的逻辑,并没有请注意,这里只是阐释了概率抽样的逻辑,并没有描述实际的研究过程。描述实际的研究过程。概率理论指出,当我们进行相当多次的抽样后,会概率理论指出,当我们进行相当多次的抽样后,会有有6868的样本落在与

22、参数值相距一个标准误的范围的样本落在与参数值相距一个标准误的范围内。内。反过来考虑这一逻辑,我们可以推论,对任何一组反过来考虑这一逻辑,我们可以推论,对任何一组随机抽样样本而言,其结果落在与参数值相距一个随机抽样样本而言,其结果落在与参数值相距一个标准误范围内的概率应该是标准误范围内的概率应该是6868。 社会研究方法(十)抽样325.3.4 二项式抽样分布二项式抽样分布虽然我们在某种程度上可以确信,样本虽然我们在某种程度上可以确信,样本会落在与参数值接近的某个范围内,然会落在与参数值接近的某个范围内,然而我们并不知道参数值是多少。而我们并不知道参数值是多少。为了解决这一问题,我们必须用样本统

23、为了解决这一问题,我们必须用样本统计值取代公式中的参数值。计值取代公式中的参数值。也就是说,没有真实值时,我们只好以也就是说,没有真实值时,我们只好以最佳的猜测值来代替。最佳的猜测值来代替。 社会研究方法(十)抽样336 抽样设计的类型抽样设计的类型简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样多级整群抽样多级整群抽样概率比例抽样概率比例抽样社会研究方法(十)抽样346.1 简单随机抽样简单随机抽样简单随机抽样任何要素都具有同等的、简单随机抽样任何要素都具有同等的、独立于任何其他事件的被抽到的概率。独立于任何其他事件的被抽到的概率。从逻辑上讲,简单随机抽样是概率抽样从逻辑上讲,简单随

24、机抽样是概率抽样最基本的技巧,尽管实际中这种方法很最基本的技巧,尽管实际中这种方法很少被使用。少被使用。要素名单、随机数表要素名单、随机数表例子例子社会研究方法(十)抽样356.2 系统抽样系统抽样系统抽样所采取的原则是随机选择抽样系统抽样所采取的原则是随机选择抽样框中的一个号码,然后每隔框中的一个号码,然后每隔K个要素选个要素选择一个要素。择一个要素。抽样间距、抽样比率抽样间距、抽样比率打破排列的周期性问题打破排列的周期性问题除了少数例外,这种方法与简单随机抽除了少数例外,这种方法与简单随机抽样的功能是相同的,然而,它更为实用。样的功能是相同的,然而,它更为实用。社会研究方法(十)抽样366.3 分层抽样分层抽样分层是在抽样之前先将总体要素按不同的性质分层是在抽样之前先将总体要素按不同的性质来事先加以区分的过程。(增加次级集合之间来事先加以区分的过程。(增加次级集合之间的异质性)的异质性)降低误差两法:降低误差两法:1 1大样本、大样本、2 2同质总体同质总体分层变量的选择分层变量的选择从总体中各次级集合抽出适当数量的要素。从总体中各次级集合抽出适当数量的要素。这样的过程能降低抽样误差的程度,并增进样这样的过程能降低抽样误差的程度,并增进样本的代表性。本的代表性。在抽样框顺序隐含分层的情况下,系统抽样比在抽样框顺序隐含分层的情况下,系统抽样比简单随机方法更

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论