抽样和研究设计.ppt_第1页
抽样和研究设计.ppt_第2页
抽样和研究设计.ppt_第3页
抽样和研究设计.ppt_第4页
抽样和研究设计.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、a,1,5讲座的取样和研究设计,a,2,引言和问题,很多情况下,社会研究者希望对特定社会现象的整体或特定类型的人进行全面的解释,但是对其中每个因素(或个别)的研究往往不切实际。因此,选择可以代表全体的部分个人,成为研究者需要解决的问题之一。此选择是样品。问题:1 .我们为什么要取样?2.抽样方法,抽样包括哪些类型?具体的抽样方法是什么?如何进行研究设计?a,3,思考:据中央电视台调查,约有80%的观众在春晚满意,新浪网站调查,只有20%的现实观众在春晚满意。a、4、1、采样的含义和作用;(a)采样的优点:时间、成本和准确性。很多情况下,社会研究者希望对特定社会现象的整体或特定类型的人进行全面的

2、解释,但对这些因素(或个别)的研究往往是不切实际的。因此,选择可以代表全体的部分个人,成为研究者需要解决的问题之一。此选择是样品。取样可以节省时间和资金。同时,在研究结果的准确性方面,仔细取样的结果也不比整个研究中每个人的结果差。a,5,(2)采样的作用为人们实现“部分整体认识”的目标提供了方法和方法。案例:里根于1984年当选为美国新总统。见附表,2009,119页),a,6,对各类研究人员来说,取样是个问题。我们不能研究自己感兴趣的所有事例,也不能祷告。每个科学计划都研究一些例子,试图发现可以应用于一切的东西,这种研究的结果按我们的一般说法是“一般规则”。贝克尔、交易的诡计、67、a、7、

3、a、8、(4)样品的两种类型:1。概率抽样:基于数学概率论的随机原则的抽样。“关于采样的大部分讨论来自定量研究人员。他们的基本目标是获取代表性样本,或从一个大单位或事件的集合或总体中获取小单位或案例的集合,以便研究者研究更小的群体,对更大的群体做出正确的推断。研究者们关注的是能够生成更大的代表性样本(即样本与整体非常相似)的特定技术。数量研究人员倾向于使用基于数学概率论的抽样类型(称为概率抽样)(纽曼2007: 266)。2.不扩散率抽样:根据研究人员的主观意愿、判断或方便程度进行抽样。”质的研究人员对提取标本的代表性和一个概率标本的技术细节不太在意。相反,重点是标本、小单位、事例、行动的集合

4、体如何显示社会生活。取样的基本目的是收集特殊案例、事件和行动,以澄清和加深理解。定性研究的重点是为了提高研究者对特定内容的社会生活过程认识而发现的案例。为此,定性研究者倾向于采用第二类抽样,即不扩散率抽样。“(纽曼2007: 267)。3.这两种类型的采样还可以细分为多种不同的形式。见笑2009: 120),a,9,a,10,3取样概念(笑,2009,116-118页),1,全部(population) (1)(2)元素是构成整体的最基本单位。在社会研究中,最常见的枪声是由社会中的特定个人组成的,这些个人就是这一整体因素。案例一:需要研究全省大学生的职业倾向。那么这个地方所有的在校大学生都是我

5、们研究的总汇,所有的在校大学生都是那个总汇。案例2:研究城市居民家庭生活质量。那么,该城所有居民家庭都是总汇,其中每个家庭都是总汇。,a,11,2。样本与样本(1)样本(sample):以特定方式整体萃取的某些元素的集合。或者,示例是整个子集。(2)采样:以特定方式从构成整个零件的所有零件族中选择或提取零件部分的过程。3.抽样单位和抽样框(1)抽样单位(sampling unit):一个直接抽样使用的主要单位。采样单位和元素有时可以相同或不同。在这个地方,如果从全体在校大学生(12万8000名)中直接选出1000名大学生,那么这些个别大学生就是元素和取样单位。如果从该人口中导入40个类(此类的

6、数量正好为1000个),则该类是抽样单位。a、12、(2)“示例框”(sampling frame)也称为示例范围。一次直接采样中的整个采样单位列表。例如,在某省研究在校学生就业倾向的同时,直接选出的1000名大学生的名单就是此次标本的抽样箱。这40个班级的名单是另一个样品箱。a,13,案例讨论:美国杂志文学摘要在1920年、1924年、1928年、1932年美国总统选举时,从州登记部和电话簿中挑选了样本,让调查者调查选举意向,受访者发回投票意向,这四个预测都是正确的。1936年增加到1000万人,兰登预测将大胜罗斯福,结果错了。罗斯福当选了。分析:(1)原因是样品箱错误,未正确代表整个目标(

7、所有选民),排除了没有电话或汽车的人,1936年这部分选民占了很高的比例,该框架排除了近65%的总因素和有罗斯福偏好倾向的低收入选民。(2)之前预测了几次正确的原因:高收入和低收入群体的投票对象没有多大区别;另外,经济大萧条前相对较多的低收入阶层也有可能购买电话和汽车。a,14,“好的抽样箱是实现好的抽样的关键。采样框和概念定义的整体之间存在差异,可能是偏差的主要来源。如果变量的理论定义和任务定义之间存在差异,则会创建有效性不足测量,并且由于示例框和整体之间的不匹配,会生成错误的示例。研究者必须尽力减少这种分歧”(纽曼2007: 274)。a、15、a、16,4。参数值和统计(1)“参数值”(

8、parametre)、总值、整个内变量的综合说明或整个元素的特定属性(变量)的综合数量表示。统计中最常见的是一个变量的平均值,例如住在一个城市的青年的平均年龄。(2)统计,也称为样例值。样品中变量的综合说明。或者是样品中所有要素的特定特性(变量)的综合数量表示法。样品值是根据样品的所有因素计算出来的,只是该总量的一个度量值。a,17,5。采样分布:根据从一个群体中持续提取样本时可能发生的各种样本统计的分布概率原则形成的合理分布。a,18,3,采样方法:(a)非概率采样,非概率采样不是等价的概率原则,而是根据人们的主观经验或其他条件提取样本。通常只用于定性研究。以下是一些常用方法:(a)偶然取样

9、也称为方便取样或自然取样。研究人员根据现实情况,将偶然遇到的人以自己方便的形式提取到对象中,或者只选择靠近并且容易找到的人作为对象。(b)配额采样也称为配额采样。研究人员将整体分类后,决定从各类别中选出的人数。2、能保证样品的整体差异。a,19,(3)判断抽样(judge mental sampling)也称为重新抽样(purposive sampling),研究人员是根据自己的研究目标和主观分析选择和确定研究对象的方法。这种方法具有很强的主观性,其结果如何往往与研究者的理论培养和实际经验以及对对象的熟悉程度有很大关系。“根据专家的判断选择事件,或根据内心的特定目的选择事件”(纽曼2007:

10、269)。1、用于选择可以提供信息的独特案例。2、研究人员可以使用重新取样,选择难以接近的特殊群体的成员。3、研究者确认特殊病例类型进行深入调查。a,20,(4)雪球取样无法理解整体情况时,先调查全体成员中的多少人,问他们是否知道更多合格的人。再去调查那些人,问问还有哪些人符合条件。笑2009: 148)“社会研究者经常关心相互关联的人或组织网络。该网络可以是全世界讨论相同问题的科学家、中等规模城市的精英成员、从事有组织犯罪的家庭成员、重要银行和企业社会的董事,也可以是大学校园中相互发生性关系的人。这里的重要特征是每个个人或单位与其他部分直接或间接连接。但这并不意味着网络上的所有人都直接相互认

11、识,相互作用或相互影响。相反,这意味着大部分人和事都是通过直接或间接的关系,在相互连接的网络里”(纽曼2007: 270)。a,21,a,22,(5)异常案例抽样“当研究者搜索与主要模型不同或与其他案例的主要特征不同的案例时,异常案例抽样方法(也称为极端案例抽样方法)。像重新取样一样,研究者使用多种技术来查明具有某种特性的案例。异常案例抽样与意图抽样的不同之处在于,不常见、有差异或不需要标识特殊案例集,并代表全部。选择不寻常的案例的原因是,研究人员想通过调查其他案例、主流事件等,进一步了解社会生活。”纽曼2007: 271),a,23,(6)理论抽样“研究者发展根理论时,他会使用理论抽样仔细选

12、择抽样(例如群众、情况、时间、持续时间等)。日益增加的理论兴趣指导案例选择。研究人员根据对事例特性的新理解选择事例。例如,现场研究人员可能在周末观察到某些场景和一群人。理论上,你可以问,在改变不同的时间,场景的不同方面后,人们的行为是否相同。因此,研究人员可能会在其他期间(如晚上和周末)取样更丰富的图像,以了解重要条件是否相同。”纽曼2007: 272)个案:微博现象的调查。a,24,II采样方法(2):概率采样,(a)定义1。概率采样:基于数学概率论的随机原则进行采样。2.随机这个词在数学上有特殊的意义,在数学上是指所谓随机结果的过程。也就是说,选择过程强调了真正随机的方法,研究人员可以计算

13、出结果出现的概率。在实际随机历史记录中,每个元素被选择为相同大小的概率(Newman 2007: 275)。a,25,3。案例讨论:美国杂志文学摘要在1920年、1924年、1928年、1932年的美国大选中,挑选了车主登记簿和电话簿,发送了调查选举意图的明信片,受访者发回了投票意向,这四个预测都是正确的。1936年增加到1000万人,兰登预测将大胜罗斯福,结果错了。罗斯福当选了。分析:(1)抽样框错误的原因是没有正确代表整个目标(所有选民),排除了没有电话或汽车的人,1936年占了总要素的近65%,除了罗斯福偏好倾向的低收入选民以外的选民的高比例。(2)之前预测了几次正确的原因:高收入和低收

14、入群体的投票对象没有多大区别;另外,经济大萧条前相对较多的低收入阶层也有可能购买电话和汽车。4.样品分布:根据从一个群体中持续提取样品时可能发生的各种样品统计的分布概率原则形成的合理分布。a,26,(b)概率采样的一般程序1。一般定义:在取样之前明确定义整体范围和边界。2.开发抽样框:收集所有抽样单位的列表并对列表编号。3.确定抽样计划:确定要使用的抽样方法。实际抽取样品:作为现场抽取样品。5.样品质量评估:根据研究人员的抽样设计和抽样实施过程的质量进行评估。一般使用比较方法:将可能得到的反应的全部几个重要特征及其分布的数据与样品中类似指标的数据进行比较。差异小,样品质量高。相反,样品的质量很

15、低。案例2009: 127,a,27,(c)取样设计原则:1。请参阅目的原则。设计抽样计划时,应该从正在研究的问题、对确保研究资料最有帮助的因素、最适合研究目的的因素等出发。2.可测试性原则:可以从样品本身计算有效的估计值。可行性原则:抽样方案必须实际可行。4.经济原则:抽样方案应适合可用资源。a,28,1。简单随机抽样(simple random sampling)也称为纯粹随机抽样(simple random sampling)。在包含n个元素的整个过程中,直接随机提取n个元素以构建示例。其中Nn .这类似于抽签。(1)最简单的随机采样,是其他类型的模仿对象。(2)开发精确的示例框,对示例

16、框内的所有元素进行编号,并根据数学随机数从示例框中选择元素。a,29,中心极限定理:“样本分布中不同随机样本组的数量无限增加之前,样本的模式和整体参数越来越可预测。在许多随机采样集中,采样分布表示随着提取的采样组数的增加,接近整个参数的正常曲线(Newman 2007: 278)。a、30、a、31、“随机采样不能保证每个随机采样集完全代表全部。相反,这意味着大多数随机抽样在大多数情况下相当接近整体;因此,可以计算特定样本集的不准确概率。研究者利用从这组抽样中获取的信息估计抽样分布,估计这组抽样偏离或不代表整个机会(即抽样误差的大小)的机会。同时,他把这些信息与中央极限定理的知识相结合,建立了信赖区间”(纽曼2007: 279)。a,32,2。系统取样也称为等距取样或机器取样。对整个单位进行编号,计算一定的间隔,然后按一定的间隔抽取个人的号码制作标本。k(采样间隔)=N(完整大小)/n(采样大小)优点:比简单随机采样更容易。(1)对采样框中的每个元素编号。(2)计算采样间隔后,间隔成为准随机提取方法。a,33,3。“分层取样”(stratified sampling)也称为类型取样。将整个单位的所有单位按特定特性划分为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论