版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、抽样:选择少数代表多数教育研究方法之九2016.11.28基本内容一、简介二、抽样的基本思想三、抽样术语四、选取研究样本的方法简介任何研究均要有明确对象,才能据以搜集资料,所以确定研究对象乃是研究设计的首要工作。一般来说,教育研究的对象以学生、教师、家长、学校行政人员、教育行政人员等于教育活动相关的人为主,当然也可以包括与教育活动有关的机构、组织、或社区,如学校、教育行政机关等。简介但无论研究对象是人或机构,当我们在选取研究对象时,都要考虑下面四个问题并做决定:第一,我们要探讨的、要解释的是哪一群人或哪一类机构?第二,我们能从哪些人或机构搜集到实证资料?用什么方法来选取这些人或机构?第三,这些
2、据以搜集资料的人或机构,究竟要有多少才算适合?第四,在选取这些人或机构的过程中,会有什么误差?如何避免?简介在上述四个问题中,已包含了研究方法论的基本概念。第一个问题涉及研究的总体(population),第二个问题涉及样本(sample)与抽样方法(method of sampling),第三个问题涉及样本大小(sample size),第四个问题涉及取样的误差(sampling error)与偏差(sampling bias)。如果使用这些术语来说明,那么选取研究对象的程序是:(1)界定研究的总体,(2)选取研究样本,(3)决定样本大小,与(4)避免抽样误差。抽样的基本思想 (1)当我们从
3、事一项研究时,都期望研究结果具有相当程度的普遍性,而能解释某一个“特定群体”的情形。这个“特定群体”就是研究的全部对象,称为“总体”(population)。抽样的基本思想 (2)有时,一项研究可以包含全部总体中的所有个体,但是在很多教育调查研究中这几乎不可能做到。时间和工作精力就是限制条件,而在调查研究中又往往涉及大容量的总体。因此,样本就用得比较普遍了。样本是总体的一个子集,研究者往往从样本特征推断出它所属的总体的特征。合适的样本让你能研究它的各种特征,并据此对整个总体做出高度精确的概括。抽样的基本思想 (3)抽样术语 (1)个体(element):是收集信息的基本单位,即分析单位。个体可
4、以是某种类型的人,也可以是家庭、组织、社区等。除此之外,个体还可以是文化产物,例如文章、杂志、歌曲、词汇等。抽样术语 (2)抽样单位(sampling unit):一个抽样单位是指在一组个体中,经由抽样程序选出的一个个体。个体与抽样单位在有些研究中是相同的,但在实际抽样中,抽样单位往往是多层次的。例如,要调查家庭,可先在一个县抽选若干乡,然后从这些乡组成的样本中抽选某些村,最后从村样本中抽出家庭样本。这时抽样单位是乡、村、家庭三种,分别称为初级抽样单位、次级抽样单位和终极抽样单位。抽样术语 (3)目标总体(target population or theoretical population)
5、:在理论上明确界定的个体的集合体,它必须受几个方面的限定:内容、单位、范围、时间。目标总体是在理论上明确定义的整体,但在实际中很难做到使符合这一定义的一切个体均能有机会被选入样本。实际上,样本是从调查总体而不是从研究总体中抽取的。抽样术语 (4)调查总体(study population or accessible population):研究者从中实际抽取调查样本的个体的集合体,它往往是对研究总体的进一步界定,即对时间、范围做更进一步的规定。抽样术语 (5)抽样框(sampling frame):一旦我们界定了目标总体和调查总体,我们还需要在正式抽样之前做一件事我们必须得到调查总体成员的名单
6、(a list of members of the accessible population)。从中抽取样本的调查总体成员的名单被称为“抽样框”。例如:学生的花名册、电话号码簿、驾驶记录等。恰当的抽样框架对于精确的抽样是至关重要的。抽样术语 (6)抽样术语 (7)样本(sample):我们通过抽样方法所获得的一组抽样单位就构成了一个样本。抽样术语 (8)抽样术语(9)参数(parameter):关于总体中某一变量的综合描述。例如,全中国20至30岁男性的平均身高,就是一个参数值。统计量(statistic):关于调查样本中某一变量的综合描述。例如,从一个样本中得到的20至30 岁男性的平均身
7、高。抽样调查的重要内容之一就是通过样本的统计量值推算总体的参数值,从而达到由部分认识总体的目的。经典例子 (1)经典例子 (2)工作人员从汽车登记表和电话号码薄上记录的姓名,制作了抽样框架。这次预测错在抽样框架并不能精确地代表所有选民。它排除了没有电话或汽车的人,他们在1936年的全美人口中占相当大的比例,这一年是20世纪30年代大萧条最为严重的时期。这次的抽样框架排除了多达65%的总人口。经典例子 (3)文摘能准确预测之前总统选举是因为高收入和低收入的选民在投票上并无差异。此外,在大萧条之前,很多低收入的人能负担得起电话和汽车。经典例子 (4)两个教训:首先,抽样框架至关重要。其次,样本大小
8、并没有它对总体的代表性重要。选取研究样本 (1)普查 (census)vs 抽样(sample)普查是对整个总体(population)做全面的、普遍的调查。抽样是从总体中选出一部分的过程。所选出的者部分代表称为样本,样本是总体的一个子集(subset)。选取研究样本 (2)选取样本的方法一般分为两大类:非概率抽样和概率抽样非概率抽样是根据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象的总体中进行选择。概率抽样是根据概率理论,按照随机的原则选择样本,完全不带调查者的主观色彩。概率抽样的基本原则 (1)随机(random)在数学上有一个特定的含义,它是指产生一个数学上所谓随机结果的
9、过程,也就是说,选择过程是按照真正的方式运作的(如不参照任何模式),而且研究人员能够计算出结果出现的概率。在真正的随机过程中,每一个要素都有同等被选中的概率。随机过程使我们可能对样本和总体匹配程度进行数学上的估计,即抽样误差(sampling error)。在没有掌握整个总体的情况下,你每次抽样,样本都可能偏离整个总体。抽样误差表示偏离或不匹配的大小。概率抽样的基本原则 (2)各种概率样本都有三个重要特征:你必须先有调查总体中精确的抽样框架即抽样个体清单。你必须使用不带有人的主观判断的随机选择程序(例如计算机程序、随机数字表)。你必须识别并挑选特定的抽样个体,尽可能少地使用替代个体。概率抽样的
10、分类 简单随机抽样(simple random sampling)系统抽样(systematic sampling)分层抽样(stratified sampling)群集抽样(cluster sampling)简单随机抽样 (1) 简单随机抽样(SRS)是其他类随机样本的原型。在简单随机抽样时要做到:首先要确定精确的抽样框架其次要根据数学上的随机选择程序从框架中选择个体然后确定你样本里所选取的确切个体简单随机抽样 (2) 在所有的随机样本中,一开始你要给抽样框架里的每个个体从1到最后一个编上号。使用特别的计算机程序,输入样本框架的大小和样本的大小;然后程序输出一列随机数字。请注意:在选择个体前
11、必须决定样本大小。简单随机抽样 (3) 大家或许会问,在从抽样框架中选取一个个体后,应该把它放回抽样框架还是将它单独保留?通常不会放回,不会替换到原位抽样。在大多数以人为抽样单位的情况下,这样做没有意义。简单随机抽样 (4) 简单随机抽样法如应用在总体不大的情况下,实在是简便易行,而且取出的样本又有代表性。但若总体的范围很广,所包含的个体数量很多时,要将每一个体都编上号码后再来抽取,必须花费很多时间,实在不经济,有时也是不可能;而且当总体之中的个体特征有明显的群体差异时,如应用简单随机抽样法来取样,也容易有偏差而失去样本的代表性。因此,在教育研究中的取样,大都以随机为基本原则,再配合其他方法来
12、应用。系统抽样 (1) 如果大家没有基于计算机的随机数字生成器,得不到完全随机的样本,我们可以使用系统抽样(systematic sampling)的方法。正如简单随机样本一样,你仍然必须给抽样框架中的每一个个体编号,但不会使用完全随机过程生成样本,而要计算抽样间隔(sampling interval)。根据抽样间隔你能确定在挑选一个样本个体之前要跳过多少个抽样框架里的个体。系统抽样 (2) 要计算抽样间隔,把抽样框架中的全部个体的数量除以样本大小,再取最近的整数值。例如,某个抽样框架包括社会服务机构的1800名接受救济人员的名单,需要抽取300人的样本。要计算抽样间隔,把接受救济的人数除以样
13、本大小,即1800/300=6。这就表明你要跳过5个人的名字后挑选第6个人的名字加入样本。重复这一步骤,直到你取足了样本中的300人的名字。系统抽样 (3) 系统抽样法的应用时机大体与简单随机抽样法相同,但比简单随机抽样简便,尤其是在总体不大而且其中个体已有号码顺序时,更为适用。不过在应用系统抽样时,仍要细心检查,看看总体中个体的号码顺序是否随机排列。如果发现个体的号码顺序系依特定标准排列者,则不使用系统抽样,而要改用简单随机抽样。分层抽样 (1) 在一个群体中,个体的特征不完全相同。比如智力,一群儿童之中有较高智力者,也有较低智力者;身高、体重也都如此。但是我们也可以发现,有些群体相似的程度
14、较大,有些群体相似程度较小。这种群体内(intragroup)特征一致的程度称为“同质性”(homogeneity),而同质性较高的群体则成为“同质团体”(homogeneous group);分层抽样 (2) 相对的,群体内特征不一致的程度成为“异质性”(heterogeneity),而异质性较高的群体就称为“异质团体”(heterogeneous group)。比如,能力分班后的班级,就是同质团体,而常态编班下的班级就是异质团体。但同质或异质仅是程度之分,而非有无之别。分层抽样 (3) 理论上群体内个体特征的分布是常态的(normal),如人的身高、体重、智力等,在非经刻意挑选或安排的群体
15、中,大体是居中者较多,两端者较少。如果是这种群体结构,那么采用简单随机法即可取得具有代表性的样本。但是,群体的结构却常是以两个或多个“次团体”(subgroups)存在,次团体之内是同质的,而次团体之间(inter-groups)却是异质的。比如性别,就可将群体区分为两个次团体男性团体与女性团体。分层抽样 (4) 这种群体内依某种特征而形成的“次团体”,称为“层”(stratum)。男性是一个层,女性又是一个层。如以学校的年级分层则有六层(strata),每一年级是一层,显示同年级的同质性大,不同年级的同质性小。在这种情况下,如果采用简单随机抽样法来取样,就没有把握取到反映总体中次团体结构的代
16、表性样本,因此要先将总体中的次团体区分出“层”来,然后再分别从每个“层”之中以随机方式抽选样本。这样的方法称为分层抽样。分层抽样 (5) 需要注意的是,在不必分层而分层时,不会影响研究结果;但在必须分层而未分层时,则可能影响研究结果。因此保守的策略是:尽量采取分层抽样。分层抽样 (6) 某些情况下,你希望在样本中确保包含有总体的各种不同类型。例如,你得知4类残疾人(行走、视物、听力、言语能力不健全)在你要研究的总体中占8%。你想在样本中确定的包括同一比例的残疾人。分层抽样(stratified sampling)就能解决这类问题。分层抽样 (7) 在进行分层抽样时,你首先要把总体分为子总体(s
17、ubpopulation)也就是层(strata)。要进行分层抽样,你必须了解总体中各层的信息,这是分层的前提。其次你要确定多个抽样框架,每个子总体是一个抽样框架。例如,你有可能有两个抽样框架,一个是8%的残疾人士,另一个是92%的健全人士。分层抽样 (8) 在进行分层抽样时,你首先要把总体分为子总体(subpopulation)也就是层(strata)。最后,从每个抽样框架中分别抽取随机样本。因为你控制着每个层的相对大小,而不是采用随机过程决定,所以样本能代表总体中的各个层。一般而言,分层抽样的样本比简单随机抽样的样本代表性略强。分层抽样 (9)分层抽样 (6) 10000雇员,8%有上述4
18、类残疾;92%的人为健全人。需要一个200人的样本。确定两个抽样框架,采用分层抽样。然后在每个抽样框架内按比例抽取残疾人与健全人作为样本。整个样本能够精确的代表总体。群集抽样 (1) 在很多情况下,我们并没有合适的抽样框架。假设你想抽样调查985院校里的所有老师。要抽取简单随机样本,就需要有抽样框架,但并没有所有老师的名单。没有可供使用的单一抽样框架,但你能利用群集进行多阶段的抽样。群集抽样 (2) 在某些情况下,总体中的个体是以“群集”(cluster)的形式存在,每一个个体皆有其归属的群集,因此总体中形成若干集团。例如以小学生为总体时,我们可以发现,每一个学生都归属于一个学校,所以一所学校
19、就是一个学生集团,其中包含数百名或数千名学生;如果单就一校之内的学生来看,每一名学生皆有所属的班级,所以一个班级就是一个学生集团,其中包含数十名学生。你可能得不到所有985院校教师的名单,但你能得到985大学的精确名单。每一所985高校就是一个群集。群集抽样 (3) 首先,你要抽取群集。本例中,一所985大学就是你所关注的一个群集。你有中国全部985院校名单的抽样框架。你可能随机地从群集抽样框架中的39所985高校中,选取20所。每所学校都有本校所有教师的名单。然后,你从每个已抽取的群集(本例为985大学)抽取100名教师作为第二阶段样本。这样你的样本就有2000名教师。群集抽样 (4) 群集
20、抽样 (5) 群集抽样较实用,比简单随机抽样成本低,但精确性要稍差。在群集抽样的每个阶段都会产生抽样误差。一般而言,多阶段的群集样本比单一过程的随机样本存在更多的抽样误差。多阶段随机抽样(1) 依据上述四种概率抽样方法说明可以发现,虽然每一种抽样方法都有优点,如果单独使用,却也有不少限制。事实上,在教育研究中,常因总体的复杂庞大,很难单用一种取样方法,一次即可完成取样工作,故须将取样的过程分成几个“阶段”(stage)来进行,而在每一个阶段运用适当的抽样方法,逐渐缩小抽样范围,最终取得所需样本。这种抽样过程称为“多阶段抽样”。Questions?46凡事不要说我不会或不可能,因为你根本还没有去做!47成功不是靠梦想和希望,而是靠努力和实践48只有在天空最暗的时候,才可以看到天上的星星49上帝说:你要什么便取什么,但是要付出相当的代价50现在站在什么地方不重要,重要的是你往什么方向移动。51宁可辛苦一阵子,不要苦一辈子52为成功找方法,不为失败找借口53不断反思自己的弱点,是让自己获得更好成功的优良习惯。54垃圾桶哲学:别人不要做的事,我拣来做!55不一定要做最大的,但要做最好的56死的方式由上帝决定,活的方式由自己决定!57成功是动词,不是名词!28、年轻是我们拼搏的筹码,不是供我们挥霍的资本。59、世界上最不能等待的事
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中华传统美德心得体会(10篇)
- 员工表扬信15篇
- 会飞的教室读后感集合
- 中国好人李培生先进事迹
- 他乡的童年日本纪录片观后感
- 二八定律读后感
- 个人无收入证明书(9篇)
- DB12∕T 1050-2021 畜禽粪污异位发酵床处理技术规范
- 报关实务-教学课件 第三章 海关检验检疫
- 影响我国自主创新因素的SVAR分析
- 初中数学规律探索公开课完整教学课件
- 2022-2023学年天津市河西区高一年级上册学期期中数学试题【含答案】
- 工密闭空间施工方案
- 备用金申请单(完美版)
- 健康营养科学减脂课件
- 三国演义作品简介名著导读PPT 模板
- 直角角焊缝的受力性能
- 固定资产情况表
- 水利工程管理单位定岗标准(试点)
- 《建筑施工技术》课后习题答案(大学期末复习资料)
- 广东开放大学风险投资(本2022春)-练习4答案
评论
0/150
提交评论