




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章抽样1第一节抽样的概念、类型和作用一、抽样的基本概念二、抽样类型三、抽样的作用2一、抽样的基本概念
1、总体(population)
2、样本(sample)
3、抽样(sampling)
4、抽样单位(samplingunit)
5、抽样框(samplingframe)
6、参数值(parameter)
7、统计值(statistic)
8、置信度(ConfidenceLevel)
9、置信区间(ConfidenceInterval)32、样本(sample)样本就是从全体或总体中随机抽取出来并用来代表总体的那部分单位所构成的新的小总体。53、抽样(sampling)抽样指的是从组成某个总体的所有元素的集合中,按一定的方式选择和抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。64、抽样单位(samplingunit)
抽样单位就是我们可以单独从总体中抽取出来的基本单位。75、抽样框(samplingframe)抽样框又称抽样范畴,是从中抽取样本的抽样单位名单。一个理想的抽样框的要求是,它应该尽可能地与目标总体相一致。85、抽样框(samplingframe)一般而言,如果总体中的每个元素在清单上分别只出现一次,且清单上又没有总体以外的其他元素出现,则该清单就是一个完备的抽样框。在完备的抽样框中,每个元素必须且只能同一个号码对应。96、参数值(parameter)参数值是关于总体中某一变量的综合指标,在统计中最常见的总体值是某一变量的平均值。107、统计值(statistic)统计值是关于样本中某一变量的综合描述,它是相应的总体值的估计量。118、置信度(ConfidenceLevel)置信度也称作置信水平,是指总体参数值落在样本统计值某一正负区间内的概率。129、置信区间(ConfidenceInterval)置信区间是指在某一置信水平下,样本统计值与总体参数值的误差范围。13二、抽样类型根据抽取对象的具体方式,我们把抽样分为各种不同类型。从大的方面看,各种抽样都可以归为概率抽样与非概率抽样两大类。在概率抽样与非概率抽样两大类中,还可细分出若干不同的形式,具体情况见图5-1。14
抽样技术非概率抽样概率抽样方便抽样判断抽样配额抽样滚雪球抽样简单随机抽样系统抽样分层抽样整群抽样多级抽样其他抽样技术按比例不按比例15三、抽样的作用1、现实生活中有些研究总体是不可能进行全面调查的,只可能调查其中的一部分。2、节约人力、物力。3、对其他调查方法所得到的资料的可信性的检验,尤其是对普查资料的修正与补充,必须进行抽样调查。16第二节非概率抽样非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其它条件来抽取样本。因而,其样本的代表性往往较小,误差有时相当大,而且这种误差又无法估计。17第二节非概率抽样非概率抽样由于每个个体进入样本的概率是未知的,而且由于排除不了调查者的主观影响,因而无法说明样本是否重现了总体的结构,用这样的样本推论总体是极不可靠的。18第二节非概率抽样一、偶遇抽样二、判断抽样三、定额抽样四、滚雪球抽样19一、偶遇抽样
偶遇抽样又称做方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近的、最容易找到的人作为对象。20一、偶遇抽样
常见的未经许可的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。其优点就在于方便省力,速度快,可以用于那些需要迅速了解到信息的调查。但是样本的代表性差,带有很大的偶然性。21一、偶遇抽样
举例说明:为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车的人选作调查对象。其他类似的偶遇抽样还有:22一、偶遇抽样
在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读的读者进行调查;在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查;利用报刊杂志向读者进行调查;老师以他所教的班级的学生作为调查样本的调查等等。23一、偶遇抽样实例“都市里的吉卜赛人——对武汉市外来务工、经商人员的调查”,《青年研究》2001年第6期,作者:刘玉等24一、偶遇抽样调查对象。本次调查以武汉市外来务工、经商人员为对象。具体做法如下:在武汉市外来务工、经商人员集中的地方(汉正街)的几条主街道发放调查问卷,由调查员按照非随机抽样中的偶遇抽样原则抽取一定的人员进行调查。25一、偶遇抽样资料的收集方法。本次调查问卷由58个问题组成,主要询问了外来务工、经商人员的基本社会特征、工作、收入与支出、观念、社会交往以及对现有生活的满意度等方面的问题。实际发放问卷280份,回收有效问卷252份,有效回收率90%。26一、偶遇抽样问卷采用自填法,由被调查者当场填写回收,对一些没有上过学不识字的被调查者采取由调查员根据问卷的内容逐一访谈的方式完成。27二、判断抽样判断抽样又称立意抽样,它是研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法。这种抽样首先要确定抽样标准。28二、判断抽样这种通过主观判断对样本的选择通常有两种方法,一是找“平均人”的方法,一是找异常个案的方法。小组座谈会调查属于判断抽样。29二、判断抽样案例:我们要对学生抗议活动中的学生领袖进行研究。许多学生领袖是很容易找到的,但是却不大可能对所有的学生领袖的样本进行研究。为了对所有的或大多数样本进行研究,就必须根据研究目的来搜集资料,所运用的抽样方法就是判断抽样法。30二、判断抽样实例:“丹江口水库移民生活满意度的调查”,载《社会》2002年6月,作者:陆青华。31二、判断抽样这次我们调查的对象是1978年前因丹江口水库工程而迁出的移民,着重是了解他们的生活状况以及对移民生活的满意程度,希望通过对移民们生活中这一敏感而又关键的问题的把握,为改善移民工作提供一些有价值的参考意见。32二、判断抽样本次调查以湖北的宜城市和荆门市的部分乡镇的移民为总体,采用判断抽样方法选取调查对象。由于该项调查的指导者王茂福教授对宜城一带较熟悉且得到荆门地区移民局的热情支持,所以首选了这两个地区。33二、判断抽样此次调查总样本为427人。其中宜城市为238人,占总样本的55.7%,荆门市为189人,占总样本的44.3%。资料收集方法:问卷法。34三、定额抽样定额抽样也叫配额抽样,它与分层抽样中的比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层所占比例与他们在总体中所占的比例一样。35三、定额抽样但不同的是,分层抽样中各层样本是随机抽取的,而定额抽样中各层样本是非随机抽取的。
36三、定额抽样定额抽样假定:(1)只要类型划分较细,那么同一个类型中的每一个个体都是同质的,因而无需采用随机抽样。37三、定额抽样(2)只要类型划分合理,且分配给各类的名额符合总体中各类人员的分布,那么,样本就可以准确地反映总体。38三、定额抽样举例如下:1936年美国的盖洛普使用配额抽样的方法成功地预测了总统当选人,而同样的方法却也造成了他在1948年的错误预测。就像概率抽样一样,配额抽样所强调的也是样本的代表性,虽说二者所达到目的的方法不一样。39三、定额抽样
表5-1年龄所得34岁以下35岁以上合计¥10,000以下21%27%48%¥10,001以上12%40%52%合计33%67%100%定额抽样示例40三、定额抽样组合不同年龄与所得额可形成四种类型:(1)年龄在34岁以下,所得额在10000元以下;(2)年龄在34岁以下,所得额在10001以上;(3)年龄在35岁以上,所得额在10000元以下;(4)年龄在35岁以上,所得额在10001元以上。41三、定额抽样此时,研究者就根据研究目的从不同的格子里选择样本并搜集资料,而代表每一个格子出现的人,则按照这些格子相对于总体的比例,给予加权。42三、定额抽样当所有的样本的要素都被加权时,这样的资料就可以合理的代表整个总体了。同样,定额抽样的逻辑有时还可以有效地用于实地调查。43三、定额抽样
实例:“职业地位:社会分层的指示器———上海社会结构与社会分层研究”,仇立平,《社会学研究》调查方法和样本:研究总体是具有上海户籍的、年龄在35-60岁的上海职工(包括部分郊区农民)。44三、定额抽样由于根据研究框架设计的问卷涉及到许多个人隐私,如家庭财产、经济收入、重大生活事件、家庭出身或家庭成分等,因此抽样是采用判断抽样法,即要求访问员在自己的熟人范围里选择调查对象。45三、定额抽样考虑到样本的代表性,访问员在选择调查对象时要按照年龄、性别、职业等要求,按配额抽样方法选择样本。计划样本400个,有效样本391个,调查时间是1999年1月。46三、定额抽样根据调查结果,样本的基本情况如下:男性占59.3%,女性占40.7%;平均年龄为46.25岁。大多数调查对象的教育程度在初中及以上(95%)。47三、定额抽样本人平均月收入约1030元,家庭平均月收入约2074元;家庭平均财产(包括不动产)为23.29万(据《1999上海年鉴》,1998年职工月平均工资为1005元,2000年为1188元。《文汇报》,2000)。48三、定额抽样虽然样本的本人月收入较接近总体状况;但由于是非概率抽样,某些指标如性别、职业等与总体有较大差别,且样本较小,因此样本的资料按抽样理论是不能推论总体的,或者在推论时要谨慎。49三、定额抽样本调查的目的在于检验以“职业地位”作为社会分层标准的有效性和可行性,以及理论假设的内在逻辑性。50三、定额抽样配额抽样和分层抽样的区别:二者虽然都依据某些特征对总体进行分层,但二者的目的不同,抽样方法也不同。51三、定额抽样定额抽样之所以分层分类,其目的在于要抽选出一个总体的“模拟物”,其方法则是通过主观的分析来确定和选择组成这种模拟物的成员。也就是说,定额抽样注重的是样本与总体在结构比例上的表面一致性。52三、定额抽样而分层抽样进行分层,一方面是要提高各层间的异质性与同层中的同质性,另一方面也是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减小。53三、定额抽样而其抽样的方法则是完全根据概率原则,排除主观因素,客观地、等概率地到各层中进行抽样,这与定额抽样中那种“按事先规定地条件,有目的地寻找”的做法是完全不同的。54四、滚雪球抽样滚雪球抽样是先从几个适合的调查对象开始,然后通过他们得到更多的调查对象,这样一步步扩大样本范围。当调查总体中的个体信息不充分时,常采用这种方法。55四、滚雪球抽样例如,某研究部门在调查某市劳务市场中的保姆问题时,先访问了7名保姆,然后请她们再提供其他保姆名单,逐步扩大到近百人。56四、滚雪球抽样通过对这些保姆的调查,对保姆的来源地、从事工作的性质等状况就有了较全面的掌握。还有对政府工作人员心理素质的测试、家用健身器的应用状况、老人问题调查等等。57四、滚雪球抽样
滚雪球抽样的主要优点:能够保证抽取的样本均具有某总特征,且抽样误差和成本都较小;这种由推荐获得的样本能够很好地满足抽样对样本的人口统计学和心理统计学的特征的要求,因为推荐人对这些特征比随机情景更熟悉。58四、滚雪球抽样滚雪球抽样的局限性:有许多个体无法找到,产生误差。59四、滚雪球抽样实例:“城市非自愿离岗女性的社会支持系统——北京市个案研究”,载《妇女研究论从》2001年第1期,作者:张艳霞60四、滚雪球抽样这篇文章借鉴组织制度变迁理论、社会网理论和社会性别理论,通过分析北京市26位非自愿离岗者的个案访谈资料,阐述了城市非自愿离岗女性主要的社会支持需求,揭示了离岗女性的社会支持系统是一个由正式支持系统和非正式支持系统共同组成的多元化结构。61四、滚雪球抽样并分析了在社会支持系统的具体构成和各组成部分的特点上,离岗女性与男性之间的性别差异。这个研究主要采用个案深人访谈和定性分析方法。62四、滚雪球抽样全国妇联妇女研究所课题组在1999至2000年进行了“北京市暂不在业女性的社会支持系统”调查研究,走访了30位非自愿离岗人员,其中女性22人,男性8人,对男性个案的调查研究,主要是为了补充丰富调查资料和进行男女两性的比较分析。63四、滚雪球抽样这篇文章基于对其中20位女性、6位男性个案访谈材料的定性分析。在个案的选择上,这个研究使用的是滚雪球抽样方法,在选择调查对象时,尽量选择了有代表性的个案。64四、滚雪球抽样值得一提的是,在文章最后,作者补充到由于采用非概率抽样,调查对象的代表性有一定局限。65第二节非概率抽样在很大情况下,严格的随机抽样几乎无法进行,例如调查对象的总体边界不清而无法制作抽样框。此外有些研究为了符合研究的目的,不得不按照需要从总体中抽取少数有代表性的个体作为样本。66第二节非概率抽样为了保证随机的原则,对抽样的操作过程要求严格,实施起来比较麻烦,费时费力,因此如果调查的目的仅是对问题的初步探索,获得研究的线索和提出假设,而不是由样本推论总体,采用随机抽样就不一定是必须的。67第二节非概率抽样综上所述:非概率抽样操作方便、省钱省力,统计上也远较概率抽样简单,而且若能对调查总体和调查对象有较好的了解,抽样也可获得相当的成功。68第三节概率抽样一、概率抽样的原理二、抽样分布三、抽样的一般程序四、抽样设计的原则五、概率抽样方法69一、概率抽样的原理抽样的最终目的在于通过对样本的统计值的描述来相对准确地勾画出总体的面貌。概率抽样的方法可以帮助我们实现这一过程的目标,并且可以对这种勾画的准确程度作出估计。70一、概率抽样的原理随机抽取是这一过程的关键。所谓随机抽取,就是保证总体中的每一个个体都有同等的机会入选样本。71一、概率抽样的原理概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好地按总体内在结构中所蕴涵的各种随机事件的概率来构成样本,使样本成为总体的缩影。72一、概率抽样的原理在讨论概率抽样的问题时,应对有关放回抽样与不放回抽样的问题作出说明:所谓放回抽样是指抽取一个单位后,在抽选下一个单位时把前一个已被抽中的单位放回总体中再进行抽取;不放回抽样则是将已抽中的单位不放回总体,因而每个单位最多只能被抽中一次。73二、抽样分布抽样分布是根据概率原则而成立的理性分布。它显示出:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。74二、抽样分布在实际应用中,更多采用下列数字:有90%落在μ±1.65SE之间;有95%落在μ±1.96SE之间;有98%落在μ±2.33SE之间;有99%落在μ±2.58SE之间;75三、抽样的一般程序界定总体收集全部名单决定样本大小设计抽样方法评估样本761、界定总体清楚地说明全部研究对象的范围,包括时间、地点和人物。例如,我们要调查兰州市青年对计划生育的态度,可以界定总体范围如下:2005年年中兰州市界乎15~25岁之间的居民。771、界定总体总体的定义越清楚越好。由样本所得的结果,原则上只能推论到这个所界定的总体范围。782、收集全部名单例如,从有关的单位取得符合上述总体定义的青年姓名。这份名单,称为抽样框架。在应用前,必须审核其完整性和准确性,例如,有无遗漏?有无列于名单上但实际不存在的个案?名单上的个案有无重复或不属研究范围的?793、决定样本大小决定样本大小的一般准则是:根据所能付出的研究代价的最大限度抽取最大的样本。其实,除了这个准则之外,还有两个准则可供参考:我们愿意容忍多少错误?所研究的个案之间的相互差异有多大?但总的原则是“宁纵无枉”。804、设计抽样方法不同的抽样方法所犯的抽样误差会很不一样,所需要付出的代价也不一样。因此,我们在抽样时,要小心选择一种较为恰当的方法。815、评估样本的正误如果总体的资料分布与样本的资料分布基本上一致,则我们对样本的代表性就有较大的信心。年龄总体(N=100000)样本(n=1000)15~17302818~22505123~25202182四、抽样设计的原则1、目的性原则。目的性原则是指在进行抽样方案设计时,要以课题研究的总体方案和研究的目标为依据。2、可测性原则。可测性原则指的是抽样设计能够从样本自身计算出有效的统计值或者抽样变动的近似值。83四、抽样设计的原则3、可行性原则。可行性原则是指研究者所设计的抽样方案必须在实践上切实可行。4、经济性原则。这一原则指的是抽样方案的设计要与研究的可得资源相适应。这种资源主要包括研究的经费、时间、人力等等。84五、概率抽样方法1、简单随机抽样2、系统抽样3、分层抽样4、整群抽样5、多阶段抽样851、简单随机抽样(1)简单随机抽样的定义简单随机抽样又称纯随机抽样,是概率抽样的最基本形式。它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。861、简单随机抽样(2)简单随机抽样的应用抽签法:先将研究总体中的每一个单位统一编号,使每一个单位都有一个号,然后将每一个号作成一个卡号并且混合均匀,最后从中随机抽取卡片,直到抽到额定的数目为止。这种方法在一般日常生活中用得比较多。871、简单随机抽样直接抽选法:即直接从调查对象中随机抽取一个样本。但这种方法有难以完全遵循随机的缺点,因为在抽选的过程中往往受到主观判断的影响,所以采取这种方法时避免主观判断的影响是关键。在正式调查中,很少采用直接抽选法。881、简单随机抽样随机数字表法:其具体步骤如下是先取得一份总体所有元素的名单,将总体中所有元素一一按顺序编号,根据总体规模是几位数来确定从随机数表中选几位数码。891、简单随机抽样然后以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;根据样本规模的要求选择出足够的数码个数;依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。902、系统抽样(1)系统抽样的定义系统抽样又称等距抽样或机械抽样。它是把总体的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。912、系统抽样(2)系统抽样的具体步骤是:①将总体的所有个体前后排列起来。②计算抽样距离。抽样距离是由总体大小和样本大小决定的,假设总体所含个体数为N,样本所含个体数为n,则抽样距离应为K=N/n。922、系统抽样③在头K个个体中,用完全随机的方式抽取一个个体,设其所在位置的序号是k。④自k开始,每隔K个个体抽取一个个体,即陆续抽取的个体所在位置序号为k,k+K,k+2K,直到k+(n-1)K。932、系统抽样(3)系统抽样实例:某地区有零售店110户,采用系统抽样方法抽取11户进行调查。第一步:将总体调查对象进行编号,即从1号到110号。第二步:确定抽样距离。调查总体N=110户,所需样本数n=11户,所以,抽样距离K=10户;
942、系统抽样第三步:确定起抽号数。随机地从1-10中抽取一个数作为抽号;第四步:确定被抽取单位。从起抽号开始,按照抽样距离选取样本如果随机抽取了2为起抽号,那么:952、系统抽样22+10=122+10*2=22等等即所抽的样本为编号是2,12,22,32,一直到102共11个零售店。962、系统抽样(4)系统抽样的优点:系统抽样不需多次使用随机数字表抽取个体,而只需按间隔等距抽样即可;系统抽样的另一个优点是样本在总体中的分布更均匀,故而抽样误差小于或至多等于简单随机抽样,即较其更准确。973、分层抽样(1)分层抽样的定义分层抽样又称类型抽样,它是先将总体中的所有单位按某种特征或标志划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。983、分层抽样(2)分层抽样的使用条件①被抽取的总体是异质的,一个变量或多个变量可能影响调查结果。如,大学生的性别、年级、籍贯可能影响对婚恋的态度。②对所研究的总体有详细地名单。流程图:总体——层——子样本——样本993、分层抽样(3)分层抽样的应用
在实际运用分层抽样的方法时,研究者需要考虑下列两个方面的问题:1003、分层抽样①分层的标准问题通常采用原则有:以所要分析和研究的主要变量或相关的变量作为分层的标准;以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量;以那些已有明显层次区分的变量作为分层变量。1013、分层抽样②分层的比例问题分层抽样中有按比例和不按比例分层两种方法。按比例分层抽样是指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。1023、分层抽样采用按比例分层抽样的方法,可以确保得到一个与总体结构完全一样的样本。但是,在有些情况下,又不宜采用这种方法。例如,有时总体中有的类型或层次的单位数目太少,若以按比例分层的方法抽样,则有的层次在样本中个案太少,不便于了解各个层次的情况。1033、分层抽样(4)分层抽样实例某地共有居民20000户,按经济收入高低进行分类,其中高收入的居民为4000户,占总体的20%;中等收入为12000户,占总体的60%;低收入为4000户,占总体的20%。1043、分层抽样要从中抽取200户,进行购买力调查,则各类型应抽取的样本单位为:经济收入高的样本单位数目为:200*20%=40户经济收入中的样本单位数目为:200*60%=120户经济收入低的样本单位数目为:200*20%=40户1053、分层抽样(5)分层抽样的特点①当一个总体其内部分层明显时,分层
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度新能源电池外壳油漆喷涂质量检测合同
- 2025年中国金蝉花行业市场调查研究及投资前景预测报告
- 2025代购进口红酒合同范本二零二五
- 广告店销售合同范本
- 2025版顶级模特经纪公司独家合作协议
- 2025年劳动合同变更与员工加班费协议书
- 食品销售合同范本简易
- 2025年度绿色建筑项目借款第三方担保与节能减排协议
- 自然奇观探秘旅游合同
- 合同范本加工承揽
- 山东省成人教育毕业生登记表
- 地下室车库综合管线施工布置
- 月度及年度绩效考核管理办法
- 采购订单模板
- 毕业设计钢筋弯曲机的结构设计
- 工程结构质量特色介绍
- 清华大学MBA课程——运筹学
- 湿法冶金浸出净化和沉积PPT课件
- 生产现场作业十不干PPT课件
- 通信杆路工程施工
- 初中物理光学经典题(共23页)
评论
0/150
提交评论