




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章、抽样(1)2022/10/31第四章抽样(1)第四章、抽样(1)2022/10/23第四章抽样(1)1第四章抽样
1.抽样的意义与作用
2.概率抽样的原理与程序
3.概率抽样方法
4.非概率抽样方法
5.样本规模与抽样误差第四章抽样(1)第四章抽样1.抽样的意义与作用
2.概率抽样的原理与程2一、抽样的意义与作用1.抽样的意义与作用
人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是抽样复杂的社会现象有限的研究资源
抽样主要涉及和处理有关总体与部分之间的关系问题。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。抽样第四章抽样(1)一、抽样的意义与作用1.抽样的意义与作用抽样第四章抽样(1)3一、抽样的意义与作用
1.抽样的作用
抽样是社会研究的主要内容之一,也是社会调查的一个重要步骤。它与研究目的及研究内容紧密相关。它直接关系到资料的收集、整理与分析。它还涉及到整个研究的费用以及应用的范围。抽样是否科学,直接关系到研究的成败第四章抽样(1)一、抽样的意义与作用1.抽样的作用第四章抽样(1)4侯选人《LiteraryDigest》预测%选举结果%罗斯福4362兰顿5738
一个著名的案例——抽样中的泰坦尼克事件1936年美国正从经济大恐慌中复苏,全国仍有9百万人失业.当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐.《文学文摘》(LiteraryDigest)杂志对结果进行了调查预测.他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄1千万份问卷调查表,回收约240万份.工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登将以370∶161的优势,即以57%比43%,领先14个百分点击败罗斯福.与之相反,一个名叫乔治•盖洛普的人,对《文学文摘》调查结果的可信度提出质疑.他也组织了抽样调查,进行民意测验.他的预测与《文学文摘》截然相反,认为罗斯福必胜无疑.结果,罗斯福以62%比38%压倒性地大胜兰登.这一结果使《文学文摘》销声匿迹,而盖洛普则名声大噪.第四章抽样(1)侯选人《LiteraryDigest》预测%选举结果%罗斯5年代候选人盖洛普民意测验结果(%)总统选举真实结果(%)盖洛普误差(%)2000布什48.047.9+0.11996克林顿52.049.2+2.81992克林顿49.043.3+5.71988老布什56.053.9+2.11984里根59.059.2-0.21980里根47.050.8-3.81976卡特48.050.1-2.11972尼克松62.061.8+0.21968尼克松43.043.5-0.51964约翰逊64.061.3+2.71960肯尼迪51.050.1+0.91956艾森豪威尔59.557.8+1.71952艾森豪威尔51.055.4-4.41948杜鲁门44.549.5-5.01944罗斯福51.553.8-2.31940罗斯福52.055.0-3.01936罗斯福55.762.5-6.8从美国总统大选预测看抽样的效率:
第四章抽样(1)年代候选人盖洛普民意测验结果(%)总统选举真实结果(%)盖洛6一、抽样的意义与作用
2.抽样的概念在我们的日常生活中经常存在着抽样。如抽血化验,尝试水温,窥一斑而知全豹。抽样(sampling)从组成某个总体的所有元素的集合中,按一定的方式选择或抽取样本的过程抽样调查,就是从研究总体中抽取一部分代表加以调查研究,然后用所得结果推论和说明总体的特性。总体(population):构成它的所有元素的集合样本(sample)从总体中按一定方式抽取出的一部分元素的集合抽样单位(samplingunit)一次直接的抽样所使用的基本单位第四章抽样(1)一、抽样的意义与作用2.抽样的概念第四章抽样(1)7一、抽样的意义与作用
抽样框(samplingframe)抽样范围,指一次直接抽样时总体中所有抽样单位的名单参数值(parameter)是对总体中某一变量的综合描述,或总体中所有元素某些特征的综合数量表现。最常见的参数值是总体某一变量的平均值。统计值(statistic)是对样本中某一变量的综合描述,或样本中所有元素某些特征的综合数量表现。根据样本计算出来的关于样本变量的数量表现置信度(confidencelevel)总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间内的把握性程度置信区间(confidenceintevalue)上述“某一区间”,就是置信区间第四章抽样(1)一、抽样的意义与作用抽样框(samplingframe)8二、概率抽样的原理与程序概率抽样:(1)每一个体有同等机会被抽取(2)每一个体的抽取都是相互独立的第四章抽样(1)二、概率抽样的原理与程序概率抽样:第四章抽样(1)9二、概率抽样的原理与程序概率抽样的逻辑
(1)同质性和异质性
如果研究总体是完全同质的,抽样就没有必要;社会科学中的研究总体往往具有较强的异质性;为了实现“通过部分认识整体”,样本应该包含总体的各种差异特征。第四章抽样(1)二、概率抽样的原理与程序概率抽样的逻辑第四章抽样(1)10二、概率抽样的原理与程序概率抽样的逻辑
(2)无意识抽样导致的偏差方便获取的样本:易得,但缺乏代表性;例如:如何获取由100个学生构成的样本访问者的偏好影响样本的代表性;例如:有意回避具有某些特征(“酷”,“冷”)的受访者抽样的地点影响样本的代表性例如:图书馆门口访问第四章抽样(1)二、概率抽样的原理与程序概率抽样的逻辑第四章抽样(1)11二、概率抽样的原理与程序概率抽样的逻辑
(3)代表性和选择的概率
如果总体中的每一个体都具有同等机会被选入样本,那么从这一总体中抽取的样本就能够代表总体。概率抽样的优点
(1)样本对总体更具代表性(相对其它类型抽样)(2)可以对样本的精确性和代表性作出估计第四章抽样(1)二、概率抽样的原理与程序概率抽样的逻辑第四章抽样(1)12二、概率抽样的原理与程序总体分布、样本分布、抽样分布
当样本容量继续增大,样本平均数的分布会进一步发生变化。这种变化趋势是:平均数的范围将逐步缩小(即底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显.
第四章抽样(1)二、概率抽样的原理与程序总体分布、样本分布、抽样分布第四13总体分布(population
distribution)
总体分布:
总体中各元素的观察值所形成的相对频数(频率)分布
分布通常是未知的(因为几乎得不到总体所有观察值)可以(根据理论分析)假定它服从某种分布
总体第四章抽样(1)总体分布(populationdistribution)14
(sampledistribution)样本分布也称经验分布,指一个样本中各观察值的形成的相对频数(频率)分布。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。样本第四章抽样(1)(sampledistribution)样本分布也称经验15抽样分布(samplingdistribution)抽样分布:样本统计量的概率分布,是一种理论分布。在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布样本统计量是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是随机变量样本均值,样本比例,样本方差等第四章抽样(1)抽样分布(samplingdistribution)抽样分16样本均值的抽样分布在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布
第四章抽样(1)样本均值的抽样分布在重复选取容量为n的样本时,由样本均值的所17总体分布、样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体)
,即总体单位数N=4。4
个个体分别为x1=1,x2=2,x3=3,x4=4
。总体分布、总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差第四章抽样(1)总体分布、样本均值的抽样分布(例题分析)【例】设一个总体,含18
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)第四章抽样(1)现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共19
计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(
)x样本均值的抽样分布1.000.10.20.3P
(x)1.53.04.03.52.02.5第四章抽样(1)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.20样本均值的分布与总体分布的比较
(例题分析)
=2.5σ2=1.25
的分布形式与原有总体和样本容量n的大小有关14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x总体分布第四章抽样(1)样本均值的分布与总体分布的比较(例题分析)=2.21样本均值的抽样分布与中心极限定理
=50=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x
的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)第四章抽样(1)样本均值的抽样分布与中心极限定理=50=10X总体22中心极限定理
(centrallimittheorem)当样本容量足够大时(n
³30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为,方差为
2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x第四章抽样(1)中心极限定理(centrallimittheorem23中心极限定理(centrallimittheorem)x的分布趋于正态分布的过程第四章抽样(1)中心极限定理(centrallimittheorem)24抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布第四章抽样(1)抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样25样本均值的数学期望样本均值的方差(方差的概率意义在于刻画了随机变量取值的分散程度。方差越小,随随机变量的取值越集中在期望值附件。)
重复抽样样本均值的抽样分布第四章抽样(1)样本均值的数学期望样本均值的抽样分布第四章抽样(1)26抽样的一般程序界定总体:对从中抽取样本的总体范围与界限作明确的界定制定抽样框:依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框决定抽样方案:选择抽样方法,确定样本规模实际抽取样本:1.先抽好样本,再调查2.一边抽样一边调查评估样本质量:对样本的质量、代表性、偏差等进行初步的检验和衡量第四章抽样(1)抽样的一般程序界定总体:对从中抽取样本的总体范围与界限作明确27概率抽样的方法抽样的类型
偶遇抽样判断抽样定额抽样雪球抽样简单随机抽系统多层抽样分层抽样整群抽样多段抽样概率抽样非概率抽样抽样类型第四章抽样(1)概率抽样的方法抽样的类型偶遇抽样简单随机抽概率抽样非概率抽样28三、概率抽样的方法
1.简单随机抽样:概率抽样的最基本形式方法:1.总体较少:搅拌抽签;2.总体较多:用随机数表见P269.表4-23.利用EXCEL的randbetween(a,b)函数实现简单随机抽样第四章抽样(1)三、概率抽样的方法1.简单随机抽样:第四章抽样(1)29三、概率抽样的方法1.简单随机抽样概念:一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取n(n≤N)个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。要点:它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是一种不放回抽样它是一种等概率抽样用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概率等于第四章抽样(1)三、概率抽样的方法1.简单随机抽样用从个体数为N的总体中抽取30三、概率抽样的方法1.简单随机抽样抽签法(抓阄法)将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。第四章抽样(1)三、概率抽样的方法1.简单随机抽样第四章抽样(1)31三、概率抽样的方法练习1.高二(21)班有53名同学,现要从中抽取8名去参加一个座谈会,请写出用抽签法抽选的过程。2.假设一个总体有5个元素,分别记为a、b、c、d、e,采用抽签法抽取一个容量为2的样本,样本共有多少个?为了考察某公司生产的250克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.当总体的个数较多时,将总体“搅拌均匀”比较困难,抽签法产生的样本代表性差的可能性很大。第四章抽样(1)三、概率抽样的方法练习当总体的个数较多时,将总体“搅拌均匀”32三、概率抽样的方法1.简单随机抽样随机数表法随机数表是统计工作者用计算机生成的随机数,保证表中的每个位置上的数字是等可能出现的用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的第四章抽样(1)三、概率抽样的方法1.简单随机抽样第四章抽样(1)33练习例:为了考察某公司生产底250克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.S1,将800袋牛奶编号,可以编为000,001,……,799;S2,在随机数表中任意选一个数,例如第8行第7列的数7;S3,从选定的数7开始向右读,得到一个三位数,如果这个三位数在000~799范围内,则取出,否则去掉;继续向右读,得下一个三位数;依次下去,直到样本的60个号码全部取出.将总体中的个体编号时从000开始,用意何在?当随机地选定开始读数的数后,读数的方向只能向右吗?三、概率抽样的方法第四章抽样(1)练习三、概率抽样的方法第四章抽样(1)34三、概率抽样的方法练习将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。
上述问题中抽取样本的方法用随机数表法来进行!规则1:从269页表中第3行第11列的两位数开始,依次向下读数,到头后再转向它左面的两位数号码,并向上读数,以此下去,直到取足样本。规则2:从269页表中第12行第10列的两位数开始,依次向左读数,到头后再转向它下面的两位数号码,并向右读数,以此下去,直到取足样本。第四章抽样(1)三、概率抽样的方法练习第四章抽样(1)35三、概率抽样的方法1.简单随机抽样利用EXCEL的randbetween(a,b)函数实现简单随机抽样例:某总体共3000人(四位数),需要从中抽取100人作为样本进行调查打开EXCEL,用鼠标左键点击1A,点开fx,出现一个对话框,在对话框的选择类别这一栏中选择“数学与三角函数”,在选择函数这一栏中选择randbetween,在randbetween后又出现对话框,在对话框的bottom栏填写最小数,在top栏填写最大数,鼠标左键点击确定,在1A栏出现一个随机数字,下拉该栏到100A处就出现了100个随机数字。第四章抽样(1)三、概率抽样的方法1.简单随机抽样第四章抽样(1)36三、概率抽样的方法1.简单随机抽样简单随机抽样方法的优缺点优点:可能产生代表性样本缺点:不容易做抽样元素多,编号难必须能够接触到被选中的个体搅拌均匀不易第四章抽样(1)三、概率抽样的方法1.简单随机抽样第四章抽样(1)37三、概率抽样的方法
2.系统抽样(等距抽样或间隔抽样)
定义:等距抽样或机械抽样,将总体的单位编号排序后,按照固定的间隔抽取个体组成样本的方法。步骤:编号确定抽样间距确定抽样起点等间距抽样第四章抽样(1)三、概率抽样的方法2.系统抽样(等距抽样或间隔抽样)第四38三、概率抽样的方法2.系统抽样(等距抽样)举例:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见,需要抽取30名听众进行座谈,除了用简单随机抽样获得样本外,你能否设计其他的抽取样本的方法?留下每排座位号为20的30名听众进行座谈。注意:这种抽取样本的方法与简单随机抽样有什么区别?你能说出操作步骤吗?第四章抽样(1)三、概率抽样的方法2.系统抽样(等距抽样)第四章抽样(1)392.系统抽样(等距抽样)优点:简便易行条件:抽样框里的元素应该是随机排列的.。三、概率抽样的方法第四章抽样(1)2.系统抽样(等距抽样)三、概率抽样的方法第四章抽样(1)40三、概率抽样的方法注意1:系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。例如:从总体2000户家庭的社区中,抽取一个50户家庭的样本进行调查消费状况的调查,而这2000户家庭的名单是按每个家庭总收入的多少,由高到低的顺序排列的。初始号码为3和38,所抽样本家庭平均收入有很大区别,消费状况也有很大区别。注意2:元素排列的周期性可能导致抽样的重大偏差!例如:每个班级内的50名学生按照学生成绩的高低来排序,每个班抽取一名学生组成样本,初始号码为2和48号,所抽样本的平均成绩差别很大第四章抽样(1)三、概率抽样的方法注意1:系统抽样的一个十分重要的前提条件,41三、概率抽样的方法2.系统抽样(等距抽样)以下抽样方法的区别中,说法错误的是___
(A)4个人打牌时,将洗好的牌(52张)随机确定一张牌为起始牌,然后按次序发牌,每人13张,这种抽样方法属于随机抽样(B)从标号为1~15的15个球中,任选3个做为样本,按从小到大排序,随机选取起点号i0,以后选取i0+5,i0+10(超过5则从1数起),这种抽样方法属于系统抽样(C)工厂生产某种产品,用传送带送入包装车间,检验人员每隔五分钟从传送带上抽一产品进行检验,这种抽样方法属于系统抽样(D)电影院为调查观众某项指标,通知每排的座位号为8号的观众留下来,这种抽样方法属于系统抽样第四章抽样(1)三、概率抽样的方法2.系统抽样(等距抽样)第四章抽样(1)42三、概率抽样的方法2.系统抽样(等距抽样)应用举例某地区有3000名学生参加学科竞赛,现要从中抽取一个样本对他们的成绩进行分析,每个学生被抽到的概率均为1/15,试确定样本容量,并说出抽样步骤。设某校共有108名教师,为了支援西部的教育事业,要从中随机抽出16名教师组成暑期西部讲师团。请用系统抽样方法选出讲师团成员。有人说,可以借用居民身份证号码(18位)来进行央视春晚的收视率调查:在1~999中抽出一个随机数,比如632,那么身份证后三位是632的观众就是要调查的对象。你觉得这样所获得的样本有代表性吗?第四章抽样(1)三、概率抽样的方法2.系统抽样(等距抽样)第四章抽样(1)43系统抽样的优缺点如何改进?优点:(1)简单易操作(2)当对总体结构有一定了解时,充分利用已有的信息对总体中的个体进行排队后再抽样,可提高抽样效率(3)当总体中的个体存在一种自然编号时,采用系统抽样比较方便缺点:(4)当在不了解样本总体的情况下(如性别差异,经济基础,个人喜好,天气因素等等),所抽出的样本可能会有一定的偏差。第四章抽样(1)系统抽样的优缺点如何改进?优点:第四章抽样(1)44三、概率抽样的方法3.分层抽样问题情景:一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?第四章抽样(1)三、概率抽样的方法3.分层抽样第四章抽样(1)45三、概率抽样的方法
3.分层抽样
首先将总体中的所有单位按某种特征或标志划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后将这些子样本合起来构成总体的样本。第四章抽样(1)三、概率抽样的方法3.分层抽样第四章抽样(1)46三、概率抽样的方法
第四章抽样(1)三、概率抽样的方法第四章抽样(1)47分层抽样的步骤1.总体与样本容量确定抽取的比例。2.由分层情况,确定各层抽取的样本数。3.各层的抽取数之和应等于样本容量。4.对于不能取整的数,求其近似值。问题:每个个体在整个抽样过程中被抽取的概率是否相等?第四章抽样(1)分层抽样的步骤1.总体与样本容量确定抽取的比例。问题:每个个48三、概率抽样的方法
3.分层抽样优点:在不增加样本规模的前提下降低抽样误差,提高抽样精度,增大代表性。便于了解总体内不同层次的情况,以及对总体中的不同层次进行单独研究或者进行比较。缺点:
对抽样框的要求比较高,必须有分层的辅助信息;收集或编制抽样框的费用比较高;若调查变量与分层的变量不相关,效率可能降低;第四章抽样(1)三、概率抽样的方法3.分层抽样第四章抽样(1)49三、概率抽样的方法
3.分层抽样分层的标准问题以分析的主要变量或相关变量作为分层的标准保证各层内部同质性强,各层之间异质性强以已有明显层次区分的变量作为分层变量分层的比例问题按比例分层抽样不按比例分层抽样
第四章抽样(1)三、概率抽样的方法3.分层抽样第四章抽样(1)50
三、概率抽样的方法分层抽样举例一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?解:抽取人数与职工总数的比是100:500=1:5,
则各年龄段(层)的职工人数依次是125:280:95
=25:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人。第四章抽样(1)三、概率抽样的方法分层抽样举例第四章抽样(1)51三、概率抽样的方法练习1.某科研单位有科研人员160人,其中具有高级以上职称的24人,中级职称48人,其余均为初级以下职称,现要抽取一个容量为20的样本,试确定抽样方法,并写出抽样过程.2.某市3个区共有高中学生20000人,且3个区的高中学生人数之比为2:3:5,现在要用分层抽样的方法从所有学生中抽取一个容量为200的样本,这3个区应该分别抽取多少人?3.如果采用分层抽样,从个体数为N的总体中,抽取一个容量为n的样本,那么每个个体被抽到的概率等于()第四章抽样(1)三、概率抽样的方法练习第四章抽样(1)524.下列属于分层抽样特点的是()A.从总体中逐个抽取B.将总体分成几层,分层进行抽取C.将总体分成几部分,按事先确定的规则在各部分抽取D.将总体随意分成几部分,然后进行随机抽取5.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一,高二,高三各年级抽取人数分别为()A15,5,25B15,15,15C10,5,30D15,10,20三、概率抽样的方法第四章抽样(1)4.下列属于分层抽样特点的是()A15,53B6.某公司在A、B、C、D四个地区分别有150个、120个、180个和150个销售点,公司为了调查产品销售情况,需从这600个销售点中抽取容量为100的样本,记这项调查为①;在C地区有20个特大型销售点,现从中抽取7个调查它的销售收入和销后服务情况,记这项调查为②;则完成①、②这两项调查应采取的抽样方法依次为()A.分层抽样法,系统抽样法;B.分层抽样法,简单随机抽样法;C.系统抽样法,分层抽样法;D.简单随机抽样法,分层抽样法;三、概率抽样的方法第四章抽样(1)B6.某公司在A、B、C、D四个地区分别有150个、12547.在100个零件中,有一级品20个,二级品30个,其余为三级品,从中抽取20个作为样本.(1)采用随机抽样法,将零件编号为00,01,…99.抽签取出20个;(2)采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;(3)采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个,则下列说法正确的是()A.不论用哪种抽样方法,这100个零件中每个被抽到的概率都是1/5B.(1),(2)2种方法,这100个零件中每个被抽到的概率都是1/5;(3)并非如此C.(1),(3)2种方法,这100个零件中每个被抽到的概率都是1/5;(2)并非如此D.用不同的抽样方法,这100个零件中每个被抽到的概率是各不相同的三、概率抽样的方法第四章抽样(1)7.在100个零件中,有一级品20个,二级品30个,其余为三558.某中学有学生2000名,高一、高二、高三的学生人数之比为5:3:2,现要抽取一个容量为200的样本,则学生甲被抽到的概率是______________,
若高一学生抽取50人,则样本的容量为__________.9.一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下所示:很喜爱喜爱一般不喜爱2400420038001600打算从中抽取60人进行详细调查,如何抽取?三、概率抽样的方法第四章抽样(1)8.某中学有学生2000名,高一、高二、高三的学生人数之比为56三种抽样方法的比较类别各自特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取总体中的个体数较少抽样过程中每个个体被抽取的概率相等系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成简单随机抽样最简单,但是也是相对复杂的。系统抽样操作简单,在有充分的总体信息的前提下,估计精度比随机抽样高,且操作、简单。分层抽样由于已经利用了总体信息,因此估计精度也比随机简单抽样要高。第四章抽样(1)三种抽样方法的比较类别各自特点相互联系适用范围共同点简单随机57三、概率抽样的方法
4.整群抽样
将总体按某种标准划分为一些子群体,每个子群为一个抽样单位,用随机方法从中抽若干子群,将抽出的子群中的所有个体结合起来构成样本。第四章抽样(1)三、概率抽样的方法4.整群抽样第四章抽样(1)58三、概率抽样的方法
整群抽样特点:抽样单位不是单个的个体,而是成群的个体优缺点:优点:不需要详细的所有元素的名单,简单,费用低缺点:样本的分布面不广,代表性相对较差
整群抽样和分层抽样的比较:子群间异质性强,群内同质性强——分层抽样子群间同质性强,群内异质性强——整群抽样
第四章抽样(1)三、概率抽样的方法整群抽样特点:第四章抽样(1)59三、概率抽样的方法
5.多阶段抽样
按抽样元素的隶属关系或层次关系,把抽样分为几个阶段进行。例1:大学——院系——班级——学生例2:城市——区——街道——居委会——家庭——个人特征:适用于范围大、总体数量多的社会调查优缺点:优点:不需要总体的全部名单,各阶段的抽样单一般较少,容易操作缺点:每一个阶段都存在误差,抽样误差可能较大应对方法:尽量增加开头阶段的样本数适当减少最后阶段的样本数
第四章抽样(1)三、概率抽样的方法5.多阶段抽样第四章抽样(1)60三、概率抽样的方法
6.PPS抽样(概率与元素的规模大小成比例的抽样)什么情况下要使用PPS抽样:以上所介绍的抽样方法有一个共同的特点:总体(或子总体)中的每一个元素都具有同等的被抽中的概率。如果总体中每个元素的“大小”基本相同,或者每一个元素在总体中的地位或重要性相差不多,则这种基于同等概率的抽样是合适的。但当元素的大小不同,或者元素在总体中的地位不同时,则需要采用不等概率抽样的方法。第四章抽样(1)三、概率抽样的方法6.PPS抽样(概率与元素的规模大小成比61三、概率抽样的方法
如何进行PPS抽样?(P72)例:从全市100家不同规模的企业(共20万职工)中抽取1000名职工进行调查100家企业抽取20家企业,20家企业每家抽取50个工人,合计1000名职工20家企业抽取概论相同每个企业职工抽取的概论不同企业3每个职工抽取的概论=50/16000企业4每个职工抽取的概论=50/200第四章抽样(1)三、概率抽样的方法如何进行PPS抽样?(P72)第四章抽62第四章抽样(1)第四章抽样(1)63四、非概率抽样方法
非概率抽样:
又称非随机抽样,就是调查者根据自己的方便或主观判断抽取样本,这样的抽样方法不遵循概率均等的原则。常见的非概率抽样方法:偶遇抽样判断抽样定额抽样滚雪球抽样第四章抽样(1)四、非概率抽样方法非概率抽样:第四章抽样(1)64四、非概率抽样方法
1.偶遇抽样定义:方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。适用范围可用于经常性的市场调查;可用于正式市场调查之前的试验调查;任意调查适用于同质总体。第四章抽样(1)四、非概率抽样方法1.偶遇抽样第四章抽样(1)651.偶遇抽样优点:方便、灵活,简便易行,及时取得所需资料,节约时间和费用成本低缺点:样本的代表性差、有很大的偶然性。例:1.在商场、码头等公共场所调查2.街头拦截调查3.报刊的读者调查四、非概率抽样方法
第四章抽样(1)1.偶遇抽样四、非概率抽样方法第四章抽样(1)66四、非概率抽样方法
判断抽样:
也叫立意抽样,研究者根据自己的主观判断来抽选样本,分为印象判断抽样和经验判断抽样。印象判断抽样:纯粹凭研究者的主观印象抽样经验判断抽样:根据以往经验和对调查对象的了解抽样注意的问题:判断抽样的关键是抽样标准的确立,这种方法的运用与研究者本人的因素比如理论修养、实践经验以及对调查对象的熟悉程度有关
第四章抽样(1)四、非概率抽样方法判断抽样:第四章抽样(1)67四、非概率抽样方法
判断抽样:适用场合:多用于无法确定总体边界、或总体规模小、调查所涉及的范围较窄,或调查时间、人力等条件有限而难以进行大规模抽样的情况。优点:可以充分发挥研究人员的主观能动作用。样本是按照调查人员的需要来选定的,所以较好地满足了特殊的调查需要。缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。样本的代表性难以判断,不能推论。第四章抽样(1)四、非概率抽样方法判断抽样:第四章抽样(1)68四、非概率抽样方法
3.定额抽样
又称配额抽样,先根据总体各个组成部分所包含的抽样单位的比例分配样本数额,然后由调查者在各个组成部分内根据配额的多少采用偶遇抽样或判断抽样方法抽取样本。第四章抽样(1)四、非概率抽样方法3.定额抽样第四章抽样(1)69四、非概率抽样方法
定额抽样
例:某高校有2000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%、二年级、三年级、四年级学牛分别占30%、20%和10%。现在要用定额抽样方法依上述3个变数抽取一个规模为100人的样本。依据总体的构成和样本规模,我们可得到下列定额表
第四章抽样(1)四、非概率抽样方法定额抽样第四章抽样(1)70四、非概率抽样方法
定额抽样
定额抽样与分层抽样的区别在于,定额抽样最后抽取样本时所采用的方法是非随机抽样。配额抽样的优点
适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。
配额抽样的缺点
容易掩盖不可忽略的偏差第四章抽样(1)四、非概率抽样方法定额抽样第四章抽样(1)71四、非概率抽样方法
滚雪球抽样
当无法了解总体时,可以从总体中少数成员入手,对他们进行调查,并进一步询问还知道哪些符合条件的再进一步询问。例:对球迷、戏迷的调查缺点:同质性较强第四章抽样(1)四、非概率抽样方法滚雪球抽样第四章抽样(1)72四、非概率抽样方法
非随机抽样抽选样本的质量,主要取决于调查者的主观状况和各种偶然因素。优点:简单、易行,可以获得对调查对象的大致了解。缺点:代表性差,调查资料不能从数量上推断总体。第四章抽样(1)四、非概率抽样方法非随机抽样抽选样本的质量,主要73五、样本规模与抽样误差
样本规模:又称样本容量,就是指样本所含个案的数量。
确定样本规模也是每一项具体的社会研究所必须解决的问题之一.统计学与社会研究的样本统计学中通常以30为界,把样本分为大样本和小样本.社会研究中的样本规模至少不能少于100个个案,第四章抽样(1)五、样本规模与抽样误差样本规模:又称样本容量,就是指样本所74五、样本规模与抽样误差
确定样本规模需要考虑的因素:1.推断的把握性与精确度;2.总体的规模;3.总体的异质性程度;4.研究者所拥有的资源。
第四章抽样(1)五、样本规模与抽样误差确定样本规模需要考虑的因素:第四章抽75五、样本规模与抽样误差
1.推断的把握性与精确度置信度:把握性置信区间:精确度
一般地说,在其他条件不变的情况下,置信度越高,即推断的可靠程度越高,所要求的样本规模就越大;置信区间越小,即样本值与总体值之间误差范围越小,所要求的样本规模就越大。
第四章抽样(1)五、样本规模与抽样误差1.推断的把握性与精确度第四章抽样(76五、样本规模与抽样误差
不同允许误差水平所需的最少样本量
第四章抽样(1)五、样本规模与抽样误差不同允许误差水平所需的最少样本量第77五、样本规模与抽样误差
2.总体的规模
在置信度和抽样误差不变的条件下,样本规模是随着总体规模的扩大而扩大,但样本占总体的比重却不断缩小。当总体规模大到一定程度时(例如100万),样本规模的增加对抽样误差的影响就微乎其微。例如:美国大选的民意调查中样本通常不超过3000第四章抽样(1)五、样本规模与抽样误差2.总体的规模第四章抽样(1)78五、样本规模与抽样误差
总体规模与样本规模的关系(置信度95%,抽样误差3%)
总体规模样本规模样本占总体的比重(%)100035035200046023300048016500055011100006006200006403.2500006501.31000006800.685000007000.14第四章抽样(1)五、样本规模与抽样误差总体规模与样本规模的关系总体规模样本79五、样本规模与抽样误差
3.总体的异质性程度;4.研究者所拥有的资源。第四章抽样(1)五、样本规模与抽样误差3.总体的异质性程度;第四章抽样(180五、样本规模与抽样误差
经验确定样本数的范围总体规模100以下
100-1000
1000-5000
5000—1万1万—10万10万以上样本所占比重50%以上
50—20%
30—10%
15—3%5—1%1%以下第四章抽样(1)五、样本规模与抽样误差经验确定样本数的范围总体规模1081演讲完毕,谢谢听讲!再见,seeyouagain3rew2022/10/31第四章抽样(1)演讲完毕,谢谢听讲!再见,seeyouagain3rew82第四章、抽样(1)2022/10/31第四章抽样(1)第四章、抽样(1)2022/10/23第四章抽样(1)83第四章抽样
1.抽样的意义与作用
2.概率抽样的原理与程序
3.概率抽样方法
4.非概率抽样方法
5.样本规模与抽样误差第四章抽样(1)第四章抽样1.抽样的意义与作用
2.概率抽样的原理与程84一、抽样的意义与作用1.抽样的意义与作用
人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是抽样复杂的社会现象有限的研究资源
抽样主要涉及和处理有关总体与部分之间的关系问题。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。抽样第四章抽样(1)一、抽样的意义与作用1.抽样的意义与作用抽样第四章抽样(1)85一、抽样的意义与作用
1.抽样的作用
抽样是社会研究的主要内容之一,也是社会调查的一个重要步骤。它与研究目的及研究内容紧密相关。它直接关系到资料的收集、整理与分析。它还涉及到整个研究的费用以及应用的范围。抽样是否科学,直接关系到研究的成败第四章抽样(1)一、抽样的意义与作用1.抽样的作用第四章抽样(1)86侯选人《LiteraryDigest》预测%选举结果%罗斯福4362兰顿5738
一个著名的案例——抽样中的泰坦尼克事件1936年美国正从经济大恐慌中复苏,全国仍有9百万人失业.当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐.《文学文摘》(LiteraryDigest)杂志对结果进行了调查预测.他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄1千万份问卷调查表,回收约240万份.工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登将以370∶161的优势,即以57%比43%,领先14个百分点击败罗斯福.与之相反,一个名叫乔治•盖洛普的人,对《文学文摘》调查结果的可信度提出质疑.他也组织了抽样调查,进行民意测验.他的预测与《文学文摘》截然相反,认为罗斯福必胜无疑.结果,罗斯福以62%比38%压倒性地大胜兰登.这一结果使《文学文摘》销声匿迹,而盖洛普则名声大噪.第四章抽样(1)侯选人《LiteraryDigest》预测%选举结果%罗斯87年代候选人盖洛普民意测验结果(%)总统选举真实结果(%)盖洛普误差(%)2000布什48.047.9+0.11996克林顿52.049.2+2.81992克林顿49.043.3+5.71988老布什56.053.9+2.11984里根59.059.2-0.21980里根47.050.8-3.81976卡特48.050.1-2.11972尼克松62.061.8+0.21968尼克松43.043.5-0.51964约翰逊64.061.3+2.71960肯尼迪51.050.1+0.91956艾森豪威尔59.557.8+1.71952艾森豪威尔51.055.4-4.41948杜鲁门44.549.5-5.01944罗斯福51.553.8-2.31940罗斯福52.055.0-3.01936罗斯福55.762.5-6.8从美国总统大选预测看抽样的效率:
第四章抽样(1)年代候选人盖洛普民意测验结果(%)总统选举真实结果(%)盖洛88一、抽样的意义与作用
2.抽样的概念在我们的日常生活中经常存在着抽样。如抽血化验,尝试水温,窥一斑而知全豹。抽样(sampling)从组成某个总体的所有元素的集合中,按一定的方式选择或抽取样本的过程抽样调查,就是从研究总体中抽取一部分代表加以调查研究,然后用所得结果推论和说明总体的特性。总体(population):构成它的所有元素的集合样本(sample)从总体中按一定方式抽取出的一部分元素的集合抽样单位(samplingunit)一次直接的抽样所使用的基本单位第四章抽样(1)一、抽样的意义与作用2.抽样的概念第四章抽样(1)89一、抽样的意义与作用
抽样框(samplingframe)抽样范围,指一次直接抽样时总体中所有抽样单位的名单参数值(parameter)是对总体中某一变量的综合描述,或总体中所有元素某些特征的综合数量表现。最常见的参数值是总体某一变量的平均值。统计值(statistic)是对样本中某一变量的综合描述,或样本中所有元素某些特征的综合数量表现。根据样本计算出来的关于样本变量的数量表现置信度(confidencelevel)总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间内的把握性程度置信区间(confidenceintevalue)上述“某一区间”,就是置信区间第四章抽样(1)一、抽样的意义与作用抽样框(samplingframe)90二、概率抽样的原理与程序概率抽样:(1)每一个体有同等机会被抽取(2)每一个体的抽取都是相互独立的第四章抽样(1)二、概率抽样的原理与程序概率抽样:第四章抽样(1)91二、概率抽样的原理与程序概率抽样的逻辑
(1)同质性和异质性
如果研究总体是完全同质的,抽样就没有必要;社会科学中的研究总体往往具有较强的异质性;为了实现“通过部分认识整体”,样本应该包含总体的各种差异特征。第四章抽样(1)二、概率抽样的原理与程序概率抽样的逻辑第四章抽样(1)92二、概率抽样的原理与程序概率抽样的逻辑
(2)无意识抽样导致的偏差方便获取的样本:易得,但缺乏代表性;例如:如何获取由100个学生构成的样本访问者的偏好影响样本的代表性;例如:有意回避具有某些特征(“酷”,“冷”)的受访者抽样的地点影响样本的代表性例如:图书馆门口访问第四章抽样(1)二、概率抽样的原理与程序概率抽样的逻辑第四章抽样(1)93二、概率抽样的原理与程序概率抽样的逻辑
(3)代表性和选择的概率
如果总体中的每一个体都具有同等机会被选入样本,那么从这一总体中抽取的样本就能够代表总体。概率抽样的优点
(1)样本对总体更具代表性(相对其它类型抽样)(2)可以对样本的精确性和代表性作出估计第四章抽样(1)二、概率抽样的原理与程序概率抽样的逻辑第四章抽样(1)94二、概率抽样的原理与程序总体分布、样本分布、抽样分布
当样本容量继续增大,样本平均数的分布会进一步发生变化。这种变化趋势是:平均数的范围将逐步缩小(即底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显.
第四章抽样(1)二、概率抽样的原理与程序总体分布、样本分布、抽样分布第四95总体分布(population
distribution)
总体分布:
总体中各元素的观察值所形成的相对频数(频率)分布
分布通常是未知的(因为几乎得不到总体所有观察值)可以(根据理论分析)假定它服从某种分布
总体第四章抽样(1)总体分布(populationdistribution)96
(sampledistribution)样本分布也称经验分布,指一个样本中各观察值的形成的相对频数(频率)分布。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。样本第四章抽样(1)(sampledistribution)样本分布也称经验97抽样分布(samplingdistribution)抽样分布:样本统计量的概率分布,是一种理论分布。在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布样本统计量是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是随机变量样本均值,样本比例,样本方差等第四章抽样(1)抽样分布(samplingdistribution)抽样分98样本均值的抽样分布在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布
第四章抽样(1)样本均值的抽样分布在重复选取容量为n的样本时,由样本均值的所99总体分布、样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体)
,即总体单位数N=4。4
个个体分别为x1=1,x2=2,x3=3,x4=4
。总体分布、总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差第四章抽样(1)总体分布、样本均值的抽样分布(例题分析)【例】设一个总体,含100
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)第四章抽样(1)现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共101
计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(
)x样本均值的抽样分布1.000.10.20.3P
(x)1.53.04.03.52.02.5第四章抽样(1)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.102样本均值的分布与总体分布的比较
(例题分析)
=2.5σ2=1.25
的分布形式与原有总体和样本容量n的大小有关14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x总体分布第四章抽样(1)样本均值的分布与总体分布的比较(例题分析)=2.103样本均值的抽样分布与中心极限定理
=50=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x
的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)第四章抽样(1)样本均值的抽样分布与中心极限定理=50=10X总体104中心极限定理
(centrallimittheorem)当样本容量足够大时(n
³30),样本均值的抽样分布逐渐趋于正态分布中心极限定理:设从均值为,方差为
2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x第四章抽样(1)中心极限定理(centrallimittheorem105中心极限定理(centrallimittheorem)x的分布趋于正态分布的过程第四章抽样(1)中心极限定理(centrallimittheorem)106抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布第四章抽样(1)抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样107样本均值的数学期望样本均值的方差(方差的概率意义在于刻画了随机变量取值的分散程度。方差越小,随随机变量的取值越集中在期望值附件。)
重复抽样样本均值的抽样分布第四章抽样(1)样本均值的数学期望样本均值的抽样分布第四章抽样(1)108抽样的一般程序界定总体:对从中抽取样本的总体范围与界限作明确的界定制定抽样框:依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框决定抽样方案:选择抽样方法,确定样本规模实际抽取样本:1.先抽好样本,再调查2.一边抽样一边调查评估样本质量:对样本的质量、代表性、偏差等进行初步的检验和衡量第四章抽样(1)抽样的一般程序界定总体:对从中抽取样本的总体范围与界限作明确109概率抽样的方法抽样的类型
偶遇抽样判断抽样定额抽样雪球抽样简单随机抽系统多层抽样分层抽样整群抽样多段抽样概率抽样非概率抽样抽样类型第四章抽样(1)概率抽样的方法抽样的类型偶遇抽样简单随机抽概率抽样非概率抽样110三、概率抽样的方法
1.简单随机抽样:概率抽样的最基本形式方法:1.总体较少:搅拌抽签;2.总体较多:用随机数表见P269.表4-23.利用EXCEL的randbetween(a,b)函数实现简单随机抽样第四章抽样(1)三、概率抽样的方法1.简单随机抽样:第四章抽样(1)111三、概率抽样的方法1.简单随机抽样概念:一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取n(n≤N)个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。要点:它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是一种不放回抽样它是一种等概率抽样用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概率等于第四章抽样(1)三、概率抽样的方法1.简单随机抽样用从个体数为N的总体中抽取112三、概率抽样的方法1.简单随机抽样抽签法(抓阄法)将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。第四章抽样(1)三、概率抽样的方法1.简单随机抽样第四章抽样(1)113三、概率抽样的方法练习1.高二(21)班有53名同学,现要从中抽取8名去参加一个座谈会,请写出用抽签法抽选的过程。2.假设一个总体有5个元素,分别记为a、b、c、d、e,采用抽签法抽取一个容量为2的样本,样本共有多少个?为了考察某公司生产的250克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.当总体的个数较多时,将总体“搅拌均匀”比较困难,抽签法产生的样本代表性差的可能性很大。第四章抽样(1)三、概率抽样的方法练习当总体的个数较多时,将总体“搅拌均匀”114三、概率抽样的方法1.简单随机抽样随机数表法随机数表是统计工作者用计算机生成的随机数,保证表中的每个位置上的数字是等可能出现的用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的第四章抽样(1)三、概率抽样的方法1.简单随机抽样第四章抽样(1)115练习例:为了考察某公司生产底250克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.S1,将800袋牛奶编号,可以编为000,001,……,799;S2,在随机数表中任意选一个数,例如第8行第7列的数7;S3,从选定的数7开始向右读,得到一个三位数,如果这个三位数在000~799范围内,则取出,否则去掉;继续向右读,得下一个三位数;依次下去,直到样本的60个号码全部取出.将总体中的个体编号时从000开始,用意何在?当随机地选定开始读数的数后,读数的方向只能向右吗?三、概率抽样的方法第四章抽样(1)练习三、概率抽样的方法第四章抽样(1)116三、概率抽样的方法练习将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。
上述问题中抽取样本的方法用随机数表法来进行!规则1:从269页表中第3行第11列的两位数开始,依次向下读数,到头后再转向它左面的两位数号码,并向上读数,以此下去,直到取足样本。规则2:从269页表中第12行第10列的两位数开始,依次向左读数,到头后再转向它下面的两位数号码,并向右读数,以此下去,直到取足样本。第四章抽样(1)三、概率抽样的方法练习第四章抽样(1)117三、概率抽样的方法1.简单随机抽样利用EXCEL的randbetween(a,b)函数实现简单随机抽样例:某总体共3000人(四位数),需要从中抽取100人作为样本进行调查打开EXCEL,用鼠标左键点击1A,点开fx,出现一个对话框,在对话框的选择类别这一栏中选择“数学与三角函数”,在选择函数这一栏中选择randbetween,在randbetween后又出现对话框,在对话框的bottom栏填写最小数,在top栏填写最大数,鼠标左键点击确定,在1A栏出现一个随机数字,下拉该栏到100A处就出现了100个随机数字。第四章抽样(1)三、概率抽样的方法1.简单随机抽样第四章抽样(1)118三、概率抽样的方法1.简单随机抽样简单随机抽样方法的优缺点优点:可能产生代表性样本缺点:不容易做抽样元素多,编号难必须能够接触到被选中的个体搅拌均匀不易第四章抽样(1)三、概率抽样的方法1.简单随机抽样第四章抽样(1)119三、概率抽样的方法
2.系统抽样(等距抽样或间隔抽样)
定义:等距抽样或机械抽样,将总体的单位编号排序后,按照固定的间隔抽取个体组成样本的方法。步骤:编号确定抽样间距确定抽样起点等间距抽样第四章抽样(1)三、概率抽样的方法2.系统抽样(等距抽样或间隔抽样)第四120三、概率抽样的方法2.系统抽样(等距抽样)举例:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见,需要抽取30名听众进行座谈,除了用简单随机抽样获得样本外,你能否设计其他的抽取样本的方法?留下每排座位号为20的30名听众进行座谈。注意:这种抽取样本的方法与简单随机抽样有什么区别?你能说出操作步骤吗?第四章抽样(1)三、概率抽样的方法2.系统抽样(等距抽样)第四章抽样(1)1212.系统抽样(等距抽样)优点:简便易行条件:抽样框里的元素应该是随机排列的.。三、概率抽样的方法第四章抽样(1)2.系统抽样(等距抽样)三、概率抽样的方法第四章抽样(1)122三、概率抽样的方法注意1:系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。例如:从总体2000户家庭的社区中,抽取一个50户家庭的样本进行调查消费状况的调查,而这2000户家庭的名单是按每个家庭总收入的多少,由高到低的顺序排列的。初始号码为3和38,所抽样本家庭平均收入有很大区别,消费状况也有很大区别。注意2:元素排列的周期性可能导致抽样的重大偏差!例如:每个班级内的50名学生按照学生成绩的高低来排序,每个班抽取一名学生组成样本,初始号码为2和48号,所抽样本的平均成绩差别很大第四章抽样(1)三、概率抽样的方法注意1:系统抽样的一个十分重要的前提条件,123三、概率抽样的方法2.系统抽样(等距抽样)以下抽样方法的区别中,说法错误的是___
(A)4个人打牌时,将洗好的牌(52张)随机确定一张牌为起始牌,然后按次序发牌,每人13张,这种抽样方法属于随机抽样(B)从标号为1~15的15个球中,任选3个做为样本,按从小到大排序,随机选取起点号i0,以后选取i0+5,i0+10(超过5则从1数起),这种抽样方法属于系统抽样(C)工厂生产某种产品,用传送带送入包装车间,检验人员每隔五分钟从传送带上抽一产品进行检验,这种抽样方法属于系统抽样(D)电影院为调查观众某项指标,通知每排的座位号为8号的观众留下来,这种抽样方法属于系统抽样第四章抽样(1)三、概率抽样的方法2.系统抽样(等距抽样)第四章抽样(1)124三、概率抽样的方法2.系统抽样(等距抽样)应用举例某地区有3000名学生参加学科竞赛,现要从中抽取一个样本对他们的成绩进行分析,每个学生被抽到的概率均为1/15,试确定样本容量,并说出抽样步骤。设某校共有108名教师,为了支援西部的教育事业,要从中随机抽出16名教师组成暑期西部讲师团。请用系统抽样方法选出讲师团成员。有人说,可以借用居民身份证号码(18位)来进行央视春晚的收视率调查:在1~999中抽出一个随机数,比如632,那么身份证后三位是632的观众就是要调查的对象。你觉得这样所获得的样本有代表性吗?第四章抽样(1)三、概率抽样的方法2.系统抽样(等距抽样)第四章抽样(1)125系统抽样的优缺点如何改进?优点:(1)简单易操作(2)当对总体结构有一定了解时,充分利用已有的信息对总体中的个体进行排队后再抽样,可提高抽样效率(3)当总体中的个体存在一种自然编号时,采用系统抽样比较方便缺点:(4)当在不了解样本总体的情况下(如性别差异,经济基础,个人喜好,天气因素等等),所抽出的样本可能会有一定的偏差。第四章抽样(1)系统抽样的优缺点如何改进?优点:第四章抽样(1)126三、概率抽样的方法3.分层抽样问
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建筑施工安全监管信息化解决方案2025年研究报告
- 食品转包类型的合同协议
- 离婚协议赠予协议书范本
- 杀菌釜设备安装合同范本
- 物流代办合同协议书模板
- 法律合作协议书模板模板
- 矿山承包开采破碎协议书
- 独栋物业转让协议书范本
- 游泳馆培训协议合同范本
- 销售超滤纯水器合同范本
- 性关系协议书范本
- DB13-T1349-2010-超贫磁铁矿勘查技术规范-河北省
- GB/T 196-2025普通螺纹基本尺寸
- 民族理论与民族政策课程
- SA8000标准全套控制程序文件及实施指南
- 高中政治学科教学设计
- 2025年渠道维护工(技师)技能理论考试题(附答案)
- 县委办副主任2024年个人述职报告
- 花生生长全过程图谱
- 装饰装修工程居间合同范本
- 2025年烟台汽车工程职业学院单招职业技能测试题库一套
评论
0/150
提交评论