第三讲样本的抽取_第1页
第三讲样本的抽取_第2页
第三讲样本的抽取_第3页
第三讲样本的抽取_第4页
第三讲样本的抽取_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲样本的抽取第1页,共36页,2023年,2月20日,星期一一、抽样的基本原理

抽样就是从一个总体中抽取部分具有代表性的个体作为样本,然后用这一样本的结果去推断总体。(总体、样本、样本容量)第2页,共36页,2023年,2月20日,星期一

总体100000人样本1000人随机抽样

研究结果推断

抽样基本原理关系图第3页,共36页,2023年,2月20日,星期一二、抽样的基本要求1.明确规定总体2.取样的随机性3.取样的代表性4.合理的样本容量第4页,共36页,2023年,2月20日,星期一三、概率抽样的方法遵循随机化原则的抽样称为概率抽样。理论依据:

——大数法则

第5页,共36页,2023年,2月20日,星期一1.简单随机抽样

定义:总体中每个个体被抽到的机会是均等的,且在抽样取走一个个体之后总体内成分不变。如图:第6页,共36页,2023年,2月20日,星期一简单随机抽样一般用下述三种方法:

(1)抽签法

(2)查表法

(3)计算机造数法

主要适用于小总体的情况。

第7页,共36页,2023年,2月20日,星期一

2.系统抽样(等距抽样)

这种抽样的具体做法是:(1)将总体的所有单位按一定顺序排列起来。(2)计算抽样间隔。抽样间隔是有总体所含的单位数与样本容量决定的。假设前者是N个,后者为n个,则抽样间隔应是K=N/n。(3)在第一个抽样间隔内用完全随机的方法抽取一个单位作为第一个样本单位。(4)以第一个抽中的单位为起点,每隔k个总体单位抽取一个单位作为样本单位,直至抽满为止。第8页,共36页,2023年,2月20日,星期一

[例1]

现有180名学生,要利用系统抽样法从中抽取15名学生作研究样本,其方法如下:先将学生按与学生学习成绩无关的标志编号,假设按学生座位顺序把学生编为1-180号,然后按下述步骤抽取:

(1)确定间隔距离;

(2)决定起点R=(K+2)/2=(12+2)/2=7,即决定从第一部分的第7号单位作为第一个样本。第二个样本为7+12=19号单位;如此类推,抽出的15个样本为:

(7),(19),(31),(43),(55),(67),(79),(91),(103),(115),(127),(139),(151),(163),(175)。第9页,共36页,2023年,2月20日,星期一例2、下列抽样中不是系统抽样的是()A、从标有1—15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样。B、工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验。C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止。D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。第10页,共36页,2023年,2月20日,星期一例3、从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A、5,10,15,20,25B、3,13,23,33,43C、1,2,3,4,5D、2,4,6,16,32第11页,共36页,2023年,2月20日,星期一例4.从某厂生产的802辆轿车中随机抽取80辆测试某项性能。请合理选择抽样方法进行抽样,并写出抽样过程。例5.某装订厂平均每小时约装订图书362册,需要检验员每小时抽取40册图书,检验其质量状况,请你设计一个抽样方案。第12页,共36页,2023年,2月20日,星期一3.分层抽样(类型抽样)

分层抽样是先把总体按一定标志分成不同类型或层次,然后从各种不同类型中随机抽取若干单位组成样本。第13页,共36页,2023年,2月20日,星期一第14页,共36页,2023年,2月20日,星期一分层抽样探究假设某地区有高中生2400人,初中生10900人,小学生11000人。此地区教育部门为了了解本地区中小学生的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查。你认为应当怎样抽取样本?能在14300人中任意取143个吗?能将143个份额均分到这三部分中吗?

分析:考察对象的特点是由具有明显差异的几部分组成。当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。第15页,共36页,2023年,2月20日,星期一1、一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本。由于职工年龄与这项指标有关,试问:应用什么方法抽取?解:1)确定样本容量与总体的个体数之比100:500=1:52)利用抽样比确定各年龄段应抽取的个体数,依次为:125/5,280/5,95/5,即25,56,19。3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取25,56,19人,然后合在一起,就是所抽取的样本。练习第16页,共36页,2023年,2月20日,星期一分层抽样的步骤1、根据总体的差异将总体分为互不交叉的层。2、按比例k=n/N的比例在每层当中抽取样本。3、合成样本。第17页,共36页,2023年,2月20日,星期一[例2]某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人。上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作。1.抽样比例k=1:5;2.每层中抽取的样本分别为:n1=10*1/5=2(人)n2=70*1/5=14(人)N3=20*1/5=4(人)3.则样本容量:n=n1+n2+n3=20。第18页,共36页,2023年,2月20日,星期一分层抽样的主要优点:

一是当一个总体其内部分层明显时,分层抽样能够提高样本的代表性,从而提高从样本推断总体的精确性。二是分层抽样特别适用于既要对总体参数进行推断,也要对各子总体(层)的参数进行推断的情形。三是允许不同层的情况采用不同的抽样方法。局限性:

调查者必须对总体情况有较多的了解,否则无法进行恰当的分层。第19页,共36页,2023年,2月20日,星期一4.整群抽样又称聚类抽样,它是将总体按照某种标准划分为一些子群体,每个子群体作为一个抽样单位,用随机的方法从中抽取若干子群,将抽出的子群中的所有单位合起来作为总体的样本。

第20页,共36页,2023年,2月20日,星期一第21页,共36页,2023年,2月20日,星期一思考:分层抽样与整群抽样的联系与区别?第22页,共36页,2023年,2月20日,星期一整群抽样的主要优点:

易于取得抽样框,便于组织,可以节省人力、物力和财力。最大缺点:

样本分布不均匀,样本的代表性差。

第23页,共36页,2023年,2月20日,星期一

四、非概率抽样不按照随机化原则进行的抽样叫非概率抽样。四种类型:就近抽样、目标式或判断式抽样、滚雪球抽样、配额抽样。第24页,共36页,2023年,2月20日,星期一就近抽样(偶遇抽样、方便抽样、自然抽样)

定义:是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。例优点——方便省力;缺点——样本的代表性差,有很大的偶然性。第25页,共36页,2023年,2月20日,星期一目标式和判断式抽样(主观抽样、立意抽样):定义:调查者根据研究的目标和自己主观的分析,来选择和确定调查对象的方法。它是“有目的的”选择样本

优点:

可以充分发挥研究人员的主观能动作用。缺点:

样本的代表性难以判断,不能推论。

第26页,共36页,2023年,2月20日,星期一滚雪球抽样:定义:当我们无法了解总体情况时,可以从总体中的少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并询问他们知道的人。

第27页,共36页,2023年,2月20日,星期一配额抽样(定额抽样):定义:

按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层(类)所占比例与他们在总体中所占比例一样。例:假设某高校有2000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%,二年级、三年级、四年级学生分别占30%、20%和10%。现要用定额抽样方法依上述三个变量抽取一个规模为100人的样本。

第28页,共36页,2023年,2月20日,星期一第29页,共36页,2023年,2月20日,星期一配额抽样方法的缺陷:配额的框架必须十分精确。为了做到这一点,必须掌握最新的资料,但这是十分困难的。从某些特定的格子中选择样本时,可能会存在偏误。

配额抽样和分层抽样的区别:

——本质上的差别——

第30页,共36页,2023年,2月20日,星期一非概率抽样的优缺点及适用范围:

其样本的代表性往往较小,误差有时相当大,而且这种误差又无法估计。

优点:

操作方便、省钱省力,统计上也远较概率抽样简单;适于探索性研究。第31页,共36页,2023年,2月20日,星期一举例:“大学生学习现状调查与学习指导的研究”

“弱智儿童智能特点的研究”

“小学学习困难学生教育的研究”第32页,共36页,2023年,2月20日,星期一样本大小取决于以下诸方面因素:(1)研究的不同类型;(2)预定分析的精确程度;(3)允许误差的大小;(4)总体的同质性;(5)研究者的时间、人力和物力;(6)取样的方法等。

第33页,共36页,2023年,2月20日,星期一

表1从给定的总体确定样本大小一览表总体样本总体样本总体样本10102201401200291151423014413002972019240148140030225242501521500306302826015516003103532270159170031340362801621800317454029016519003205044300169200032255483201752200327605234018124003316556360186260033570593801912800338756340019630003418066420201350034685704402054000351907346021045003549576480214500035710080500217600036111086550226700036412092600234800036713097650242900036814010370024810000370150108750254150003751601138002602000037717011885026530000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论