版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三讲
抽样的逻辑讲解:李素梅第三讲
抽样的逻辑讲解:1
总体与抽样框
概率抽样的应用提纲概率抽样的实际操作总体与抽样框概率抽样的应用提纲概率抽样的实际操作2抽样:从总体中选出具有代表性样本的过程。以便通过对样本的研究,取得能说明总体的足够可靠的资料,准确地推断总体的情况,从而认识总体的特征或规律性。从样本的特征推断总体的特征统计值参数值本样总体抽样知识回顾抽样原则:样本具有代表性,即所选取的样本能再现总体的结构。抽样:从总体中选出具有代表性样本的过程。以便通过对样本的研究3
总体
研究总体
抽样框
样本推论的对象
抽样的对象
抽样的名单
抽到的对象回顾几个概念吧总体研究总体抽样框样本推论的4影响样本代表性的因素样本容量
抽样方法
抽样框、总体是否一致等
抽样框与总体的关系:经过正确抽样所得的样本信息,只适合于描述构成抽样框的要素组成的总体,是否能扩展需要分析。例:对纽约以及新泽西48个社区中68个药房药物的销售情况进行25年的调查(方法:“调查邻近药房的方式”)----能推断整个美国药房销售的情况吗?或是否能推论纽约和新泽西的药房的情况?总体与抽样框影响样本代表性的因素样本容量抽样方法抽样框、总体是否一致5理想的抽样框:所有的抽样单位必须覆盖总体,抽样框要求每个总体单位都应该对应着一个抽样单位,抽样单位必须相互独立,互不重叠。如以北京的所有街道的名单为一阶抽样中的抽样框,其必须覆盖北京所有的街道。最理想的抽样框随机抽取成员组织如学校等成员总体与抽样框抽样框表现形式----例:电话号码簿、邮政编码簿、车主名单、纳税人名单、领有营业执照的人员名单;大学、学术期刊、报纸、工会等名单理想的抽样框:所有的抽样单位必须覆盖总体,抽样框要求每个总体6当你用电话簿或名册作为抽样框时,有没有注意它是否包含了总体所有单位呢?抽样框误差来源于:
1.不能覆盖总体单位;2.包含了非总体单位;3.复合联接;
4.抽样框老化。总体与抽样框当你用电话簿或名册作为抽样框时,有没有注意它是否包含了总体所7非概率抽样方法就近法、目标式抽样、配額抽样、滾雪球抽样确定合适的样本量执行抽样设计界定总体
决定抽样框确定抽样步骤抽样的设计概率抽样方法
简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样非概率抽样方法确定合适的样本量执行抽样设计界定总体决定抽8概率抽样(ProbabilitySampling)
概率抽样系统抽样简单随机抽样分层抽样整群抽样多阶段抽样概率抽样:按照概率论和数理统计的原理,根据随机原则从调查研究的总体中抽选样本,使每个要素以已知非零的机会进入样本的方法。特点:1、按随机原则抽选样本;2、总体中每一个单位被抽中的概率已知非零,样本具有代表性;3、可以估计可能出现的误差并加以控制。
概率抽样(ProbabilitySampling)9简单随机抽样(SimpleRandomSampling)总体各单元不经过任何排队或分类,从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式,是其他概率抽样方法的基础。简单随机抽样(SimpleRandomSampling)10 方法:抛硬币、掷骰子、抽签、查随机数表等。随机数表法例:(例:K=100,n=10)1.给每个要素编码;2.从随机表中随机选取10个数字:确定所选择的随机数的位数;随意从随机数表中任何一区的任何一个数目开始,依次向各个方向顺序连续选取数字。评价:概率抽样的理想类型,没有偏见,简单易行。但当总体所含个体数目太多时,费时、费力,费用高;而且在总体异质性很高时,误差较大。因此,名册齐全的话,一般会用系统抽样法而不是简单随机抽样法。黑人白人机会均等 方法:抛硬币、掷骰子、抽签、查随机数表等。随机数表法例:(11
步骤:(1)将总体的所有单位按一定顺序排列起来。(2)计算抽样间距:k=总体大小(N)/样本大小(n)。(3)随机确定一个起点a(1≤a≤k)
作为第一个样本单位。(4)每隔k个单位抽取1个,即由a,a+k,a+2k….a+(n-1)k组成容量为n的样本。2.系统抽样(SystematicSampling)亦称等距抽样或机械抽样,系统化地选择完整名单中每第K个要素组成样本的概率抽样方法。步骤:2.系统抽样(Systematic12123456789103132333435363738394021222324252627282930
11121314151617181920N=40n=8k=5
我的fans多得不得了呢.优点比简单随机抽样方便简单样本在总体中的分布比较均匀局限性是以总体单位的无规律排列为前提的,如果总体的排列出现规律性,特别是周期性时,就可能会使抽样出现系统偏差。1234513
如果在一栋公寓楼里选选择公寓样本,如上图样本间距是8,那么所选样本的每个要素可能全是西北角上房间,这样样本就可能会缺乏代表性.如果有周期性,可以采取在每个间隔内随机抽取等方法解决。如果在一栋公寓楼里选选择公寓样本,如上图样本间距是143.分层抽样(StratifiedSampling)
先将总体按照一种或几种特征将总体的N个单位分成互不交叉、互不重复的若干个组(层);然后从每层中独立、随机地抽取一个子样本,将子样本合在一起,即为总体的样本。腌菜缸厂家想了解各类腌菜的长度,于是….3.分层抽样(StratifiedSampling)
先15变量的选择:1.研究涉及到的主要变量或相关的变量;2.保证各层内部同质性强的变量;3.有明显分层区分的变量;如:某厂职工购买书籍的情况—”文化程度”;某高校宿舍使用电脑情况-“本科生、研究生”等常用指标:行政区划、地理位置、海拔高度、行业、经济发达程度、企业规模、家庭收入水平、性别、年龄、民族等分层应遵循原则:尽可能层内样本的变异小,层间变异大。
优点:1.样本同质性高,样本分布均匀,样本结构与总体结构接近;2.也可对各子层的参数进行推断;3.组织实施比较方便。
应用上最为普遍。尤其是总体数目较大,内部结构复杂时常能取得比较好的效果;
注意:要求调查者对总体及各层有一定的了解,否则无法作出科学的分类。
变量的选择:分层应遵循原则:尽可能层内样本的变异小,层间变异16
步骤:
1.变量的选择。可按一种或几种特征对总体进行分层。如调查某年高考生的语文成绩,可根据科目分类,如文科、理科、艺术、体育、外语等层次来进行简单随机抽样;男性白人、女性白人、男性黑人、女性黑人;2.确定在各层中抽取样本单位的数量。可采取等比例和不等比例抽取两种不同的方法。
步骤:
1.变量的选择。可按一种或几种特征对总体进行分17a.等比例抽样要求各层之间的抽样比例相等。方法1:先分成不同的层,然后采取系统抽样或者随机抽样按照比例抽取。6040样本n=100占总体之60%占总体之40%女生N2=400总体(N=1000)男生N1=600a.等比例抽样要求各层之间的抽样比例相等。6040样本n=18 方法2.分类,再把不同类别的要素放到一个连续性的列表中,然后再对整个列表进行随机开始的系统抽样。(误差将会在1-2个以内,如果在此步采取简单随机抽样将会使分层的效应被抵消) 方法2.分类,再把不同类别的要素放到一个连续性的列表中,19b.不等比例抽样,加权即各层之间的抽样比例不等:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行比较研究。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。例:N=120n=60各层人数不等比例样本样本概率值加权重本科生60201/33硕士生40201/22博士生202011
基本上一个样本成员的权重,应该是其获选为样本概率值的倒数。加权:由于各种误差因素的存在,常导致样本的人口统计数据有别于普查数据。为了减小这种误差,在数据处理时,我们要算出各个样本的权值,使样本结构与普查数据一致,这种数据处理方法就是加权。b.不等比例抽样,加权即各层之间的抽样比例不等:有的层次204.整群抽样(ClusterSampling)
整群抽样又称聚类抽样,一种以群而非个体为抽样单位的抽样方式。先将总体划分为若干能代表总体的子群体,从中随机抽取一些子群体,抽取的群里所有要素共同组成样本的方法。例:对北京市小学生的视力状况进行抽样调查,以学校作为群,抽出部分学校,再对抽中的所有学校的学生统一调查。
4.整群抽样(ClusterSampling)整群抽样21群的划分标准:按行政或地域形成的群体,如学校、企业或街道等。自行划分群时原则:尽可能群间差异小,群内差异大,让每个群更具有代表性。优点:1.转换抽样单位,编制抽样框得以简化;2.群通常由那些地理位置邻近,或隶属于同一系统的单元构成,调查方便;可了解每个子群的情况(如省-市,亦可了解市的情况);局限性:当样本集中于少数群时,引起抽样误差大于其他方法。群的划分标准:按行政或地域形成的群体,如学校、企业或街道等。22对抽取的群的所有人进行调查总体被分为若干子群体图1:分层抽样图2:整群抽样对抽取的群的所有人进行调查总体被分为若干子群体图1:分层抽样235.多阶段抽样(MultiStageSampling)亦称多级抽样,在上述整群抽样中,当子群或子群内部个体数目较多,彼此间的差异不太大时,常常采用更加经济的方法,即不将样本子群中的所有个体作为样本,而是从中再抽取样本,因最终样本的获得经过两次抽样,我们称其为二阶段抽样。同样可进行三阶段、四阶段等多阶段抽样。
如:我们若要调查北京市小学生的视力状况,可采用三阶段抽样的方法:先以学校为抽样单位,抽出若干所小学,然后再以班级为抽样单位抽出若干班级,最后以学生个人为单位从抽中的班级中抽取最终样本。5.多阶段抽样(MultiStageSampling)24多阶段抽样例:在一项某市居民对香皂颜色喜好的调查中,设计者打算采用入户调查的方式,为节省差旅费,希望样本能够集中,因此准备采用整群抽样。方案设计者手头有份该市街道名单。以街道作为群,工作量太大,以居委会为群,编制抽样框来不及,因此,他决定…………三阶段抽样所有街道名单抽取部分街道,并建立其所有居委会名单抽取部分居委会对所有家庭调查二级整群抽样抽除部分家庭最后一阶抽群最后一阶抽要素多阶段抽样多级整群抽样抽取部分居委会多阶段抽样例:在一项某市居民对香皂颜色喜好的调查中,设计者打25抽取100个居委会,每个居委会抽取2个人?抽10个居委会,每个抽取20个人?按照增加样本容量的原则通过同质性解决自然群如居委会群内差异较小,需要大量的群才能充分代表所有群之间的差异尽量多地选择群,而减少每个群中要素的数量上例:N=200建议:在多阶段抽样中,增加开头阶段的样本数,同时适当地减少最后阶段的样本数。多阶段抽样中如何处理样本量的平衡问题?抽取100个居委会,每个居委会抽取2个人?抽10个居委会,按26优点:效率较高局限性:每一阶段都会有误差。适用范围:跨地区的研究,不可能或不方便编制一个完整的名单形成目标总体时;或者是在总体层次比较多或层次内单位数目比较多时,更加经济实用。辅助方法:对于群体规模不等的多阶段抽样,通常使用概率比例抽样,即pps抽样。就是根据每一群的规模分配样本容量的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年全球及中国ROV船体清洁服务行业头部企业市场占有率及排名调研报告
- 四甲基二丙烯三胺行业行业发展趋势及投资战略研究分析报告
- 木壳有隔板过滤器行业市场发展及发展趋势与投资战略研究报告
- 数据安全保障及技术服务合同
- 智慧城市工程项目投资合作合同
- 年产6000吨包覆纱(氨纶)生产可行性研究报告申请建议书
- 2025年化学纤维项目可行性研究报告
- 2025年中国食用碗行业市场发展前景及发展趋势与投资战略研究报告
- 2025年度多媒体广告工程承包实施合同
- 2025年度公司投标管理制度实施细则合同
- 福建省泉州市晋江市2024-2025学年七年级上学期期末生物学试题(含答案)
- 2025年春新人教版物理八年级下册课件 第十章 浮力 第4节 跨学科实践:制作微型密度计
- 货运车辆驾驶员服务标准化培训考核试卷
- 财务BP经营分析报告
- 三年级上册体育课教案
- 2024高考物理二轮复习电学实验专项训练含解析
- 2024年全国统一高考英语试卷(新课标Ⅰ卷)含答案
- 高中英语:倒装句专项练习(附答案)
- 2025届河北衡水数学高三第一学期期末统考试题含解析
- 2024年山东省青岛市普通高中自主招生物理试卷(含解析)
- 2024信息技术数字孪生能力成熟度模型
评论
0/150
提交评论