版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 五章 抽 样 调查,抽样使我们能从总体具有代表性的部分样本中获取数据,从而可以得到关于整个总体的有效结论。 英托尼普罗科特,5.1抽样调查概述,一、抽样调查的概念,总体和抽样总体,总体是指所要调查对象的全体,有有限和无限之分。有限总体的数量可以确定,无限总体的具体数值则无法准确确定。 抽样总体是指从总体中抽取出来所要直接观察的全部单位。又被称为样本量或样本。每一个被抽到的个体或单位就是一个样本。,抽样单位及抽样框,抽样单位:一次直接的抽样所使用的基本单位 抽样单位与构成总体的元素有时相同,有时不同 抽样框就是一次直接抽样时总体中所有元素的名单, 是总体的数据目录或全部总体单位的名单。 理想
2、的完整抽样框相近的抽样框,应具备以下几个条件: 1.包含尽可能多的样本单位,而且总体是清晰的,易确定的。 2.所有样本单位出现在这一集合中的概率相等。 3. 有时可以按照一定原则方法进行人为的假定。,总体指标与抽样指标,根据总体各个单位标志值计算出来的综合指标称为总体指标,用X表示。它是我们想知道的对象特征的数量反映。 常用的指标主要用平均数(X)和成数(P)来表示。,,或 , 为成数,并且 、 分别为两种表现的总体单位数。并且,总体方差和均方差 总体方差和均方差是用来说明总体指标变异程度的指标。方差与均方差的关系是平方和开平方的关系,可分别计算平均数与成数的方差和标准差。 总体平均数方差和均
3、方差的计算公式为:,或,抽样指标是从样本中计算出来的,它是相应的总体指标的估计量,全及总体是唯一确定 的,样本总体不唯一,注 意,抽样指标:统计值(已知量),总体指标:参数值(未知量),统计推断,抽样调查从调查总体中抽取一部分单位作为样本进行调查,然后根据样本调查结果来推断总体情况的方法,是一种非全面调查 。 问题思考:为什么要采用抽样调查?,抽样调查的原因: 1、对有些社会现象,不可能进行普查,而又要了解其全面情况时,就必须采用抽样调查。 2、对有些社会现象,不必要采用普查,利用抽样调查完全可以得到准确的结论,并且可以省时、省力、节约支出。 3、利用抽样调查,可以检验普查资料的准确性,并可以
4、修正普查的结果。,二、抽样调查的特点,抽样误差的控制 要准确选定抽样方法 随机抽样和非随机抽样 要正确确定样本数目 抽样误差的允许程度、总体的差异性、经济效益的要求 要加强对抽样调查的组织领导,提高抽样调查工作的质量,抽样调查的误差,非抽样误差,抽样误差,随机抽样,按照随机原则抽取样本,非随机抽样,根据调查者主观意愿和判断选取样本,5.2 抽样调查的组织,1.抽样调查的程序,(1)界定调查总体及样本单位,详细说明和描述提供信息或与所需信息有关的个体或实体所具有的特征,确定调查范围及总体单位。可从以下几方面进行描述:地域特征、人口统计学的特征、产品或服务使用情况、认知程度等。 调查总体是指市场调
5、查对象的全体。它可以是一群人、一个企业、一个组织、一种情形或一项活动等。 样本单位是对总体划分成的互不相交的各个部分 。,(2)确定抽样框,两种处理方法: 1.根据抽样框重新界定总体。如抽样框是电话簿,则家庭成员总体可以被重新界定为列入电话簿中的那部分家庭的成员。 2.筛选个体。 可以依据人口统计特征、产品的使用习惯特征等筛选回答者,剔除抽样框中不适当的个体。,(3)选择抽样方法,取决于研究目的、经济实力、时间限制、欲调查问题的性质,重复抽样 又称作重置抽样、有放回抽样,抽出 个体,登记 特征,放回 总体,继续 抽取,特点,同一总体单位有可能被重复抽中,而且每次抽取都是独立进行,不重复抽样 又
6、被称作不重置抽样、不放回抽样,抽出 个体,登记 特征,继续 抽取,特点,同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行。,是最常用的抽样方法,用于无限总体和许多 有限总体样本单位的抽样。,(4)抽样调查的样本,抽样调查样本量的确定 样本容量又称样本规模,是指样本内所包含的单位数。 考虑预算、抽选规则、子集量的分析和传统的统计样本量的计算。 非随机抽样,依预算、抽选规则(凭经验确定)、子集量分析而定。 对随机抽样,考虑允许误差的目标水平和置信水平计算样本量,使抽样误差被限制在允许的范围内 其他因素:个体差异大小;调查项目多少;控制质量情况;抽样组织方式,一般来讲:当
7、 n 30,称为大样本; 当 n 30,称为小样本。,5.3 随机抽样技术及应用,(一)随机抽样 随机抽样调查就是对总体中每一个体都给予平等的抽取机会的抽样方法。 (二)随机抽样的优缺点 优点:就是机会均等,抽取的样本可以大体上代表总体,同时,采用此方法调查的范围和工作量比较小,又排除了人为干扰,因此能省时、省力、省费用,又能较快的取得调查的结果。 缺点:对所有样本都给予平等对待,难以体现重点;另外,需要有一定专业技术的专业人员进行抽样和资料的分析,一般调查人员难以胜任。,简单随机抽样,简单随机抽样就是总体中的第一个单位在抽取时都有相同的被抽中机会。其概率公式为: 抽样概率=样本单位数 /总体
8、单位数 一般应用于调查总体中各个体之间差异程度较小,或者调查总体数量不太多的情况。,最简单、最基本、最符合随机原则,但同 时也是抽样误差最大的抽样组织形式,简单随机抽样方法常用的有: 1. 抽签法:先将调查总体的每个个体编上号码,然后将号码写在卡片上搅拌均匀,任意从中选取,抽到一个号码,就对上一个个体,直到抽足预先规定的样本数目为止。 此方法适用于调查总体中的个体数目较少的情况。 2.随机数表法:随机数表法也称为乱数表法,是指含有一系列组别的随机数字的表格,一般利用特制的摇码设备在09的阿拉伯数字中,按照每组数字位数的要求自动摇出随机数字,也可以用电子设备自动产生随机数字。,分层抽样,将总体按
9、期属性不同划分为若干层次(或类型),然后在个层次(或类型)中随机抽取样本的技术。例如,常见分层标志为年龄、收入、职业等,其实质是科学分组与抽样原理的结合。,总体 N,样本 n,能使样本结构更接近于总体结构,提高样本的代表 性;能同时推断总体指标和各子总体的指标,等比例分层抽样: 等比例分层抽样是按各层(或各类型)中的个体数量占总体数量的比例分配各层的样本数量。其表达式为: 或,式 中: ni为第i层抽出的样本数 Ni为第i层的总单位数 N为总体单位数 n为总体样本数,例1:某市有各类型书店500家,其中大型50家,中型150家,小型300家。为了调查该市图书销售情况,先计划从中抽取30家书店进
10、行调查,采用分层比例抽样法应从各层中抽取多少家书店调查? 解:根据等比例抽样公式,则 (1)大型书店应抽取的样本数为: n大=50家/500家*30家=3家 (2)中型书店应抽取的样本数为: n中=150家/500家*30家=9家 (3)小型书店应抽取的样本数为: n小=300家/500家*30家=18家,思 考:,假定某大学的商学院想对今年的毕业生进行一次调查,以便了解他们的就业意向。该学院共有5个专业:会计、金融、市场营销、经营管理、信息系统。今年共有1500名毕业生,其中,会计专业有500名,金融专业300名,市场营销300名,经营管理250名,信息系统150名。 请 问:假定要抽取的样
11、本数为180人,各专业按比例分别应抽取多少人?,分层最佳抽样,指不仅按各层单位数占总体单位数的比例分配各层的样本数,还根据各层标准差的大小来调整各层样本数目的抽样方法。,每层抽取的样本数计算公式为:,式 中: ni为第i层抽出的样本数 Ni为第i层的总单位数 为第i层的标准差 n 为总体样本数,例 如( 2): 仍用上例资料,假设各类型书店图书销售额的标准差估计值为:大型20000元;中型8000元;小型5000元。按照最佳抽样法应从各层中抽取多少家书店进行调查?,解:根据分层最佳抽样法,则,思 考,某地共有居民20000户,按经济收入高低进行分类,其中高收入的居民户为4000户,标准差为30
12、0元,;中等收入为12000户,标准差为200元;低收入为4000户,标准差为100元。 请问:若要从中抽取200户进行购买力调查,则各类型应抽取的样本数为多少?,解:(1)等比例分层抽样法 高收入:20020%=40户 中等收入: 20060%= 120户 低收入: 20020%=40户,解:(2)分层最佳抽样法 高收入:60户(40) 中等收入: 120 户(120) 低收入: 20户(40) 通过计算可以看出,采用分层最佳抽样法,高收入者家庭增加了20户,低收入家庭减少了20户,中收入不变。 因此,由于购买力同家庭经济收入关系很大,因而采用分层最佳抽样方法,可以增加高收入样本数,相应减少
13、低收入层的样本数,这样使所抽取的样本更具有代表性。,最低成本抽样,指在考虑统计效果的前提下,根据费用支出来确定各层应抽取的单位数,以节省调查费用。(经济效益),每层抽取的样本数计算公式为:,式 中: ni为第i层抽出的样本数 Ni为第i层的总单位数 为第i层的标准差 为第i层每单位的调查费用 n 为总体样本数,例 如( 3): 仍用上例资料,现假设对不同类型书店进行调查,每调查一家大型书店需要的调查费用为600元,中型书店需要500元,小型书店需要400元,其他情况不变。按照最低成本抽样法应从各层中抽取多少家书店进行调查?,解:根据最低成本抽样法,则,分层抽样的特点,充分利用了总体已有的信息,
14、分配比较合理,样本的代表性及推论的精确性般都优于简单随机抽样,在实际中应用较广泛,适合总体情况复杂,各单位之间差异程度较大,单位数较多时采用。,系统抽样方法,系统抽样也称为等距离抽样,常作为简单随机抽样的补充方法使用。 先按一定标志把总体中的个体顺序排列; 确定一个抽样间隔,其公式如下: 抽样间隔=总体单位数 /样本单位数 按计算得到的抽样间隔继续抽取以后的个体,直至到规定的样本容量数。,例 如:,某企业对购进的10000台电视机的质量进行调查,计划抽取400台作为样本调查,总体编号为1-10000,样本间距为K=10000/400=25,然后从1-25中任意抽取一个数为样本,假定为第8台,则
15、第2个样本为8+25=33,即抽取第33台作为第2个样本,以此类推,一直抽够400台为止。,系统抽样的优缺点,优 点: (1)简便易行,容易确定样本单元 (2)分布比较均匀,有利于提高估计精度 例 如:对公路旁树木进行病虫害防治,确定每30棵树检查1棵,只要确定了起点的被检查树,每隔30棵检查1棵即可。 缺 点:若存在周期性变化,代表性差,整群抽样,整群抽样技术也称为分群抽样技术,它是指当总体所在基本单位自然组合为或被划分为若干个群后,从中随机抽取部分群的方法。,例:总体群数R=16 样本群数r=4,样本容量,简单、方便,易于组织,能节省人力、物力、财力 和时间,但其限制了样本在总体中分配的均
16、匀性。,分群抽样的特点: (1)总体和样本都是由“群”组成;以群为单位进行抽取,对样本的均匀性有较大影响; (2)整群抽样均为不重复抽样,可提高样本的代表性。 (3)与其他随机抽样技术相比,抽样误差较大,代表性较低,常通过多抽取样本来弥补不足。,应注意的问题: 在实际工作中,选择适当的抽样组织方式主要应考虑:,调查对象的性质特点 对调查对象的了解程度(抽样框的特点) 抽样误差的大小 人力、财力和物力等条件的限制,5.4.非随机抽样及其应用,非随机抽样是指抽样时不遵循总体中每个单位都有客观相等的被选中机会的原则,而是按照一定主观标准来抽选样本的抽样方法。 1、非随机抽样的优缺点 优点:按一定主观
17、标准抽选样本,可以充分利用已知资料,选择较为典型的样本,使样本能更好的代表总体;可以缩小抽样范围,节约时间和经费。 缺点:无法判断其误差,无法检查结果的准确性。可靠程度只能由调查人员主观评定。由于主观标准不当或主观判断失误均会增大抽样误差,并且出现差错时难以核实。,2、采用非随机抽样的条件: 受客观条件的限制,无法进行严格的随机抽样; 为了快速得到调查的结果; 调查对象不确定或其总体规模无法确定; 调查人员比较熟悉调查对象,且有较丰富的经验,据此快速推断,做到快、准、省。,方便抽样,方便抽样又称为任意抽样或偶遇抽样,是根据调查者的方便与否来抽取样本的一种抽样方法。例如,在街头向过路人做访问调查
18、;在柜台访问顾客,征求对某类商品或市场供求的意见等。 任意抽样的优点是:对于调查条件要求低,难度小,简便易行;接受访问的成功率较高,容易得到受访者的配合;省时省力,且对访问的进度容易控制; 任意抽样的不足之处:没有概率论作为理论基础,所以无法推断总体,且代表性差,偶然性强。,判断抽样,判断抽样也称为目的抽样,主要凭借调查者的主观意愿、经验和知识,从总体中选取具有代表性的个体样本作为调查对象的抽样方法。 要求调查者对总体的有关特征有相当程度的了解。 典型调查:选择最能代表普遍情况的调查对象,常以“平均型”和“多数型”为标准。如了解一国的民风,应该入乡随俗,和当地最普通的人生活一段时间。 重点调查
19、:对那些占被调查总体内较重要的个体进行抽取调查,如调查消费者满意度时,对大客户或在贵宾进行调查。,配额抽样,配额抽样又称定额抽样或计划抽样。它是依据一定标志对总体分层或分类后,从各层或类别中主观地选择一定比例的调查对象作为样本的方法。配额抽样法是在分层基础上进行的。 基本步骤: (1)选择控制特性作为分层标准 (2)分层 (3)确定各层样本额 (4)配额指派,根据其抽样方法可以分为: 独立控制配额抽样:根据调查总体的特性对某个特性调查样本单独分配额 ; 交叉控制配额抽样:任何一个配额者会受到两个以上的控制属性的影响。,独立控制配额抽样,分别按照收入水平、年龄与性别进行的独立控制配额抽样的样本分布如下表所示:,交叉控制配额抽样,以年龄、性别与收入水平作为交叉控制因素进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年中国硅肥行业产能预测及发展风险分析报告版
- 2024年度企业环境社会责任报告书合同
- 2024年超高压电缆连接件项目评价分析报告
- 贵州省都匀一中2025届物理高二第一学期期中达标检测试题含解析
- 2025届山东省烟台市第二中学物理高二上期中监测模拟试题含解析
- 2025届上海市上海外国语大学附中物理高三上期中综合测试模拟试题含解析
- 2025届天津市宁河区芦台第一中学高一物理第一学期期末学业质量监测试题含解析
- 2025届贵州省毕节市实验高级中学高二物理第一学期期中质量检测试题含解析
- 2025届福建省三明市第一中学物理高一上期中统考模拟试题含解析
- 2025届云南省昆明市五华区高二物理第一学期期中考试模拟试题含解析
- 护理质量安全与风险管理的案例分析
- 工程流体力学课后习题答案-(杜广生)
- AI智能客服应用实践
- 《止吐药临床应用》课件
- 幕墙工程检验批质量验收记录
- 危险化学品经营企业安全生产奖惩制度范本
- 报价单模板完
- 30题药品质量检测岗位常见面试问题含HR问题考察点及参考回答
- 《婴幼儿行为观察、记录与评价》期末试卷及答案 卷3
- 企业战略管理概述
- 消防安全概述
评论
0/150
提交评论