版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样推断分析第八章内容提要
本章包括抽样推断的含义、特点;几种常见的抽样方式、方法和抽样推断的基本要求;抽样误差的含义及各种抽样平均误差的计算方法;总体指标的推断方法和必要的样本单位数的确定方法。
第一节抽样推断的概念和作用一、抽样推断的概念和特点1.抽样推断的概念(1)从广义的角度理解,凡是抽取一部分单位进行观察,根据观察结果来推断全体的都是抽样调查,可分为随机抽样和非随机抽样两种。(2)从狭义的角度理解,抽样推断是在抽样调查的基础上,运用数理统计的原理,以被抽取部分单位的数量特征为代表,从数量上对总体做出具有一定可靠程度的估计与推断的一种统计分析方法。2.特点(1)抽样推断是由部分推算总体的一种认识方法。(2)抽样推断是建立在按随机原则抽取样本的基础上。(3)抽样推断是运用概率估计的方法。(4)抽样推断产生的误差可以事先计算、并加以控制。二、抽样推断的作用1.应用抽样推断法可对某些不可能或不容易进行全面调查而又要了解其全面情况的社会经济现象进行数量方面的统计分析。2.应用抽样法可对全面调查的结果加以补充或订正。3.应用抽样法可对生产过程中产品质量进行检查和控制。4.应用抽样推断法可对总体的某种假设进行检验,判断假设的真伪。第二节抽样推断中的几个基本概念一、全及总体和样本总体全及总体(简称总体或母体)指所要认识的研究对象的全体,总体中的单位数通常用“N”来表示,N总是很大的数,全及总体是唯一确定的。2.样本总体(简称样本或子样)是指从全及总体中按随机原则抽取的部分单位的集合体。样本总体的单位数通常用“n”表示,一般来说,样本单位数达到或超过30称为大样本,而在30以下称为小样本。二、总体指标和样本指标1.总体指标也称为母体参数,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种特征的综合指标。总体平均数:总体标准差:总体成数:2.样本指标也称样本统计量,是根据抽样总体中各单位的标志值或标志特征计算的综合指标。样本成数:样本平均数:样本标准差:三、重复抽样和不重复抽样1.重复抽样(重置抽样、回置抽样)。是指从总体N个单位中随机抽取容量为n的样本时,每次从总体中抽取一个单位,把结果登记下来后,重新返回,再从全及总体中抽取下一个样本单位。一般地说,从总体N个单位中,随机抽取n个单位构成样本,则样本可能数目为Nn个。2.不重复抽样(不重置抽样、不回置抽样)。是指从总体N个单位中随机抽取容量为n的样本时,每次从总体中抽取一个单位,不再放回去,下一次则从剩下的总体单位中继续进行抽取,如此反复构成一个样本。一般地讲,从总体N个单位中,随机不重复抽取n个单位构成一样本,则样本可能数目为CNn个。四、抽样方式㈠简单随机抽样也叫纯随机抽样,是按纯随机原则直接从总体中抽取一部分单位来组成样本的抽样组织方式,是抽样中最基本、最简单的抽样组织形式,有三种具体做法:
1.直接抽选法12.抽签法23.随机数表法3(二)类型抽样先对总体各单位按一定标志分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个样本的抽样组织形式,类型抽样的样本单位数有三种分配方法:1.等数分配类型抽样2.等比分配类型抽样3.不等比例类型抽样(三)等距抽样也称机械抽样或系统抽样,是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式,有两种形式:1.无关标志排队。指排队的标志与总体单位标志值的大小无关,抽样间隔为:等距抽样示意图2.有关标志排队:指排队的标志与总体单位标志值的大小有密切的关系,为增强抽样调查的代表性,采取对称等距抽样的方法。(四)整群抽样也称集团抽样、区域抽样,是将总体各单位按时间或空间形式划分成许多群,然后按纯随机抽样或机械抽样方式从中抽取部分群,对中选的所有单位进行全面调查的抽样组织方式。【例】假设某大学共有100个班级,每班都是30名学生,总共有3000名学生,现要抽300学生作为样本进行调查,如果采用整群抽样的方法,就不是直接去抽一个个的学生,而是从学校100个班级中,采取简单随机抽样的方法(或是类型抽样、等距抽样的方法)抽取10个班级,然后由这10个班级的全体学生构成调查的样本。(五)多阶段抽样是把整个抽样过程分为若干个阶段,逐级抽出样本单位。在大多数情况下,抽样调查都是针对一个极大的总体进行的,在这种情况下,直接进行纯随机抽样是不现实的。例如,在某省100多万农户中抽取1000户,调查农户生产性投资情况,此时构造数百万人的名单就将是一个非常浩大的工程。实际进行抽样时,可以多阶段抽样法,具体如下。第一阶段:从省内全部县中抽取5个县第二阶段:从抽中的5个县中各抽4个乡第三阶段:从抽中的20个乡中各抽5个村第四阶段:从抽中的100个村中各抽10户则样本单位数为:1000户第三节抽样误差一、抽样误差的概念是指样本指标与总体指标之间的离差,具体地讲,就是样本平均数与总体平均数的离差,或样本成数与总体成数的离差。按照形成原因的不同,分为登记性误差和代表性误差两种。抽样调查误差登记性误差(非抽样误差)代表性误差系统误差随机误差(偶然性误差)二、影响抽样误差的因素
1.样本容量n的大小。
2.总体内各单位被研究标志的变异程度。
3.抽样组织形式。
4.抽样方法。三、抽样平均误差(一)涵义指所有可能样本的抽样指标与总体的全及指标之间的平均误差,是以全部可能样本指标为变量,以总体指标为平均数计算得到的标准差,作为反映抽样误差一般水平的指标。——样本平均数——总体平均数——样本成数——总体成数(二)抽样平均误差的理论计算公式1.平均数抽样平均误差重复抽样条件下:不重复抽样条件下:当N很大时(三)抽样平均误差的实际计算公式2.成数的抽样平均误差重复抽样条件下:不重复抽样条件下:当N很大时计算抽样平均误差时要注意两点:1.公式中的全及总体的标准差和成数,通常是不知道的,一般通过以下方法解决。(1)用样本的标准差和成数来代替,得到近似值;(2)可以用过去的经验资料;(3)还可以用试验资料(4)成数标准差的最大值可以取为0.25。2.不重复抽样误差总是小于重复抽样误差。【例】从某厂生产的10000只日光灯管中随机抽取100只进行检查,假如该产品平均使用寿命的标准差为100小时,试计算该厂日光灯管平均使用寿命的平均误差。解:在重复抽样条件下:在不重复抽样条件下:【例】从某厂生产的10000件产品中,随机抽取1000件进行调查,测得有85件为不合格。试求产品合格率的抽样平均误差。解:合格率:重复抽样条件下:不重复抽样条件下:四、抽样极限误差(一)抽样极限误差是指样本指标和总体指标之间抽样误差的可能范围。上面等式可以变换为:
由于总体指标是未知的,它要用实测的样本来估计,因而极限抽样误差的实际意义是希望总体平均数和总体成数落在根据抽样平均数(成数)所确定的范围内。因此上述不等式可推导为:(二)抽样推断的概率度抽样极限误差与抽样平均误差的比值。数理统计证明,当抽样总体的单位数足够大时,抽样平均数和抽样成数都接近于以全及总体平均数或成数为中心的正态分布,正态分布具有两个重要特征:
1.抽样指标高于或低于总体指标的概率分布是完全对称的;
2.抽样平均数愈接近总体平均数,出现的可能性越大,概率越大;反之,抽样平均数越离开总体平均数,出现的可能性越小,概率越小,而趋于0。由此可见抽样误差的概率就是概率度的函数。将这种对应函数关系编成《正态分布概率表》给定的值,便可以直接从表上查找抽样误差的概率,即估计置信度或概率保证程度、把握程度。
注:极限误差与概率度和抽样平均误差三者之间存在如下关系:
1.在平均误差保持不变的情况下,增大概率度的值,把握程度相应增加,误差范围也随之扩大,这时估计的精确度将降低;反之,要提高估计的精确度,就得缩小概率度值,此时把握程度也会相应降低。
2.在概率度保持不变的情况下,抽样平均误差小,则误差范围就就小,估计的精确度就高;反之,抽样平均误差大,误差范围就大,估计的精确度就低。1.无偏性2.一致性3.有效性(一)点估计是以抽样指标数值直接作为总体指标估计值的一种估计方法,判别标准有三个:
五、抽样估计的方法(二)区间估计1.涵义。根据一定的概率保证程度,利用抽样指标和极限误差,推断总体指标可能存在的区间范围的方法。置信区间:★区间估计的三要素是:估计值,误差范围,概率保证程度。2.两种模式(1)根据给定的抽样误差范围,求概率保证程度,具体步骤是:第一步,抽取样本,计算抽样平均数和抽样成数,作为总体指标的估计值,并计算样本标准差,以此计算抽样平均误差。第二步,根据给定的抽样误差范围(极限误差),估计总体指标的上限和下限。第三步,根据抽样极限误差和抽样平均误差,计算概率度的数值,查《正态分布概率表》,求出相应的概率保证程度。(2)根据已给定的置信度,求抽样极限误差。具体步骤是:1.抽取样本,计算抽样指标,作为总体指标的估计值,并计算样本标准差以推算抽样平均误差。2.根据给定的置信度,查正态分布概率表求得概率度值。3.根据概率度和抽样平均误差推算抽样极限误差,并根据抽样极限误差求出被估计总体指标的上、下限。第四节必要样本容量的确定1.总体被研究标志的变异程度12.允许的抽样误差的大小23.概率保证程度的高低3一、影响样本容量的因素4.抽样调查的组织方式和方法45.人力、物力和财力的允许条件5二、必要样本容量的计算1.重复抽样条件下:2.不重复抽样条件下:三、确定必要样本容量应注意的问题1.必要抽样单位数应大于30。2.实际调查时可对计算的必要抽样单位数进行调整。3.当总体单位数不多时,如果采用不重复抽样的方法抽取样本单位时,必须应用不重复抽样的计算公式计算必要的抽样单位数;当总体单位数很多时,虽然采用不重复抽样方法,亦可采用重复抽样的计算公式计算必要的抽样单位数。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年通信设备、计算机及其他电子设备项目资金需求报告代可行性研究报告
- AI智慧园区平台方案
- 2024-2025年(室内设计师)职业技能从业资格基础知识考试题库与答案
- 《利乐包装培训》课件
- 《影视专业用语》课件
- 风温-温病学课件南京中医药大学课程
- 《统计案例指数》课件
- 河北省张家口市桥西区2024-2025学年七年级上学期11月期中考试数学试题
- 天津市静海区运河学校2024-2025学年九年级上学期11月期中考试数学试题
- 中医五行养生课件
- 2024年文化版:含有文物保修责任的文化遗址租赁合同
- 保健按摩师(高级)技能理论考试题库(含答案)
- 大学生职业发展与就业指导22-23-2学习通超星期末考试答案章节答案2024年
- 公民科学素质大赛参考试题库600题(含答案)
- 2024-2030年全球及中国岸电行业发展现状与未来前景预测报告
- 三年级上册心理健康课件-第十四课-尊重他人-尊重自己|北师大版
- 第五单元测试卷(单元测试)-2024-2025学年六年级上册语文统编版
- 耳鸣的认知治疗干预
- 2024年浙江嘉兴南湖区教育研究培训中心选聘研训员历年高频500题难、易错点模拟试题附带答案详解
- 珍爱生命阳光成长主题班会课件
- 中药方剂基本知识
评论
0/150
提交评论