抽样推断的一般问题课件_第1页
抽样推断的一般问题课件_第2页
抽样推断的一般问题课件_第3页
抽样推断的一般问题课件_第4页
抽样推断的一般问题课件_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 抽样估计教学目的:通过对本章的学习,了解抽样估计的基本原理,掌握抽样估计的基本方法。教学设计:对主要的知识点进行讲解,通过在线学习平台的“教学辅导”与“参考资料”栏目获取相关知识,从而对重要的知识点有进一步的认识,在此基础上通过练习来加深对相关问题的理解,同时通过网上实时与非实时的答疑解决疑难问题。重难点讲解:抽样误差的概念及计算;抽样估计的方法第五章 抽样估计第一节 抽样推断的一般问题第二节 抽样误差第三节 抽样估计的方法第四节 抽样组织设计统计调查方法 全面调查非全面调查 普 查 抽样调查 重点调查 典型调查相关知识回顾: 统计报表 抽样调查:按照随机原则,从总体中抽取一部分样本单

2、位,根据对样本单位的调查结果来推断总体的数量特征。 一、抽样推断的意义 1、概念: 抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。 第一节 抽样推断的一般问题样 本总 体推断 2、特点(1)由部分推算整体的一种方法;(2)抽样推断建立在随机抽样的基础上;(3)抽样推断是运用概率估计的方法;(4)抽样推断的误差可以计算并加以控制。样 本(非唯一)总 体(唯一)推断二、抽样推断的内容(一)参数估计 用样本的观察资料来估计所研究现象总体的水平、结构、规模等数量特征,这种推断方法称为参数估计。(二)假设检验 对总体的状况作出某种假设,然后根

3、据样本所提供的信息来判断总体未知参数事先所作的假设是否成立的统计分析方法称为假设检验。三、抽样的几个基本概念 1、总体 也称全及总体,指所要认识的研究对象全体,由具有某种共同性质许多单位组成的集合体,一般用N表示。 无限总体、有限总体 2、样本 又称子样,是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体,一般用n表示。总 体样 本 3、随机抽样 按随机原则从总体中抽取样本单位。 4、非随机抽样 根据市场调查者的主观分析判断来选取样本单位。包括偶遇抽样、主观抽样、定额抽样。5、参数 根据总体各单位的标志值或标志特征计算的,反映总体数量特征的综合指标,称为全及指标,由总体各单位

4、的标志值或标志特征所决定,全及指标的指标值是确定的,唯一的,称为参数。对于总体中的品质标志: 由于不能用数量来表示,总体参数通常用成数P表示。成数:总体中具有某种性质的单位数在总体全部单位数中的比重,用P表示。总体中不具有某种性质的单位数在总体中所占的比重,用Q表示。有P+Q=1 X:表示总体变量,有N个单位,所以可以表示为 当某种标志,它的标志表现只有是非两种,可 以用“1”表示标志表现为“是”的标志的标志表现,“0”表示标志表现为“非”的标志的标志表现,在此情况下: 6、统计量 根据样本各单位标志值或标志属性计算的综合指标称为统计量。样本统计量是用来估计总体参数的。反映样本的数量特征。参数

5、总 体统计量样 本例题:某批产品共500件,合格品480件,不合格品20件,要求计算成数合格品率、7、样本容量 指一个样本所包含的单位数。8、样本个数 又称样本可能数目,是指从一个总体中可能抽取的样本个数。9、重复抽样 从总体N个单位中随机抽取样本容量为n的样本,每次从总体中抽取一个,连续进行n次实验构成抽样样本。每次抽出一个单位把结果登记下来又放回,重新参加下一次的抽选。共可抽取容量为n的样本 个。10、不重复抽样 从总体N个单位中随机抽取容量为n的样本,每次从总体中抽取一个,连续进行n次实验构成抽样样本。但每次抽选出的单位就不再放回参加下一次抽选。共可抽取容量为n的样本N(N-1)(N-2

6、).(N-n+1)个。 结论:总体单位数一致,在相同样本容量的情况下,重复抽样的样本个数大于不重复抽样的样本个数。 第二节 抽样误差一、抽样误差的概念概念: 指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。 系统偏误与登记性误差可以防止或避免,抽样误差不可避免,只能加以控制。影响抽样误差大小的因素:(1)总体各单位标志值的差异程度;(2)样本单位数;(3)抽样方法;(4)抽样组织形式。二、抽样平均误差(抽样指标的标准差) 反映抽样误差一般水平的指标。是所有可能出现的样本指标和总体指标的平均离差。1、抽样平均数的平均误差,也可称为抽样

7、平均数的标准差(表明各样本均值与总体均值离差的一般水平)(1)重复抽样情况下 例:设有三个数8、10、12,这一总体的均值、标准差分别为:用重复抽样的方法,从8、10、12三个数中抽两个数构成样本,求样本的平均值,用以代表三个数的一般水平,所有可能的样本以及样本的平均值列表如下:样本个数样本变量样本均值 平均数离差 离差平方 1 2 3 4 5 6 7 8 9 8 8 8 10 8 12 10 10 10 12 10 8 12 12 12 8 12 10 8 9 10 10 11 9 12 10 11-2-1 0 0 1 2 0 1-1 410014011 合 计 90 0 抽样平均数的标准差

8、:现在按重复抽样误差公式计算抽样平均误差 几个基本关系: a.样本平均数的平均数等于总体平均数; b.抽样平均误差实质上就是抽样平均数的标准差,也称为抽样标准误差;c.抽样平均数的标准差(抽样平均误差)比总体标准差小很多,仅为总体标准差的 。 d.可以通过调整样本单位数n来控制抽样平均误差。(2)在不重复抽样的情况下样本个数样本变量样本均值 平均数离差 离差平方 1 2 3 4 5 6 8 10 8 12 10 12 10 8 12 8 12 10 9 10 11 9 10 11-10 1 -1 0 1 101101 合 计 60 0 按不重复抽样误差公式计算抽样平均误差 某工厂有1500个工

9、人,用简单随机重复抽样的方法抽取50个工人作为样本,调查其工资水平,资料如下:月平均工资(元)524534540550560580600660工人数 (人)469108643计算样本平均数和抽样平均误差。2、抽样成数的平均误差(表明各样本成数与总体成数绝对离差的一般水平)(1)在重复抽样下P:总体成数n:样本单位数(2)在不重复抽样下在实际计算中,用样本成数p代替总体成数P 从2000件产品中抽查200件,其中合格品190件,要求:计算样本合格率及其抽样平均误差。 解:在重复抽样下:在不重复抽样下: 某电子产品使用寿命在3000小时以下为不合格品。现在用简单随机抽样方法从5000个产品中抽取1

10、00个对其使用寿命进行调查,结果如下表所示 使用寿命(小时) 产品数量(个)3000以下30004000400050005000以上2305018合计要求:(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差;(2)按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。解:根据资料可算出 使用寿命(小时)组中值 产品数量(个) xf3000以下30004000400050005000以上2500350045005500 2 30 50 18 500010500022500099000 合计 三、抽样极限误差 指变动的抽样指标与确定的总体指标之间离差的可能范围,统计上称为抽样极限误差。设

11、四、抽样误差的概率度 对某市居民进行生活水平调查,现随机抽取100户,结果户月均收入为482元,标准差为50元,要求该市居民户月均收入在472492元的范围内,试求抽样极限误差和抽样概率度。 第三节 抽样估计的方法 一、总体参数的点估计 根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值,即直接以样本平均数、成数推断总体的平均数和成数。 优良估计的标准: 1、无偏性:以抽样指标估计总体指标要求抽样指 标值的平均数等于被估计的总体指标值本身。2、一致性:以抽样指标估计总体指标要求当样本容量增大时,抽样指标也充分地靠近总体指标。3、有效性:以抽

12、样指标值估计总体指标要求作为优良估计量的方差应该比其他估计量的方差小。二、抽样估计的精度 估计精度1误差率 三、抽样估计的置信度 表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。样本平均数700800900100011001200130014001500频数 f121242121频率根据以上分布写出平均工资落在各种区间范围内的概率P: 已经证明,当样本单位数大于或等于30的条件下,抽样平均数的分布接近与正态分布。 该分布的特点是:(1)抽样平均数以总体平均数为中心,它大于或小于总体平均数的概率分布完全呈对称分布;抽样平均数的正误差和负误差的可能性完全相等。(2)抽样平均数越接近总体平

13、均数,其出现的概率越大;越远离总体平均数,其出现的概率越小。 概率度与概率保证程度之间是函数关系,概率保证程度是概率度的函数,即: t与F(t)之间的关系可以查正态分布概率表,附录三四、总体参数的区间估计 对于总体的被估计值(总体参数)X,找出两个数值 使被估计指标X落在区间 内的概率 为已知的。(用一个具有一定可靠程度的区间范围来估计总体参数) 区间估计的两种方法:1、根据已知的抽样误差范围(抽样极限误差)求概率保证程度(置信度)。 并给出相应的概率保证程度耐用时间组中值灯泡数耐用时间组中值灯泡数800850825359501000975103850900875127100010501025

14、429009509251851050110010758(1)样本平均数及抽样平均误差以99.73的可靠程度推断这批灯泡的耐用时间在(919小时,933.8小时)的范围内。 若已知样本灯泡的合格率为95,要求合格率的误差范围不超过0.97,估计该批灯泡的合格率,并给出相应的概率保证程度。 2、给出置信度,求抽样极限误差的可能范围 以68.27的概率保证程度估计该批灯泡的合格率在(94.03%,95.97%)范围内。 某城市某街道所管辖的10000户居民中,用单纯随机重复抽样方法抽取200户,对某种商品的平均需求量和需求倾向进行调查,调查结果表明,每户居民对该商品的月平均需求量为500克,标准差为

15、100克,表示一年内不选择其他替代商品,继续消费该商品的居民户为90,试对总体平均数,总体成数进行区间估计。(1)当置信度85时 该街道10000户居民表示继续消费该商品的居民户占8793,估计的置信度为(2)当置信度95时, 该街道10000户居民对该商品需求量为486.1513.9克,置信度为总体参数的区间估计的三要素是:估计值、抽样误差范围、概率保证程度。该街道10000户居民表示继续消费该商品的居民户占86.193.9,置信度为例1:某工厂生产一种新型灯泡5000只,随机抽取100只作耐用时间实验,测试结果平均寿命为4500小时,标准差为300小时,试在95.45概率保证下,估计该新式

16、灯泡平均寿命区间。例2:某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元,要求:(1)以95的概率估计全乡平均每户年纯收入的区间;(2)以同样概率估计全乡农户年纯收入总额的区间范围。 例3:某学校进行一次英语测验,为了了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下:考试成绩60以下60707080809090100学生人数102022408试以95.45的可靠性估计该学校英语考试的平均成绩的范围及该校学生成绩在80分以上的学生所占的比重的范围。解:该校学生英语考试的平均成绩标准差为平均成绩的抽样平均误差为平均成绩的抽样极限误差为该

17、校学生考试的平均成绩的区间范围是样本中考试成绩在80分以上的学生比重考试成绩在80分以上的学生比重在95.45概率保证程度下,该校学生成绩在80分以上的学生所占比重的范围在38.0157.99之间例4:外贸公司出口一种茶叶,规定每包毛重不低于100克,现用不重复抽样的方法抽取其中的1进行检验,其结果如下:每包重量(克)包数98999910010010110110210205020合计100试以99.73(t=3)的概率保证程度估计这批茶叶合格率范围。解:样本合格率为以99.73的概率保证程度保证这批茶叶包装合格率在56.383.7之间。第四节 抽样组织设计一、抽样组织设计的基本原则1、保证随机

18、性原则的实现(1)要有合适的抽样框 抽样框:指编制抽样单位的目录。(2)取样的实施问题2、考虑样本容量问题3、关于抽样的组织形式4、必须重视调查经费 二、几种常用的抽样组织形式 1、简单随机抽样(最基本、最简单的抽样组织形式) 直接从总体N个单位中随机抽取n个单位作为样本,适用于均匀总体。类型 (1)抽签法 (2)随机数表法简单随机抽样样本单位数的确定: a.在重复抽样下,由于样本平均数的抽样极限误差公式为: b.在不重复抽样下,由于样本平均数的抽样极限误差公式为:c.在重复抽样下,由于样本成数的抽样极限误差公式为d.在不重复抽样下,由于样本成数的抽样极限误差公式为 调查一批机械零件合格率,根

19、据过去的资料,合格品率曾有过99、97、95三种情况,现在要求误差不超过1,要求估计的把握程度为95,问需要抽查多少个零件?2、类型抽样(分层抽样) 设总体由N个单位组成,把总体划分为K组,每组有 个单位, 然后从每组的 个单位中抽取 个单位构成样本容量为n的样本,使 , 这种抽样方法称为类型抽样。各组应抽样本单位数的确定: 由各组的总体单位数在全部总体单位数中的比重来确定。从250家百货公司中抽取50家进行本季度销售额的调查 分 层各层商店数各层应抽样本单位数各层销售额的样本均值各层销售额的样本方差大型商店中型商店小型商店25751500.10.30.65153017008001202800

20、698510850合 计 以上题为例,求样本平均销售额和抽样平均误差。 类型抽样的抽样平均误差只取决于组内方差的平均水平,不受组间方差的影响。它小于简单随机抽样的抽样平均误差,因此在对总体进行分组时,应尽量扩大组间方差,缩小组内方差。(总方差组内方差组间方差) 3、整群抽样 将总体各单位划分为许多群,然后随机抽取部分群,对中选群的所有单位进行全面调查的抽样组织形式。 将总体的全部单位N划分成R群,每群包括M个单位(假设每群的单位数是相等的),有RM=N,从总体R群中随机抽取r群组成样本,并对中选的r群的所有M单位进行调查。 第i群样本平均数 整群抽样对群而言是非全面调查,对被抽中的群内单位而言

21、是全面调查,因此,整群抽样的误差取决于群间差异,不受群内单位之间差异的影响,这就要求总体N个单位所形成的各个群,尽量有相同或相近的群内结构;也就是说要尽量把总体方程转化为群内方差,缩小群间方差。例:某工厂生产某种灯泡,在连续生产720小时中,每隔24小时抽取1小时的全部产品加以检查,根据抽样资料计算结果,灯泡平均使用寿命1200小时,群间方差为60小时,计算样本平均数的抽样误差,并以95的可靠程度推算该批灯泡的平均使用寿命。 即该批灯泡的平均使用寿命在1197.291202.72小时之间。 4、等距抽样 也称机械抽样或系统抽样。将总体各单位按某一标志进行排队,然后依一定顺序和间隔抽取样本单位的一种抽样组织形式。 在总体N个单位按某一标志排队后,从头到尾编上1至N的号码,并等分成n断,每段含K个单位,N=nK,然后在第一段的K个单位中随机抽取一个单位(设为第i号, )以后每隔k抽取下一个单位(如i+K号,i+2K号,直至i+(n-1)K号), 共n个单位构成样本。一共可抽取K套样本。 无关标志:和单位标志值的大小无关或不起主要的影响作用。如职工家计调查按其姓氏笔划、家庭门牌号等顺序排队。有关标志:和单位标志值的大小有密

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论