统计学教案第6章抽样推断_第1页
统计学教案第6章抽样推断_第2页
统计学教案第6章抽样推断_第3页
统计学教案第6章抽样推断_第4页
统计学教案第6章抽样推断_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学授课题目第6章抽样推断课次第8-9次授课方式讲授课时安排第8教学周-第9教学周,共4课时教学目的:通过本章的学习,要求掌握利用样本统计资料来推断总体数量特征的原理及方法;深刻理解抽样推断的概念及特点;了解抽样误差产生的原因,并对抽样误差、抽样平均误差、抽样极限误差加 以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的方法;掌握必要样本 单位数的确定方法。教学重点及难点提示:重点:区间估计难点:抽样平均误差的计算案例导入:大学生消费调查:一个月你花多少?第一节抽样推断概述一、抽样推断的概念及特点(一)概念按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征

2、进行 科学估计与推断的方法。包括抽样调查和统计推断抽样调查:一种非全面调查,按随机原则从总体中抽取部分单位进行调查以获得相 关资料,以推断总体统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有一定程度的估 计和推断。(二)特点1.按随机原则(等可能性原则)抽取调查单位随机抽样的目的是为了排除人的主观教法提示:多媒体教学案例教学列举法影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。随机性 原则是保证抽样推断正确性的一个重要前提条件。随机抽样不是随便抽样。2. 根据部分推断总体的数量特征3. 抽样推断的结果具有一定的可靠性和准确性,抽样误差可以事先计算和控制其他特点

3、有经济性、时效性、准确性、灵活性等(三)抽样推断的应用1. 不可能进行全面调查时2. 不必要进行全面调查时3. 检杳牛产过程正常与否4. 对全面调查资料进行补充修正时二、抽样的几个基本概念1. 样本容量与样本个数(1 )样本容量:样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。(2)样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样 本个数的多少与抽样方法有关。2. 总体参数与样本统计量(1) 总体参数:总体分布的数量特征就是总体参数,也是

4、抽样统计推断的对象。常 见的总体参数有:总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。(2) 样本统计量:与总体参数对应的是样本统计量。设(X1,X2L ,Xn)是总体X容量为n的样本,若样本函数T T ( X1,X2L ,Xn )中不含任何未知参数,则称 T为一个统计量。例如1 n X _ Xjn i i就是一个统计量,称为样本均值(Sample mean),1 nS2 丄(Xi X)2n i i也是统计量,称为样本方差(Sample varianee ),3.重复抽样与不重复抽样(1 )重复抽样:是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总 体中继续参加

5、下一次样本单位的抽取。(2)不重复抽样:即每次从总体中抽取一个单位,登记后不放回原总体,不参加下 一次抽样。第二节抽样推断的方法一、点估计(一)点估计的概念及特点参数估计:以样本统计量对总体参数进行估计,有点估计和区间估计两种。点估计:直接以样本统计量作为相应的总体参数的估计量。优点:直接给出了总体参数的具体数值缺点:未能反映误差的大小参数点估计有:(1) 样本均值估计总体均值? xP p(2) 样本成数估计总体成数厂 H?2S2(3)样本方差估计总体方差(二)估计的评价标准:(1)无偏性:设?T(Xi,X2丄,Xn)是未知参数的一个点估计量,若?满足E?即估计量的数学期望等于被估计参数则称?

6、是的无偏估计量,否则称为有偏估计量。需要注意的是,由于估计量?是样本(Xi,X2丄,Xn)的函数,样本量是n维随机变量,所以对?求平均是按样本(Xl,X2丄,Xn)的概率分布求平均。无偏性是我们衡量点估计量好坏的一个评价标准,这个评价标准的直观意义如下: 由于样本的出现带有随机性,所以基于一次具体抽样所得的参数估计值未必等于参数真 值,这是由样本的随机性造成的。我们希望当大量使用这个估计量对参数进行估计时, 一系列估计值的平均值应该与待估参数真值相等。这就从平均效果上对估计量的优劣给 出一个评价标准。(2)有效性:设?飞伙必2丄,Xn), ? T2 (Xi,X2,L ,Xn)均为未知参数的无偏

7、估计? ?量,如果对参数 的一切可能取值有2(?)2(?2),则称无偏估计量 1比2有效一个无偏估计量并不意味着他就非常接近被估计的参数,他还必须与总体参数的离 散程度比较小。对同一总体参数的两个无偏点估计量,方差小者更有效。(3)一致性:指随着样本单位数 n的增大,样本估计量将在概率意义下越来越接近于总体真实值 若对于任意 0,有lim P I?丨 1n二、区间估计法在参数估计中,虽然点估计可以给出未知参数的一个估计,但不能给出估计的精度。为此人们希望利用样本给出一个范围,要求它以足够大的概率包含待估参数真值。这就 是导致区间估计问题。所谓区间估计,就是估计总体参数的区间范围,并要求给出区间

8、估计成立的概率值。设 是未知参数,(Xi,X2,L ,Xn)是来自总体的样本,构造两个统计量 ? Ti (Xi,X2,L ,Xn) , ? T2(Xi,X2,L ,Xn),对于给定的 (0 1),若?、 ?满足P1则称随机区间? , ?是参数 的置信水平为1的置信区间,1称为 ?,?的置信度,?,称为置信限。这里有几点需要说明:(1) 区间 ? ,的端点? ,?及长度? 一 ?都是样本的函数,从而都是随机变量,因此? , ?是一个随机区间。(2) P ?1是说随机区间?, ?以1的概率包含未知参数真值,区间长度 ? ?描述估计的精度,置信水平 1描述了估计的可靠度。(3) 因为未知参数是非随机

9、变量,所以不能说落入区间? , ?,的概率是1,而应是随机区间? , ?包含 的概率是1。通俗地说,在点估计的基础上,给出总体参数的一个范围称为区间估计。(二)总体均值的区间估计1.正态总体且方差已知;或非正态总体、方差未知、大样本情况下在这种情况下,样本均值的抽样分布呈正态分布,其数学期望为总体均值,方差2为。则X Z厂称为总体均值在1置信水平下的置信区间。n2 Un区间估计步骤:1.计算样本统计量X, pp(1 p)2.计算抽样平均误差3.计算极限误差4.确定置信区间x,Xp,pNXNP5估计总量指标注意抽样方法的不同例保险公司从投保人中随机抽取36人,计算得36人的平均年龄 X 39.5

10、岁,已知投保人平均年龄近似服从正态分布,标准差为 置信水平为99%勺置信区间。7.2岁,试求全体投保人平均年龄的解:10.99,0.01,查 N(0,1)表得 ZT2.57539.5 2.5757?36.41、3639.5 2.5757.242.59 .36故全体投保人平均年龄的置信水平为99%勺置信区间为36.41,42.5922若总体方差未知,可用样本方差 S代替即39.5 2.13=(37.37 ,41.63),投保人平均年龄在90%的置信水平下的置信区间为37.37岁41.63岁。2.正态总体、方差未知、小样本情况下如果总体服从正态分布,无论样本容量大小,样本均值的抽样分布都服从正态分

11、布。 只要总体方差已知,即使在小样本情况下,也可以计算总体均值的置信区间。如果总体方差2未知,需用样本方差 S2代替,在小样本情况下,应用 t分布来建立总体均值的置信区间。t分布是类似正态分布的一种对称分布,他通常要比正态分布平坦和分散。随着自由度的增大,t分布逐渐趋于正态分布。正态总体、方差未知、小样本情况下,总体均值在1置信水平下的置信区间为: sX t ”2(重复抽样条件下)(6.18)X t2Sn(不重复抽样条件下)(6.19)其中t (n 1)为t分布临界值,可以查t分布临界值表得到2(三)成数的区间估计在大样本(一般经验规则:np 5和n(1 p) 5)条件下,样本比例的抽样分布可

12、用正态分布近似。在这种情况下,数理统计已经证明如下结论:置信水平为1的置信区间为:p(1 p)(重复抽样)譽(汙(不重复抽样)95%的置信水平估计该城市下岗职工中女性所例某城市想要估计下岗职工中女性所占的比例,采取重复抽样方法随机抽取了 100名下岗职工,其中65人为女性。试以 占比例的置信区间。解:已知n100, z 1.96,265%根据公式得:p(1 P)n65% 1.9665% (1 65%)100即65% 9.35%=(55.65% , 74.35%) , 95%的置信水平下估计该城市下岗职工中女性 所占比例的置信区间为55.65%74.35%。例某企业共有职工 不重复抽样方法,随机

13、抽取 革,有50人表示反对。试以1000人,企业准备实行一项改革,在职工中征求意见,采用200人作为样本,调查结果显示,由150人表示赞成这项改95 %的置信水平确定赞成改革的人数比例的置信区间。解:已知 n 200, j 1.96 , p150 75%200根据公式得:P(1 P)(N n) n ( N 1)75% 1.96 75%(1 了5%)(1000 200) 200 1000 1即75% 5.37%=(69.63% , 80.37%) , 95%的置信水平下估计赞成改革的人数比例的 置信区间为69.63%80.37%。三、样本容量的确定(一)影响样本容量的意义在抽取样本时样本容量应多

14、大是一个很实际的问题。样本容量取得比较大,收集的 信息就比较多,从而估计精度比较高,但进行观测所投入的费用、人力及时间就比较多; 样本容量取得比较小,则投入的费用、人力及时间就比较少,但收集的信息也比较少, 从而估计精度比较低。这说明精度和费用对样本量的影响是矛盾的,不存在既使精度最 高又使费用最省的样本量。一个常用的准则是在使精度得到保证的前提下寻求使费用最 省的样本量。由于费用通常是样本量的正向线性函数,故使费用最省的样本量也就是使精度得到保证的最小样本量。(二)估计总体均值时样本容量的确定2 2z重复抽样条件下:n - J在简单随机不重复抽样条件下,M22Nzn22 2Nz才b或S通常未

15、知。一般按以下方法确定其估计值:过去的经验数据;试验调查样本的S。例在某企业中采用简单随机抽样调查职工月平均奖金额,设职工月奖金额服从标准差为10兀的正态分布,要求估计的绝对误差为 3兀,可靠度为95%试问应抽多少职工?解:已知10310.95z 1.96 则2 2 Q QzT1.962 102”n242.68 43232即需抽取43名职工作为样本进行调查。(二)估计成数时样本大小的确疋在简单随机重复抽样条件下,得到样本容量:Z2P(1 P)n 2(重复抽样条件下)P在简单随机不重复抽样条件下,我们可以得出估计总体比例时样本容量的计算公式为:NZ2P(1 P)n 产=(不重复抽样条件下)N P

16、2 z!p(1 P)2例根据以往的生产统计,某种产品的合格率为90%现要求绝对误差为 5%在置信水平为95%勺置信区间时,应抽取多少个产品作为样本?已知,P 90%P 5% Z 1.9622血Z2P(1 P) 1.962 0.9 (1 0.9)彳“则 n 2 2 =2139P20.052必要样本容量的影响因素1. 总体方差的大小;2. 允许误差范围的大小;3. 概率保证程度;4. 抽样方法;5. 抽样的组织方式。第三节抽样的组织形式? 抽样的组织形式有纯随机抽样、机械抽样、类型抽样、整群抽样和多阶段抽样。一、纯随机抽样1. 含义:对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样

17、本2. 特点:最符合抽样调查的随机原则,是基本形式。简便易行。3. 范围:仅适用于单位数不多、标志变异较小、分布较均匀的总体二、类型抽样1. 含义:先将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽 样或机械抽样方式,抽取一定数目的调查单位构成所需的样本。又叫分层抽样或分类抽 样。2. 方法:A比例分配法 n i/n=Ni/NB最佳分配法根据各层单位的变异程度的大小来分配C经济分配法 除了考虑单位数目和变异程度外,还有调查费用。3.特点:能保证分布的均匀性,提高样本的代表性,误差较小;能冋时推断总体指标和 各子总体的指标三、机械抽样1. 含义:是先将全及总体所有单位按某一标志顺序编号排列,然后按照固定顺序和相等 的空间距离或间隔,从中抽取样本单位的一种抽样组织方式。又叫等距抽样或系统抽样。2. 方法:根据需要计算抽取各个样本单位之间的距离或间隔;然后,按此间隔依次抽取 必要的样本单位。3. 特点:能保证样本较均匀地分布。是不重复的抽样。4. 形式:按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样 效果相当于类型抽样。四、整群抽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论