统计学课件七_第1页
统计学课件七_第2页
统计学课件七_第3页
统计学课件七_第4页
统计学课件七_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章抽样推断★§7.1抽样推断的一般问题§7.2抽样误差§7.3抽样估计的方法§7.4抽样的组织设计抽样推断的过程样本总体样本统计量例如:样本均值、比例、方差总体均值、比例、方差本章主要内容抽样推断的概念与特点抽样的基本组织形式抽样误差的含义、计算方法参数估计和假设检验的含义及方法简单随机抽样条件下样本容量的确定第一节抽样推断概述

(定义)你不必吃完整头牛,才知道牛肉是老的。总体

随机样本

抽样推断是指按照随机原则,从研究对象的总体中抽取一部分单位进行调查,并用这一部分单位的指标数值去推断总体的指标数值,从而达到认识总体目的的一种统计方法。抽样推断概述

(特点)建立在随机原则基础上。根据部分单位的调查结果,对总体进行科学推断。抽样误差不可避免,但可以事先计算和控制。抽样推断概述

(作用)可用以对无限总体进行认识可用于属于破坏性或消耗性的产品的质量检验可用于某些不必要进行全面调查的现象可以对全面调查的资料进行评价和修正可用于生产过程的质量控制对某些总体的假设进行伪真判断,为决策提供依据抽样推断概述

(内容)推断统计参数估计假设检验抽样推断概述

(基本概念)总体:我们求取信息的对象全体总体容量:一个总体中所含的个体的数量。样本:从总体中所抽取的部分个体,我们从样本搜集信息,以便对整个总体做某些结论。样本容量:样本中所含个体的数量.抽样推断概述

(基本概念)总体参数:在抽样推断中,用来反映总体数量特征的指标,也叫称为总体指标或全及指标。统计量是根据样本资料计算的,用以估计和推断相应总体指标的综合指标。抽样推断概述

(基本概念)将样本单位数不少于30个的样本称为大样本,即为大样本;不及30个的称为小样本。样本可能数目又称样本个数,指按一定的抽样方法和抽样组织形式,从全及总体个单位中随机抽取个单位构成样本,一共可以抽出的不同样本的数量,一般用m表示。参数统计量定义反映总体数量特征的指标反映样本数量特征的指标符号及计算公式总体容量总体均值总体成数总体方差总体标准差样本容量样本均值样本成数样本方差样本标准差参数与样本统计量的对比第七章抽样推断★§7.1抽样推断的一般问题§7.2抽样误差§7.3抽样估计的方法§7.4抽样的组织设计★一、抽样误差的概念二、抽样平均误差三、抽样极限误差§7.2简单随机抽样的抽样误差的测定★指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差抽样误差影响抽样误差的因素总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。一、抽样误差的概念二、抽样平均误差三、抽样极限误差§7.2简单随机抽样的抽样误差的测定★★抽样平均误差抽样平均数(或成数)的标准差。反映抽样指标和总体指标的平均离差程度。式中:为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数。p为样本成数,P为总体成数。抽样平均误差的计算公式⒈样本平均数的抽样平均误差当N≥500时,有重复抽样时:不重复抽样时:⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:当N≥500时,有抽样平均误差的计算公式上一页下一页求样本平均数和样本成数(使用时间1000小时以上为合格品)的抽样平均误差。返回本节首页⒈求灯泡平均使用时间、标准差和灯泡合格率(样本)上一页下一页返回本节首页⒉求灯泡使用时间抽样平均误差:在重复抽样下抽样平均误差上一页下一页在不重复抽样下抽样平均误差返回本节首页⒊求灯泡合格率的抽样平均误差:在重复抽样下抽样平均误差上一页下一页在不重复抽样下抽样平均误差返回本节首页一、抽样误差的概念二、抽样平均误差三、抽样极限误差§7.2简单随机抽样的抽样误差的测定★★★抽样极限误差指在一定的概率保证程度下,抽样误差允许的某一给定误差范围,也称作允许误差、误差范围、误差置信限等。由于提高把握程度,会增大允许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会降低估计的把握程度,所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。⒈抽样平均数的抽样极限误差⒉抽样成数的抽样极限误差上一页下一页返回本节首页若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计:⒈抽样平均数的范围⒉抽样成数的抽样极限误差上一页下一页返回本节首页例:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。样本成数

p=190/200=95%总体成数下限=95%-2%=93%总体成数上限=95+2%=97%即该产品合格率在93%~97%之间。上一页下一页返回本节首页抽样极限误差与抽样平均误差的关系抽样极限误差通常用抽样平均误差的倍数表示,即上一页下一页返回本节首页t称为概率度。可信程度

可信程度是表示估计的可靠程度如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t决定的。因而可靠程度与t之间有一定正比关系。概率度t与概率保证程度(可靠程度)之间的关系见下表。例:若概率为0.95,查表得t=1.96

t值概率保证程度

1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973常用的t值及相应的概率保证程度对照表第七章抽样推断★§7.1抽样推断的一般问题§7.2抽样误差§7.3抽样估计的方法§7.4抽样的组织设计★★一、点估计二、区间估计三、样本数目的确定§7.3简单随机抽样的抽样估计★点估计指直接以样本指标来估计总体指标,也叫定值估计简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况一、点估计二、区间估计三、样本数目的确定§7.3简单随机抽样的抽样估计★★二、区间估计㈠总体平均数的区间估计㈡总体成数的区间估计总体平均数的区间估计表达式其中,为极限误差步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,即总体平均数的区间估计步骤⒊计算抽样平均误差:重复抽样时:不重复抽样时:总体平均数的区间估计步骤⒋计算抽样极限误差:⒌确定总体平均数的置信区间:总体平均数的区间估计【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。总体平均数的区间估计按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144100名工人的日产量分组资料解:则该企业工人人均产量及日总产量的置信区间为:即该企业工人人均产量在124.8至127.2件之间,其日总产量在124800至127200件之间,估计的可靠程度为95﹪。总体成数的区间估计表达式其中,为极限误差步骤⒈计算样本成数;⒉搜集总体方差的经验数据;⒊计算抽样平均误差:重复抽样条件下不重复抽样条件下总体成数的区间估计步骤⒋计算抽样极限误差:⒌确定总体成数的置信区间:总体成数的区间估计【例B】若例A中工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。总体成数的区间估计按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数解:则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8441至0.9559之间,完成定额的工人总数在844.1至955.9人之间,估计的可靠程度为95﹪。例:某灯泡厂某月生产5000000个灯泡,在进行质量检查中,随机抽取500个进行检验,这500个灯泡的耐用时间见下表:

上一页下一页返回本节首页试求:⑴该厂全部灯泡平均耐用时间的取值范围(概率保证程度0.9973)⑵检查500个灯泡中不合格产品占0.4%,试在0.6827概率保证下,估计全部产品中不合格率的取值范围。求解如下:⑴①计算抽样平均误差②由概率保证程度0.9973,查表得概率度t=3③计算抽样极限误差

④估计总体指标区间上一页下一页返回本节首页⑵p=0.4%上一页下一页返回本节首页概率保证程度为0.6827时,t=1一、点估计二、区间估计三、样本数目的确定§7.3简单随机抽样的抽样估计★★★三、样本容量的确定㈠确定样本容量的意义㈡推断总体平均数所需的样本容量㈢推断总体成数所需的样本容量㈣必要样本容量的影响因素样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量确定样本容量的意义找出在限定费用范围内的最大样本容量确定方法推断总体平均数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。或S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的S。计算结果通常向上进位⑵不重复抽样条件下:确定方法推断总体平均数所需的样本容量【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?解:确定方法推断总体成数所需的样本容量⑴重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。计算结果通常向上进位通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的;③取方差的最大值0.25。⑵不重复抽样条件下:确定方法推断总体成数所需的样本容量【例B】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率为93﹪、95﹪、96﹪,为了使合格率的允许误差不超过3﹪,在99.73﹪的概率保证程度下,应抽查多少件产品?【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93﹪。解:必要样本容量的影响因素总体方差的大小;允许误差范围的大小;概率保证程度;抽样方法;抽样的组织方式。重复抽样条件下:不重复抽样条件下:第七章抽样推断★§7.1抽样推断的一般问题§7.2抽样误差§7.3抽样估计的方法§7.4抽样的组织设计★★★§7.4抽样方案的设计一、抽样方案设计的基本原则二、简单随机抽样三、类型抽样四、机械抽样误差五、整群抽样★一、抽样方案设计的基本原则㈠保证实现抽样随机性的原则㈡保证实现最大的抽样效果原则上一页下一页返回本节首页§7.4抽样方案的设计一、抽样方案设计的基本原则二、简单随机抽样三、类型抽样四、机械抽样误差五、整群抽样★★1·简单随机抽样(纯随机抽样)——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本应用仅适用于规模不大、内部各单位标志值差异较小的总体是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式§7.4抽样方案的设计一、抽样方案设计的基本原则二、简单随机抽样三、类型抽样四、机械抽样误差五、整群抽样★★★类型抽样(分层抽样)——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。总体N样本n等额抽取等比例抽取最优抽取······能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标各组的样本单位数为:计算各组抽样平均数:计算全样本抽样平均数:计算各组内方差:计算各组内方差平均数:不重复抽样下抽样平均误差为:重复抽样下:§7.4抽样方案的设计一、抽样方案设计的基本原则二、简单随机抽样三、类型抽样四、机械抽样误差五、整群抽样★★★★3·等距抽样(机械抽样或系统抽样)——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。······随机起点半距起点对称起点(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。不重复抽样下抽样平均误差为:重复抽样下:§7.4抽样方案的设计一、抽样方案设计的基本原则二、简单随机抽样三、类型抽样四、机械抽样误差五、整群抽样★★★★★4·整群抽样(集团抽样)——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本,即对抽中“群”中的所有单位都进行调查。例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差计算第i群样本平均数:计算全样本平均数:计算群间方差:抽样平均误差为:5·多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单位的过程例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)1、准确性检查——以方案所要求的允许误差范围为标准,用已掌握的资料检查其在一定的概率保证下,实际的极限误差是否超过方案允许的误差范围。抽样方案的检查2、代表性检查——用方案中的样本指标与过去已掌握资料的总体同一指标或进行对比,视其比率是否超过规定的要求。我国规定农产量的比率不超过,居民收入的比率不超过。第七章抽样推断习题五、计算题

1.某工厂有1500个工人,用简单随机重复抽样的方法,抽出50个工人作为样本,调查其工资水平,如下表:要求:1)计算样本平均数和抽样平均误差;

2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。样本平均数和方差计算表【解】五、1题(1)平均工资的置信区间为:[550.82,569.18]元

工资总额的置信区间为:[550.82×1500,569.18×150

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论