




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章抽样推断
美国总统选举民意调查1984年11月里根与孟代尔竞选总统,美国著名的盖洛普、哈里斯、国家广播公司三家民意调查社在选举前三个星期所做调查的统计分析,里根分別约可获得58%、55%及60%选票,正式选举的结果:里根约获得59%选票,而孟代尔约41%选票。此次美国所有的民意调查社的预测数字与选举结果最多只有4%误差,但被调查的选民不超过3000人,可见统计的技巧是多么有用。在以往的十七次美国总统选举预测中,只有两次失败,第一次是1936年的蓝顿对罗斯福的选举,样本数一千万但是误差20%,第二次是1948年杜威对杜鲁门,样本数二百万误差5%,50年来美国21次全国选举预测之平均误差只有2.3%。学习目标抽样推断是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估计。主要内容第一节抽样推断概述
第二节抽样误差第三节抽样估计的方法第四节抽样组织设计第五节样本容量的确定一、抽样推断的概念和特点
概念
抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。特点
它是由部分推断整体的一种认识方法。
抽样推断建立在随机取样的基础上。
抽样推断运用概率估计的方法。
抽样推断的误差可以事先计算并加以控制。第一节抽样推断概述随机原则——即是在抽取样本时,排除人们主观意图的作用,使得总体中的每个单位或每个样本有相等的入选机会。统计推断的过程:样本总体样本指标总体指标二、抽样推断的作用适用于无限总体或者很难进行全面调查的总体的研究;对某些可以但事实上不必或不可能进行全面调查的现象总体的研究;适应于破坏性产品的质量检验;可以用于生产过程中的质量控制;用于订正全面调查的数据。第一节抽样推断概述8三、抽样推断的理论依据(一)大数定理当样本容量n
充分大时,可以用样本平均数估计总体平均数。当试验次数n充分大时,可以用频率代替概率。大数定理的意义:个别现象受偶然因素影响而表现出差异性,但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,从而使总体平均数稳定下来,反映出事物变化的一般规律,这就是大数定理的意义。9(二)中心极限定理
中心极限定理的意义:在一定条件下,大量相互独立的随机变量之和的概率分布是以正态分布为极限的。其主要内容是:如果总体分布未知,且存在有限的均值和方差,则当样本容量足够大时,抽样平均数近似服从正态分布。四、有关抽样的基本概念(一)总体和样本总体:又称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。样本:又称样本总体。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用“n”表示。第一节抽样推断概述(二)参数和统计量
参数
反映总体数量特征的全及指标。参数研究总体中的数量标志总体平均数总体方差X=∑XNX=∑XF∑FΣ(X-X)
N2σ=2Σ(X-X)FΣF2σ=2研究总体中的品质标志总体成数成数方差σ2=P(1-P)P=
N1N(只有两种表现)第一节抽样推断概述
统计量根据样本数据计算的综合指标。研究数量标志
样本平均数
x=∑xnx=∑xf∑f样本方差研究品质标志样本成数
成数标准差
np=n第一节抽样推断概述(三)样本容量和样本个数样本容量:一个样本包含的单位数。用“n”表示。一般要求n≥30(n≥30叫做大样本)样本个数:从一个全及总体中可能抽取的样本数目。(四)重复抽样和不重复抽样重复抽样:又称有放回抽样。不重复抽样:又称无放回抽样。可能组成的样本数目:N(N-1)(N-2)……(N-n+1)可能组成的样本数目:nN第一节抽样推断概述例如:从A、B、C、D四个单位中,抽出两个单位构成一个样本,问可能组成的样本数目是多少?重复抽样AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42
=16(个样本)不重复抽样N(N-1)(N-2)……(N-n+1)4×3=12(个样本)第一节抽样推断概述(五)抽样框概念:在抽样之前,为便于抽样工作的组织,常需要一份包含所有抽样单元的名单或清册,这种名单或清册称为抽样框。例如:对某企业职工的收入状况进行调查,该企业职工名单就形成了抽样框。在抽样框中,每个抽样单元都被编上号码,一旦某个单元被抽中,则可以根据抽样框在实际中找到这个单元,从而实施调查。第一节抽样推断概述第二节抽样误差一、抽样误差的概念与种类1.概念把按随机原则抽样时,由于调查范围的非全面性和抽样的随机性而产生的样本指标数值与所要估计的总体指标数值之差。是偶然性的代表性误差。2.种类(1)抽样平均误差(2)抽样极限误差二、影响抽样误差大小的因素第二节抽样误差总体各单位标志值的差异程度(即标准差的大小):
越大,抽样误差越大;样本单位数的多少:n越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。三、抽样平均误差抽样平均误差是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。第二节抽样误差假设总体包含1、2、3、4、5,五个数字。则:总体平均数为X=1+2+3+4+55=3
现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:25个。如:
1+3
2=21+42=2.52+42=33+52=4第二节抽样误差
多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平均误差是反映抽样误差一般水平的指标。第二节抽样误差
抽样平均误差的计算公式抽样平均数的平均误差抽样成数平均误差(以上两个公式反映的是样本指标与总体指标的平均离差程度)实际上,利用上述两个公式是计算不出抽样平均误差的。想一想,为什么?第二节抽样误差抽样平均数平均误差的计算方法采用重复抽样:此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。(当总体标准差未知时,可用样本标准差代替)注意以下几点:①样本平均数的平均数等于总体平均数。②抽样平均数的标准差仅为总体标准差的③可通过调整样本单位数来控制抽样平均误差。第二节抽样误差例题:假定抽样单位数增加2倍、0.5
倍时,抽样平均误差怎样变化?解:抽样单位数增加2倍,即为原来的3倍则:抽样单位数增加0.5倍,即为原来的1.5倍则:即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。第二节抽样误差采用不重复抽样:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。例题一:随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?第二节抽样误差例题一解:即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。例题二解:
计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。已知:则:已知:则:n=100σ=10x=58N=2000n=400σ=300x=4800第二节抽样误差抽样成数平均误差的计算方法采用重复抽样:采用不重复抽样:例题三:
某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?例题四:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?第二节抽样误差例题三解:已知:则:样本成数即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。第二节抽样误差例题四解:已知:则:样本合格率计算结果表明:不重复抽样的平均误差小于重复抽样,但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。第二节抽样误差【例五】
第二节抽样误差【例六】
第二节抽样误差四、抽样极限误差含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。计算方法:它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。=Δp│p-
P│p-Δ≤P≤p+Δpp抽样平均数极限误差:抽样成数极限误差:≤≤第二节抽样误差五、抽样误差的概率度
含义抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“
t”表示。公式表示:
t=
Δμ
Δ=tμ(t是极限误差与抽样平均误差的比值)(极限误差是t倍的抽样平均误差)上式可变形为:第二节抽样误差估计量的优良标准无偏性:要求样本统计量的平均数等于被估计的总体参数本身。一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。有效性:第三节抽样估计的方法第三节抽样估计的方法一、总体参数的点估计点估计就是用样本指标直接代表总体指标。二、总体参数的区间估计区间估计三要素估计值抽样误差范围抽样估计的置信度区间估计是根据样本指标和抽样平均误差,去推断总体指标的可能范围。点估计完全正确的概率通常为0。因此,我们更多的是考虑用样本统计量去估计总体参数的范围
区间估计。
什么是抽样估计的置信度?
抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度符号表示:P(x-X≤Δ)=F(t)
x第三节抽样估计的方法P(p-P≤Δp
)=F(t)
理论已经证明,在大样本的情况下,抽样平均数的分布接近于正态分布。分布特点是:抽样平均数以总体平均数为中心,两边完全对称分布,即抽样平均数的正误差与负误差的可能性是完全相等的。且抽样平均数愈接近总体平均数,出现的可能性愈大,概率愈大;反之,抽样平均数愈离开总体平均数,出现的可能性愈小,概率愈小,趋于0。(见下图)第三节抽样估计的方法正态概率分布图Xx+1μx-1μ68.27%x+2μx-2μ95.45%由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计的精确度愈低;反之,误差范围愈小,则抽样估计的置信度愈低,但抽样估计的精确度愈高。因为扩大或缩小以后的平均误差,就是极限误差:Δ=tμ所以,抽样平均误差的系数就是概率度t。数理统计已经证明,抽样误差的概率就是概率度的函数,二者对应的函数关系已编成“正态分布概率表”。第三节抽样估计的方法步骤⒈计算样本平均数;⒉搜集总体方差的经验数据;或计算样本标准差,即三、总体参数区间估计的一般方法第三节抽样估计的方法步骤⒊计算抽样平均误差:重复抽样时:不重复抽样时:第三节抽样估计的方法步骤⒋计算抽样极限误差:⒌确定总体平均数的置信区间:Δx=tμx第三节抽样估计的方法三、总体参数区间估计的方法(一)根据给定的抽样误差范围(Δx),求概率保证程度分析步骤:1、抽取样本,计算抽样指标。2、根据给定的极限误差范围估计总体参数的上限和下限。3、计算概率度。4、查表求出概率F(t),并对总体参数作出区间估计。第三节抽样估计的方法(二)根据给定的概率F(t),推算抽样极限误差的可能范围分析步骤:1、抽取样本,计算样本指标。2、根据给定的F(t)查表求得概率度t。3、根据概率度和抽样平均误差计算极限误差。4、计算被估计值的上、下限,对总体参数作出区间估计。第三节抽样估计的方法
某农场进行小麦产量抽样调查,小麦播种总面积为1万亩,采用不重复简单随机抽样,从中抽选了100亩作为样本进行实割实测,测得样本平均亩产400斤,方差144斤。
(1)以95.45%的可靠性推断该农场小麦平均亩产可能在多少斤之间?若概率保证程度不变,要求抽样允许误差不超过1斤,问至少应抽多少亩作为样本?例题一:第三节抽样估计的方法例题一解题过程:已知:N=10000n=100
问题一解:1、计算抽样平均误差2、计算抽样极限误差3、计算总体平均数的置信区间上限:下限:即:以95.45%的可靠性估计该农场小麦平均亩产量在397.62斤至402.38斤之间.第三节抽样估计的方法问题二解:已知:则样本单位数:即:当至少应抽544.6亩作为样本。第三节抽样估计的方法例题二:某纱厂某时期内生产了10万个单位的纱,按纯随机抽样方式抽取2000个单位检验,检验结果合格率为95%,废品率为5%,试以95%的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?已知:区间下限:区间上限:第三节抽样估计的方法例题三:为调查农民生活状况,在某地区5000户农民中,按不重复简单随机抽样法,抽取400户进行调查,得知这400户中拥有彩色电视机的农户为87户。要求计算:1、以95%的把握程度估计该地区全部农户中拥有彩色电视机的农户在多大比例之间?2、若要求抽样允许误差不超过0.02,其它条件不变,问应抽多少户作为样本?第三节抽样估计的方法例题三的问题一解:已知:N=5000N=4001、计算样本成数:2、计算抽样平均误差:第三节抽样估计的方法即:以95%的把握程度估计该地区农户中拥有彩电的农户在17.87%至25.63%之间。4、计算总体P的置信区间:下限:上限:3、计算抽样极限误差:第三节抽样估计的方法例题三的问题二解:当其他条件不变时:第三节抽样估计的方法第四节抽样调查的组织形式一、简单随机抽样二、分层抽样三、整群抽样四、等距抽样五、多阶段抽样一、简单随机抽样概念:按照随机原则直接从总体里抽取样本单位,即抽样时对总体不进行任何分组、排列,使总体中的每一个单位都有同样的机会被抽中,是抽样调查组织形式中最简单也是最基本的一种方式。抽样方法:抽签法随机数字表法
第四节抽样调查的组织形式应用仅适用于规模不大、内部各单位标志值差异较小的总体二、分层抽样概念:又称类型抽样,它是对总体先按某个标志分成若干个类别,然后再按随机原则从每一个类别里抽取一定数目的单位数构成样本。各层样本量的分配方法:1.等比例分配抽样2.不等比例分配抽样第四节抽样调查的组织形式分类随机抽样
总体样本子群分层抽样图示总体N样本n······能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标1、分层抽样对层而言是全面调查,对层内单位而言是非全面调查。2、能避免明显的偏高或偏低情况,适合于调查标志在各单位间的分布差异大的总体。第四节抽样调查的组织形式三、整群抽样概念:先将总体划分为若干个群,再按随机原则从总体里抽取出部分群,并对抽中的群实施全面调查,这样的抽样方式称为整群抽样。注:整群抽样中,如果群内总体单位的差异较大,群与群之间的差异较小,每个群可以看作是总体的缩影,则整群抽样可以达到较高的抽样效果。
第四节抽样调查的组织形式划分子群随机抽样整群抽样图示例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量特点:简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差,适用于群间差异较小的调查。第四节抽样调查的组织形式子群体之间的差异大,内部差异小——分层抽样子群体之间的差异小,内部差异大——整群抽样四、系统抽样概念:先将总体单位按照某个标志进行排队,并根据总体单位数与样本单位数的比例计算出抽样距离和间隔,随机确定一个起始点作为第一个样本单位,以后每隔相等的距离和间隔抽取样本,这样的抽样方式称为系统抽样,又叫等距抽样。注:等距抽样要避免抽样间隔或样本距离和现象本身的节奏性或循环周期相重合。第四节抽样调查的组织形式随机起点半距起点对称起点(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。第四节抽样调查的组织形式排队的两种抽样方法1、无关标志排队:如家庭调查,按门牌号码排序。
2、有关标志排队:如农作物产量调查按平均亩产量高低排序。五、多阶段抽样概念:把抽样过程分成若干阶段来完成。抽样时先抽总体中范围较大的单位,再从抽中的范围大的单位中抽取范围小的单位,逐次类推,直到最后抽到样本单位。第四节抽样调查的组织形式例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)简单随机抽样样本单位数的计算方法通过抽样极限误差公式计算必要的样本单位数。重复抽样:不重复抽样:抽样平均数抽样成数附:确定样本容量一、确定样本容量的意义二、推断总体平均数所需的样本容量三、推断总体成数所需的样本容量四、必要样本容量的影响因素五、抽样复查的方法第五节样本容量的确定样本容量调查误差调查费用小样本容量节省费用但调查误差大大样本容量调查精度高但费用较大找出在规定误差范围内的最小样本容量一、确定样本容量的意义找出在限定费用范围内的最大样本容量确定方法二、推断总体平均数所需的样本容量1.重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。或S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的S。计算结果通常向上进位2.不重复抽样条件下:确定方法【例A】某食品厂要检验本月生产的10000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在95.45﹪的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?解:确定方法三、推断总体成数所需的样本容量1.重复抽样条件下:通常的做法是先确定置信度,然后限定抽样极限误差。计算结果通常向上进位通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的。⑵不重复抽样条件下:确定方法【例B】某企业对一批总数为5000件的产品进行质量检查,过去几次同类调查所得的产品合格率为93﹪、95﹪、96﹪,为了使合格率的允许误差不超过3﹪,在99.73﹪的概率保证程度下,应抽查多少件产品?【分析】因为共有三个过去的合格率的资料,为保证推断的把握程度,应选其中方差最大者,即P=93﹪。解:四、影响样本容量的因素总体方差的大小;允许误差范围的大小;概率保证程度;抽样方法;抽样的组织方式。五、抽样复查的方法其全面调查时的登记结果为2.2861亿元其抽样复查的结果为2.1734亿元随机抽取五个下属单位修正系数=则:该企业集团所拥有的固定资产原值应为16.851×0.9507=16.020(亿元)所拥有固定资产原值的普查结果为16.851亿元某企业集团总体练习题一.单项选择题1.抽样调查与典型调查的主要区别是()
A.所研究的总体不同B.调查对象不同
C.调查对象的代表性不同D.调查单位的选取方式不同2.下列指标中为随机变量的是()。
A.抽样误差B.抽样平均误差
C.允许误差D.样本容量3.样本是指()。
A.任何一个总体B.任何一个被抽中的调查单位
C.抽样单元D.由被抽中的调查单位所形成的总体练习题
4.抽样误差是指()。
A.在调查过程中由于观察、测量等差错所引起的误差
B.在调查中违反随机原则出现的系统误差
C.随机抽样而产生的代表性误差
D.人为原因所造成的误差
5.抽样平均误差说明抽样指标与总体指标之间的()。
A.实际误差B.平均误差C.实际误差的平方D.允许误差
6.总体均值和样本均值之间的关系是()。
A.总体均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 平行线的判定定理说课
- 共同抵押合同协议
- 小班瞬间记忆课件
- 插花初级培训
- 器官捐赠协议书(2篇)
- 指南培训全攻略
- 施工现场设备调拨管理协议
- 定制家具设计费用结算协议
- 辛集中学高三下学期模拟巩固训练(5)历史试题
- 阿克苏工业职业技术学院《语文学科教学知识与能力实训教程》2023-2024学年第一学期期末试卷
- 疤痕修复协议书
- 2025年企业文化建设工作及2025年的工作计划
- 第二十届中央纪律检查委员会第四次全体会议公报学习解读
- 书店接待礼仪培训
- 小学生理性消费课件
- 药剂科培训课件:《医院特殊药品管理》
- 村级公墓规划设计方案
- 2024年7月国家开放大学法律事务专科《民法学(2)》期末纸质考试试题及答案
- 中央戏剧学院招聘笔试真题2023
- 2021年高级经济师《高级经济实务》建筑与房地产经济专业考试题库及答案解析
- 人教版高中物理选择性必修第三册第五章原子核第2节放射性元素的衰变课件
评论
0/150
提交评论