




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第九第九章章 抽样抽样与抽样估计与抽样估计本本 章章 重重 点点1、抽样平均误差的计算、抽样平均误差的计算3、简单随机抽样下总体平均数和总体、简单随机抽样下总体平均数和总体成数的区间估计成数的区间估计2、影响抽样平均误差的因素、影响抽样平均误差的因素4、必要抽样单位数的确定、必要抽样单位数的确定一、抽样调查一、抽样调查的概念和特点的概念和特点1 1、概念、概念:抽样调查抽样调查是按是按随机原则随机原则从全部研究对从全部研究对象中抽取部分单位进行观察,并根据象中抽取部分单位进行观察,并根据样本的实际数据对总体的样本的实际数据对总体的数量特征数量特征作作出具有一定出具有一定可靠程度可靠程度的估计和
2、判断的估计和判断。 只抽取部分单位进行调查只抽取部分单位进行调查。1 1 抽样调查抽样调查的一般问题的一般问题2 2、特点、特点(1) 抽样调查抽样调查建立在随机取样的基础上建立在随机取样的基础上。(2)(2)它是由部分推断整体的一种认识方它是由部分推断整体的一种认识方法法。(3)抽样调查抽样调查的误差可以事先计算并加以的误差可以事先计算并加以控制。控制。3 3、抽样调查的适用范围、抽样调查的适用范围抽抽样调查方法是市场经济国家在样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、它具有准确度高、成本低、速度快、应用面广
3、等优点。应用面广等优点。1.1.实实际工作不可能进行全面调查观察,而又际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;需要了解其全面资料的事物;2.2.虽虽可进行全面调查观察,但比较困难或并可进行全面调查观察,但比较困难或并不必要;不必要;3.3.对对普查或全面调查统计资料的质量进行检普查或全面调查统计资料的质量进行检查和修正;查和修正;4.4.抽抽样方法适用于对大量现象的观察,即组样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;成事物总体的单位数量较多的情况;5.5.利利用抽样推断的方法,可以对于某种总体用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种
4、假设的真伪,的假设进行检验,判断这种假设的真伪,以决定取舍。以决定取舍。一般适用于以下范围:一般适用于以下范围:三、有关抽样的基本概念三、有关抽样的基本概念(一)总体和样本(一)总体和样本总体:总体:也称全及总体。指所要认识的研究对也称全及总体。指所要认识的研究对象全体。总体单位总数用象全体。总体单位总数用“N N”表示。表示。样本:样本:也称抽样总体,是抽出的单位组成也称抽样总体,是抽出的单位组成的整体。样本单位总数用的整体。样本单位总数用“n n”表示。表示。二、抽样推断的内容二、抽样推断的内容参数估计参数估计假设检验假设检验(二)参数和统计量(二)参数和统计量1 1、针对总体计算的指标叫
5、总体参数,也叫全及、针对总体计算的指标叫总体参数,也叫全及指标。指标。2 2、针对样本计算的指标为统计量,也叫估计、针对样本计算的指标为统计量,也叫估计量量, ,也叫抽样指标。也叫抽样指标。参数的值是定值参数的值是定值常用的参数有:总体平均数、总体成数常用的参数有:总体平均数、总体成数P P、总体、总体标准差标准差其值随样本的不同而不同,是个随机变量。其值随样本的不同而不同,是个随机变量。抽样估计就是通过统计量的值去估计参数的值。抽样估计就是通过统计量的值去估计参数的值。常用的统计量有:样本平均数、样本成数常用的统计量有:样本平均数、样本成数p p、样、样本标准差本标准差S S 1N0NNNP
6、1 。n1nnnp1%1P%3pXnxxPnnp12 xp2ssnxnxxxxn21fxfffffxfxfxxnnn212211ffxffxffxffxinnii2211或NXXNii122)(KiiKiiiFFXX1122)(NXXNii12)(KiiKiiiFFXX112)(nxxs22)(ffxxs22)(nxxs2)(ffxxs2)(ffxxs22)(ffxxs2)(利用样本统计量对总体某些利用样本统计量对总体某些性质或数量特征进行推断。性质或数量特征进行推断。随机原则随机原则总体参数总体参数统计量统计量推断估计推断估计参数估计参数估计检验检验假设检验假设检验抽样分布抽样分布(三)样本
7、容量和样本个数(三)样本容量和样本个数1 1、样本容量:、样本容量:一个样本包含的单位数。一个样本包含的单位数。用用 “n n”表示。一般要求表示。一般要求 n 30n 302 2、样本个数:、样本个数:从一个全及总体中可能抽从一个全及总体中可能抽取的样本数目。取的样本数目。(四)重复抽样和不重复抽样(四)重复抽样和不重复抽样1 1、重复抽样:也叫放回抽样。、重复抽样:也叫放回抽样。2 2、不重复抽样:也叫无放回抽样。、不重复抽样:也叫无放回抽样。一个单位可能中选多次一个单位可能中选多次每次抽单位,概率固定,都为每次抽单位,概率固定,都为1/N1/N。一个单位最多中选一次一个单位最多中选一次每
8、次抽单位,概率不同,逐渐增加每次抽单位,概率不同,逐渐增加( (五五) ) 、概率抽样与非概率抽样、概率抽样与非概率抽样1、概率抽样:也叫随机抽样,是指按照随、概率抽样:也叫随机抽样,是指按照随机原则抽取样本。概率抽样最基本的组机原则抽取样本。概率抽样最基本的组织方式有:简单随机抽样、分层抽样、织方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。等距抽样和整群抽样。2、非概率抽样:也叫非随机抽样,是指从、非概率抽样:也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构断,从总体中有意识地抽取若干单位构成样本。重点调查、典
9、型调查、配额调成样本。重点调查、典型调查、配额调查等属于非随机抽样。查等属于非随机抽样。(六)、抽样框(六)、抽样框 1 1、抽样框是包括全部抽样单位的名单框架。编、抽样框是包括全部抽样单位的名单框架。编制抽样框是实施抽样的基础。抽样框的好坏通常制抽样框是实施抽样的基础。抽样框的好坏通常会直接影响到抽样调查的随机性和调查的效果。会直接影响到抽样调查的随机性和调查的效果。2 2、抽样框主要有三种形式:、抽样框主要有三种形式: 名单抽样框,即列出全部总体单位的名录一名单抽样框,即列出全部总体单位的名录一览表,如职工名单、企业名单等。览表,如职工名单、企业名单等。 区域抽样框,即按地理位置将总体范围
10、划分区域抽样框,即按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。如对某市为若干小区域,以小区域为抽样单位。如对某市居民住房情况进行调查,将全市居民户划分为若居民住房情况进行调查,将全市居民户划分为若干街道或片区。干街道或片区。3 3、一个理想的抽样框应该与目标总体一致,即、一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复,也不遗漏(穷应包括全部总体单位,既不重复,也不遗漏(穷尽与互斥)。若有遗漏,易造成系统性误差。尽与互斥)。若有遗漏,易造成系统性误差。在实践中,要取得与目标总体完全一致的抽样在实践中,要取得与目标总体完全一致的抽样框往往很困难,甚至不可能,常常只
11、能采用与框往往很困难,甚至不可能,常常只能采用与目标总体近似的抽样框。目标总体近似的抽样框。 时间表抽样框,即将总体全部单位按时间顺时间表抽样框,即将总体全部单位按时间顺序排列,把总体的时间过程分为若干个小的时间序排列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。如对流水线上单位,以此时间单位为抽样单位。如对流水线上2424小时内生产的产品进行质量抽查时,以小时内生产的产品进行质量抽查时,以5 5分钟分钟为一个抽样单位,可将全部产品分为为一个抽样单位,可将全部产品分为288288个抽样个抽样单位并按时间顺序排列。单位并按时间顺序排列。(七)、抽样误差(七)、抽样误差统计调查
12、的误差,是指调查所得结果与总体统计调查的误差,是指调查所得结果与总体真实值之间的差异。在抽样调查中,误差的真实值之间的差异。在抽样调查中,误差的来源有登记性误差和代表性误差两大类。来源有登记性误差和代表性误差两大类。 登登记记误误差差系系统统性性误误差差统统计计误误差差代代表表性性误误差差实实际际误误差差随随机机误误差差抽抽样样平平均均误误差差(1 1)登记性误差,指在调查和汇总过程)登记性误差,指在调查和汇总过程中由于测量、登记、计算等方面的差错中由于测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差。或被调查者提供虚假资料而造成的误差。它在任何调查中均存在。而且调查范围它在任何
13、调查中均存在。而且调查范围越大,调查单位越多,产生登记性误差越大,调查单位越多,产生登记性误差的可能性也越大。的可能性也越大。(2 2)代表性误差,指样本推断总体时,)代表性误差,指样本推断总体时,由于样本结构与总体结构不一致而产生由于样本结构与总体结构不一致而产生的误差。又分系统误差与随机误差两种。的误差。又分系统误差与随机误差两种。随机误差也叫偶然误差。它是由偶随机误差也叫偶然误差。它是由偶然性因素引起的代表性误差。它不可然性因素引起的代表性误差。它不可避免,但可计算与控制。抽样估计中避免,但可计算与控制。抽样估计中的抽样误差,就是指这种随机误差。的抽样误差,就是指这种随机误差。在计算抽样
14、误差时,常常假设不存在登在计算抽样误差时,常常假设不存在登记性误差和系统误差记性误差和系统误差系统误差是非随机因素引起的误差,系统误差是非随机因素引起的误差,它系统性偏高或偏低,也称偏差。它系统性偏高或偏低,也称偏差。2 2 抽样平均误差抽样平均误差一、抽样误差的概念一、抽样误差的概念1 1、抽样误差是指由于抽样的随机性而产生的、抽样误差是指由于抽样的随机性而产生的那一部分代表性误差(随机性误差),不包括那一部分代表性误差(随机性误差),不包括 登记性误差,也不包括可能发生的偏差。登记性误差,也不包括可能发生的偏差。主要有两主要有两种种: :实际抽样误差实际抽样误差, ,抽样平均误差。抽样平均
15、误差。(1 1)实际抽样误差:指某一样本指标与总体)实际抽样误差:指某一样本指标与总体参数之间的离差参数之间的离差例例8 8-2-1-2-1: 从从1 1、2 2、3 3中抽中抽2 2个(重复),个(重复),参数取总体平均数参数取总体平均数 (等于(等于2 2),则实),则实际抽样误差如下:际抽样误差如下:X样本样本 样本统计量样本统计量实际抽样误差实际抽样误差( - - ) (1 1、1 1) 1 1-1-1(1(1、2 2)1.51.5-0.5-0.5(1 1、3 3)2 20 0(2 2、1 1)1.51.5-0.5-0.5(2 2、2 2)2 20 0(2 2、3 3)2.52.50.
16、50.5(3 3、1 1)2 20 0(3 3、2 2)2.52.50.50.5(3 3、3 3)3 31 1xxxX(2) (2) 抽样平均误差:指样本指标的标准差。抽样平均误差:指样本指标的标准差。抽样实际误差是无法知道的,而抽样平均抽样实际误差是无法知道的,而抽样平均误差可以计算。误差可以计算。在讨论抽样误差时,通常指抽样平均误差在讨论抽样误差时,通常指抽样平均误差要计算抽样平均误差,得从抽样分布谈起要计算抽样平均误差,得从抽样分布谈起二、抽样分布及抽样平均误差的计算二、抽样分布及抽样平均误差的计算 抽样分布是指样本指标的概率分布,抽样分布是指样本指标的概率分布,由样本指标的可能取值与之
17、相应的频数或由样本指标的可能取值与之相应的频数或频率组成频率组成。 对于抽样分布,可计算其均值和方差等对于抽样分布,可计算其均值和方差等来反映该分布的中心和离散趋势。来反映该分布的中心和离散趋势。(一)抽样分布的集中趋势与离中趋势的测定(一)抽样分布的集中趋势与离中趋势的测定 A A、样本平均数的抽样分布的集中趋势与离、样本平均数的抽样分布的集中趋势与离中趋势的测定中趋势的测定 1 1、把所有可能样本的平均数及其相应的、把所有可能样本的平均数及其相应的频数或频率排列起来,就是样本平均数的频数或频率排列起来,就是样本平均数的抽样分布。抽样分布。通常计算这一分布的均值和标准差,分别反通常计算这一分
18、布的均值和标准差,分别反映样本平均数分布的集中趋势与离中趋势。映样本平均数分布的集中趋势与离中趋势。2 2、例、例8 8-2-2-2-2: 从从4 4、6 6、8 8三个数中按重复抽样抽三个数中按重复抽样抽2 2个,调查其平均数,形成的抽样分布如下:个,调查其平均数,形成的抽样分布如下:样本样本样本平均数样本平均数频数频数(4、4)41(4、6) (6、4)52(4、8) (6、6) (8、4)63(6、8) (8、6)72(8、8)81x平均数:平均数: xE32118273625146954计算该分布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差:标准差:x9122121122
19、22234而总体平均数和标准差分别为:而总体平均数和标准差分别为: X638643222238所以,可得以下两点结论:(重复)所以,可得以下两点结论:(重复)样本平均数的平均数等于总体平均数。样本平均数的平均数等于总体平均数。抽样平均数的标准差仅为总体标准差的抽样平均数的标准差仅为总体标准差的n13 3、 样本平均数的标准差即是平均数的样本平均数的标准差即是平均数的抽样平均误差抽样平均误差)(x在实际中,不可能一一列举所有可能的样本,在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上述第个从而不能按上述方法计算。可利用上述第个结论计算,即:结论计算,即: 重复抽样重复抽样
20、时:时: xnn2不重复抽不重复抽样时:样时: x)1(21NnnNnn 2S4 4、例、例8 8-2-3-2-3: 用简单重复抽样的方法,从用简单重复抽样的方法,从660660个个工厂中抽取工厂中抽取3333个工厂调查月产值情况,得资料如个工厂调查月产值情况,得资料如下,试求月产值的抽样平均误差。下,试求月产值的抽样平均误差。 月产值(万元)月产值(万元)工厂数工厂数 0-10 0-10 20 20 10-20 10-20 9 9 20-30 20-30 2 2 30-40 30-40 2 2解解xfxf33235225915205=10.76 ffxx2332292024.2424.142
21、4. 476. 5222291.72xn)(49.13391.72万元(万元)(万元)B B、样本成数的抽样分布的集中趋势与离、样本成数的抽样分布的集中趋势与离中趋势的测定中趋势的测定1 1、把所有可能样本的成数及其相应的、把所有可能样本的成数及其相应的频数或频率排列起来,就是样本成数的频数或频率排列起来,就是样本成数的抽样分布。抽样分布。通常计算这一分布的均值和标准差,分别通常计算这一分布的均值和标准差,分别反映样本成数分布的集中趋势与离中趋势。反映样本成数分布的集中趋势与离中趋势。2 2、例、例8 8-2-4-2-4:从张(男)、王(男)、田(女):从张(男)、王(男)、田(女)三个人中按
22、重复抽样抽三个人中按重复抽样抽2 2个,调查其男性比重,个,调查其男性比重,形成的抽样分布如下形成的抽样分布如下 样本样本样本成数样本成数(p p)频数频数(张、张)(张、王)(张、张)(张、王)(王、张)(王、王)(王、张)(王、王)1 14 4(张、田)(张、田) (王、田)(王、田)(田、张)(田、王)(田、张)(田、王)1/21/24 4(田、田)(田、田) 0 01 1平均数:平均数: pE14410421413296计算该分布的平均数和标准差,得计算该分布的平均数和标准差,得 标准差:标准差:p914432613122291而总体成数和标准差分别为:而总体成数和标准差分别为: P3
23、2)( PP192所以,可得以下两点结论:(重复)所以,可得以下两点结论:(重复)样本成数的平均数等于总体成数。样本成数的平均数等于总体成数。抽样成数的标准差仅为总体成数标准差的抽样成数的标准差仅为总体成数标准差的n13 3、 样本成数的标准差即是成数的抽样样本成数的标准差即是成数的抽样平均误差平均误差在实际中,不可能一一列举所有可能的样在实际中,不可能一一列举所有可能的样本,从而不能按上述方法计算。可利用上本,从而不能按上述方法计算。可利用上述第个结论计算,即:述第个结论计算,即: )(p重复抽样重复抽样时:时: 不重复抽不重复抽样时:样时: nppp1Nnnppp11当总体成数未知时,可用
24、当总体成数未知时,可用4 4种方法取得:种方法取得:样本资料、历史资料、小规模调查资料、估样本资料、历史资料、小规模调查资料、估计资料计资料4 4、例、例6-2-56-2-5:一批:一批8 8瓦的日光灯管瓦的日光灯管8000080000只,只,从中抽取从中抽取400400只检验,发现有只检验,发现有1212只不合格,试只不合格,试求合格率的抽样平均误差。求合格率的抽样平均误差。 解:解: 样本合样本合格率格率 p40012400 %97重复抽样重复抽样时:时: 不重复抽不重复抽样时:样时: nppp1Nnnppp1140003.097.0= 0.853% = 0.853% )(80000400
25、140003.097.0= 0.85% = 0.85% (二)影响抽样平均误差的因素(二)影响抽样平均误差的因素 1 1、总体方差或标准差。总体各单位在被研究、总体方差或标准差。总体各单位在被研究变量上的差异程度差异越大,误差越大。变量上的差异程度差异越大,误差越大。2 2、 样本容量样本容量n n的大小。抽取的单位数越多,的大小。抽取的单位数越多,误差越小。误差越小。3 3、抽样方法。重复抽样的误差大于不重复、抽样方法。重复抽样的误差大于不重复抽样的误差。抽样的误差。当一个总体给定后,总体各单位在被研究当一个总体给定后,总体各单位在被研究变量上的差异程度也随之确定。所以在选变量上的差异程度也
26、随之确定。所以在选定抽样方式和方法后,要缩小抽样平均误定抽样方式和方法后,要缩小抽样平均误差,必须保证足够多的样本容量差,必须保证足够多的样本容量n n4 4、抽样组织的方式、抽样组织的方式2 2、抽样平均数极限误差:、抽样平均数极限误差:抽样成数极限误差:抽样成数极限误差:Xxx3 3 总体总体指标的推断指标的推断一、抽样极限误差一、抽样极限误差1 1、样本指标与总体指标之差的绝对值的、样本指标与总体指标之差的绝对值的最大值为抽样极限误差最大值为抽样极限误差Ppp3 3、一般通过抽样平均误差计算抽样极、一般通过抽样平均误差计算抽样极限误差限误差xtxptp t t叫概率度,叫概率度, 一个概
27、率度对应一个概率保一个概率度对应一个概率保证程度证程度F F(t t)可通过查正态分布表得到对应的可通过查正态分布表得到对应的t t与与F F(t t)常用的常用的t t 值及所对应概率的关系值及所对应概率的关系: 99.73% 99.73%3 3 95.45% 95.45%2 2 68.27% 68.27%95%95%1 1 1.96 1.96概率概率F F(t t)概率度(概率度( t t )4 4、例、例8 8-3-1-3-1:设成人身高的达标值为:设成人身高的达标值为165165厘米。从一批成年人中随机抽厘米。从一批成年人中随机抽7 7人,得身人,得身高分别为高分别为155155、16
28、0160、165165、170170、175175、180180、185185(厘米)。(厘米)。要求:以要求:以95.45%95.45%的概率保证度求平均身的概率保证度求平均身高的极限误差;高的极限误差; 以以99.73%99.73%的概率保证度求身高达的概率保证度求身高达标率的极限误差。标率的极限误差。 解:解:x= 170= 17010 xn71078. 3F F(t t)= 95.45%= 95.45%, 则则t= 2t= 2xtx56. 7278. 3所以,所以,(厘米)(厘米)(厘米)(厘米)厘米厘米p75%43.71nppp172857. 07143. 0= 17.07% ptp
29、 %21.513%07.17所以,所以,F F(t t)= 99.73%= 99.73%, 则则t= 3t= 3二、总体二、总体指标的推断方法指标的推断方法1 1、点估计、点估计三、区间估计三、区间估计区间估计就是根据样本指标和抽样区间估计就是根据样本指标和抽样极限误差以一定把握程度推断总体指标极限误差以一定把握程度推断总体指标的区间范围。的区间范围。在一定概率保证程度下:在一定概率保证程度下:XxxxxXxx Ppppp Ppp 2 2、区间估计的三要素为:、区间估计的三要素为:估计值估计值抽样误差范围抽样误差范围概率保证程度概率保证程度 应用区间估计时要注意:应用区间估计时要注意:()所求
30、出的区间只是一个可能范围,()所求出的区间只是一个可能范围,而不是一个完全肯定的范围。而不是一个完全肯定的范围。()所估计的区间大小(估计的精确()所估计的区间大小(估计的精确度)是与概率保证程度紧密联系的。度)是与概率保证程度紧密联系的。 (二)实(二)实例例例例8 8-3-2-3-2:某农场进行小麦产量抽样调查,小麦:某农场进行小麦产量抽样调查,小麦播种总面积为播种总面积为1 1万亩,采用不重复简单随机抽样,万亩,采用不重复简单随机抽样,从中抽选了从中抽选了100100亩作为样本进行实割实测,测得亩作为样本进行实割实测,测得样本平均亩产样本平均亩产400400斤,方差斤,方差144144斤
31、。斤。以以95.45%95.45%的可靠性推断小麦平均亩产的区间的可靠性推断小麦平均亩产的区间解:解: N=10000n=100 9545. 0,144,4002tFx(1 1)计算抽样平均误)计算抽样平均误差差 斤19. 110000100110014412Nnnx(2 2)计算抽样极限误差)计算抽样极限误差斤38.219.12xtx(3 3)计算总体平均数的置信区间)计算总体平均数的置信区间上限:上限: 斤38.40238. 2400 xx下限:下限: 斤62.39738. 2400 xx即:以即:以95.45%95.45%的可靠性估计该农场小麦平均的可靠性估计该农场小麦平均亩产量在亩产量
32、在397.62397.62斤至斤至402.38402.38斤之间斤之间. . 例例8 8-3-3 -3-3 :某纱厂某时期内生产了:某纱厂某时期内生产了1010万个单万个单位的纱,按纯随机抽样方式抽取位的纱,按纯随机抽样方式抽取20002000个单位检个单位检验,结果合格率为验,结果合格率为95%95%,试以,试以95%95%的把握程度估的把握程度估计全部纱合格品率的区间计全部纱合格品率的区间100000N2000n%95p%51 p 95.0tF96. 1tNnnppp11%48. 010000020001200005. 095. 0%94. 0%48. 096. 1ppt区间下限:区间下限
33、:%06.940094. 095. 0pp区间上限:区间上限:%94.950094. 095. 0pp解:解:例例8 8-3-4:-3-4:对一批电子元件进行耐用性能的检查,对一批电子元件进行耐用性能的检查,随机重置抽样方法选取随机重置抽样方法选取100100件作耐用测试,所得件作耐用测试,所得结果的分组资料如下:结果的分组资料如下:100100合计合计 18 185500550050005000以上以上 50 50450045004000400050005000 30 30 3500 35003000300040004000 2 2 2500 250030003000以下以下件数(件数(f
34、f)组中值(组中值(x x)耐用时数耐用时数(小时)(小时)试以试以95.45%95.45%的把握程度估计这批产品的平均耐的把握程度估计这批产品的平均耐用时数用时数解解: : (1)(1)、计算样本平均数和样本标准差、计算样本平均数和样本标准差)(73110018)43405500(2)43402500(4340100434000222小时)(小时) ffxxsfxfx(2)(2)、计算极限误差、计算极限误差(小时)小时2 .1461 .7322%45.95)()( 1 .73100731tttFnsx(3)(3)、估计区间的下限:估计区间的下限:43404340146.2=4193.8146
35、.2=4193.8小时小时估计区间的上限:估计区间的上限:43404340146.2=4486.2146.2=4486.2小时小时 所以,这批电子元件的平均耐用时数在所以,这批电子元件的平均耐用时数在4193.84193.8小时至小时至4486.24486.2小时之间,可靠程度为小时之间,可靠程度为95.45%95.45%。区间估计区间估计例例8 8-3-5:-3-5:上例中上例中, ,如果如果30003000小时以下为不合格品小时以下为不合格品(1)(1)以同样的把握程度估计这批产品的合格率以同样的把握程度估计这批产品的合格率; ;(2)(2)如果共有如果共有2000020000件产品件产品
36、, ,至少有多少件合格品。至少有多少件合格品。解解:(1):(1)%8 . 2%4 . 12%4 . 1100)98. 01 (98. 01%98100981ppptnppnnp)(估计的下限:估计的下限:98%98%2.8% = 95.2%2.8% = 95.2%估计的上限:估计的上限:98%98%2.8% = 100%2.8% = 100% 所以,这批电子元件的合格品率在所以,这批电子元件的合格品率在95.2%95.2%至至100%100%之间,可靠程度为之间,可靠程度为95.45%95.45%。(2)(2)至少有至少有200002000095.2%=1904095.2%=19040件合格
37、品件合格品例例8 8-3-6-3-6对某广播电台的对某广播电台的800800名经常听众进名经常听众进行调查,发现有行调查,发现有600600名是青少年,要求误名是青少年,要求误差范围不超过差范围不超过3%3%。试估计全部听众中青少。试估计全部听众中青少年听众所占比重的区间范围。年听众所占比重的区间范围。解:已知解:已知 n=800 n=800%3p%53. 180025. 075. 0)1 (%75800600npppp,96. 1%53. 1%3ppt查表查表F F(t)=95%t)=95% 4 4、抽样方案的设计、抽样方案的设计一、抽样设计必须掌握两个基本原则:一、抽样设计必须掌握两个基本
38、原则:(二)、保证实现最大的抽样效果原(二)、保证实现最大的抽样效果原则,即在一定的调查费用条件下,选则,即在一定的调查费用条件下,选取抽样误差最小的方案;或在给定精取抽样误差最小的方案;或在给定精确度的要求下,做到调查费用最少。确度的要求下,做到调查费用最少。(一)、保证实现抽样的随机性原则(一)、保证实现抽样的随机性原则二、抽样调查的几种常用形式二、抽样调查的几种常用形式简单随机抽样简单随机抽样类型抽样类型抽样等距抽样等距抽样整群抽样整群抽样多阶段抽样多阶段抽样( (一一) )、简单随机抽样、简单随机抽样( (纯随机抽样纯随机抽样) )即从总体单位中不加任何分组、即从总体单位中不加任何分组
39、、排队,完全随机地抽取调查单位。排队,完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:随机抽选可有各种不同的具体做法,如:1.1.直接抽选法;直接抽选法;2.2.抽签法;抽签法;3.3.随机数码表法;随机数码表法;( (二二) )、类型抽样、类型抽样( (分类抽样分类抽样) )先对总体各单位按一定标志加以先对总体各单位按一定标志加以分类分类( (层层) ),然后再从各类,然后再从各类( (层层) )中按随机中按随机原则抽取样本,组成一个总的样本。原则抽取样本,组成一个总的样本。 类型的划分:类型的划分:一一是必须有清楚的划类界限;是必须有清楚的划类界限;二二是必须知道各类中的单位数
40、目和比例;是必须知道各类中的单位数目和比例;三三是分类型的数目不宜太多。是分类型的数目不宜太多。类型抽样的好处是:类型抽样的好处是:样样本代表性高、抽样误差小、抽本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。求相同的话则抽样数目可以减少。两种类型:两种类型:1.1.等等比例类型抽样比例类型抽样( (类型比例抽样类型比例抽样) );2.2.不不等比例类型抽样等比例类型抽样( (类型适宜类型适宜抽样抽样) )。( (三三) )、机械抽样、机械抽样( (等距抽样等距抽样) ) 先先将全及总体的所有单位按某一标志顺将全及总体的所
41、有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。序排队,然后按相等的距离抽取样本单位。排列次序用的标志有两种:排列次序用的标志有两种:1. 1. 选选择标志与抽样调查所研究内容无择标志与抽样调查所研究内容无关,称无关标志排队。关,称无关标志排队。2. 2. 选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关, 称有关标志排队。称有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资研究工人的生活水平,按工人月工资额高低排队。额高低排队。例例机械抽样的好处:机械抽样的好处: 1. 1. 可可以使抽
42、样过程大大简化,减轻以使抽样过程大大简化,减轻抽样的工作量;抽样的工作量;2. 2. 如如果用有关标志排队,还可以缩果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。小抽样误差,提高抽样推断效果。机械抽样机械抽样,实际上是一种特殊的类,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽抽一个样本,在这种情况下,则类型抽样就成了机械抽样。样就成了机械抽样。( (四四) )、整群抽样、整群抽样 整群抽样整群抽样即从全及总体中成群地即从全及总体中成群地抽取
43、样本单位,对抽中的群内的所有抽取样本单位,对抽中的群内的所有单位都进行观察。单位都进行观察。整群抽样的好处:整群抽样的好处:组织工作比较简组织工作比较简单方便,适用于一些特殊的研究对象。单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的其不足之处是,一般比其它抽样方式的抽样误差大。抽样误差大。( (五五) )、多阶段抽样、多阶段抽样 即把抽样本单位的过程分为两个或几即把抽样本单位的过程分为两个或几个阶段来进行。个阶段来进行。(如果一次就直接抽选出具体样本单位,(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲:这叫单阶段抽样)具体讲: 先抽大单先抽大单位位( (可以用
44、类型抽样或机械抽样可以用类型抽样或机械抽样) ), 再再在大单位中抽小单位在大单位中抽小单位( (可用整群抽样或简可用整群抽样或简单随机抽样单随机抽样) ),小单位中再抽更小的单,小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单位;而不是一次就直接抽取基层的调查单位。位。三、必要抽样单位数的确定三、必要抽样单位数的确定指为了使抽样误差不超过给定的允许范围指为了使抽样误差不超过给定的允许范围至少应抽取的样本单位数目。至少应抽取的样本单位数目。(一)简单随机抽样下必要抽样单位数(一)简单随机抽样下必要抽样单位数的确定的确定1 1、由样本平均数估计总体平均数时、由样本平均数估计总体平均数时重
45、复抽样:重复抽样:n= n= xt222 不重复抽样:不重复抽样:n= n= 22222ttxNN不重复抽样:不重复抽样:n=n=pPPt212PPtpNPPtN122122 2、由样本成数估计总体成数时、由样本成数估计总体成数时重复抽样:重复抽样:n= n= 解:解: xtn222202502222=625=625(户)(户) 例例8 8-3-6-3-6: 根据历史资料,某市职工家根据历史资料,某市职工家庭年收入的标准差为庭年收入的标准差为250250元现再次调查收元现再次调查收入状况,要求在入状况,要求在95.45%95.45%的把握度下平均的把握度下平均年收入的允许误差不超过年收入的允许
46、误差不超过2020元,问应抽元,问应抽多少户家庭调查?多少户家庭调查? 例例8 8-3-7-3-7:调查一批零件的合格率,根据:调查一批零件的合格率,根据过去的资料,合格率为过去的资料,合格率为97%97%。如果要求误差。如果要求误差不超过不超过1%1%,把握程度为,把握程度为95%95%,问需抽多少个,问需抽多少个零件检查?零件检查? 解:解: pPPtn21201. 096. 12203. 097. 0=1118=1118(件)(件) (二)必要抽样单位数的影响因素(二)必要抽样单位数的影响因素1 1、概率保证程度、概率保证程度2 2、总体各单位在被研究标志上的差异程度、总体各单位在被研究
47、标志上的差异程度4 4、不同的抽样方法、不同的抽样方法5 5、不同的抽样组织方式、不同的抽样组织方式 最后,要考虑调查的人力、物力、财最后,要考虑调查的人力、物力、财力的许可情况力的许可情况3 3、允许误差范围、允许误差范围第六章第六章 抽样推断抽样推断一、判一、判 断断 对对 错错1 1、样本统计量是一个随机变量。(、样本统计量是一个随机变量。( )2 2、抽样极限误差总是大于抽样平均误差。、抽样极限误差总是大于抽样平均误差。 ( )3 3、在抽样推断中,作为推断的总体和和为观察对象的样本都是、在抽样推断中,作为推断的总体和和为观察对象的样本都是 确定的、唯一的。确定的、唯一的。 ( )4 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。高抽样估计的精确度。 ( )5 5、在其它条件固定时,重复抽样的抽样误
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 育婴师在职能力评估试题及答案
- 艾滋病azt试题及答案2020
- 激光工程师的职业定位考题试题及答案
- 考中取胜的初级会计师试题及答案
- 现代图书管理员素质模型试题及答案
- 服装开发考试题及答案
- 畜牧经营管理试题及答案
- 新课标2024春高中语文第十三课宇宙的未来第2课时针对性训练含解析新人教版必修5
- 网络规划设计师考试的个人经验分享及试题及答案
- 药品不良反应处理技巧试题及答案
- 小学语文中国诗词飞花令集锦
- 甲状腺结节射频消融治疗
- NC63全产品培训课件-合同管理
- 2024年中信银行唐山分行招聘管理单位遴选500模拟题附带答案详解
- 天车技能培训
- 租车位安装充电桩合同范本
- 七年级上册地理填图训练
- 幼儿园孩子食物中毒培训
- 人教版(2024)英语七年级上册单词表
- 建筑工程cad课程说课
- 独山玉饰品质量等级评价DB41-T 1435-2017
评论
0/150
提交评论