第五章 参数估计_第1页
第五章 参数估计_第2页
第五章 参数估计_第3页
第五章 参数估计_第4页
第五章 参数估计_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 参数估计参数估计第一节第一节 抽样分布抽样分布第二节第二节 点估计与估计量的评价标准点估计与估计量的评价标准第三节第三节 简单随机抽样的区间估计简单随机抽样的区间估计第四节第四节 样本容量的确定样本容量的确定第一节第一节 抽样分布抽样分布一、抽样推断的概念及特点一、抽样推断的概念及特点指样本单位的抽取不受主观因素及指样本单位的抽取不受主观因素及其他系统性因素的影响,其他系统性因素的影响,每个总体每个总体单位都有均等的被抽中机会单位都有均等的被抽中机会按照按照 随机原则随机原则 从全部研究对象中抽取一部分单位从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体数量特征作出具有

2、一定可靠程进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估计与推断,度的估计与推断,以反映总体的数量特征和数量表现以反映总体的数量特征和数量表现,从而认,从而认识总体的一种统计方法。识总体的一种统计方法。随机抽样的目的随机抽样的目的随机抽样的目的是使样本与总体同分布随机抽样的目的是使样本与总体同分布。抽样推断的特点抽样推断的特点(1)抽样推断是由部分推断总体的一种认识)抽样推断是由部分推断总体的一种认识 方法。方法。(2)抽样推断是建立在随机取样的基础上的。)抽样推断是建立在随机取样的基础上的。(3)抽样推断运用概率估计的方法。)抽样推断运用概率估计的方法。(4)抽样推断的误差可以

3、事先计算并加以控)抽样推断的误差可以事先计算并加以控 制。制。二、抽样推断的内容 抽样推断的内容有参数估计和假设检验两抽样推断的内容有参数估计和假设检验两方面。方面。 1.参数估计:参数估计是依据所获得的样本参数估计:参数估计是依据所获得的样本观察资料,对所研究现象总体数量特征进观察资料,对所研究现象总体数量特征进行估计。行估计。 2.假设检验:(第六章)假设检验:(第六章) 统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验1 1、对、对无限总体无限总体全面情况的了解,必须采用抽样推断。全面情况的了解,必须采用抽样推断。2 2、对、对破坏性或消耗性破坏性或消耗性

4、检查,必须采用抽样调查。检查,必须采用抽样调查。3 3、对某些可以但、对某些可以但事实上不必或不可能事实上不必或不可能进行全面调查的进行全面调查的 现象总体,可以采用抽样推断获取相关资料。现象总体,可以采用抽样推断获取相关资料。4 4、抽样调查可以对全面调查得来的资料进行、抽样调查可以对全面调查得来的资料进行验证验证,并,并据以进行据以进行补充和修改补充和修改。5 5、抽样推断可以用于生产过程的、抽样推断可以用于生产过程的质量控制质量控制。 抽样推断的应用抽样推断的应用有关抽样的基本概念有关抽样的基本概念全及总体和样本全及总体和样本 全及总体:研究对象全体,简称总体,又称母体。容量用全及总体:

5、研究对象全体,简称总体,又称母体。容量用 N表示。表示。具备惟一性具备惟一性。 样本:样本又称子样或样本总体、抽样总体,按随机原则样本:样本又称子样或样本总体、抽样总体,按随机原则从总体中抽出的部分单位的全体,被抽出的每个单位称样本单从总体中抽出的部分单位的全体,被抽出的每个单位称样本单位。容量用位。容量用 n表示。表示。样本不具惟一性样本不具惟一性。 例如:在例如:在100100万户居民中,随机抽取万户居民中,随机抽取10001000户居民进行家庭户居民进行家庭收支情况调查收支情况调查。其中的。其中的100万户居民就是全及总体,而被抽中万户居民就是全及总体,而被抽中的的1000户居民则构成样

6、本。户居民则构成样本。样本容量和样本个数样本容量和样本个数 样本容量样本容量 样本容量是指样本所包含的单位数样本容量是指样本所包含的单位数(n)。 它关系到调查的结果。它关系到调查的结果。大样本:大样本:n30小样本:小样本:n n 30) 30) ,样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布中心极限定理:中心极限定理:设从均值为设从均值为 ,方差为,方差为 2 2的一个任意总体的一个任意总体中抽取容量为中抽取容量为n n的样本,当的样本,当n n充分大时,样本均值的抽样分布充分大时,样本均值的抽样分布近似服从均值为近似服从均值为、方差为、方差为2 2/n/n的正态分

7、布。的正态分布。个任意分个任意分布的总体布的总体X当总体服从正态分布当总体服从正态分布N N (,(,2 2 ) )时,来自该总体的所时,来自该总体的所有容量为有容量为n n的样本的均值的样本的均值 X X也服从正态分布,也服从正态分布, X X 的数学期望的数学期望为为,方差为,方差为2 2/n/n。即。即 X XN(,N(,2 2/n)/n)关于均值的抽样分布有如下的一些结论关于均值的抽样分布有如下的一些结论:1.对于多数总体分布来说,不论其形态如何,如果样本观察对于多数总体分布来说,不论其形态如何,如果样本观察值值超过超过30个个,那么均值的抽样分布将,那么均值的抽样分布将近似于正态分布

8、近似于正态分布。2.2.如果总体分布是明显对称的,那么只要样本观察值超过如果总体分布是明显对称的,那么只要样本观察值超过15个,均值的抽样分布也近似于正态分布。个,均值的抽样分布也近似于正态分布。 3.3.如果总体是正态分布的,则不管样本大小如何,均值的抽如果总体是正态分布的,则不管样本大小如何,均值的抽样分布一定是正态分布的。样分布一定是正态分布的。 抽样误差的意义抽样误差的意义 用抽样指标来估计全及指标是否可行,关键问题在于抽样误用抽样指标来估计全及指标是否可行,关键问题在于抽样误差,抽样误差大小表明抽样效果好坏差,抽样误差大小表明抽样效果好坏。如果误差超过了允许的如果误差超过了允许的限度

9、,抽样调查就失去了价值限度,抽样调查就失去了价值。抽样误差的概念及影响因素抽样误差的概念及影响因素在统计调查过程中,产生统计误差的原因主要有两类在统计调查过程中,产生统计误差的原因主要有两类: :抽样误差产生的原因抽样误差产生的原因一类是登记性误差一类是登记性误差: : 调查过程中由于各环节工作不准确而引起的误差。例如,调查方调查过程中由于各环节工作不准确而引起的误差。例如,调查方案中有关规定或解释不明确导致的填报错误;由于工作失误造成的计案中有关规定或解释不明确导致的填报错误;由于工作失误造成的计量错误、计算错误、抄录错误和汇总错误;以及调查者或被调查者有量错误、计算错误、抄录错误和汇总错误

10、;以及调查者或被调查者有意弄虚作假,虚报瞒报。意弄虚作假,虚报瞒报。 二类是代表性误差二类是代表性误差:即样本各单位的结构情况不足以代表总体特征而引起的误差。 系统性误差:违反随机原则系统性误差:违反随机原则(可以消除)(可以消除)随机性误差:随机性因素影响随机性误差:随机性因素影响(即抽样误差,必然存在,但可以用抽样方(即抽样误差,必然存在,但可以用抽样方法、样本容量等手段控制)法、样本容量等手段控制)用设计、培训、管理等方法可以消除用设计、培训、管理等方法可以消除 抽样误差是由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标与全及指标之间的绝对离差。 抽样误

11、差产生的原因抽样误差产生的原因 例例: :某班有某班有100100个同学个同学, ,男生男生6060名名, ,女生女生4040名名, ,现抽取现抽取1010名同学名同学为样本为样本, ,由于随机原因未必能抽到由于随机原因未必能抽到6 6名男生名男生4 4名女生名女生, ,使得由样本使得由样本计算的性别比例指标不能代表班级同学的性别比例指标计算的性别比例指标不能代表班级同学的性别比例指标, ,而发生而发生误差。误差。抽样误差的影响因素抽样误差的影响因素抽样误差是抽样调查固有的抽样误差是抽样调查固有的, ,但可计算并控制但可计算并控制. .1.1.总体各单位标志值的差异程度总体各单位标志值的差异程

12、度 标志变异程度愈大,在其他条件给定下标志变异程度愈大,在其他条件给定下, ,抽样误差越大。抽样误差越大。如果标志之间没有差异,每一个单位的标志都一样,则抽出任如果标志之间没有差异,每一个单位的标志都一样,则抽出任何一个单位都可代表总体,这时也就不存在抽样误差了。何一个单位都可代表总体,这时也就不存在抽样误差了。抽样误差的影响因素2.2.样本的单位数样本的单位数 在其他条件相同的情况下在其他条件相同的情况下, ,样本单位数越多,抽样误差越小。样本单位数越多,抽样误差越小。可以想象,当把样本容量可以想象,当把样本容量n n扩大到等于总体容量扩大到等于总体容量N N时,抽样调查时,抽样调查也就等于

13、全面调查,抽样误差也就随之消失。也就等于全面调查,抽样误差也就随之消失。 抽样误差的影响因素3.3.抽样的方法抽样的方法 对同一总体抽样对同一总体抽样, ,不重复抽样误差小于重复抽样误差。因为不重复抽样误差小于重复抽样误差。因为重复抽样有可能使同一单位被多次抽中,因而产生的样本对总重复抽样有可能使同一单位被多次抽中,因而产生的样本对总体的代表性就较差。当然,这两种方式产生的差别也仅在总体体的代表性就较差。当然,这两种方式产生的差别也仅在总体不很大时才有体现。不很大时才有体现。抽样误差的影响因素4.4.抽样调查的组织形式抽样调查的组织形式 抽样组织的方式有简单随机抽样、类型抽样、整群抽样、抽样组

14、织的方式有简单随机抽样、类型抽样、整群抽样、机械抽样等。简单随机抽样的抽样误差最大。机械抽样等。简单随机抽样的抽样误差最大。 抽样误差可以从绝对差额和平均差额抽样误差可以从绝对差额和平均差额这两方面来度量。这两方面来度量。抽样误差的测定抽样误差的测定绝对差额绝对差额平均差额平均差额抽样成数的抽样误差抽样平均数的抽样误差:PX 某次抽样指标与总体指标之间的误差。某次抽样指标与总体指标之间的误差。(一一)抽样误差绝对差额抽样误差绝对差额 实际误差实际误差 由于不同的抽样所得到的样本值不尽相同,这样抽样由于不同的抽样所得到的样本值不尽相同,这样抽样指标也就成为随机变量,它有不确定的值。而某一被估指标

15、也就成为随机变量,它有不确定的值。而某一被估计的总体指标值是未知的,正是需要估计的计的总体指标值是未知的,正是需要估计的 实际抽样误差实际上是测定不到的。实际抽样误差实际上是测定不到的。抽样误差绝对差额抽样误差绝对差额实际误差实际误差抽样成数的抽样误差抽样平均数的抽样误差:PX 总体指标是确定的,但是未知的,总体指标是确定的,但是未知的, 从一个总体中可能抽取从一个总体中可能抽取许多个样本,所以抽样指标许多个样本,所以抽样指标(抽样平均数或抽样成数抽样平均数或抽样成数)是随不同样是随不同样本而有不同取值,它与总体指标本而有不同取值,它与总体指标(总体平均数或总体成数总体平均数或总体成数)的误差

16、的误差就有大有小就有大有小 有必要用一个指标来衡量抽样误差的一般水平有必要用一个指标来衡量抽样误差的一般水平 抽样平抽样平均误差。均误差。(二二)抽样误差平均差额抽样误差平均差额 平均误差平均误差 1.1.如果采取重复抽样,则抽样平均数的平均误差与总体的变如果采取重复抽样,则抽样平均数的平均误差与总体的变异程度以及样本容量大小有关:异程度以及样本容量大小有关:抽样平均数的平均误差的计算抽样平均数的平均误差的计算 nxDnxnDxDniinii212111设总体均值为,总体方差为2 ,则有:数理统计证明,在简单随机抽样的条件下,数理统计证明,在简单随机抽样的条件下, 为总体标准差,为总体标准差,

17、n为样本单位为样本单位数,在总体标准差数,在总体标准差未知时,可未知时,可用样本标准差用样本标准差 s 代替。代替。nnX2 2.2.如果采取不重复抽样,则抽样平均数的平均误差不但和如果采取不重复抽样,则抽样平均数的平均误差不但和总体变异程度、样本容量有关,而且还与总体单位数有关:总体变异程度、样本容量有关,而且还与总体单位数有关:抽样平均数的平均误差的计算抽样平均数的平均误差的计算为修正因子。为总体标准差,为总体标准差,n为样本为样本单位数,单位数,N为总体单位数。为总体单位数。)1-(2NnNnX 1.1.如果采取重复抽样,则:如果采取重复抽样,则: 2.2.如果采取不重复抽样,则:如果采

18、取不重复抽样,则:抽样成数的平均误差的计算抽样成数的平均误差的计算nnP)-1 (2)1-()-1 (2NnNnnP 有限总体有限总体 修正系数修正系数1NnNNn1 当当N N足够大足够大nNnNx21nx2 用于不重复抽样用于不重复抽样 用于重复抽样用于重复抽样 【例】【例】 从某校从某校8000名学生中随机抽取名学生中随机抽取400人,称得其平人,称得其平均体重为均体重为58公斤,标准差为公斤,标准差为10公斤,计算抽样平均误差。公斤,计算抽样平均误差。 【解【解】222100.5400Snn公斤在不重复抽样条件下为:在不重复抽样条件下为:2210400110.494008000nnN公

19、斤在重复抽样条件下为:在重复抽样条件下为: 【例】有一批食品罐头共【例】有一批食品罐头共60 000瓶,从中随机抽取瓶,从中随机抽取300瓶,发瓶,发现有现有6瓶不合格,求合格率的抽样平均误差。瓶不合格,求合格率的抽样平均误差。 【解【解】 在重复抽样条件下为:在重复抽样条件下为:10.981 0.980.008080.81%300PPPn30060.9898%300P在不重复抽样条件下:在不重复抽样条件下:10.981 0.98300110.008060.81%30060000PPPnnN(其中,合格率(其中,合格率 ) 2()M2nn总体均方差已知总体均方差已知2()1NnnN若总体均方差

20、若总体均方差 未知:未知:v用样本均方差用样本均方差代替代替v用历史资料代替用历史资料代替v用试验结果估算用试验结果估算2()1Snnns或22()11XSornfSfX(1)()1PNnnN(1)Pn(1)(1)()1PPPPPPnnn 或 总体成数总体成数 的均方差已知的均方差已知 若若总体成数的均方差未知总体成数的均方差未知 按照质量规定,电灯泡使用寿命在按照质量规定,电灯泡使用寿命在10001000小时以上者小时以上者为合格品,可按以上资料计算抽样平均误差。为合格品,可按以上资料计算抽样平均误差。例例:某灯泡厂对某灯泡厂对10000个产个产品进行使用品进行使用寿命检验,寿命检验,随机抽

21、取随机抽取2%样本进行测样本进行测试,所得资试,所得资料如右表。料如右表。,63.531-,2ffSXX1057fXfX%5 .91200183P求灯泡平均使用时求灯泡平均使用时 间、标准差和灯泡间、标准差和灯泡 合格率(样本)合格率(样本)小时79. 320063.532nX在不重复抽样下,抽样平均误差:在不重复抽样下,抽样平均误差:7541. 3)100002001 (200)63.53()1 ()1 (222NnnSNnnX在重复抽样下,抽样平均误差:在重复抽样下,抽样平均误差:求灯泡使用时间抽样平均误差:求灯泡使用时间抽样平均误差:1057fXfX,63.53,2ffSXX%5 .91

22、200183P求灯泡平均使用时间、标准差和灯泡合格率(样本)求灯泡平均使用时间、标准差和灯泡合格率(样本)求灯泡合格率的抽样平均误差:求灯泡合格率的抽样平均误差: 在重复抽样下,抽样平均误差:在重复抽样下,抽样平均误差:%97. 1200085. 0915. 01nP在不重复抽样下,抽样平均误差:在不重复抽样下,抽样平均误差:00952. 1)100002001 (200085. 0915. 0)1 ()1 (NnnP 抽样估计就是利用实际调查计算的抽样估计就是利用实际调查计算的样本指标值样本指标值来估计来估计相应的相应的总体指标的数值总体指标的数值,由于总体指标是表明总体数量特,由于总体指标

23、是表明总体数量特征的参数,所以也称为征的参数,所以也称为参数估计参数估计。 分为分为点估计点估计与与区间估计区间估计。参数估计参数估计第二节第二节 点估计与估计量的评价标准点估计与估计量的评价标准 总体参数的点估计总体参数的点估计 点估计点估计是以是以抽样指标数值抽样指标数值直接作为直接作为总体指标估计值总体指标估计值的一的一种估计方法,又称定值估计种估计方法,又称定值估计 。例如,对一批某种型号的电子元件例如,对一批某种型号的电子元件10000只进行耐用时间检查,只进行耐用时间检查,随机抽取随机抽取100只,测试的平均耐用时间为只,测试的平均耐用时间为1055小时,合格率为小时,合格率为91

24、%,我们推断说我们推断说10000只电子元件的平均耐用时间为只电子元件的平均耐用时间为1055小时,全部电小时,全部电子元件的合格率也是子元件的合格率也是91%。 总体参数的点估计总体参数的点估计 点估计点估计是以是以抽样指标数值抽样指标数值直接作为直接作为总体指标估计值总体指标估计值的一的一种估计方法,又称定值估计种估计方法,又称定值估计 。简单,具体明确简单,具体明确优点优点缺点缺点无法控制误差,仅适用于对推断的准确程度与可无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况靠程度要求不高的情况参数点估计的基本特点参数点估计的基本特点 根据总体指标的结构形式设计样本指标作为总体参

25、数的根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估估计量,并以样本指标的实际值直接作为相应总体参数的估计值。计值。 第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数? 第二,如果有两个以上的统计量可以用来估计某个总体参数,其估计结果是否一致?是否一个统计量要优于另一个?oex 对于总体的同一个特征数,可以构造出若干对于总体的同一个特征数,可以构造出若干个不同的统计量作为其估计量。个不同的统计量作为其估计量。那么哪一个估那么哪一个估计量更好,需要建立一个评价估计量好计量更好,需要建立一个评价估计量好坏的准则。坏的准则。问题问题 作

26、为总体参数估计量的样本统计量,要求其期望值作为总体参数估计量的样本统计量,要求其期望值(平均数)等于被估计的总体参数。这样的估计量称为(平均数)等于被估计的总体参数。这样的估计量称为抽样估计的优良标准抽样估计的优良标准 就是说,虽然每一次的抽样指标就是说,虽然每一次的抽样指标( (如如x,p等等) )和未知的全及和未知的全及指标指标( (如如X X,P P等等) )可能不相同,但在多次反复的估计中各个抽样可能不相同,但在多次反复的估计中各个抽样指标的平均数应等于全及指标,即抽样指标平均来说与全及指指标的平均数应等于全及指标,即抽样指标平均来说与全及指标是没有偏误的。标是没有偏误的。 无偏估计量

27、。无偏估计量。若,则称若,则称 为为 的无偏估计量的无偏估计量)(E 作为优良估计量的作为优良估计量的样本容量充分大样本容量充分大时,抽样指标也应充分时,抽样指标也应充分地靠近总体指标。地靠近总体指标。 较大时的抽样分布n较小时的抽样分布n两个不同容量样本的点估计量的抽样分布两个不同容量样本的点估计量的抽样分布 以抽样指标估计总体指标以抽样指标估计总体指标要求作为优良估计量的方要求作为优良估计量的方差应比其它估计量的方差小差应比其它估计量的方差小。eM的抽样分布的抽样分布的抽样分布的抽样分布 自正态总体抽样时,自正态总体抽样时,总体均值与总体中位数总体均值与总体中位数相同,而中位数的标准相同,

28、而中位数的标准误差大约比均值的标准误差大约比均值的标准误差大误差大25%。因此,样。因此,样本均值更有效。本均值更有效。为为 的无偏、有效、一致估计量;的无偏、有效、一致估计量; 1nSP 为为 的无偏、有效、一致估计量;的无偏、有效、一致估计量; 为为 的无偏、有效、一致估计量。的无偏、有效、一致估计量。数理统计证明:数理统计证明:抽样估计的优良标准抽样估计的优良标准置信度的意义置信度的意义v 从主观上说,我们希望被估计的总体指标都能落在允许的误从主观上说,我们希望被估计的总体指标都能落在允许的误差范围内,但这并非都能实现。差范围内,但这并非都能实现。样本指标随样本的变动而变动,它本身是个随

29、机变量,因而样样本指标随样本的变动而变动,它本身是个随机变量,因而样本指标和总体指标之间的本指标和总体指标之间的误差仍然是一个随机变量误差仍然是一个随机变量。 不能保证误差不超过一定范围,而只能给予不能保证误差不超过一定范围,而只能给予一定程度的概率保一定程度的概率保证证。 第三节第三节 简单随机抽样的区间估计简单随机抽样的区间估计v 设设 和和 分别为总体参数分别为总体参数 区间估计的下限和上限,则区间估计的下限和上限,则要求要求 v 称为区间估计的称为区间估计的显著性水平(显著性水平(常取常取1%1%、5%5%、10% 10% v 称为称为置信度置信度(置信水平)常取置信水平)常取 99%

30、, 95%, 90%;抽样估计的抽样估计的置信度置信度是表明样本指标和总体参数之间的误是表明样本指标和总体参数之间的误 差不超过一定范围的概率差不超过一定范围的概率(估计的可靠性问题)。(估计的可靠性问题)。v 是置信度为是置信度为 的的 置信区间置信区间。12()1P 12(01)112 , 1)(zF)(zF 在实际进行抽样调查时,误差太大或太小都会给抽样工在实际进行抽样调查时,误差太大或太小都会给抽样工作造成不利影响。因此对于该项抽样调查,应根据研究对象作造成不利影响。因此对于该项抽样调查,应根据研究对象的差异程度和分析任务的需要来确定一个允许误差的范围。的差异程度和分析任务的需要来确定

31、一个允许误差的范围。这一允许误差的范围,就称作极限误差。这一允许误差的范围,就称作极限误差。 抽样极限误差抽样极限误差 抽样极限误差:抽样极限误差:样本估计值与总体参数之间所允许的样本估计值与总体参数之间所允许的最最大绝对误差大绝对误差 。表示抽样误差的可能范围,又称允许误差。表示抽样误差的可能范围,又称允许误差。 XPXP 等等 价价PPXXPPXX例:要估计一批产品的合格率,从例:要估计一批产品的合格率,从1000件产品中抽取件产品中抽取200件,件,其中有其中有10件不合格品,如果确定抽样极限误差的范围为件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。试估计产品合格

32、率的范围。样本成数样本成数 p=190/200=95%总体成数下限总体成数下限=95%-2%=93%总体成数上限总体成数上限= 95%+2%=97%即该产品合格率在即该产品合格率在93%97%之间。之间。PPXXPPXXX例:如要估计北京北站整车到达货物的平均运送时间。从交付例:如要估计北京北站整车到达货物的平均运送时间。从交付的全部整车货票共的全部整车货票共26 193批中,用不重复抽样抽取批中,用不重复抽样抽取2 718批货票。批货票。若允许的抽样极限误差若允许的抽样极限误差 =0.125(天),经计算知所抽取的(天),经计算知所抽取的每批货物平均运送时间为每批货物平均运送时间为 5.64

33、(天),那么北京北站整(天),那么北京北站整车到达货物的平均运送时间区间估计为车到达货物的平均运送时间区间估计为(5.640.125,5.64+0.125),即在),即在5.515到到5.765天之间。天之间。XPPXXPPXX 区间估计所表明的是一个可能范围,不是一个绝对可靠的区间估计所表明的是一个可能范围,不是一个绝对可靠的范围。范围。是用是用样本指标和它的抽样极限误差构成的区间样本指标和它的抽样极限误差构成的区间(置信区(置信区间)间)来估计总体指标,来估计总体指标,并以一定的概率保证并以一定的概率保证(置信度)(置信度)总体指总体指标将在所估计的区间内。标将在所估计的区间内。区间估计区

34、间估计PPXXPPXX PPXXPPXX区间估计必须具备的区间估计必须具备的三个要素三个要素:(1)估计值(量)估计值(量)(2)抽样误差范围(准确性)抽样误差范围(准确性)(3)概率保证程度或置信度()概率保证程度或置信度(可靠性)可靠性) 区间估计区间估计12()1P 例如:估计粮食亩产例如:估计粮食亩产600公斤,允许误差范围公斤,允许误差范围6公斤,这公斤,这意味着如果实际的粮食亩产在意味着如果实际的粮食亩产在594606公斤之间都应该认为公斤之间都应该认为估计是有效的。我们把允许误差的区间估计是有效的。我们把允许误差的区间594606公斤称为估公斤称为估计区间。计区间。1评价一个置信

35、区间的好坏有两个要素评价一个置信区间的好坏有两个要素: :p一是其一是其精度精度,显然这可以用区间的长度来刻划,长度越,显然这可以用区间的长度来刻划,长度越大,精度越低。大,精度越低。p一个要素是一个要素是置信度置信度 。在样本容量。在样本容量n固定时,当置信固定时,当置信度增大,此时置信区间的长度变大。度增大,此时置信区间的长度变大。也就是说,置信区间的置信度越高,则精度越低也就是说,置信区间的置信度越高,则精度越低 ,反之,反之,精度越高则置信度越低。精度越高则置信度越低。 例如:我们愿意冒例如:我们愿意冒10%10%的风险,这表示如果进行多次重的风险,这表示如果进行多次重复估计,则平均每

36、复估计,则平均每100100次估计将次估计将1010次是错误,次是错误,9090次估计正确。次估计正确。90%90%就称为置信度或称概率保证程度。在抽样估计中要求达就称为置信度或称概率保证程度。在抽样估计中要求达到到100%100%的置信度是难以做到的,但置信度小了,估计结论的的置信度是难以做到的,但置信度小了,估计结论的可靠性太低,又会影响估计本身的价值,所以在做估计的时可靠性太低,又会影响估计本身的价值,所以在做估计的时候,也应该根据所研究问题的性质和工作的需要确定一个可候,也应该根据所研究问题的性质和工作的需要确定一个可接受的估计置信度。接受的估计置信度。 估计置信度的要求和准确度的要求

37、应该结合起来考虑,估计置信度的要求和准确度的要求应该结合起来考虑,估计的准确度很高而置信度很低或准确很低而置信度很高都是估计的准确度很高而置信度很低或准确很低而置信度很高都是不合适的。不合适的。 12()1P 注意:注意:置信区间的论述是由置信区间的论述是由区间区间和和置信度置信度两部分组成。两部分组成。 12()1P 有些新闻媒体报道一些调查结果只给出百分比和误差(即有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。不负责的表现。)(zF68.27%95.45%99.73

38、%2(,)NnX2X3X2XX3X(1)68.27%(2)95.45%(3)99.73%XXXXXX这里这里1、2、3 等称为等称为概率度概率度,用,用 z 表示表示 极限误差可以表示为:极限误差可以表示为:抽样估计的概率度抽样估计的概率度或或XXzPPz(1)68.27%(2)95.45%(3)99.73%XXXXXX)(zF12()1P PPXXPPXX这里这里1、2、3 等称为等称为概率度概率度,用,用 z 表示表示 极限误差可以表示为:极限误差可以表示为:或或XXzPPz)(zF12()1P PPXXPPXX于是置信度于是置信度1-置信区间置信区间的上下限是:的上下限是:/2/2-XX

39、X zXz,于是置信度于是置信度1-置信区间置信区间的上下限是:的上下限是:将抽样平均误差的计算公式代入,可得置信度为将抽样平均误差的计算公式代入,可得置信度为1-的的总体均值置信区间公式:总体均值置信区间公式:放回抽样时放回抽样时不放回抽样时不放回抽样时/2/2-XXX zXz,/2Xzn/21NnXzNn概率度概率度z11.651.9622.583概率概率F(z)0.6827 0.9000 0.9500 0.95450.990.9973 常用的概率度与概率对照表常用的概率度与概率对照表 置信度置信度F(z)是概率度是概率度z的函数的函数。 数理统计中将数理统计中将 F(z)和和 z的对应关

40、系编成的对应关系编成正态分布概率正态分布概率表表,已知其中某一项,通过查表可求得另一项。,已知其中某一项,通过查表可求得另一项。 总体正态,总体正态,已知(不管样本容量大小),或总体非正态,已知(不管样本容量大小),或总体非正态,已知已知,大样本,大样本 总体正态,总体正态,未知(不管样本容量大小),或总体非正态,未知(不管样本容量大小),或总体非正态,未知未知,大样本,大样本 总体正态,总体正态,未知,大样本未知,大样本 总体非正态,小样本总体非正态,小样本 不能进行不能进行参数估计参数估计,即不能根据样本分布对总体平均数进行估计。,即不能根据样本分布对总体平均数进行估计。nZXnZX22,

41、1,122nnSSXtXtnnnSZXnSZX22【例【例】某企业生产某种产品的工人有某企业生产某种产品的工人有10001000人,某日采用不人,某日采用不重复抽样从中随机抽取重复抽样从中随机抽取100100人调查他们的当日产量,要求在人调查他们的当日产量,要求在9595的概率保证程度下,的概率保证程度下,估计该厂全部工人的日平均产量和日估计该厂全部工人的日平均产量和日总产量。总产量。总体平均数的区间估计总体平均数的区间估计按日产量分组按日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)11011011411411411411811811811812212212212212

42、61261261261301301301301341341341341381381381381421421121121161161201201241241281281321321361361401403 37 718182323212118186 64 43363368128122160216028522852268826882376237681681656056058858870070064864892928484648648600600784784合计合计100100126001260041444144XfXf2X Xf100100名工人的日产量分组资料名工人的日产量分组资料解:解:212

43、60012610041446.47199XfXfXXfSf件件2216.4710010.6141001000XSnnN件1.960.6141.203XXZ件则该企业工人人均产量则该企业工人人均产量 及日总产量及日总产量 的置信区间为:的置信区间为:N203.11261000203.11261000,203.1126203.1126N 即该企业工人人均产量在即该企业工人人均产量在124.797124.797至至127.203127.203件之间,其日件之间,其日总产量在总产量在124797124797至至127303127303件之间,估计的可靠程度为件之间,估计的可靠程度为9595。总体成数的

44、区间估计总体成数的区间估计【例【例】若上例中工人日产量在若上例中工人日产量在118118件以上者为完成生产定额件以上者为完成生产定额任务,要求在任务,要求在9595的概率保证程度下,估计该厂全部工人中完的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。成定额的工人比重及完成定额的工人总数。按按 日产量分组日产量分组(件)(件)组中值(件)组中值(件)工人数(人)工人数(人)110114114118118122122126126130130134134138138142112116120124128132136140371823211864合计合计100Xf 100名工

45、人的日产量分组资料名工人的日产量分组资料完成定额的完成定额的人数人数解:解:1011000,100,90,10,1.96,900.9,10010.90.1100111100110000.0291.960.0290.0568PPPNnnnznPnPPnnNz己 知则则该企业全部工人中完成定额的工人比重则该企业全部工人中完成定额的工人比重 及完成定额及完成定额的工人总数的工人总数 的置信区间为:的置信区间为:N0.90.05680.90.0568,1000 0.90.05681000 0.90.0568N 即该企业工人中完成定额的工人比重在即该企业工人中完成定额的工人比重在0.84320.8432

46、至至0.95680.9568之间,完成定额的工人总数在之间,完成定额的工人总数在843.2843.2至至956.8956.8人之间,估计的人之间,估计的可靠程度为可靠程度为9595。 例:例: 一个电视节目主持人想了解观众对某个电视专题节目一个电视节目主持人想了解观众对某个电视专题节目的喜欢情况,他选取了的喜欢情况,他选取了500个观众做样本,结果发现喜欢该节目个观众做样本,结果发现喜欢该节目的有的有175人。试以人。试以95%的概率估计观众喜欢这一专题节目的区间的概率估计观众喜欢这一专题节目的区间范围范围 。若该节目主持人希望估计的极限误差不超过。若该节目主持人希望估计的极限误差不超过5%,

47、问有多,问有多大把握程度大把握程度?1755000.351.96500(1)0.35 0.650.0255001.96 0.0250.049(0.300.40)0.052( )95.45%PPPPPnPzPPnzF z 1、估计允许有一定的误差,在一定的允许误差的条、估计允许有一定的误差,在一定的允许误差的条件下只需抽取一定的样本单位。件下只需抽取一定的样本单位。 抽取的样本单位数过多,增加不必要的人、财、物开支;抽取的样本单位数过多,增加不必要的人、财、物开支; 抽取的样本单位数过少,会使误差过大,达不到所要求抽取的样本单位数过少,会使误差过大,达不到所要求的准确程度。的准确程度。 确定适当

48、样本容量的意义确定适当样本容量的意义 在实际工作和理论研究中,我们总希望有一个在实际工作和理论研究中,我们总希望有一个比较恰当的比较恰当的样本容量样本容量,使之既可以取得足够的信息,又不至于在搜集过,使之既可以取得足够的信息,又不至于在搜集过多样本时造成浪费和麻烦。多样本时造成浪费和麻烦。第四节第四节 样本容量的确定样本容量的确定 2 2、抽样数目是影响抽样误差的重要因素。、抽样数目是影响抽样误差的重要因素。 如果改变了对抽样误差的要求,在其他条件相如果改变了对抽样误差的要求,在其他条件相同时,要相应地改变抽样数目,就是要用同时,要相应地改变抽样数目,就是要用增加或减增加或减少抽样数目的方法来控制抽样误差的大小少抽样数目的方法来控制抽样误差的大小。 必要抽样单位数必要抽样单位数:保证估计精度以及费用限制:保证估计精度以及费用限制的前提下,必须抽取的单位数。的前提下,必须抽取的单位数。必要抽样数目的计算公式必要抽样数目的计算公式XznXzn222Xzn通常的做法是先确定置信度,然后通常的做法是先确定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论