统计学第3章(参数估计)_第1页
统计学第3章(参数估计)_第2页
统计学第3章(参数估计)_第3页
统计学第3章(参数估计)_第4页
统计学第3章(参数估计)_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 想要知道的信息是:想要知道的信息是:A A、B B两种品牌灯泡的两种品牌灯泡的平均使用寿命?两种灯泡平均使用寿命的差值是平均使用寿命?两种灯泡平均使用寿命的差值是多少?(这些都是总体的参数)多少?(这些都是总体的参数) 已知的信息是:已知的信息是:8 8只只A A品牌灯泡的使用寿命,品牌灯泡的使用寿命,1010只只B B品牌灯泡的使用寿命。(这些都是样本信品牌灯泡的使用寿命。(这些都是样本信息)息) 因此,为了得到想要的答案,我们能做的就因此,为了得到想要的答案,我们能做的就是:利用抽样得到的样本信息来估计总体的信息。是:利用抽样得到的样本信息来估计总体的信息。【引例】灯泡的使用寿命【引例】

2、灯泡的使用寿命 在现实经济社会中,我们通常会面临两种在现实经济社会中,我们通常会面临两种情况:情况: 1、掌握了所研究总体的全部数据,那么、掌握了所研究总体的全部数据,那么只需要做一些简单的统计描述,就可以得到有只需要做一些简单的统计描述,就可以得到有关总体的数量特征。关总体的数量特征。 2、有些现象的范围比较广,或者有些总、有些现象的范围比较广,或者有些总体的单位数很多,不可能也没有必要进行一一体的单位数很多,不可能也没有必要进行一一测定。这就需要从总体中抽取一部分单位进行测定。这就需要从总体中抽取一部分单位进行调查,进而利用样本提供的信息来推断总体的调查,进而利用样本提供的信息来推断总体的

3、数量特征。数量特征。 推断统计学是当代统计学的主要内容。统推断统计学是当代统计学的主要内容。统计推断分为抽样估计、假设检验、统计预测三计推断分为抽样估计、假设检验、统计预测三个部分。个部分。 抽样估计抽样估计是指用样本提供的信息对总是指用样本提供的信息对总体相应的数量特征所进行的估计或推断。体相应的数量特征所进行的估计或推断。具体具体来说,就是用来说,就是用样本统计量去估计相应的总体参样本统计量去估计相应的总体参数。数。 从数理统计的理论来看,抽样估计包括:从数理统计的理论来看,抽样估计包括:参数估计和非参数估计。参数估计和非参数估计。非参数估计非参数估计 非参数估计非参数估计是指对总体的分布

4、形式一是指对总体的分布形式一无所知,不仅要对总体的分布类型,还要对部无所知,不仅要对总体的分布类型,还要对部分或全部总体参数一一作出估计和推断。分或全部总体参数一一作出估计和推断。 非参数估计是非常复杂的,不在我们讨非参数估计是非常复杂的,不在我们讨论的范围之内。论的范围之内。参数估计参数估计 参数估计参数估计是指在抽样和抽样分布的基是指在抽样和抽样分布的基础上,根据样本信息对总体的未知参数进行的础上,根据样本信息对总体的未知参数进行的估计。估计。 比比如,用样本均值估计总体均值;用样本如,用样本均值估计总体均值;用样本比率估计总体比率;用样本方差估计总体方差比率估计总体比率;用样本方差估计总

5、体方差等。等。 参数估计包括:点估计和区间估计两种参数估计包括:点估计和区间估计两种具体的估计形式。具体的估计形式。统计预测区间估计点估计参数估计非参数估计抽样估计假设检验推断统计一、点估计一、点估计 点估计点估计又称为定值估计,是指直接用一又称为定值估计,是指直接用一个样本统计量的值作为总体参数的估计值。个样本统计量的值作为总体参数的估计值。 【例【例】要估计一批产品的合格率,根据随机要估计一批产品的合格率,根据随机抽出的一个样本可以计算出合格率为抽出的一个样本可以计算出合格率为96%96%,若将,若将96%96%直接作为这批产品合格率的估计值,就是一直接作为这批产品合格率的估计值,就是一个

6、点估计。个点估计。 用于点估计的主要方法:矩估计法、最用于点估计的主要方法:矩估计法、最大似然估计法。大似然估计法。1、矩估计法矩估计法 矩估计法是英国统计学家皮尔逊于矩估计法是英国统计学家皮尔逊于1900年提出的一种估计方法,它源于替换原理。年提出的一种估计方法,它源于替换原理。 矩估计法矩估计法是指根据替换原理,用样本是指根据替换原理,用样本矩去替换相应的总体矩,用样本矩的函数去替矩去替换相应的总体矩,用样本矩的函数去替换相应总体矩的函数,求得估计量的方法。换相应总体矩的函数,求得估计量的方法。 相应地,用矩估计法求得的估计量称为矩相应地,用矩估计法求得的估计量称为矩估计量。估计量。 矩估

7、计法的统计思想非常简单,使用也很矩估计法的统计思想非常简单,使用也很方便,其实质是用样本矩去替换总体矩,从而方便,其实质是用样本矩去替换总体矩,从而求得总体参数的估计,是一种应用广泛的点估求得总体参数的估计,是一种应用广泛的点估计方法。计方法。 需要注意的是,用矩估计法得出的估计需要注意的是,用矩估计法得出的估计值可能不是唯一的。值可能不是唯一的。2、最大似然法最大似然法 最大似然法是在最大似然法是在1821年首先由德国数学年首先由德国数学家高斯提出的,后英国统计学家费雪研究了这家高斯提出的,后英国统计学家费雪研究了这种方法的性质。种方法的性质。 最大似然估计法最大似然估计法就是从参数空间中寻

8、就是从参数空间中寻找一个参数值,这个参数值对已经出现的样本找一个参数值,这个参数值对已经出现的样本观测值是最可能的,即把令样本观测值出现的观测值是最可能的,即把令样本观测值出现的可能性最大的参数值作为参数的估计。可能性最大的参数值作为参数的估计。 相应地,用最大似然法求得的估计量称相应地,用最大似然法求得的估计量称为最大似然估计量,简记为为最大似然估计量,简记为MLEMLE。3 3、矩法和最大似然法的比较矩法和最大似然法的比较 矩估计法是采用样本矩替换总体矩来估矩估计法是采用样本矩替换总体矩来估计参数,相当于使用了分布函数的部分信息;计参数,相当于使用了分布函数的部分信息; 最大似然估计法是采

9、用似然函数来求得最大似然估计法是采用似然函数来求得参数的估计,理论上相当于使用了分布函数的参数的估计,理论上相当于使用了分布函数的全部信息;全部信息; 在已知总体分布的前提下,采用最大似然在已知总体分布的前提下,采用最大似然估计法的理由更充分,而在总体分布函数未知估计法的理由更充分,而在总体分布函数未知但有关的总体矩已知的情况下,采用矩估计法但有关的总体矩已知的情况下,采用矩估计法更合适。更合适。 从上面的介绍可以看出,对于同一个总体从上面的介绍可以看出,对于同一个总体参数,采用不同的估计方法,可能会得到不同参数,采用不同的估计方法,可能会得到不同的估计量。的估计量。 那么,究竟用样本的哪种估

10、计量作为总体那么,究竟用样本的哪种估计量作为总体参数的估计最好?什么样的估计量才算是一个参数的估计最好?什么样的估计量才算是一个好的估计量?这就需要有一定的评价标准。好的估计量?这就需要有一定的评价标准。 而且对同一估计量使用不同的评价标准可而且对同一估计量使用不同的评价标准可能得到不同的结论,因此评价某个估计量的好能得到不同的结论,因此评价某个估计量的好坏一定要说明是在哪一个标准之下。坏一定要说明是在哪一个标准之下。常用的评常用的评价标准有三个:无偏性、有效性、一致性。价标准有三个:无偏性、有效性、一致性。一、无偏性一、无偏性 无偏性无偏性是指样本估计量抽样分布的均是指样本估计量抽样分布的均

11、值等于被估总体参数的真实值。值等于被估总体参数的真实值。 无偏性实际是指:不同的样本,会有不同无偏性实际是指:不同的样本,会有不同的估计值。虽然从某一个具体样本来看,估计的估计值。虽然从某一个具体样本来看,估计值有时会大于值有时会大于,有时会小于,有时会小于,有误差。但,有误差。但从所有可能样本的角度来看,估计值的平均水从所有可能样本的角度来看,估计值的平均水平等于总体参数的真实值,即平均说来,估计平等于总体参数的真实值,即平均说来,估计是无偏的。是无偏的。)(E二、有效性二、有效性 参数的无偏估计量可能有很多个,那么该参数的无偏估计量可能有很多个,那么该如何考察这些估计量哪个更好呢?这时可以

12、比如何考察这些估计量哪个更好呢?这时可以比较它们有效性的大小。较它们有效性的大小。 有效性有效性又称为最小方差性,是指在若又称为最小方差性,是指在若干个无偏估计量中,方差最小的那个无偏估计干个无偏估计量中,方差最小的那个无偏估计量就是有效估计量。量就是有效估计量。 可见,一个有效的估计量,首先必须是无可见,一个有效的估计量,首先必须是无偏的。偏的。 【例【例】现要通过抽样考察某班同学统计学测验现要通过抽样考察某班同学统计学测验平均成绩,而且已知样本均值和中位数是两个平均成绩,而且已知样本均值和中位数是两个总体参数的无偏估计量,问应该用哪个统计量总体参数的无偏估计量,问应该用哪个统计量作为总体参

13、数的估计呢?作为总体参数的估计呢? 【解【解】可以考察两个统计量的有效性来决定。可以考察两个统计量的有效性来决定。 更有效,则说明均值比中位数若)()(eMDxD更有效,则说明中位数比均值若)()(eMDxD三、一致性三、一致性 一致性一致性又称为相合性,它说明当样本又称为相合性,它说明当样本容量容量n趋近于无穷大趋近于无穷大时,样本估计量依概率收时,样本估计量依概率收敛于总体参数的真实值敛于总体参数的真实值。即随着样本容量的。即随着样本容量的增大,点估计量的值越来越接近被估计总体参增大,点估计量的值越来越接近被估计总体参数的真值。数的真值。 换言之,一个大样本给出的估计量要比一换言之,一个大

14、样本给出的估计量要比一个小样本给出的估计量更接近总体参数的真实个小样本给出的估计量更接近总体参数的真实值值。四、几个重要的结论四、几个重要的结论 样本均值、样本方差和样本比率,分别样本均值、样本方差和样本比率,分别是总体均值、总体方差和总体比率的无偏、有是总体均值、总体方差和总体比率的无偏、有效和一致的优良估计量;效和一致的优良估计量; 无偏估计有时可能不存在,有时也可能无偏估计有时可能不存在,有时也可能不唯一;不唯一; 除了无偏性、有效性、一致性,评价一除了无偏性、有效性、一致性,评价一个点估计量的好坏时,还可以用均方误差个点估计量的好坏时,还可以用均方误差MSEMSE的概念。的概念。一、区

15、间估计的概念一、区间估计的概念 用点估计值代表总体参数值时,只给出用点估计值代表总体参数值时,只给出了未知参数的一个具体数值,但没有回答估计了未知参数的一个具体数值,但没有回答估计的精度。也就是说,除了具体的估计值,我们的精度。也就是说,除了具体的估计值,我们还想知道这个估计值和真实值接近的程度是怎还想知道这个估计值和真实值接近的程度是怎样的,这时就必须进行区间估计。样的,这时就必须进行区间估计。 通常可以认为,区间估计是在点估计的通常可以认为,区间估计是在点估计的基础上,给出未知总体参数的一个取值范围,基础上,给出未知总体参数的一个取值范围,及这个范围的可靠程度。及这个范围的可靠程度。 区间

16、估计区间估计就是用一个区间去估计未知就是用一个区间去估计未知总体参数,把未知总体参数值界定在两个数值总体参数,把未知总体参数值界定在两个数值之间。即根据样本估计量,以一定的置信度估之间。即根据样本估计量,以一定的置信度估计和推断总体参数的区间范围。计和推断总体参数的区间范围。 总体参数的估计区间,通常是由样本总体参数的估计区间,通常是由样本统计量加减抽样极限误差而得到的。统计量加减抽样极限误差而得到的。二、区间估计的数学表达式二、区间估计的数学表达式 设总体设总体X的分布密度函数的分布密度函数F( (x, ,) )中含有一中含有一个未知参数个未知参数,而,而x1 1, , ,xn是来自是来自X

17、的一个样本,的一个样本,对于给定的对于给定的(0(01)1),若能找到两个统计量,若能找到两个统计量1 1和和2 2,使得:,使得: P 1 12 2=1-=1- 则称区间则称区间 1 1, ,2 2 为为的置信度为的置信度为1-1-的的置信区间。置信区间。为显著性水平;为显著性水平;1-1-为区间估计为区间估计的置信度或置信水平。的置信度或置信水平。置信区间图示置信区间图示 xf0 x22121置信下限置信下限点估计值点估计值置信上限置信上限置信区间置信区间三、区间估计的基本原理三、区间估计的基本原理 如果我们作多次同样的抽样,将会得到多个如果我们作多次同样的抽样,将会得到多个置信区间,那么

18、其中有的置信区间包含了总体参置信区间,那么其中有的置信区间包含了总体参数的真值;而有的置信区间却未包含总体参数的数的真值;而有的置信区间却未包含总体参数的真值。真值。 置信度置信度包含总体参数真值的次数在所有包含总体参数真值的次数在所有置信区间中所占的比率。置信区间中所占的比率。 【例如【例如】置信度为置信度为95%95%表明:如果抽取表明:如果抽取100100个随机样个随机样本来估计总体的均值,那么由本来估计总体的均值,那么由100100个样本所构造的个样本所构造的100100个置信区间中,有个置信区间中,有9595个区间包含了总体参数的个区间包含了总体参数的真值,而另外真值,而另外5 5个

19、区间则不包含。个区间则不包含。置信水平置信水平显著性水平显著性水平 90% 90% 95% 95% 99% 99% 0.10 0.10 0.05 0.05 0.01 0.01 1.645 1.645 1.96 1.96 2.58 2.581Z2四、四、常用的置信度常用的置信度 在构造置信区间时,我们可以用所希望的值在构造置信区间时,我们可以用所希望的值作为置信水平。比较常用的置信水平及临界值如作为置信水平。比较常用的置信水平及临界值如下表:下表: 但要特别注意:查但要特别注意:查“标准正态分布表标准正态分布表” 时,由于时,由于 通常不直接查通常不直接查 而是查而是查 具体地,从表中先找到与具

20、体地,从表中先找到与 最接近的数最接近的数 值,该数值对应的值,该数值对应的x值,就是值,就是 值。值。 ZZ212Z221Z21Z2五、影响置信区间宽度的因素五、影响置信区间宽度的因素 当样本容量当样本容量n确定时,置信区间的宽度随确定时,置信区间的宽度随着置信水平着置信水平1-1-的增大而增大。从直觉上说,的增大而增大。从直觉上说,置信区间比较宽时,才会使这一区间有更大的置信区间比较宽时,才会使这一区间有更大的可能性包含总体参数的真值。可能性包含总体参数的真值。 当置信水平当置信水平1-1-固定时,置信区间的宽固定时,置信区间的宽度随着样本容量度随着样本容量n的增大而变窄。即置信水平不的增

21、大而变窄。即置信水平不变时,样本容量变时,样本容量n越大,抽样误差越小,估计的越大,抽样误差越小,估计的精度越高,则置信区间就越窄。精度越高,则置信区间就越窄。六、理解置信区间必须注意的问题六、理解置信区间必须注意的问题 若在所有区间中,有若在所有区间中,有95%95%的区间包含总的区间包含总体参数的真值,有体参数的真值,有5%5%的区间不包含,则这个区的区间不包含,则这个区间就称为置信水平为间就称为置信水平为95%95%的置信区间。的置信区间。 这样表述置信区间的理由是:总体参数真这样表述置信区间的理由是:总体参数真值是固定的、未知的,而用样本构造的区间随值是固定的、未知的,而用样本构造的区

22、间随样本不同而不同,因此置信区间是一个随机区样本不同而不同,因此置信区间是一个随机区间,它不仅因样本的不同而不同,且不是所有间,它不仅因样本的不同而不同,且不是所有的区间都包含总体参数的真值。的区间都包含总体参数的真值。 置信水平置信水平1-1-这个概率,不能用来描述这个概率,不能用来描述某个特定的区间包含总体参数真值的可能性。某个特定的区间包含总体参数真值的可能性。只能知道在多次抽样得到的区间中,大概有多只能知道在多次抽样得到的区间中,大概有多少个区间包含了总体参数的真值。少个区间包含了总体参数的真值。 一个特定的区间包不包含总体参数的真值一个特定的区间包不包含总体参数的真值是绝对的,不存在

23、可能或不可能包含的问题。是绝对的,不存在可能或不可能包含的问题。 【例如【例如】在在99%99%的置信度下,得到某班学生身高的置信度下,得到某班学生身高的置信区间为(的置信区间为(155155,175175),若该班平均身高),若该班平均身高的真值为的真值为170170,则绝对包含;若为,则绝对包含;若为150150,则绝对,则绝对不包含。不包含。区间估计区间估计一个正态总体参数一个正态总体参数的区间估计的区间估计两个正态总体参数两个正态总体参数的区间估计的区间估计均值均值比率比率方差方差方差方差之比之比比率比率之差之差均值均值之差之差一、总体均值的区间估计一、总体均值的区间估计 在对正态总体

24、的均值进行区间估计时,需在对正态总体的均值进行区间估计时,需要考虑以下几个方面的内容:要考虑以下几个方面的内容: 总体的方差是否已知;总体的方差是否已知; 用于构造估计量的样本是大样本还是小用于构造估计量的样本是大样本还是小样本等。样本等。1 1、总体方差、总体方差2 2已知时已知时 当总体服从正态分布,又已知总体方差当总体服从正态分布,又已知总体方差2 2时,无论样本为大样本或小样本,经过标时,无论样本为大样本或小样本,经过标准化后,样本均值都服从标准正态分布,因准化后,样本均值都服从标准正态分布,因此总体均值此总体均值在在11的置信水平下,置信区的置信水平下,置信区间为:间为:nxnxZZ

25、22 在第八章将介绍,抽样平均误差为在第八章将介绍,抽样平均误差为 而抽样极限误差而抽样极限误差= =临界值临界值抽样平均误差抽样平均误差 因此,置信区间可以简写成因此,置信区间可以简写成“点估计值点估计值抽样极限误差抽样极限误差”nxnZZxx22xxxx 【例【例1 1】一家企业每天生产化肥的产量为一家企业每天生产化肥的产量为80008000袋袋左右,按规定每袋的重量应为左右,按规定每袋的重量应为100100克。为分析克。为分析每袋重量是否符合要求,质检部门从某天生产每袋重量是否符合要求,质检部门从某天生产的一批化肥中随机抽取了的一批化肥中随机抽取了2525袋,测得平均每袋袋,测得平均每袋

26、的重量为的重量为105.36105.36克,已知产品重量的分布服从克,已知产品重量的分布服从正态分布,且总体的方差为正态分布,且总体的方差为100100。 要求以要求以95%95%的置信度,估计该批产品平均的置信度,估计该批产品平均重量的置信区间。重量的置信区间。 【解【解】依题意得,零件长度方差已知,又依题意得,零件长度方差已知,又n=25=25,=10=10,查表得,查表得 Z/2/2=1.96=1.96, 而抽样极限误差为:而抽样极限误差为: 所以在所以在95%95%的置信水平下该种零件的平均长度的置的置信水平下该种零件的平均长度的置信区间为:信区间为: 表明在表明在95%95%的置信水

27、平下,该批产品的平均重量在的置信水平下,该批产品的平均重量在101.44101.44至至109.28109.28克之间。克之间。36.105x92. 3251096. 12/nZx28.10944.10192. 336.10592. 336.105xxxx 【练习【练习1 1】某种零件的长度服从正态分布,现从某种零件的长度服从正态分布,现从该产品中随机抽取该产品中随机抽取9 9件,测得其平均长度为件,测得其平均长度为21.421.4厘米。根据以往的经验,该批产品的总体厘米。根据以往的经验,该批产品的总体标准差标准差=0.15=0.15厘米。厘米。 要求以要求以95%95%的置信度估计该种零件平

28、均长的置信度估计该种零件平均长度的置信区间。度的置信区间。 【解【解】依题意得,零件长度方差已知,又依题意得,零件长度方差已知,又n=9=9,=0.15=0.15,Z/2/2=1.96=1.96 而抽样极限误差为:而抽样极限误差为: 所以在所以在95%95%的置信水平下该种零件的平均长度的的置信水平下该种零件的平均长度的置信区间为:置信区间为: 表明在表明在95%95%的置信水平下该种零件的平均长度在的置信水平下该种零件的平均长度在21.30221.302至至21.49821.498厘米之间。厘米之间。4 .21x098. 0915. 096. 12/nZx498.21302.21098. 0

29、4 .21098. 04 .21xxxx2 2、总体方差未知,但大样本时、总体方差未知,但大样本时 若总体方差未知,但在大样本的情况下,若总体方差未知,但在大样本的情况下,样本均值仍然可以用正态分布近似,只是要用样本均值仍然可以用正态分布近似,只是要用样本方差代替总体方差,此时总体均值的置信样本方差代替总体方差,此时总体均值的置信区间为:区间为:nsxnsxZZ22 【例【例2 2】一家保险公司收集到由一家保险公司收集到由3636个投保人组成个投保人组成的一个随机样本,并计算得到这个样本的平均的一个随机样本,并计算得到这个样本的平均年龄为年龄为39.539.5岁,标准差为岁,标准差为7.777

30、.77岁。岁。 试在试在90%90%的置信水平下,建立投保人年龄的的置信水平下,建立投保人年龄的置信区间。置信区间。10. 077. 75 .39,sx645.12Z【解【解】本题的总体方差未知,但属于大样本本题的总体方差未知,但属于大样本抽样极限误差为:抽样极限误差为:13. 23677. 7645. 12nsZx所以,在所以,在90%90%的置信水平下,置信区间为:的置信水平下,置信区间为:表明在表明在90%90%的置信水平下,投保人的平均年龄在的置信水平下,投保人的平均年龄在37.3737.37至至41.6341.63岁之间。岁之间。63.4137.3713.25 .3913.25 .3

31、9xxxx 【练习【练习2 2】在大兴安岭林区,随机抽取了在大兴安岭林区,随机抽取了100100块面块面积为积为1 1公顷的样地,根据调查测量求得每公顷林公顷的样地,根据调查测量求得每公顷林地平均出材量为地平均出材量为8888m3 3,标准差为,标准差为1010m3 3。 试分别在试分别在99%99%和和95%95%的置信水平下,估计大的置信水平下,估计大兴安岭林区每公顷地平均出材量的置信区间。兴安岭林区每公顷地平均出材量的置信区间。01. 01088,sx58.22Z【解【解】本题的总体方差未知,但属于大样本本题的总体方差未知,但属于大样本抽样极限误差为:抽样极限误差为:58. 210010

32、58. 22nsZx所以,在所以,在99%99%的置信水平下,置信区间为:的置信水平下,置信区间为:表明在表明在99%99%的置信水平下,大兴安岭林区每公顷的置信水平下,大兴安岭林区每公顷地平均出材量在地平均出材量在85.4285.42至至90.5890.58之间。之间。58.9042.8558. 28858. 288xxxx 当当1-1-=0.95=0.95,查表得,查表得Z/2/2=1.96=1.96,又已知抽样平均,又已知抽样平均误差误差=1=1,于是,抽样极限误差,于是,抽样极限误差 96. 1196. 12xxZ 则置信区间为则置信区间为 显然,显然,95%95%比比99%99%的置

33、信区间缩小了。的置信区间缩小了。 由此可见:置信度由此可见:置信度越大,抽样极限误差越大,抽样极限误差越越大,置信区间就越宽。反之,置信度大,置信区间就越宽。反之,置信度越小,抽越小,抽样极限误差样极限误差越小,置信区间就越窄。越小,置信区间就越窄。96.8904.8696. 18896. 188xxxx3 3、总体方差未知且小样本时、总体方差未知且小样本时 根据小样本分布定理可知,在小样本条根据小样本分布定理可知,在小样本条件下,如果总体是正态分布、总体方差未知件下,如果总体是正态分布、总体方差未知的情况,那么随机变量服从自由度为的情况,那么随机变量服从自由度为n-1n-1的的t t分布。此

34、时在给定的置信水平分布。此时在给定的置信水平1-1-下,总体下,总体均值均值的置信区间为的置信区间为nSnxnSnxtt) 1(122 【例【例3 3】已知某种灯泡的寿命服从正态分布,现已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取从一批灯泡中随机抽取1616只,测得其平均使用只,测得其平均使用寿命为寿命为14901490小时,标准差为小时,标准差为24.7724.77小时。小时。 试以试以95%95%的置信度,估计该批灯泡平均使的置信度,估计该批灯泡平均使用寿命的置信区间。用寿命的置信区间。131. 2) 1(2/nt77.241490sx,【解【解】n=16=16属于小样本且总体方

35、差属于小样本且总体方差2 2未知,未知,又已知又已知=0.05=0.05,于是,抽样极限误差为:于是,抽样极限误差为:2 .131677.24131. 212nsntx所以在所以在95%95%的置信度下,的置信度下,置信区间为:置信区间为:计算结果表明:在计算结果表明:在95%95%的置信度下,该种灯泡平的置信度下,该种灯泡平均使用寿命在均使用寿命在1476.81476.8至至1503.21503.2小时之间。小时之间。2 .15038 .14762 .1314902 .131490 xxxx 【练习【练习3 3】设某上市公司的股票价格服从正态分设某上市公司的股票价格服从正态分布,为了掌握该上

36、市公司股票的平均价格情况,布,为了掌握该上市公司股票的平均价格情况,现随机抽取了现随机抽取了2525天的交易价格进行调查,测得天的交易价格进行调查,测得平均价格为平均价格为3535元,方差为元,方差为4 4。 试以试以98%98%的置信度,估计该上市公司股票的置信度,估计该上市公司股票平均交易价格的置信区间。平均交易价格的置信区间。492. 2) 1(2/nt4352sx,【解【解】本题本题n=25=25属于小样本且总体方差未知,属于小样本且总体方差未知,又已知又已知1-=0.981-=0.98,于是,抽样极限误差为:于是,抽样极限误差为:997. 0252492. 212nsntx所以在所以

37、在98%98%的置信度下,该公司股票交易价格的置信度下,该公司股票交易价格的的置信区间为:置信区间为:计算结果表明:在计算结果表明:在98%98%的置信度下该上市公司股的置信度下该上市公司股票交易的平均价格在票交易的平均价格在34.0034.00至至36.0036.00元之间。元之间。997.35003.34997.035997.035xxxx单个正态总体均值的区间估计小结单个正态总体均值的区间估计小结样本大小样本大小重复抽样重复抽样 总体总体方差方差已知已知大样本大样本小样本小样本总体总体方差方差未知未知大样本大样本小样本小样本nxZ2nsxZ2nsnxt12二、总体比率的区间估计二、总体比

38、率的区间估计 我们只讨论大样本情况下,总体比率的区我们只讨论大样本情况下,总体比率的区间估计。间估计。 在大样本条件下,样本比率服从正态分布。在大样本条件下,样本比率服从正态分布。标准化后,它服从标准正态分布。因此总体比标准化后,它服从标准正态分布。因此总体比率在率在1-1-的置信水平下的置信区间为:的置信水平下的置信区间为:nppZpPnppZp)1 ()1 (22 【例【例5 5】为了控制某生产线的废品率,现随机从为了控制某生产线的废品率,现随机从产品中抽取产品中抽取6060件进行调查,结果发现有件进行调查,结果发现有9 9件废件废品。品。 试以试以98%98%的置信水平,估计该生产线产品

39、的置信水平,估计该生产线产品废品率的置信区间。废品率的置信区间。【解【解】n=60=60属于大样本,属于大样本,1-1-=0.98=0.98,Z/2/2=2.33=2.33,p=0.15p=0.15,抽样极限误差为,抽样极限误差为 1074.06085.015.033.2)1 (2nppZp 所以在所以在98%98%的置信度下,该生产线产品废品率的置信度下,该生产线产品废品率的置信区间为:的置信区间为: 计算结果表明:在计算结果表明:在98%98%的置信度下,该生产线的置信度下,该生产线产品废品率在产品废品率在4.26%4.26%至至25.74%25.74%之间。之间。2574. 00426.

40、 01074. 015. 01074. 015. 0PPpPppp 【练习【练习5 5】为了研究某小学的学生拥有手机的比为了研究某小学的学生拥有手机的比例,随机抽选例,随机抽选100100名学生,调查发现其中名学生,调查发现其中3131名名拥有手机。拥有手机。 试求该小学全校学生拥有手机比例的置信试求该小学全校学生拥有手机比例的置信度为度为90%90%的置信区间。的置信区间。 【解【解】已知已知n=100=100属于大样本,有属于大样本,有1-1-=0.90=0.90,Z/2/2=1.65=1.65,p=0.31p=0.31,故抽样极限误差为,故抽样极限误差为 076.010069.031.0

41、65.1)1 (2nppZp 所以在所以在90%90%的置信度下,该小学全体学生拥有的置信度下,该小学全体学生拥有手机比例手机比例的置信区间为:的置信区间为: 计算结果表明:在计算结果表明:在90%90%的置信度下,该小学全的置信度下,该小学全体学生拥有手机的比例在体学生拥有手机的比例在23.4%23.4%至至38.6%38.6%之间。之间。386. 0234. 0076. 031. 0076. 031. 0PPpPppp三、总体方差的区间估计三、总体方差的区间估计 样本方差服从自由度为样本方差服从自由度为n-1-1的的2 2分布。分布。因此,对于给定的置信度因此,对于给定的置信度1-1-,总

42、体方差的,总体方差的置信区间为:置信区间为:2212222211SSnn 【例【例4 4】某自动车床加工的某种零件长度某自动车床加工的某种零件长度X近似近似服从正态分布,现随机抽查服从正态分布,现随机抽查1616个零件,测得个零件,测得其方差为其方差为0.002440.00244。 试以试以95%95%的置信度,估计该种零件方差的的置信度,估计该种零件方差的置信区间。置信区间。【解【解】已知已知S S2 2=0.00244=0.00244,1-1-=0.95=0.95,=0.05=0.05, 查查2 2分布表得:分布表得: 2 20.0250.025(16-1)=(16-1)=2 20.025

43、0.025(15)=27.488(15)=27.488 2 21-0.0251-0.025(16-1)=(16-1)=2 20.9750.975(15)=6.262(15)=6.262 在在95%95%的置信度下,总体方差的置信区间为:的置信度下,总体方差的置信区间为: 计算结果表明:该自动车床加工的零件长度方差计算结果表明:该自动车床加工的零件长度方差在在0.001330.00133至至0.005840.00584之间。之间。00584. 000133. 0262. 600244. 0116488.2700244. 011622 【练习【练习4 4】某机械厂的某种器械使用寿命某机械厂的某种器

44、械使用寿命X近似近似服从正态分布,现质检部门的有关人员随机服从正态分布,现质检部门的有关人员随机抽查了抽查了2525台这种器械,测得该样本的方差为台这种器械,测得该样本的方差为23502350。 试以试以99%99%的置信度,估计该种器械方差的的置信度,估计该种器械方差的置信区间。置信区间。【解【解】已知已知S S2 2=2350=2350,1-1-=0.99=0.99,=0.01=0.01, 查查2 2分布表得:分布表得: 2 20.0050.005(25-1)=(25-1)=2 20.0050.005(24)=45.5585(24)=45.5585 2 21-0.0051-0.005(25

45、-1)=(25-1)=2 20.9950.995(24)=9.886(24)=9.886 在在99%99%的置信度下,总体方差的置信区间为:的置信度下,总体方差的置信区间为: 计算结果表明:该机械厂生产的器械使用寿命计算结果表明:该机械厂生产的器械使用寿命的方差在的方差在1237.971237.97至至5705.045705.04之间。之间。04.570597.1237886. 923501255585.45235012522一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计 对于两个正态总体均值之差的估计,必须对于两个正态总体均值之差的估计,必须考虑以下几个问题:考虑以下几个问题:

46、 两个总体的方差是否已知;两个总体的方差是否已知; 两个总体的方差是否相等;两个总体的方差是否相等; 样本容量是大样本还是小样本;样本容量是大样本还是小样本;1 1、两个总体的方差都已知、两个总体的方差都已知 当两个总体都是正态总体时,两个样本当两个总体都是正态总体时,两个样本均值之差经标准化后服从标准正态分布。则均值之差经标准化后服从标准正态分布。则两个总体均值之差在两个总体均值之差在1-1-置信水平下的置信置信水平下的置信区间为:区间为: nnZxx222121221 【例【例1】为了调查甲、乙两家银行的户均存款为了调查甲、乙两家银行的户均存款额,从两家银行各抽选一个由额,从两家银行各抽选

47、一个由2525个储户组成的个储户组成的随机样本。两个样本均值分别为随机样本。两个样本均值分别为45004500元和元和32503250元,两个总体标准差分别为元,两个总体标准差分别为920920元和元和960960元。元。 根据经验,知道两个总体均服从正态分布,根据经验,知道两个总体均服从正态分布,试求两个总体均值之差的置信度为试求两个总体均值之差的置信度为90%90%的置信的置信区间。区间。 【解【解】两个总体均服从正态分布,且总体方差两个总体均服从正态分布,且总体方差都已知,因此两个总体均值之差的都已知,因此两个总体均值之差的90%90%的置信的置信区间为区间为 即置信区间为(即置信区间为

48、(811811,16891689),表明在),表明在90%90%的的置信水平下两个银行户均存款额之差在置信水平下两个银行户均存款额之差在811811元元至至16891689元之间。元之间。4391250259602592065.13250450022222121221nnZxx 【练习【练习1】某厂有两台生产金属棒的机器,由某厂有两台生产金属棒的机器,由经验可知它们生产的金属棒的长度都服从正态经验可知它们生产的金属棒的长度都服从正态分布,且两个总体的标准差分别为分布,且两个总体的标准差分别为0.0630.063厘米厘米和和0.0590.059厘米。现各抽取一个随机样本来检验厘米。现各抽取一个随

49、机样本来检验两台机器是否运转正常,一个样本由机器甲生两台机器是否运转正常,一个样本由机器甲生产的产的1111根金属棒组成,其均值为根金属棒组成,其均值为8.068.06厘米,另厘米,另一个样本由机器乙生产的一个样本由机器乙生产的2121根金属棒组成,其根金属棒组成,其均值为均值为7.747.74厘米,厘米, 试求两个总体均值之差的置信度为试求两个总体均值之差的置信度为95%95%的的置信区间。置信区间。 【解【解】两个总体均服从正态分布,且总体方差两个总体均服从正态分布,且总体方差都已知,因此两个总体均值之差的都已知,因此两个总体均值之差的95%95%的置信的置信区间为区间为 即置信区间为(即

50、置信区间为(0.2750.275,0.3650.365),表明在),表明在95%95%的置信水平下两个银行户均存款额之差在的置信水平下两个银行户均存款额之差在0.2750.275厘米至厘米至0.3650.365厘米之间。厘米之间。045. 032. 021059. 011063. 096. 174. 706. 822222121221nnZxx2 2、两个总体方差未知,但都是大样本、两个总体方差未知,但都是大样本 对于正态总体,虽然方差是未知的,但对于正态总体,虽然方差是未知的,但在大样本情况下,两个样本均值之差经标准在大样本情况下,两个样本均值之差经标准化后仍服从标准正态分布,因此可用两个样

51、化后仍服从标准正态分布,因此可用两个样本方差来代替总体方差。故两个总体均值之本方差来代替总体方差。故两个总体均值之差在差在1-1-置信水平下的置信区间为:置信水平下的置信区间为: nsnsZxx222121221 【例【例2】某地区教育委员会想估计两所中学的某地区教育委员会想估计两所中学的学生高考时的英语平均分之差,为此在两所中学生高考时的英语平均分之差,为此在两所中学独立地抽取了两个随机样本,得到有关数据学独立地抽取了两个随机样本,得到有关数据如下:如下: 中学中学1 1:样本容量为样本容量为4646,平均分为,平均分为8686分,分,标准差为标准差为5.85.8分;分; 中学中学2 2:样

52、本容量为样本容量为3333,平均分为,平均分为7878分,分,标准差为标准差为7.27.2分。分。 试以试以95%95%的置信水平估计两个中学高考英的置信水平估计两个中学高考英语平均分之差的置信区间。语平均分之差的置信区间。【解【解】依题意两个总体都未知,但有以下条件依题意两个总体都未知,但有以下条件 属于大样本,且属于大样本,且 也属于大样本,且也属于大样本,且 30461n861x8 .51s30332n782x2 .72s 于是在于是在95%95%的置信水平下两个中学高考英的置信水平下两个中学高考英语平均分之差的置信区间为:语平均分之差的置信区间为: 即置信区间为(即置信区间为(5.03

53、5.03,10.9710.97),表明在),表明在95%95%的置信水平下两个中学高考英语平均分之的置信水平下两个中学高考英语平均分之差在差在5.035.03分至分至10.9710.97分之间。分之间。97. 28332 . 7468 . 596. 1788622222121221nsnsZxx 【练习【练习2】某乡为了估计两个村小麦平均亩产某乡为了估计两个村小麦平均亩产之差,在这两个村种植小麦的地块中分别抽取之差,在这两个村种植小麦的地块中分别抽取一个随机样本,得到有关数据如下:一个随机样本,得到有关数据如下: 甲村:样本容量为甲村:样本容量为4040,平均亩产为,平均亩产为520520千千

54、克,标准差为克,标准差为2525千克;千克; 乙村:样本容量为乙村:样本容量为4545,平均亩产为,平均亩产为460460千千克,标准差为克,标准差为2828千克。千克。 试以试以95%95%的置信水平估计两个村平均亩产的置信水平估计两个村平均亩产之差的置信区间。之差的置信区间。【解【解】依题意两个总体都未知,但有以下条件依题意两个总体都未知,但有以下条件 属于大样本,且属于大样本,且 也属于大样本,且也属于大样本,且 30401n5201x62525221s30452n4602x78428222s 于是在于是在95%95%的置信水平下两个村小麦平均的置信水平下两个村小麦平均亩产量的置信区间为

55、:亩产量的置信区间为: 即置信区间为(即置信区间为(54.2554.25,65.7565.75),表明在),表明在95%95%的置信水平下两个村小麦平均亩产之差在的置信水平下两个村小麦平均亩产之差在54.2554.25千克至千克至65.7565.75千克之间。千克之间。75. 560457844062596. 1460520222121221nsnsZxx3 3、两个总体方差未知,但相等、两个总体方差未知,但相等 当两个总体方差未知但相等时,需要用两当两个总体方差未知但相等时,需要用两个样本的方差来估计,此时必须将两个样本的个样本的方差来估计,此时必须将两个样本的数据组合在一起,以给出总体方差

56、的合并估计数据组合在一起,以给出总体方差的合并估计量,计算公式为:量,计算公式为: 这时,两个样本均值之差经过标准化以后这时,两个样本均值之差经过标准化以后服从服从t分布,即分布,即211212222112nnsnsnsw21212/21112nnsnntxxw 【例【例3】为了估计两种方法组装产品所需时间的为了估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机的安差异,分别对两种不同的组装方法各随机的安排排1212个工人,得到有关数据如下:个工人,得到有关数据如下: 方法方法1 1:平均时间为平均时间为32.532.5分钟,方差为分钟,方差为15.99615.996 方法方法

57、2 2:平均时间为平均时间为28.828.8分钟,方差为分钟,方差为19.35819.358 假定两种方法组装产品的时间服从正态分假定两种方法组装产品的时间服从正态分布,且方差相等。试以布,且方差相等。试以95%95%的置信水平建立两种的置信水平建立两种方法组装产品所需平均时间差值的置信区间。方法组装产品所需平均时间差值的置信区间。【解【解】依题意两个总体方差都未知,但相等的依题意两个总体方差都未知,但相等的情况下情况下 首先,总体方差的合并估计量为首先,总体方差的合并估计量为 677.1721212358.19) 112(996.15) 112(211212222112nnsnsnsw 于是

58、在于是在95%95%的置信水平下,两个总体均值的置信水平下,两个总体均值之差的置信区间为:之差的置信区间为: 即(即(0.140.14,7.267.26),表明两种方法组装产),表明两种方法组装产品所需平均时间之差的置信区间为品所需平均时间之差的置信区间为0.140.14至至7.267.26分钟。分钟。56. 37 . 3)121121(677.17074. 28 .285 .32)11(212221nntxxws 【练习【练习3】一所大学的保健医生想了解大一和大一所大学的保健医生想了解大一和大二两个年级学生戴眼镜时间长短的差异,随机二两个年级学生戴眼镜时间长短的差异,随机在两个年级的所有学生

59、中各抽取在两个年级的所有学生中各抽取1515名学生,得名学生,得到有关数据如下:到有关数据如下: 大一生:大一生:平均时间为平均时间为10281028天,方差为天,方差为77.477.4 大二生:大二生:平均时间为平均时间为984984天,方差为天,方差为62.162.1 假定两组学生配戴眼镜的时间服从正态分假定两组学生配戴眼镜的时间服从正态分布,且方差相等。试以布,且方差相等。试以98%98%的置信水平建立两个的置信水平建立两个年级学生配戴眼镜平均时间差值的置信区间。年级学生配戴眼镜平均时间差值的置信区间。【解【解】依题意两个总体方差都未知,但相等的依题意两个总体方差都未知,但相等的情况下情

60、况下 首先,总体方差的合并估计量为首先,总体方差的合并估计量为 75.69215151 .62) 115(4 .77) 115(211212222112nnsnsnsw 于是在于是在98%98%的置信水平下,两个总体均值的置信水平下,两个总体均值之差的置信区间为:之差的置信区间为: 即(即(36.4836.48,51.5251.52),表明两个年级学生),表明两个年级学生配戴眼镜的平均时间之差的置信区间为配戴眼镜的平均时间之差的置信区间为36.4836.48天至天至51.5251.52天。天。52. 744)151151(75.694671. 29841028)11(212221nntxxws

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论