05第5章参数估计_第1页
05第5章参数估计_第2页
05第5章参数估计_第3页
05第5章参数估计_第4页
05第5章参数估计_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统统 计计 学学 ( (第三版第三版) ) 2008 作者作者 贾俊平贾俊平 统计学统计学STATISTICS (第三版第三版) 统计名言统计名言 不象其他科学,统计从来不打算使 自己完美无缺,统计意味着你永远 不需要确定无疑。 Gudmund R.Iversen 5 - 2 2008年8月 第第 5 章章 参数估计参数估计 5.1 参数估计的基本原理参数估计的基本原理 5.2 一个总体参数的区间估计一个总体参数的区间估计 5.3 两个总体参数的区间估计两个总体参数的区间估计 5.4 样本量的确定样本量的确定 统计学统计学STATISTICS (第三版第三版) 学习目标学习目标 ?参数估计的基

2、本原理参数估计的基本原理 点估计与区间估计点估计与区间估计 评价估计量优良性的标准评价估计量优良性的标准 一个总体参数的区间估计方法一个总体参数的区间估计方法 两个总体参数的区间估计方法两个总体参数的区间估计方法 样本量的确定方法样本量的确定方法 5 - 4 2008年8月 统计学统计学STATISTICS (第三版第三版) 参数估计在统计方法中的地位参数估计在统计方法中的地位 统计方法统计方法 描述统计描述统计 推断统计推断统计 参数估计参数估计 假设检验假设检验 5 - 5 2008年8月 统计学统计学STATISTICS (第三版第三版) 大学生每周上网花多少时间?大学生每周上网花多少时

3、间? ? 为了解学生每周上网花费的时间,中国人民大学公共管理学院的 4名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收费的态度,包括收费方式、价格等 ? 问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发 60份问卷,其中男、女生各30份。共收回有效问卷共 200份。其中有关上网时间方面的数据经整理如下表所示 5 - 6 2008年8月 统计学统计学STATISTICS (第三版第三版) 大学生每周上网花多少时间?大学生每周上网花多少时间? 人数(人)人数(人) 32 35 33 29

4、 71 200 频率(频率(%) 16 17.5 16.5 14.5 35.5 100 回答类别回答类别 3小时以下小时以下 36小时小时 69小时小时 912小时小时 12小时以上小时以上 合计合计 平均上网时间为 8.58小时,标准差为 0.69小时。全校学生每周的平均上网时间是多少?每周上网时间在 12小时以上的学生比例是多少?你做出估计的理论依据是什么? 5 - 7 2008年8月 第第 5 章章 参数估计参数估计 5.1 参数估计的基本原理参数估计的基本原理 5.1.1 点估计与区间估计点估计与区间估计 5.1.2 评价估计量的标准评价估计量的标准 5.1 参数估计的一般问题参数估计

5、的一般问题 5.1.1 点估计与区间估计点估计与区间估计 统计学统计学STATISTICS (第三版第三版) 估计量与估计值估计量与估计值 (estimator & estimated value) 1.参数估计(parameter estimation)就是用样本统计量去估计总体的参数 2.估计量:用于估计总体参数的统计量的名称 ?如样本均值,样本比例,样本方差等 例如: 样本均值就是总体均值? 的一个估计量 ?3.参数用? 表示,估计量用 ?表示 4.估计值:估计参数时计算出来的统计量的具体值 ?如果样本均值 ?x =80,则80就是? 的估计值 5 - 10 2008年8月 统计

6、学统计学STATISTICS (第三版第三版) 点估计点估计 (point estimate) 1. 用样本的估计量的某个取值直接作为总体参数的估计值 ? 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 2008年8月 2. 无法给出估计值接近总体参数程度的信息 ?5 - 11 统计学统计学STATISTICS (第三版第三版) 区间估计区间估计 (interval estimate)

7、1.2.在点估计的基础上,给出总体参数估计的一个估计区间,该区间由样本统计量加减估计误差而得到 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 ?比如,某班级平均分数在 7585之间,置信水平是 95% 置信区间置信区间 样本统计量样本统计量 (点估计点估计) 置信下限置信下限 5 - 12 置信上限置信上限 2008年8月 统计学统计学STATISTICS (第三版第三版) 区间估计的图示区间估计的图示 ?x?z?2?x? ? - 2.58? ?x ? ? -1.65 ? ?x ?x? ? x ? ? +1.65? ?x ? ? +2.58? ?x ? ? +1

8、.96? ?x ? ? -1.96 ? ?x 90%的样本的样本 95% 的样本的样本 99% 的样本的样本 5 - 13 2008年8月 统计学统计学STATISTICS (第三版第三版) 置信水平置信水平 (confidence level) 1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,也称置信度 2. 表示为 (1 - ? ? ? ? 为是总体参数未在区间内的比例 相应的 ? 为0.01,0.05,0.10 3. 常用的置信水平值有 99%, 95%, 90% ?5 - 14 2008年8月 统计学统计学STATISTICS (第三版第三版) 置信区间

9、的表述置信区间的表述 (confidence interval) 1.由样本估计量构造出的总体参数在一定置信水平下的估计区间 2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.如果用某种方法构造的所有区间中有 95%的区间包含总体参数的真值, 5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表述 5 - 15 2008年8月 统计学统计学STATISTICS (第三版第三版) 置信区间的表述置信区间的表述 (confidence interval) 1.总体参数的真值是固定

10、的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数 2.实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平 (比如95%)下的置信区间。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个 5 - 16 2008年8月 统计学统计学STATISTICS (第三版第三版) 置信区间的表述置信区间的表述 (confidence interval) 1.2.3.当抽取了一个具体的样本,用该样本所构造的区间是一个特定的常数区间,我们无法知道这个样本所产生的区

11、间是否包含总体参数的真值,因为它可能是包含总体均值的区间中的一个,也可能是未包含总体均值的那一个 一个特定的区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题 置信水平只是告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所抽取的这个样本所构建的区间而言的 2008年8月 5 - 17 统计学统计学STATISTICS (第三版第三版) 置信区间的表述置信区间的表述 (95%的置信区间的置信区间) 点估计值点估计值 ? 我没有抓住参数!我没有抓住参数! ? ? 5 - 18 从均值为从均值为185的总体中抽出的总体中抽出n=10的的20

12、个样本构造出个样本构造出? ?的的20个置信区间个置信区间 2008年8月 统计学统计学STATISTICS (第三版第三版) 置信区间的表述置信区间的表述 (confidence interval) 1.2.使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会得到一个较准确 (较窄)的区间。直观地说,较宽的区间会有更大的可能性包含参数 但实际应用中,过宽的区间往往没有实际意义 ?比如,天气预报说“在一年内会下一场雨”,虽然这很有把握,但有什么意义呢?另一方面,要求过于准确(过窄)的区间同样不一定有意义,因为过窄的区间虽然看上去很准确,但把握性就会降低,除非无限制增加样本

13、量,而现实中样本量总是有限的 3.区间估计总是要给结论留点儿余地 2008年8月 5 - 19 5.1 参数估计的一般问题参数估计的一般问题 5.1.2 评价估计量的标准评价估计量的标准 统计学统计学STATISTICS (第三版第三版) 无偏性无偏性 (unbiasedness) 无偏性:无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 P(? ? ) 无偏无偏 有偏有偏 A B ?2008年8月 ?5 - 21 统计学统计学STATISTICS (第三版第三版) 有效性有效性 (efficiency) 有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 ?

14、) P(? 的抽样分布的抽样分布 ? 1B A 的抽样分布的抽样分布 ? 2?5 - 22 ?2008年8月 统计学统计学STATISTICS (第三版第三版) 一致性一致性 (consistency) 一致性:一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数 P(? ? ) 较大的样本量较大的样本量 B A 较小的样本量较小的样本量 ?5 - 23 ?2008年8月 第第 5 章章 参数估计参数估计 5.2 一个总体参数的区间估计一个总体参数的区间估计 5.2.1 总体均值的区间估计总体均值的区间估计 5.2.2 总体比例的区间估计总体比例的区间估计 5.2.3 总体方差的区

15、间估计总体方差的区间估计 5.2 一个总体参数估计的区间估计一个总体参数估计的区间估计 5.2.1 总体均值的区间估计总体均值的区间估计 统计学统计学STATISTICS (第三版第三版) 一个总体参数的区间估计一个总体参数的区间估计 总体参数总体参数 符号表示符号表示 样本统计量样本统计量 均值均值 比例比例 ?xp2?方差方差 5 - 26 s22008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值区间的一般表达式总体均值区间的一般表达式 1.总体均值的置信区间是由样本均值加减估计误差得到的 2.估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分

16、布。二是估计时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度 3.总体均值在置信水平下的置信区间可一般性地表达为 样本均值分位数值样本均值的标准误差样本均值分位数值样本均值的标准误差 5 - 27 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值的区间估计总体均值的区间估计 (大样本的估计大样本的估计) 总体服从正态分布,且方差(?) 已知 如果不是正态分布,可由正态分布来近似 (n ? 30) 1. 假定条件 ?2.使用正态分布统计量 z x?z? N(0,1 )?n3. 总体均值 ? 在1-? 置信水平下的置信区间为 x?z?

17、25 - 28 ?n或 x?z?2sn(?未知)2008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值的区间估计总体均值的区间估计 (大样本的估计大样本的估计) 【例】【例】一家保险公司收集到由 36个投保人组成的随机样本,得到每个投保人的年龄 (单位:周岁)数据如下表。试建立投保人年龄 90%的置信区间 36个投保人年龄的数据个投保人年龄的数据 23 36 42 34 39 34 5 - 29 35 42 53 28 49 39 39 46 45 39 38 45 27 43 54 36 34 48 36 31 47 44 48 45 44 33 24 40 50 32

18、 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值的区间估计总体均值的区间估计 (大样本的估计大样本的估计) 解解:已知n=36, 1-? = 90%,z? /2=1.645。根据样本数据计算得:x ?39 .5, s?7 .77 总体均值?在1-? 置信水平下的置信区间为 x?z?2s7.77?39 .5?1.645?n36?39 .5?2.13?37 .37 ,41 .63?投保人平均年龄的置信区间为37.37岁41.63岁 5 - 30 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值的区间估计总体均值的区间估计 (小样本的估计小样

19、本的估计) 总体服从正态分布,但方差(?) 未知 1. 假定条件 ?小样本 (n 30) x?sn2. 使用 t 分布统计量 t?t(n?1 )3. 总体均值 ? 在1-?置信水平下的置信区间为 sx?t?2n5 - 31 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值的区间估计总体均值的区间估计 (小样本的估计小样本的估计) 【 例例 】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了 25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为

20、 10克。试估计该批产品平均重量的置信区间,置信水平为95% 25袋食品的重量袋食品的重量 112.5 102.6 100.0 116.6 136.8 5 - 32 101.0 107.5 123.5 95.4 102.8 103.0 95.0 102.0 97.8 101.5 102.0 108.8 101.6 108.6 98.4 100.5 115.6 102.2 105.0 93.3 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值的区间估计总体均值的区间估计 (小样本的估计小样本的估计) 解解:已知N(?,102),n=25, 1-? = 95%,z?/2

21、=1.96x ?105 .36。由于是正态总。根据样本数据计算得: 体,且方差已知。总体均值?在1-? 置信水平下的置信区间为 ?10 x?z?2?105 .36?1.96?n25?105 .36?3.92?101 .44 ,109 .28?该食品平均重量的置信区间为101.44g109.28g 5 - 33 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值的区间估计总体均值的区间估计 (小样本的估计小样本的估计) 【例】【例】 已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取 16只,测得其使用寿命 (单位:h)如下。建立该批灯泡平均使用寿命 95%的置信区

22、间 16灯泡使用寿命的数据灯泡使用寿命的数据 1510 1450 1480 1460 5 - 34 1520 1480 1490 1460 1480 1510 1530 1470 1500 1520 1510 1470 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体均值的区间估计总体均值的区间估计 (小样本的估计小样本的估计) 解解:已知N(?,?2),n=16, 1-? = 95%,t? /2=2.131 ?1490,s 根据样本数据计算得:x ?24 .77 总体均值?在1-? ?置信水平下的置信区间为 x?t?2s24 .77?1490?2.131?n16?14

23、90?13 .2?1476 .8,1503 .2?该种灯泡平均使用寿命的置信区间为1476.8h1503.2h 5 - 35 2008年8月 5.2 一个总体参数估计的区间估计一个总体参数估计的区间估计 5.2.2 总体比例的区间估计总体比例的区间估计 统计学统计学STATISTICS (第三版第三版) 总体比例的区间估计总体比例的区间估计 (传统方法传统方法) 总体服从二项分布 可以由正态分布来近似 np(成功次数)和n(1-p)(失败次数)均应该大于10 1. 假定条件 ?2.使用正态分布统计量 z p?z? N(0,1 )?(1?)n3. 总体比例?在1-?置信水平下的置信区间为 p(1

24、-p)p?z?2n样本比例分位数值样本比例的标准误差样本比例分位数值样本比例的标准误差 5 - 37 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体比例的区间估计总体比例的区间估计 (例题分析例题分析传统方法传统方法) 解:解:已知 n=100,p65% , 1-? = 95%,z?/2=1.96 【例】【例】 某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间 5 - 38 p?z?2p(1?p)n65 %(1?65 %)100?65 %?1.96?65 %?9.35

25、 %?55 .65 %,74 .35 %?该城市下岗职工中女性比例的置信区间为55.65%74.35% 2008年8月 统计学统计学STATISTICS (第三版第三版) 一个总体比例的区间估计一个总体比例的区间估计 (现代方法现代方法) 1.按照传统方法计算出来的置信水平为 (1-? )的置信区间能够覆盖总体真实比例的概率小于 (1-? ),既是大样本也是如此,更不可能应用于小样本 2.根据经验法则:传统方法要求np(成功次数)和n(1-p)(失败次数)均应该大于10(也有些书上说大于5) 3.对于非常大的样本,传统方法和现代方法的结果几乎相同,但对于小样本或中等样本现代方法更适用 5 -

26、39 2008年8月 统计学统计学STATISTICS (第三版第三版) 一个总体比例的区间估计一个总体比例的区间估计 (现代方法现代方法) 1.通过修正试验次数n(样本量)和试验成功的比例P(样本比例)改进置信区间 2.将试验次数n加上4,即用 n?n?4代替n;将试p?(x?2 ) n验成功的次数x加上2,即用 代替p 3.对于任意大小的样本都可以使用该方法计算置信区间 4.只是在样本较小时,偶尔会有区间下限小于 0或区间上限大于1的情况发生。此时可用 0代替小于0的下限,用1代替大于1的上限 5 - 40 2008年8月 统计学统计学STATISTICS (第三版第三版) 一个总体比例的

27、区间估计一个总体比例的区间估计 (现代方法现代方法) 1.2.3.设总体服从二项分布,即X(n,p),x为n次独立伯努利试验成功的次数,P为成功的概率 p?(x?2 ) n定义 n?n?4和 总体比例?在1-? 置信水平下的置信区间 p(1- p) p?z?2 n该区间也称为Agresti-Coull区间(由Alan Agresti和Brent Coull给出,以其姓氏命名) 如果下限小于0则用0代替;如果上限大于1则用1代替 2008年8月 4.5.5 - 41 统计学统计学STATISTICS (第三版第三版) 一个总体比例的区间估计一个总体比例的区间估计 (现代方法现代方法) 解:解:

28、n?100?4?104p?(65?2 ) 104?64 .42 %【例】【例】 某城市想要估计下岗职工p(1?p)p?z?2中女性所占的比n例,随机地抽取64 .42 %(1?64 .42 %)了100名下岗职?64 .42 %?1.96?工,其中65人为104女性职工。试以?64 .42 %?14 .7%95%的置信水平?49 .72 %,79 .12 %?估计该城市下岗职工中女性比例该城市下岗职工中女性比例的置信的置信区间 区间为47.72%79.12% 5 - 42 2008年8月 5.2 一个总体参数估计的区间估计一个总体参数估计的区间估计 5.2.3 总体方差的区间估计总体方差的区间

29、估计 统计学统计学STATISTICS (第三版第三版) 总体方差的区间估计总体方差的区间估计 1. 估计一个总体的方差或标准差 2. 假设总体服从正态分布 3. 总体方差 ? 2 的点估计量为s2,且 ?n?1?s22?4. 总体方差在1-? 置信水平下的置信区间为 ?2?n?1?n?1?s?2?n?1?s22?2?n?1?1?2?n?1?225 - 44 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体方差的区间估计总体方差的区间估计 (图示图示) 总体方差的 1? 的置信区间 2 2? ? 1?1? ? ?2?2 2 2? ? ? ? ?2?2 ? ? 2 2 2

30、008年8月 自由度为自由度为n-1的的? ?2 2 5 - 45 统计学统计学STATISTICS (第三版第三版) 总体方差的区间估计总体方差的区间估计 (例题分析例题分析) 【例】【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了 25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以 95%的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5 102.6 101.0 107.5 103.0 95.0 102.0 108.8 100.5 115.6 100.0 116.6 136.8 5 - 46 123.5 95.4

31、102.8 102.0 97.8 101.5 101.6 108.6 98.4 102.2 105.0 93.3 2008年8月 统计学统计学STATISTICS (第三版第三版) 总体方差的区间估计总体方差的区间估计 (例题分析例题分析) 解解:已知n25,1-?95% ,根据样本数据计算得 s2 =93.21 2222 ?(n?1 )?0 .025(24 )?39 .3641?1?(n?1 )?0 .975(24 )?12 .4011 ? ? 2置信度为95%的置信区间为 ?2?239 .36412?56 .83?180 .39?25?1?93 .21?2?25?1?93 .2112 .4

32、011该企业生产的食品总体重量标准差的的置信区 间为7.54g13.43g 5 - 47 2008年8月 统计学统计学STATISTICS (第三版第三版) 一个总体参数的区间估计一个总体参数的区间估计 (小结小结) 待估参数待估参数 均值均值 比例比例 小样本小样本 ? ?2 2已知已知 Z Z分布分布 ? ?2 2未知未知 t t分布分布 2008年8月 方差方差 ? ?2 2分布分布 大样本大样本 ? ?2 2已知已知 Z Z分布分布 ? ?2 2未知未知 Z Z分布分布 5 - 48 大样本大样本 Z Z分布分布 第第 5 章章 参数估计参数估计 5.3 两个总体参数的区间估计两个总体

33、参数的区间估计 5.3.1 两个总体均值之差的区间估计两个总体均值之差的区间估计 5.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计 5.3.3 两个总体方差比的区间估计两个总体方差比的区间估计 统计学统计学STATISTICS (第三版第三版) 两个总体参数的区间估计两个总体参数的区间估计 符号表示符号表示 样本统计量样本统计量 总体参数总体参数 均值差 比例差 方差比 ?1?2?1?2?2122x1?x2p1?p2s21s225 - 50 2008年8月 5.3 两个总体参数估计的区间估计两个总体参数估计的区间估计 5.3.1 两个总体均值之差的区间估计两个总体均值之差的区间

34、估计 统计学统计学STATISTICS (第三版第三版) 均值之差区间的一般表达式均值之差区间的一般表达式 1.两个总体均值的置信区间是由两个样本均值之差加减估计误差得到的 2.估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度 3.两个总体均值之差(?1-?2)在置信水平下的置信区间可一般性地表达为 (? ?x1-? ?x2 )分位数值分位数值 (? ?x1-? ?x2 )的标准误差的标准误差 5 - 52 2008年8月 统计学统计学STATISTICS (第三版第三版)

35、两个总体均值之差的估计两个总体均值之差的估计 (独立大样本独立大样本) 1. 假定条件 ?两个总体都服从正态分布,?1、 ?2已知 若不是正态分布, 可以用正态分布来近似(n1?30和n2?30) 两个样本是独立的随机样本 2. 使用正态分布统计量 z (x1?x2)?(?1?2) z?N(0 ,1 )?21n15 - 53 ?22n22008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 (独立大样本独立大样本) 1. ?1, ?2已知时,两个总体均值之差?1-?2在1-? 置信水平下的置信区间为 22?1?2(x1?x2)?z?2?

36、 n1n2 2. ?1、 ?2未知时,两个总体均值之差?1-?2在1-? 置信水平下的置信区间为 (x1?x2)?z?25 - 54 ss?n1n22008年8月 2122 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 (独立大样本独立大样本) 两个样本的有关数据两个样本的有关数据 中学中学1 中学中学2 【例】【例】某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所中学独立抽取两个随机样本,有关数据如右表 。建立两所中学高考英语平均分数之差 95%的置信区间 5 - 55 n1=46 n1=33 x1?86S1=5.

37、8 x2? 78 S2=7.2 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 (独立大样本独立大样本) 解解: 两个总体均值之差在1-?置信水平下的置信区间为 (x1?x2)?z?2ss?n1n22221225.87.2?(86?78 )?1.96?4633?8?2.97?(5.03 ,10 .97 )两所中学高考英语平均分数之差的置信区间为 5.03分10.97分 5 - 56 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 2 22 2(独立小样本独立小样本

38、: ? ?1 1? ? ? 2 2 ) 1. 假定条件 ?两个总体都服从正态分布 两个总体方差未知但相等:?1=?2 两个独立的小样本 (n130和n230) 2.3.总体方差的合并估计量 22(n1?1 )s1?(n2?1 )s22 sp?n1?n2?2估计量?x1-?x2的抽样标准差 s5 - 57 2pn1?s2pn2?sp11?n1n22008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 2 22 2(独立小样本独立小样本: ? ?1 1? ? ? 2 2 ) 1. 两个样本均值之差的标准化 (x1?x2)?(?1?2) t?

39、t(n1?n2?2 ) 11sp? n1n22.两个总体均值之差?1-?2在1-? 置信水平下的置信区间为 1?2? 1?x?x?tn?n?2 s?12?212p ?nn?2?15 - 58 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 2 22 2(独立小样本独立小样本: ? ?1 1? ? ? 2 2 ) 【例】【例】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排 12名工人,每个工人组装一件产品所需的时间(单位:min)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以 95%的置

40、信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1 28.3 30.1 29.0 36.0 37.2 38.5 34.4 28.0 30.0 方法方法2 27.6 22.2 31.0 33.8 20.0 30.2 31.7 26.0 32.0 31.2 33.4 26.5 2008年8月 37.6 32.1 5 - 59 28.8 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 2 22 2(独立小样本独立小样本: ? ?1 1? ? ? 2 2 ) 解解: 根据样本数据计算得

41、 2 x1?32 .5 s1?15 .996x2?28 .8 合并估计量为 2ps?19 .35822(12?1 )?15 .996?(12?1 )?19 .358s ?17 .67712?12?2?11?(32 .5?28 .8 )?2 .0739?17 .677?3 .7?3 .56?12 12?两种方法组装产品所需平均时间之差的置信区间为 0.14分钟7.26分钟 5 - 60 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 2 22 2(独立小样本独立小样本: ? ?1 1? ? ? 2 2 ) 1. 假定条件 ?两个总

42、体都服从正态分布 两个总体方差未知且不相等:?1?2 两个独立的小样本(n130和n230) 2.使用统计量 (x1?x2)?(?1?2)t?t(v)22s1s2?n1n25 - 61 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 2 22 2(独立小样本独立小样本: ? ?1 1? ? ? 2 2 ) ?两个总体均值之差?1-?2在1-? 置信水平下的置信区间为 ss?x1?x2?t?2(v)?n1n2222?s?s?1?2?n?n2?12222s1n1s2n2?n1?1n2?12122自由度 v?5 - 62 2008年8

43、月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 2 22 2(独立小样本独立小样本: ? ?1 1? ? ? 2 2 ) 【例】【例】 沿用前例。假定第一种方法随机安排12名工人,第二种方法随机安排 8名工人,即n1=12,n2=8 ,所得的有关数据如表。假定两种方法组装产品的时间服从正态分布,且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1 28.3 36.0 37.2 38.5 34.4 28.0 30.0 27.6 22.2 31.0 33

44、.8 20.0 30.2 方法方法2 31.7 26.5 30.1 29.0 37.6 32.1 28.8 5 - 63 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 2 22 2(独立小样本独立小样本: ? ?1 1? ? ? 2 2 ) 解解: 根据样本数据计算得 22 x1?32 .5 s1?15 .996 x2?27 .875 s2?23 .014 自由度为 ?15 .99623 .014?128?v ?13 .188?1322?15 .99612?23 .0148?12?18?1215 .99623 .014(32

45、.5?27 .875)?2 .1604?4 .625?4 .433128两种方法组装产品所需平均时间之差的置信区间为 0.192分钟9.058分钟 5 - 64 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 (匹配大样本匹配大样本) 1. 假定条件 ?两个匹配的大样本(n1? 30和n2 ? 30) 两个总体各观察值的配对差服从正态分布 2. 两个总体均值之差?d =?1-?2在1-? 置信水平下的置信区间为 d?z?2?dn ? ?d 分位数值分位数值? ?d 的标准误差的标准误差 5 - 65 2008年8月 统计学统计学

46、STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 (匹配小样本匹配小样本) 1. 假定条件 ?两个匹配的小样本(n1 30和n2 30) 两个总体各观察值的配对差服从正态分布 2. 两个总体均值之差?d=?1-?2在1-? 置信水平下的置信区间为 d?t?2(n?1 )5 - 66 sdn2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 (匹配小样本匹配小样本) 10名学生两套试卷的得分名学生两套试卷的得分 学生编号学生编号 1 2 3 4 6 5 7 8 9 10 试卷试卷A 78 63 72

47、 89 91 49 68 76 85 55 试卷试卷B 71 44 61 84 74 51 55 60 77 39 差值差值d 7 19 11 5 17 -2 13 16 8 16 2008年8月 【 例例】由10 名学 生 组 成 一 个随 机 样 本 , 让他们分别采用 A和B两套试卷进行 测 试 , 结 果如下表 。试建立 两 种 试 卷 分数之差?d=?1-?2 95% 的 置 信 区间 5 - 67 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 (匹配小样本匹配小样本) Normal Probability Plot2.01.51.

48、0Expected Normal Value0.50.0-0.5-1.0-1.5-2.0-4048分数之差121620245 - 68 两套试卷分数之差的正态概率图两套试卷分数之差的正态概率图 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体均值之差的估计两个总体均值之差的估计 (匹配小样本匹配小样本) 解解: 根据样本数据计算得 n di 110i?1d?nd?10?11sd?(di?1ni?d)2nd?1?6 .53sd6.53d?t?2(n?1 )?11?2 .2622?n10?11?4 .67两种试卷所产生的分数之差的置信区间为6.33分 15.67分 5

49、- 69 2008年8月 5.3 两个总体参数估计的区间估计两个总体参数估计的区间估计 5.3.2 两个总体比例之差的区间估计两个总体比例之差的区间估计 统计学统计学STATISTICS (第三版第三版) 两个总体比例之差的区间估计两个总体比例之差的区间估计 (传统方法传统方法) 两个总体服从二项分布 可以用正态分布来近似 两个样本是独立的 n1p1和n1(1-p1), n2p2和n2(1-p2),均应该大于10 1. 假定条件 ?2. 两个总体比例之差?1-? 2在1-? 置信水平下的置信区间为 p1(1?p1)p2(1?p2)?p1?p2?z?2?n1n2(p1- p2)分位数值分位数值(

50、p1- p2)的标准误差的标准误差 5 - 71 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体比例之差的估计两个总体比例之差的估计 (例题分析例题分析传统方法传统方法) 【例】【例】在某个电视节目的收视率调查中,农村随机调查了400人,有32%的人收看了该节目;城市随机调查了500人,有45%的人收看了该节目。试以 95%的置信水平估计城市与农村收视率差别的置信区间 5 - 72 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体比例之差的估计两个总体比例之差的估计 (例题分析例题分析传统方法传统方法) 解解: 已知 n1=500 ,n

51、2=400, p1=45%, p2=32%, 1-? =95%, z?/2=1.96 ?1-? 2置信度为95%的置信区间为 45 %?(1?45 %)32 %?(1?32 %)?45 %?32 %?1 .96?500400?13 %?6 .32 %?6 .68 % ,19 .32 %?城 市 与 农 村 收 视 率 差 值 的 置 信 区 间 为6.68%19.32% 5 - 73 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体比例之差的区间估计两个总体比例之差的区间估计 (现代方法现代方法) 1.通过修正试验次数n1、 n2(样本量)和试验成功的比例P1、 P

52、2(样本比例)改进置信区间 2.将试验次数n1和n1各加上2,即用 n1?n1?2代n1, n2?n2?2代替n2;将试验成功的次数x1和x1各加 p1?(x1?1 ) n1代替p1,用 p2?(x2?1 ) n2上1,即用 代替p2 3.对于任意大小的样本都可以使用该方法计算置信区间 5 - 74 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体比例之差的区间估计两个总体比例之差的区间估计 (现代方法现代方法) 1.2.3.4.5.设两总体都服从二项分布,即X1(n1,p1), X2(n2,p2) 。x1为n1次独立伯努利试验成功的次数,P1位成功的概率概率,x2

53、 为n2次独立伯努利试验成功的次数,P2为成功的概率 p?(x?1 ) np?(x?1 ) n定义 nn1?n1?2,111, 2222?n2?2; ?1-?2在1-? 置信水平下的置信区间 p (1?p )p (1?p )1122 p1?p2?z?2?n1n2 该区间也称为Agresti-Caffo 区间(由Alan Agresti和Brian Caffo给出,以其姓氏命名 ) 如果下限小于-1则用-1代替;如果上限大于 1则用1代替 ?5 - 75 2008年8月 5.3 两个总体参数估计的区间估计两个总体参数估计的区间估计 5.3.3 两个总体方差比的区间估计两个总体方差比的区间估计 统

54、计学统计学STATISTICS (第三版第三版) 两个总体方差比的区间估计两个总体方差比的区间估计 1. 比较两个总体的方差比 2.用两个样本的方差比来判断 ?如果S12/ S22接近于1,说明两个总体方差很接近 如果S12/ S22远离1,说明两个总体方差之间存在差异 3.总体方差比在1-?置信水平下的置信区间为 ss?F?2?5 - 77 21222122ss?F1?221222008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体方差比的区间估计两个总体方差比的区间估计 (图示图示) 总体方差比的 1? 的置信区间 F1?1? ? ?2?2 5 - 78 F? ? ?

55、2 ?2 F 2008年8月 方差比置信区间示意图方差比置信区间示意图 统计学统计学STATISTICS (第三版第三版) 两个总体方差比的区间估计两个总体方差比的区间估计 (例题分析例题分析) 【例】【例】为了研究男女学生在生活费支出 (单位:元)上的差异,在某大学各随机抽取 25名男学生和25名女学生,得到下面的结果 男学生: x1?520 女学生: x2?480s?260s? 2802221 试以90%置信水平估计男女学生生活费支出方差比的置信区间 5 - 79 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体方差比的区间估计两个总体方差比的区间估计 (例题分

56、析例题分析) 解解:根据自由度 n1=25-1=24 ,n2=25-1=24,查得 F? /2(24)=1.98, F1-?/2(24)=1/1.98=0.505 ?12 /?22置信度为90%的置信区间为 260280?1.98?2122260280?0.505男女学生生活费支出方差比的置信区间为0.471.84 5 - 80 2008年8月 统计学统计学STATISTICS (第三版第三版) 两个总体参数的区间估计两个总体参数的区间估计 (小结小结) 待估参数待估参数 均值差均值差 比例差比例差 方差比方差比 独立大样本独立大样本 独立小样本独立小样本 匹配样本匹配样本 独立大样本独立大样

57、本 F F分布分布 ? ?1 12 2、? ?2 22 2已已 正态总体正态总体 t分布分布 Z Z分布分布 Z Z分布分布 ? ?1 12 2、? ?2 22 2已知已知 ? ?1 12 2、? ?2 22 2未知未知 ? ?1 12 2、? ?2 22 2未未 Z Z分布分布 ? ?1 12 2= =? ?2 22 2 ? ?1 12 2? ?2 22 2 Z Z分布分布 t t分布分布 t t分布分布 5 - 81 2008年8月 第第 5 章章 参数估计参数估计 5.4 样本量的确定样本量的确定 5.4.1 估计总体均值时样本量的确定估计总体均值时样本量的确定 5.4.2 估计总体比例

58、时样本量的确定估计总体比例时样本量的确定 6.4 样本量的确定样本量的确定 6.4.1 估计总体均值时样本量的确定估计总体均值时样本量的确定 统计学统计学STATISTICS (第三版第三版) 估计一个总体均值时样本量的确定估计一个总体均值时样本量的确定 1. 估计总体均值时样本量n为 22?(z?2)? 其中: E?z?2n?2 nE2.样本量n与总体方差? 2、边际误差E、可靠性系数Z或t之间的关系为 ?与总体方差成正比 与边际误差的平方成反比 与可靠性系数成正比 3.样本量的圆整法则:当计算出的样本量不是整数时,将小数点后面的数值一律进位成整数,如24.68取25,24.32也取25等等 5 - 84 2008年8月 统计学统计学STATISTICS (第三版第三版) 估计一个总体均值时样本量的确定估计一个总体均值时样本量的确定 (例题分析例题分析) 【例】【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为 400元,应抽取多大的样本量? 5 - 85 2008年8月 统计学统计学STATISTICS (第三版第三版) 估计一个总体均值时样本量的确定估计一个总体均值时样本量的确定 (例题分析例题分析) 解解: 已知? =2000,E=400, 1-?=95%, z?/2=1.9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论