统计学原理:第八章 参数估计_第1页
统计学原理:第八章 参数估计_第2页
统计学原理:第八章 参数估计_第3页
统计学原理:第八章 参数估计_第4页
统计学原理:第八章 参数估计_第5页
已阅读5页,还剩112页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 参数估计 学习目的与要求学习目的与要求 通过本章的教学,使学生掌握参数估计的基本思想,会进行点估通过本章的教学,使学生掌握参数估计的基本思想,会进行点估计一个总体均值、比例计一个总体均值、比例和方差和方差的区间估计。掌握评价估计量优劣的区间估计。掌握评价估计量优劣的标准。的标准。 重点和难点重点和难点 重点:区间估计的含义和思想;评价估计量优劣的标准;一个总区间估计的含义和思想;评价估计量优劣的标准;一个总体均值的区间估计。体均值的区间估计。 难点:区间估计的含义和思想;一个总体均值的区间估计。区间估计的含义和思想;一个总体均值的区间估计。主要内容8.18.1 参数估计的一般问题参数估

2、计的一般问题 8.2 8.2 一个总体参数的区间估计一个总体参数的区间估计8.3 8.3 两两个总体参数的区间估计个总体参数的区间估计8.4 8.4 样本容量的确定样本容量的确定参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计统计推断的过程大学生每周上网花多少时间? 为了解学生每周上网花费的时间,中国人民大学公为了解学生每周上网花费的时间,中国人民大学公共管理学院的共管理学院的4 4名本科生对全校部分本科生做了问名本科生对全校部分本科生做了问卷调查。调查的对象为中国人民大学在校本科生,卷调查。调查的对象为中国人民大学在校本科生,调查内容包括上网时间、途径、支出、目的、关心调查

3、内容包括上网时间、途径、支出、目的、关心的校园网内容,以及学生对收费的态度,包括收费的校园网内容,以及学生对收费的态度,包括收费方式、价格等方式、价格等 问卷调查由调查员直接到宿舍发放并当场回收。对问卷调查由调查员直接到宿舍发放并当场回收。对四个年级中每年级各发四个年级中每年级各发6060份问卷,其中男、女生各份问卷,其中男、女生各3030份。共收回有效问卷共份。共收回有效问卷共200200份。其中有关上网时份。其中有关上网时间方面的数据经整理如下表所示间方面的数据经整理如下表所示 2008年8月大学生每周上网花多少时间?平均上网时间为8.58小时,标准差为0.69小时。全校学生每周的平均上网

4、时间是多少?每周上网时间在12小时以上的学生比例是多少?你做出估计的理论依据是什么?3小时以下小时以下321636小时小时3517.569小时小时3316.5912小时小时2914.512小时以上小时以上7135.52008年8月8.1 参数估计的一般问题一.一. 估计量与估计值估计量与估计值二.二. 点估计与区间估计点估计与区间估计三.三. 评价估计量的标准评价估计量的标准估计量与估计值 估计量:在参数估计中,用来估计总体参数的统计量的名称。用估计量:在参数估计中,用来估计总体参数的统计量的名称。用符号符号 表示。表示。 估计值:一个具体的样本计算出来的估计量的数值。估计值:一个具体的样本计

5、算出来的估计量的数值。Q参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计点估计 (point estimate)1.1. 用样本的估计量直接作为总体参数的估计值用样本的估计量直接作为总体参数的估计值例如:用样本均值直接例如:用样本均值直接作为作为总体均值的估计总体均值的估计例如:用两个样本均值之差直接例如:用两个样本均值之差直接作为作为总体均值总体均值之差的估计之差的估计2.2. 没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息3.3. 点估计的方法有矩估计法、顺序统计量法、点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等最大似然法、最

6、小二乘法等区间估计 (interval estimate)区间估计的图示置信水平(置信度) 1.1.将构造置信区间的步骤重复很多次,置信区间包含总体参数将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平真值的次数所占的比例称为置信水平 2.2.表示为表示为 (1 - (1 - 为是总体参数未在区间内的比例为是总体参数未在区间内的比例 3.3.常用的置信水平值有常用的置信水平值有 99%, 95%, 90%99%, 95%, 90%相应的相应的 为为0.010.01,0.050.05,0.100.10置信区间的表述 (confidence interval)1.

7、1.由样本统计量所构造的总体参数的估计区间称由样本统计量所构造的总体参数的估计区间称为置信区间为置信区间2.2.统计学家在某种程度上确信这个区间会包含真统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间正的总体参数,所以给它取名为置信区间 3.3.用一个具体的样本所构造的区间是一个特定的用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包

8、值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个含参数真值的区间中的一个置信区间的表述 (confidence interval)1.1. 总体参数的真值是固定的,而用样本构造的区总体参数的真值是固定的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数的区间都包含总体参数2.2. 实际估计时往往只抽取一个样本,此时所构造实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平的是与该样本相联系的一定置信水平( (比

9、如比如95%)95%)下的置信区间。我们只能希望这个区间是大量下的置信区间。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个能是少数几个不包含参数真值的区间中的一个2008年8月置信区间的表述 (confidence interval)1.1.当抽取了一个具体的样本,用该样本所构造的区间当抽取了一个具体的样本,用该样本所构造的区间是一个特定的常数区间,我们无法知道这个样本所是一个特定的常数区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值,因为它可能产生的区间是否包含总体参数的真值,因为

10、它可能是包含总体均值的区间中的一个,也可能是未包含是包含总体均值的区间中的一个,也可能是未包含总体均值的那一个总体均值的那一个2.2.一个特定的区间总是一个特定的区间总是“包含包含”或或“绝对不包含绝对不包含”参参数的真值,不存在数的真值,不存在“以多大的概率包含总体参数以多大的概率包含总体参数”的问题的问题3.3.置信水平只是告诉我们在多次估计得到的区间中大置信水平只是告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所概有多少个区间包含了参数的真值,而不是针对所抽取的这个样本所构建的区间而言的抽取的这个样本所构建的区间而言的 2008年8月置信区间的表述 (95%的

11、置信区间)2008年8月 我没有抓住参数!我没有抓住参数!置信区间与置信水平 影响区间宽度的因素置信区间的表述 (confidence interval)1.1.使用一个较大的置信水平会得到一个比较宽的置信使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会得到一个较准确区间,而使用一个较大的样本则会得到一个较准确( (较窄较窄) )的区间。直观地说,较宽的区间会有更大的的区间。直观地说,较宽的区间会有更大的可能性包含参数可能性包含参数2.2.但实际应用中,过宽的区间往往没有实际意义但实际应用中,过宽的区间往往没有实际意义l比如,天气预报说比如,天气预报说“在一年内会下一

12、场雨在一年内会下一场雨”,虽然这很有,虽然这很有把握,但有什么意义呢?另一方面,要求过于准确把握,但有什么意义呢?另一方面,要求过于准确( (过窄过窄) )的区间同样不一定有意义,因为过窄的区间虽然看上去很的区间同样不一定有意义,因为过窄的区间虽然看上去很准确,但把握性就会降低,除非无限制增加样本量,而现准确,但把握性就会降低,除非无限制增加样本量,而现实中样本量总是有限的实中样本量总是有限的3.3.区间估计总是要给结论留点儿余地区间估计总是要给结论留点儿余地 2008年8月评价估计量的标准无偏性(unbiasedness)有效性(efficiency)一致性(consistency) 一致性

13、:随着样本量的增大,估计量的 值越来越接近被估计的总体参数2008年8月8.2 一个总体参数的区间估计一.一. 总体均值的区间估计总体均值的区间估计二.二. 总体比例的区间估计总体比例的区间估计三.三. 总体方差的区间估计总体方差的区间估计一个总体参数的区间估计一、总体均值的区间估计 (正态总体、已知,或非正态总体、大样本)总体均值的区间估计(正态总体、已知,或非正态总体、大样本)总体均值的区间估计(例题分析)112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.61

14、05.0136.8102.8101.598.493.3(例题分析)总体均值的区间估计(例题分析)233539273644364246433133425345544724342839364440394938344850343945484532(例题分析)总体均值的区间估计 (正态总体、未知、小样本)总体均值的区间估计 (正态总体、未知、小样本)总体均值的区间估计(例题分析)1510152014801500145014801510152014801490153015101460146014701470(例题分析)二、总体比例的区间估计总体比例的区间估计总体比例的区间估计(例题分析)三、总体方差的区

15、间估计总体方差的区间估计总体方差的区间估计(图示)总体方差的区间估计(例题分析)112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3(例题分析)401.12)24() 1(2975. 0212n364.39)24() 1(2025. 022n一个总体参数的区间估计(小结)均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z

16、 Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分布2008年8月8.3 两个总体参数的区间估计一.一. 两个总体均值之差的区间估计两个总体均值之差的区间估计二.二. 两个总体比例的之差区间估计两个总体比例的之差区间估计三.三. 两个总体方差比的区间估计两个总体方差比的区间估计两个总体参数的区间估计两个总体均值之差的区间估计(独立大样本)两个样本均值之差的抽样分布总体1总体2抽取简单随机样样本容量 n1计算X1抽取简单随机样样本容量 n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X2m1m2两个总体均值之差的估计(大样本)两个总体均值之差的估计 (大样本大样本)两

17、个总体均值之差的估计(例题分析)中学中学1中学中学2n1=46n1=33S1=5.8 S2=7.2861x782x(例题分析)两个总体均值之差的区间估计(独立小样本)两个总体均值之差的估计(小样本: 1222 )两个总体均值之差的估计(小样本: 1222 )1.1.两个样本均值之差的标准化两个样本均值之差的标准化两个总体均值之差的估计(例题分析)方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5(例题分析)两个总体均值之差的估计(小样

18、本: 1222 )两个总体均值之差的估计(小样本: 1222 )1222221121212222121nnSnnSnSnSv两个总体均值之差的估计(例题分析)方法方法1方法方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2(例题分析)两个总体均值之差的区间估计(匹配样本)两个总体均值之差的估计(匹配大样本)两个总体均值之差的估计(匹配小样本)两个总体均值之差的估计(例题分析)学生编号学生编号试卷试卷A试卷试卷B差值差值d178717263441937261114898456917

19、41754951-27685513876601698577810553916(例题分析)两个总体比例之差区间的估计两个总体比例之差的区间估计两个总体比例之差的估计(例题分析例题分析) (例题分析)两个总体方差比的区间估计两个总体方差比的区间估计两个总体方差比的区间估计(图示)两个总体方差比的区间估计(例题分析) (例题分析)8.4 样本容量的确定一.一. 估计总体均值时样本容量的确定估计总体均值时样本容量的确定二.二. 估计总体比例时样本容量的确定估计总体比例时样本容量的确定三.三. 估计两个总体均值之差时样本容量的确定估计两个总体均值之差时样本容量的确定四.四. 估计两个总体比例之差时样本容

20、量的确定估计两个总体比例之差时样本容量的确定一、估计总体均值时样本容量的确定估计总体均值时样本容量的确定 222222)1(2zNNznx22.2.样本容量样本容量n n与总体方差与总体方差 2 2、抽样极限误差、抽样极限误差 、可靠性系数、可靠性系数Z Z或或t t之间的关系为之间的关系为与总体方差成正比与总体方差成正比与抽样极限误差成反比与抽样极限误差成反比与可靠性系数成正比与可靠性系数成正比估计总体均值时样本容量的确定 (例题分析) (例题分析)二、估计总体比例时样本容量的确定估计总体比例时样本容量的确定 重复抽样:)1 () 1()1 (22222zNNznP确定确定 的方法的方法(1

21、)(1)用以往的资料估计用以往的资料估计 (2)(2)组织实验抽样组织实验抽样. .(3)(3)当研究者对总体成数有很大把握时当研究者对总体成数有很大把握时, ,则可则可用它作为替代用它作为替代. .(4)(4)在没有其他信息可用时在没有其他信息可用时, ,可以令可以令5 . 0估计总体比例时样本容量的确定 (例题分析)估计两个总体均值之差时样本容量的确定估计两个总体均值之差时样本容量的确定 估计两个总体均值之差时样本容量的确定 (例题分析)(例题分析)估计两个总体比例之差时样本容量的确定估计两个总体比例之差时样本容量的确定 估计两个总体比例之差时样本容量的确定 (例题分析)(例题分析)案例-

22、练习1.从一个标准差为从一个标准差为5的总体中抽出一个容量为的总体中抽出一个容量为40的样的样 本,样本均值本,样本均值为为25。1)样本均值的抽样标准差样本均值的抽样标准差 (抽样平均误差或抽样标准误)抽样平均误差或抽样标准误)等于多少等于多少?2)在在95%的置信水平下,边际误差(极限误差)是多少?的置信水平下,边际误差(极限误差)是多少?2.从某快餐店想要估计每位顾客午餐的平均花费金额,在为期从某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周周的时间里选取的时间里选取49名顾客组成了一个简单随机样本。名顾客组成了一个简单随机样本。 1)假定总体标准差为假定总体标准差为15元,求样本

23、均值的抽样标准误元,求样本均值的抽样标准误差差 ; 2)在在95%的置信水平下,求极限误差;的置信水平下,求极限误差; 3)如果样本均值为如果样本均值为120元,求总体均值元,求总体均值95%的置信区间。的置信区间。 3.3.某居民小区为研究职工上班从家里到单某居民小区为研究职工上班从家里到单位的距离,抽取了由位的距离,抽取了由16个人组成的一个人组成的一个随机样本,他们到单位的距离(公个随机样本,他们到单位的距离(公里)分别是:里)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2 求职工上班从家里到单位平均距离求职工上班从家里到单位平均距离95%的置信

24、区间。的置信区间。4.在一项家电市场调查中,随机抽取了在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平。求总体比例的置信区间,置信水平分别为分别为90%和和95%。5.根据以往的生产数据,某种产品的废品根据以往的生产数据,某种产品的废品率为率为2%。如果要求。如果要求95%的置信区间,若要的置信区间,若要求极限误差不超过求极限误差不超过4%,应抽取多大的样本?,应抽取多大的样本? 6.某居民小区共有居民某居民小区共有居民50

25、0户,小区管理者准备采取户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了重复抽样方法随机抽取了50户,其中有户,其中有32户赞成,户赞成,18户反对。户反对。 1) 求总体中赞成该项改革的户数比例的置信区求总体中赞成该项改革的户数比例的置信区间,置信水平为间,置信水平为95%。2) 如果小区管理者预计赞成的比例能达到如果小区管理者预计赞成的比例能达到80%,极限误差不超过极限误差不超过10%,应抽取多少户进行调,应抽取多少户进行调查?查? 7.某超市想要估计每个顾客平均每次购物某超市想要估计每个顾客平均每次购物花费

26、的金额。根据过去的经验,标准差大花费的金额。根据过去的经验,标准差大约为约为120元,现要求以元,现要求以95%的置信水平估的置信水平估计每个购物金额的置信区间,并要求极限计每个购物金额的置信区间,并要求极限误差不超过误差不超过20元,应抽取多少个顾客作为元,应抽取多少个顾客作为样本样本?课堂作业案例2 由由120120名名 订阅者组成的样本表明订阅者组成的样本表明, ,订阅者每周使用因特订阅者每周使用因特网的平均时间为网的平均时间为9 9小时小时, ,样本标准差为样本标准差为6.56.5小时小时. .试问试问 订订阅者花费在因特网的平均时间的阅者花费在因特网的平均时间的95%95%的置信区间

27、的置信区间. .1993n案例5某公司有某公司有10001000名职工名职工, ,该公司管理层想了解职工上下该公司管理层想了解职工上下班在路途上的平均时间班在路途上的平均时间, ,决定采用随机不重复抽出一决定采用随机不重复抽出一个样本个样本, ,要求计算出的样本估计值与总体均值相差要求计算出的样本估计值与总体均值相差1 1分钟的误差范围之内分钟的误差范围之内. .假定总体管理层在正式调查前假定总体管理层在正式调查前, ,首先组织了试验抽样首先组织了试验抽样, ,得到样本标准差是得到样本标准差是4.24.2分钟分钟. .试试问问95%95%置信水平下置信水平下, ,该公司管理层应该抽取一个多大该

28、公司管理层应该抽取一个多大容量的样本来实现研究目的容量的样本来实现研究目的.?.?案例6 某网站需要了解上网使用者为女性的比例某网站需要了解上网使用者为女性的比例. .该网站希望对总体成该网站希望对总体成数的估计误差不超过数的估计误差不超过3%,3%,需要以需要以95.45%95.45%的可靠程度估计应抽取多的可靠程度估计应抽取多大容量的样本大容量的样本? ? 方达公司是一家大型加工厂的采购代理商,方达公司是一家大型加工厂的采购代理商,近期准备更新明年供应商的合同,计划从近期准备更新明年供应商的合同,计划从华强公司和华美公司中选择一家。对于方华强公司和华美公司中选择一家。对于方达公司来说,主要关心的问题是供应商订达公司来说,主要关心的问题是供应商订货后交货时间,因为是否能按时交货对于货后交货时间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论