统计学课件第6章参数估计概述配套讲义_第1页
统计学课件第6章参数估计概述配套讲义_第2页
统计学课件第6章参数估计概述配套讲义_第3页
统计学课件第6章参数估计概述配套讲义_第4页
统计学课件第6章参数估计概述配套讲义_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2022-3-101第六章 参数估计概述第一节 总体参数估计概述第二节 总体平均数和比例的区间估计第三节 两个总体平均数之差的区间估计第四节 两个总体比例之差的区间估计第五节 样本容量的确定第六节 总体方差和方差之比的区间估计第一节 总体参数估计概述2022-3-102第六章 参数估计概述一、点估计 (一)点估计的定义 点估计就是直接以样本统计量作为相应总体参数的估计量。在统计中经常使用的点估计量就是我们熟悉的样本均值( ),样本标准差(s)和(Bernoulli试验的)样本比例(p),人们用它们来分别估计总体的均值( )、总体标准差( )和总体比例(P),即有: 2022-3-103 3x2

2、221xP px xsn一、点估计 (二)点估计的评价标准 1.无偏性: ,即估计量的期望值等于欲估计的总体参数。 是总体方差的无偏估计。 2.有效性:假设 和 都是总体参数 的无偏估计量,如果 ,则说明估计量 比 更有效。 3.一致性:指随着样本容量不断增大,样本统计量接近总体参数的可能性就越来越大。即: 2022-3-104 4 E221()1ixxnslim1nP 122212( )( ) 12第二节 总体平均数和比例的区间估计2022-3-105第六章 参数估计概述一、区间估计的含义 所谓区间估计,就是给出总体参数的估计的区间范围,同时给出总体参数在该范围内的保证程度,即概率值。用公式

3、表示:式中(01)是区间估计的显著性水平,1-称为置信度或置信水平。 因此,总体参数的估计区间也称为置信区间,其中区间的最小值 称为置信下限,最大值 称为置信上限。特别地,上下限 、 都是由样本来决定的,随着样本的变化而变化,所以, 、 都是统计量。 所以 确切表述是:置信区间 以1-的概率覆盖欲估计的总体参数 。2022-3-106 612() 1P 12121212() 1P 12 , 二、总体平均数的区间估计 (一)正态总体、总体方差 已知 首先把 标准化,得到服从标准正态分布的Z统计量,即: 整理得到: 于是置信区间的上下限是: 总体均值的置信度为 的置信区间上下限公式如下:2022-

4、3-107 72/2/2(+) 1xxP xzx z x0,1xxzN图图6-1 标准正态分布的概率密度函数及双侧临界值标准正态分布的概率密度函数及双侧临界值/2xxz1/2/2()()1xznNnxzNn重复抽样时不重复抽样时90% 样本95% 样本99% 样本 X_ _nZXXZXX2.581.6451.6452.58XXXX1.961.96XX置信区间2022-3-108 8二、总体平均数的区间估计 【例6-2】在某饮料公司生产的10000罐饮料中,饮料包装上标注的每罐重量是500克。现按不重复简单随机抽样方法抽取50罐进行检查,测得平均每罐的重量为497克。已知该种罐装饮料的重量服从正

5、态分布,且标准差为5克。试以95%的置信度估计该种饮料平均重量的置信区间。如果要求估计的误差不超过2克,这时的置信度是多少? 2022-3-109 9二、总体平均数的区间估计 解:(1)查标准正态分布表或利用Excel的NORM.S.INV函数得到临界值 。 置 信 度 为 9 5 % , 即 1 - = 9 5 % , 则 = 5 % , 临 界值 。已知 =497克,n=50, =5克。由于总体服从正态分布,不重复抽样,所以置信区间上下限是: 因此,该种饮料置信度为95%的平均重量的置信区间为495.62498.38克。显然,平均来说,罐上标注的重量与实际情况不符。 (2)要求极限误差等于

6、2克,即 =2克。由 ,有 2022-3-101010 x/20.0251.96zz/2510000504971.964971.38110000150NnNxzn/2222.840.7151000050110000 150NnNnz/2=xz二、总体平均数的区间估计 (二)正态总体、总体方差 未知 样本均值经过标准化后得到的随机变量服从自由度为n-1的t分布,即: 总体均值置信区间为: 在大样本场合(样本容量大于30),t分布与标准正态分布非常接近, 值可以用 代替。2022-3-1011112/2,1/2,1()()1nnsxtnsNnxtNn重复抽样时不重复抽样时 (1)xtt nsn/2

7、,1nt/2z二、总体平均数的区间估计 t 分布与标准正态分布比较2022-3-1012120 0t (df = 5)标准正态分布 t (自由度df = 10)二、总体平均数的区间估计 【例6-3】某软件公司开办了一家服务中心,该服务中心的员工负责接听顾客的咨询电话,回答关于该公司开发的软件包的各种问题,一个研究小组收集了一个包含24个电话的简单随机样本,并基于样本数据估计总体平均服务时间。假设该小组不知道服务时间的标准差。24个电话的样本数据如下,假设总体服从正态分布。求置信度为95%的顾客咨询时间的平均数的估计区间。 2022-3-10131311.511.03.46.312.46.20.

8、88.50.411.17.11.83.76.29.113.616.914.76.91.42.78.73.67.6表6-1 软件公司的样本服务时间二、总体平均数的区间估计 解:第1步 计算样本的均值: 样本标准差 :抽样平均误差的近似值: 第2步 计算临界值: 第3步 计算置信区间总体平均咨询时间下限:总体平均咨询时间上限:2022-3-101414220.304.5024iixxxsn()()/2,1/2,15.41=7.31 2.07 0.92=7.31 2.07 0.2929. 1nnsxtnsxtn/2, 10.05/2,24 12.07ntt7.3124iixxxn4.500.9224

9、sn总体分布总体分布样本容量样本容量已知已知未知未知正态分布正态分布大样本(大样本(n30)或或 小样本(小样本(n30)非正态分布非正态分布 大样本(大样本(n30) 二、总体平均数的区间估计 (三)非正态总体 此时只考虑大样本情况。2022-3-101515/2x zn表6-2 不同情况总体均值的区间估计/2xzn/2xzn/2,1nsx tn/2xzn/2, 1nsx tn/2,1nsxzn三、总体比例的区间估计 只讨论大样本情况下的区间估计问题。 在实践中,由于总体比例P常常未知,这时可以用样本比例p来代替。 2022-3-101616/2/2()()111PPpznPPNnpznN重

10、复抽样时不重复抽样时三、总体比例的区间估计 【例6-4】在某一大城市对1200人随机调查结果显示,有823人支持限制小轿车的现有政策,假定该样本为简单随机样本,试计算全市支持该政策的人的比例的置信区间。(置信度是95%)。 解解:很容易计算出样本中,支持现有政策的人的比例 置信度1-=95%,=5%,/2=2.5%。临界值 。由于本例中全市人口未知,同时也可认为全市人口数远远大于样本容量1200人,n很大,可以按照大样本近似计算重复抽样的区间估计计算公式来近似计算。因此,支持现有政策的人比例的区间估计是: 即支持现有政策的人比例的置信区间为65.95%,71.21%。2022-3-101717

11、82368.58%1200p /20.0251.96zz/20.6858 1 0.68580.6858 1.960.68580.02612001pppzn第三节 两个总体平均数之差的区间估计2022-3-1018第六章 参数估计概述一、两个总体服从正态分布,它们的方差已知 根据中心极限定理,样本平均数之差的抽样分布就逼近正态分布,其标准差为 所以计算 的置信水平为 的置信区间的公式为 2022-3-10191912221212x xnn112 一、两个总体服从正态分布,它们的方差已知 【例6-5】某高校教务部门想了解两个学院英语期末考试成绩的平均差异,随机地分别从两个学院各抽取50名同学的成绩

12、组成随机样本。样本平均值如下:学院A:85分,学院B:79分。两个总体均服从方差分别为 12和 8的正态分布。试构造 的95%的置信区间。 解:由于两个总体均服从正态分布,因此, 也服从正态分布,从而计算总体均值之差的置信区间为 已知 ,所以95%的置信区间为 即(2.00,10.00),这就意味着有95%的把握认为总体均值之差在2.0010.00分之间。 2022-3-102020ABABxx222()ABABABxxznn1446414464(8579)1.96(8579)1.9650505050,0.0522=1.96zz二、两个总体服从正态分布,方差未知但相等 此时样本均值之差 标准差

13、为 ,其中统计量 服从自由度为 的t分布。置信度为 的两个总体均值之差( )的置信区间为 或2022-3-10212112x x222121211pppsssnnnn 12121211pxxtsnn12(2)n n 112222112212(1)(2)2pnsnssnn2211221212122(1)(1)11()2nsnsxxtnnnn1221211()pxxtsnn二、两个总体服从正态分布,方差未知但相等 【例6-6】某企业有两台生产设备。由设备A生产的零件中随机抽取21件;由设备B生产的零件中随机抽取28件。两个来自不同生产设备的零件的平均内径及方差数据如下: cm, cm; , 。假定

14、两个总体近似服从正态分布,且总体方差相等。试构造 的90%的置信区间。 解:根据总体方差相等的假设,可以算出共同方差 的一个估计值 : 的置信区间为 自由度为21+28-2=47,可靠性为90%, ,代入上式得: 所以,两台设备所加工零件的平均内径差别在0.510.69cm之间,这种估计的可靠性为90%2022-3-102222220.025Ascm22=1.678t55.6Bx AB220.04Bscm2ps56.2Ax 211()ABpABxxt snn11(56.2 55.6) 1.67530.034=0.60.089321282222(21 1)0.025(281)0.040.0342

15、1282(1)(2)2AABpABnsnssnn三、两个总体均服从正态分布,方差未知且不相等 当两个总体方差不相等时,两个平均值之差经标准化后的统计量 服从自由度为 的t分布。其中, 根据自由度 查t分布表可得置信区间为:2022-3-102323df 22211222222112212()()()11snsndfsnsnnn 1212221212()()xxtssnn df 221212122()pssxxt snn 【例例6-66-6】某企业有两台生产设备。由设备某企业有两台生产设备。由设备A A生产的零件中随机抽取生产的零件中随机抽取2121件;由设备件;由设备B B生产的零件中随机抽取

16、生产的零件中随机抽取2828件。两个来自不同生产设备的零件。两个来自不同生产设备的零件的平均内径及方差数据如下:件的平均内径及方差数据如下: cmcm, cmcm; , 。假定两个总体近似服从正态分布,且总体方差。假定两个总体近似服从正态分布,且总体方差不相等。试构造不相等。试构造 的的90%90%的置信区间。的置信区间。 解:解:其其自由度为自由度为得到得到 ,代入公式得:代入公式得: 即置信区间为(即置信区间为(0.51,0.690.51,0.69)。)。三、两个总体均服从正态分布,方差未知且不相等2022-3-10242411(56.255.6)0.034=0.60.0892212178

17、.67222(0.025 210.04 28)49(0.025 21)(0.04 28)2128df21.677=t220.025Ascm55.6Bx AB220.04Bscm56.2Ax 四、两个总体均不服从正态分布且方差未知 对于不服从正态分布的两个总体,考虑大样本的情形。根据中心极限定理,如果两个总体方差未知,就用 和 分别作为 和 的估计值,当 和 足够大时, 的置信水平为 的近似置信区间为 2022-3-1025251n1s12s22n121221212212()ssxxznn四、两个总体均不服从正态分布且方差未知 【例6-8】某部队甲、乙两个连队进行技能比赛,各参赛项目总分100。

18、根据历年成绩,甲连队认为该队战士此次技能比赛成绩比乙队高15分。为了证实这种推断,现从两队各抽取一个样本,样本资料如下: 人 , 人 , 分 , 分, 分, 分。试在95%的置信程度下确定两个连队平均成绩之差的置信区间。 解解:根据上述数据可算得: 当置信程度为95%时, ,从而其置信区间为 即置信区间为(0.54,8.46)。根据这个结果,我们有95%的把握说甲、乙两个连队技能比赛成绩之差在0.548.46分之间。这一结果说明,甲连队的平均成绩确实高于乙连队,但并未高出15分。 2022-3-10262622226.45.22.021520ABABxxABsssnn0.050.02521.9

19、6zz15An 222(75.871.3)1.962.024.53.96ABABABssxxznn20Bn 71.3Bx 5.2Bs 6.4As 75.8Ax 第四节 两个总体比例之差的区间估计2022-3-1027第六章 参数估计概述两个总体比例之差的区间估计 因为一般情况下,总体比例 和 都是未知的,所以上述标准差中的总体比例用样本比例 和 来代替,即于是总体比例之差 的置信度为 的置信区间由下式给出: 2022-3-1028281P11p112212/21211ppppppznn2P2p12112212(1)(1)ppppppSnn12()PP两个总体比例之差的区间估计 【例6-9】某汽

20、车制造集团有两个同类的下属制造企业A和B。为了提高产品质量,该集团首先对下属企业A的员工进行生产培训。培训结束后,该企业负责人对两个企业的产品质量进行了检验。从企业A抽取了320件产品,从B企业抽取了300件产品。检验的次品率A企业为 ,B企业为 试在95%的把握程度下,构造两企业废品率之差的置信区间。 解:根据公式可得从而其区间估计为即(-0.0375,-0.1225)。因此,我们有95%的把握说,企业A和企业B的废品率之差为3.75%12.25%。这说明,该集团对企业A人员的生产培训收到了效果。2022-3-102929/2()(0.04 0.12) 1.96 0.0217ABABpppp

21、zS0.04 (1 0.04)0.12 (1 0.12)0.0217320300(1)(1)ABAABBppABppppSnn=4%Ap =12%Bp 第五节 样本容量的确定2022-3-1030第六章 参数估计概述估计总体均值时样本容量的确定 (一)总体方差已知,简单重复抽样由 整理后可得: 即在给定极限误差、概率度要求下,应抽取的样本容量的最小值。 (二)总体方差已知,简单不重复抽样由 整理后可得: 2022-3-103131/2zn22/2222/2NznNz 22/22zn/21nzNn估计比例时样本容量的确定 2022-3-1032321. 重复抽样2. 不重复抽样2/221pzPP

22、n2/222/211pNzPPnNzPp P 应注意的问题 (一)计算样本容量时,上述公式都涉及到总体的方差与比例,而这些一般都是要估计的对象,是未知的。由此在抽样之前要计算必要的样本容量。 (二)如果进行一次抽样调查,同时估计总体均值与比例,用上面的公式同时计算出两个样本容量,可采用其中一个最大的样本容量的计算结果,这样就可同时满足两方面的需要。 (三)上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,而是采用比计算结果大的最小整数。这样可以满足精度和可靠程度的双重要求。 2022-3-103333样本容量的确定 【例6-10】某餐饮业对其顾客满意率进行抽样调查,之前进行的二

23、次调查资料显示,满意率分别是46%和38%,这次调查要求误差不超过10%,概率保证程度为99.73%,请问至少需要抽查多少顾客作为样本? 解解:已知1-=99.73%, , =0.1。通过之前进行的两次调查资料,分别求得成数方差为:0.46(1-0.46)=0.2484,和0.38(1-0.38)=0.2356。取方差最大者,因此选P=46%。由于一般情况下餐饮业顾客数量较大,抽出样本在总体中所占的比重很小,无论是重复抽样还是不重复抽样,结果相差不是很大,因此可按重复抽样方式计算;即,至少应抽取的样本容量为 根据结果可知,应抽取224位顾客进行调查。2022-3-10343422/222(1)

24、30.46 (1 0.46)2230. 615pzPPn/23zp样本容量的确定 【例6-11】某电子加工企业为了提高市场竞争力,对其中一种型号的电子产品进行性能检验,根据历年正常生产的经验数据,已知其标准差 为0.69,质量合格率P=95%。需要在95%的概率保证下,抽样平均性能的误差范围不超过0.24,抽样合格率误差范围不超过8%,问必要的抽样单位数为多少? 解解:已知=5%, 。可以认为总体容量远远大于样本容量,所以用重复抽样公式近似计算:因此,取以上计算结果中较大者,即n=32,应抽取32件电子产品作样本以同时保证产品性能检验与合格率调查的双重要求。2022-3-10353522222

25、/2121.960.69320.24()Pzn件/21.96z222/222(1)1.960.95 0.0529(0.08)PzPPn件第六节 总体方差和方差之比的区间估计2022-3-1036第六章 参数估计概述一、正态总体方差的区间估计 总体服从正态分布,则有即故 的置信度为 对应的置信区间为 2022-3-103737222(1)-1nsn ()12222221(1)(1),nsns22222221(1)(1)()1nsnsP 图图6-4 自由度为自由度为n-1的的分布分布一、正态总体方差的区间估计 【例6-12】某汽车制造企业为了计算完成某个工序所需的时间,进行一项试验,最终得出20个观察值组成的随机样本,根据样本数据计算得到的标准差为2.1工时。试求:(1)构造总体方差 的95%的置信区间?(2)构造置信区间作了何种假定? 解:(1)由题意可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论