版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七讲第七讲 参数估计参数估计一、什么是参数估计一、什么是参数估计 参数估计就是用样本统计量对总体的未知参数进行估计,简称参数估计。 以样本的统计值来估计总体的参数值,有两类做法,一类是点估计,另一类是区间估计。 1 1、点估计、点估计 是以一个最适当的样本统计值来代表总体的参数值。 合适的样本统计量作为参数估计量,如下:11niiXXn2211()1niiSXXn2 2、区间估计、区间估计 就是以两个数值之间的间距来估计参数值。 区间估计要包括两个要素:区间估计要包括两个要素: 一是要有合理的允许误差范围。指样本统计量与被估计总体参数离差的绝对值可允许变动的上限或下限; 二是要有一个可接受的
2、置信度。置信度又称推断的概率保证程度,这是估计的可靠性问题。二、点估计的估计方法二、点估计的估计方法 点估计,以一个最适当的样本统计值代表总体的参数值。点估计,以一个最适当的样本统计值代表总体的参数值。 评价估计量优劣的三个标准:评价估计量优劣的三个标准:(1 1)无偏性。即样本统计量的期望值(平均值)等于被估)无偏性。即样本统计量的期望值(平均值)等于被估计的总体参数。计的总体参数。虽然每一次抽样的统计量取值和总体参数的真值可能虽然每一次抽样的统计量取值和总体参数的真值可能有误差,但在多次反复抽样中,所有样本统计量取值的平有误差,但在多次反复抽样中,所有样本统计量取值的平均数应该等于总体参数
3、本身。均数应该等于总体参数本身。(2 2)一致性。即当样本的单位数充分大时,样本)一致性。即当样本的单位数充分大时,样本统计量充分靠近总体参数。统计量充分靠近总体参数。 ()有效性。即作为优良估计量的方差比其他()有效性。即作为优良估计量的方差比其他估计量的方差小。估计量的方差小。 用样本均值作为总体均用样本均值作为总体均值的点估计,用样本方差值的点估计,用样本方差作为总体方差的点估计。作为总体方差的点估计。 对于是定类变量,对于是定类变量,X X取值取值为(为(1 1,0 0),可以用样本),可以用样本成数作为总体成数估计值。成数作为总体成数估计值。11niiXXn2211()1niiSXX
4、n11niimpXnn例例1 1、工会为了解春游期间需租用几辆公共、工会为了解春游期间需租用几辆公共汽车,在全厂汽车,在全厂1000010000名职工中随机抽取名职工中随机抽取100100人进行调查。结果显示,其中有人进行调查。结果显示,其中有2020名愿意外名愿意外出旅游。设每辆车可载乘客出旅游。设每辆车可载乘客5050名,问估计要名,问估计要预租多少辆公共汽车?预租多少辆公共汽车? 解:解:P=20/100=0.2P=20/100=0.2可以用可以用P P 作为愿意外出春游总体成数的点估计,因作为愿意外出春游总体成数的点估计,因此全厂估计将有:此全厂估计将有:1000010000* *0.
5、2=20000.2=2000(人)(人)参加春游。又因为每辆公共汽车可容乘客参加春游。又因为每辆公共汽车可容乘客5050人,因人,因此有:此有:2000/50=402000/50=40(辆)(辆)三、区间估计的估计方法三、区间估计的估计方法1 1、置信区间、置信区间 置信区间是用来估计参数取值范围的,是根据置信区间是用来估计参数取值范围的,是根据给定的置信度要求,指出总体参数被估计的上限给定的置信度要求,指出总体参数被估计的上限和下限。和下限。2 2、置信度与显著性水平、置信度与显著性水平 对于总体被估计参数对于总体被估计参数 ,找出样本的两个估计量,找出样本的两个估计量11和和22,(,(1
6、212)使被估计参数落在区间()使被估计参数落在区间(11,22)内的)内的概率为概率为1-1-,其中,其中 为介于为介于0 01 1之间的已知数,即之间的已知数,即 P P(1212)=1-=1- 称区间(称区间(11,22)为总体参数的估计区间,)为总体参数的估计区间,11为估计下限,为估计下限,22为估计上限,为估计上限,1-1-为估计置信度(表为估计置信度(表示用置信区间估计的可靠性),示用置信区间估计的可靠性), 为显著性水平(表为显著性水平(表示用置信区间估计不可靠的程度)。示用置信区间估计不可靠的程度)。3 3、置信区间与置信度的关系、置信区间与置信度的关系 置信区间指被估计参数
7、的可能范围,置信度为对参数落在这一范围内给定的概率保证程度。 参数的可能范围是估计的准确性问题,而相应的概率保证程度(置信度)是估计的可靠性问题。 在作估计时我们常常希望准确性尽可能提高,在作估计时我们常常希望准确性尽可能提高,而且可能性也不能小,但这两个要求是矛盾的。在而且可能性也不能小,但这两个要求是矛盾的。在样本容量不变的条件下,要缩小估计区间,提高估样本容量不变的条件下,要缩小估计区间,提高估计的准确性,势必减少置信度,降低估计的可靠性计的准确性,势必减少置信度,降低估计的可靠性。样本变量3438424650343436384042383638404244423840424446464
8、042444648504244464850例例2、用有放回抽样的方法,从、用有放回抽样的方法,从5人中间抽取人中间抽取2个构成样本,个构成样本,求样本日平均工资,并推算总体的工资水平置信区间求样本日平均工资,并推算总体的工资水平置信区间样本日平均工资样本日平均工资频数频数频率频率3411/253622/253833/254044/254255/254444/254633/254822/255011/25合计合计251(1 1)计算样本日平均平均数和方差为)计算样本日平均平均数和方差为4242和和3333。 (2 2)根据以上分布资料可以写出样本日平均工资落在各种)根据以上分布资料可以写出样本日
9、平均工资落在各种区间的概率区间的概率p p。例如: P(40 44)=(4/25)+(5/25)+(4/25)=13/25 P(38 46)=(3/25)+(4/25)+(5/25)+(4/25)+(3/25)=19/25 P(34 50)=(1/25)+(2/25)+(19/25)+(2/25)+(1/25) =1 xxx 在重复抽样中,样本日平均工资与总体日平在重复抽样中,样本日平均工资与总体日平均工资的绝对离差不超过均工资的绝对离差不超过2 2元的概率为元的概率为13/2513/25,即,即有有52%52%的概率保证总体日平均工资落在的概率保证总体日平均工资落在40404444元元之间。
10、之间。 绝对离差不超过绝对离差不超过4 4元的概率为元的概率为19/25=76%19/25=76%,抽样误差不超过抽样误差不超过8 8元的概率为元的概率为100%100%。 抽样误差范围和估计置信度是密不可分的,抽样误差范围和估计置信度是密不可分的,抽样误差愈小,估计准确度愈高,但置信度愈小。抽样误差愈小,估计准确度愈高,但置信度愈小。置信度与准确性的关系当均值为0,标准差为1时,正态分布为标准化正态分布。4 4、抽样误差范围的计算、抽样误差范围的计算 假定我们以Z表示置信度,S表示样本的标准差,SE= 表示抽样平均误差(抽样标准误),n是样本的大小,为抽样误差范围 =Z nSnS例3、经抽样
11、调查计算样本亩产粮食600公斤,并求得抽样平均误差为3公斤,现在给定抽样误差范围为6公斤,求总体平均亩产落在估计区间的概率。 已知:已知:X=600X=600公斤,公斤,SE=3SE=3公斤,公斤,=6=6公斤,公斤,则:估计区间是为(则:估计区间是为(600-6600-6,600+6600+6)= =(594594,606606) Z= /SE = 6/3=2Z= /SE = 6/3=2 查正态概率表,落在估计区间内的概率为查正态概率表,落在估计区间内的概率为 F F(Z Z)=F=F(2 2)=95.45%=95.45%例4、麦当劳餐馆在7星期内抽查49位顾客的消费额(元)如下:求在概率9
12、0%的保证下,顾客平均消费额的估计区间。15243826304218302526344420352426344818284619303642243245362147262831424536242827323647532224324626第一步:第一步:根据样本计算样本平均数和标准差: =32, s=9.45, =9.45/7=1.35第二步:第二步:根据给定的置信度F(Z)=90%,查概率表得Z=1.64第三步:第三步:计算=Z*SE=1.64*1.35=2.2元 据此估计总体平均消费额下限=32-2.2=29.8元。估计总体平均消费额上限=32+2.2=34.2元点估计:点估计:麦当劳餐馆总
13、体顾客平均消费额为32元。区间估计:区间估计:以90%的概率保证,麦当劳餐馆顾客消费额在29.834.2之间。nxxsSEn 例5、麦当劳抽查49位顾客的消费额如下表,抽样误差范围不超过2.2元,试估计顾客平均消费额的置信区间,并计算其置信度。15243826304218302526344420352426344818284619303642243245362147262831424536242827323647532224324626第一步:抽取样本,计算样本平均数和标准差第一步:抽取样本,计算样本平均数和标准差: =32, =9.45, =9.45/7=1.35第二步:根据给定的第二步:根
14、据给定的=2.2=2.2,计算总体平均消费额的上限和下限。,计算总体平均消费额的上限和下限。 总体平均消费额下限=32-2.2=29.8元。 估计总体平均消费额上限=32+2.2=34.2元第三步:根据第三步:根据 Z=/SE = 2.2/1.35 = 1.63Z=/SE = 2.2/1.35 = 1.63,查概率表得,查概率表得F F(Z Z)= 90%= 90% 计算结果表明以90%的概率保证麦当劳顾客平均消费的置信区间为29.834.2之间。nxxsSEn四、总体成数(比例、百分比)的估计四、总体成数(比例、百分比)的估计 例例6 6,在一项新广告活动的跟踪调查中,被,在一项新广告活动的
15、跟踪调查中,被调查的调查的400400人中有人中有240240人能记起广告的标语。试人能记起广告的标语。试求能记起广告标语占总体比率的求能记起广告标语占总体比率的95%95%置信度的置信度的估计区间。估计区间。第一步第一步,根据样本资料计算: P = n1/n2 = 240/400 = 60%SE = =0.024549. 0) 6 . 01 ( 6 . 0)1 (Ppnpp)1 ( 第二步:根据给定的置信度要求第二步:根据给定的置信度要求F F(Z Z)=0.95=0.95, 查概率表求查概率表求Z Z值,得值,得Z=1.96Z=1.96第三步:根据第三步:根据p=Zp=Z* *SESE,=
16、1.96=1.96* *2.45%=4.8%2.45%=4.8%,则,则 总总体比率的上下限为:体比率的上下限为: 下限下限 = P-p = 60%-4.8%=55.2%= P-p = 60%-4.8%=55.2% 上限上限 = P+p = 60%+4.8%=64.8%= P+p = 60%+4.8%=64.8% 区间估计:以概率区间估计:以概率95%95%的保证程度,估计会记起广告的保证程度,估计会记起广告 标标语的人数占总体比率在语的人数占总体比率在55.2%55.2%64.8%64.8%之间。之间。 例7,估计某市居民住户拥有冰箱的普及率,随机抽取900户居民户,其中有675户居民有冰箱
17、。在抽样极限误差不超过2.8%的情形下,试对该市居民住户冰箱普及率进行估计。 第一步,计算成数、标准差,并推算抽样平均误差第一步,计算成数、标准差,并推算抽样平均误差SESE。P = 675 / 900 = 75%s= 0.43SE =1.4%第二步,根据给定的第二步,根据给定的p=2.8%p=2.8%,计算总体成数估计区间的下,计算总体成数估计区间的下限和上限限和上限。估计区间下限 = P p = 75% - 2.8% =72.2%估计区间上限 = P +p =75% + 2.8% = 77.8%第三步,根据第三步,根据Z =p/SE = 2.8%/1.4% = 2Z =p/SE = 2.8%/1.4% = 2。查概率。查概率表得表得F F(2 2)= 95.45%= 95.45% 点估计:点估计:估计该市居民冰箱普及率为75%。 区间估计:区间估计:以概率95.45%的保证程度,估计该市居民冰箱普及率在72.277.8%之间。五、样本的确定2理论上讲,样本越大越有代表性。但样本大,所需要理论上讲,样本越大越有代表性。但样本大,所需要的研究费用也越大。因此在调查前需要结合置信度、个案的研究费用也越大。因此在调查前需要结合置信度、个案之间相互差异的大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合同管理培训合同:上海项目实践与招投标(2025版)
- 二零二五年度智慧城市建设名义合伙人合同3篇
- 2025年度农民工劳动合同电子化管理方案及实施细则3篇
- 二零二五年度农业产业链金融服务创新合同-@-1
- 2025版企业内部设备维修承包合同规范文本4篇
- 2025年度排洪渠项目监理合同模板3篇
- 二零二五年度人工智能核心算法软件知识产权独家转让合同3篇
- 二零二五年度全新品牌专卖店开设服务合同范本4篇
- 2025年度票据代理业务委托合同范本6篇
- 2025年度苗圃技术员岗位聘用合同修订版
- 《风电场项目经济评价规范》(NB-T 31085-2016)
- 拔罐技术操作考核评分标准
- 戒赌法律协议书范本
- 竞选市级三好学生PPT
- 2024届甘肃省兰州市五十一中生物高一上期末检测模拟试题含解析
- 高标准农田建设上图入库(技术培训)
- 火灾隐患整改登记表
- 普通地质学教材
- 天津华宁KTC101说明书
- 【智慧校园】-智慧校园系统方案
- 外研版高中新教材英语单词表(必修一)
评论
0/150
提交评论