




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章参数估计参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计参数估计,就是根据一个随机样本的统计值来估计总体的参数值。应用广泛,随处可见。参数估计的基本方法点估计与区间估计估计量:用于估计总体参数的随机变量如样本均值,样本比率、样本方差等例如:样本均值就是总体均值
的一个估计量参数用
表示,估计量用表示估计值:估计参数时计算出来的统计量的具体值如果样本均值
x
=80,则80就是
的估计值估计量与估计值点估计用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计选择估计量的标准是什么?评价估计量的标准——无偏性
无偏性:估计量抽样分布的数学期望等于被估计的总体参数P(
)BA无偏有偏评价估计量的标准——有效性有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效
AB的抽样分布的抽样分布P(
)评价估计量的标准——一致性一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(
)点估计的缺陷没有给出估计值接近总体参数程度的信息。点估计完全正确的概率通常为0。因此,我们更多的是考虑用样本统计量去估计总体参数的范围
区间估计。区间估计
(intervalestimate)含义:在点估计的基础上,估计总体参数的区间范围,并给出区间估计成立的概率值。其中,称作置信区间称作置信度,可信度,或置信水平称作显著性水平。置信水平的一般取值:置信区间与置信水平样本均值的抽样分布(1-
)%区间包含了
%的区间未包含
1–aa/2a/2置信水平与Z的对应关系区间估计的图示
X95%的样本
-1.96
x
+1.96
x99%的样本
-2.58
x
+2.58x90%的样本
-1.65
x
+1.65
x区间估计的基本要素包括:样本点估计值、抽样极限误差、估计的可靠程度样本点估计值抽样极限误差:可允许的误差范围。抽样估计的可靠程度(置信度、概率保证程度)及概率度Δ表示极限误差。总体均值的区间估计正态总体且方差已知,或非正态总体,方差未知、大样本正态总体,方差未知、小样本总体均值的区间估计
(正态总体、
2已知,或非正态总体、大样本)
2已知1. 假定条件总体服从正态分布,且方差(
2)
已知如果不是正态分布,可由正态分布来近似(n
30)总体均值
在1-
置信水平下的置信区间为
2未知1. 假定条件总体服从正态分布,大样本如果不是正态分布,可由正态分布来近似(n
30)总体均值
在1-
置信水平下的置信区间为总体均值的区间估计
(大样本)1. 假定条件总体服从正态分布,方差已知或未知如果不是正态分布,可由正态分布来近似(n
30),方差已知或未知总体均值
在1-
置信水平下的置信区间为总体均值的区间估计
(例题分析)【例】某种零件的长度服从正态分布,从某天生产一批零件中按重复抽样方法随机抽取9个,测得其平均长度为21.4cm。已知总体标准差为
=0.15cm。试估计该批零件平均长度的置信区间,置信水平为95%解:已知:
=0.15cm,n=9,x=21.4,1-=95%即:21.4±0.098=(21.302,21.498),该批零件平均长度的置信区间为21.302cm~21.498cm之间总体均值的区间估计
(例题分析)【例】一家保险公司收集到由36个投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计
(例题分析)解:已知n=36,1-=90%,z
/2=1.645。根据样本数据计算得:,
总体均值
在1-
置信水平下的置信区间为投保人平均年龄的置信区间为37.37岁~41.63岁总体平均数的区间估计21、根据置信度1-α,求出极限误差Δ,并指出总体平均数的估计区间。2、给定极限误差,求置信度。例:经抽样调查计算样本平均亩产粮食600公斤,并求得抽样平均误差为3公斤,现给定允许极限误差为6公斤,求置信区间包含总体平均亩产的概率,即求置信水平。结果表明,如果多次反复抽样,每次都可以由样本值确定一个估计区间,每个区间或者包含总体参数的真值,或者不包含总体参数的真值,包含真值的区间占F(z),即每一万次抽样,就有9545个样本区间包括总体亩产,其余455个样本区间不包括总体平均数,即若接受估计区间的判断要冒4.55%的机会犯错误的风险。回顾参数估计(意义)点估计区间估计:以抽样分布为理论依据,大多已知比如
X的抽样分布~正态,且E(
X)=μ
构造统计量~Z分布或t分布,好处:总体正态,δ已知;总体非正态,大样本n无偏有效一致准确性差接近程度不知总体均值的区间估计
(正态总体、
2未知、小样本)总体均值的区间估计
(小样本)1. 假定条件总体服从正态分布,且方差(
2)
未知小样本
(n<30)使用t
分布统计量总体均值
在1-
置信水平下的置信区间为t分布
t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的t分布依赖于称之为自由度的参数。随着自由度的增大,t分布也逐渐趋于正态分布Xt
分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(k=13)t(k=5)Z总体均值的区间估计
(小样本)总体均值的区间估计
(例题分析)【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间16灯泡使用寿命的数据1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计
(例题分析)解:已知X~N(
,2),n=16,1-=95%,t
/2=2.131。根据样本数据计算得:,
总体均值
在1-
置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8小时~1503.2小时练习设某社区受教育程度服从正态分布N(μ,σ2)。根据25人的随机抽样调查结果:求μ的双侧置信区间(1-α=0.99)总结总体分布样本容量已知未知正态分布大样本(n≥30)小样本(n≤30)非正态分布大样本(n≥30)总体比例的区间估计总体比例的区间估计
(大样本)在重复抽样的情况下,总体比例
在1-
置信水平下的置信区间为在不重复抽样的情况下总体比例
在1-
置信水平下的置信区间为总体比例的区间估计
(例题分析)【例1】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%
例2:某企业共有职工1000人。企业准备实行一项改革,在职工中征求意见,采用不重复抽样的方法随机抽取200人作为样本,调查结果显示,有150人表示赞成该项改革,50人反对。试以95%的置信水平确定赞成改革的人数比例的置信区间。综合练习1、已知某校的一次考试全体考生成绩总体方差σ2=100,从中抽得5位考生的成绩为65,83,94,70,88,求全体考生成绩均值的95%和99%的置信区间。2、某校对高中一年级学生进行英语水平测试,测试后从中抽取9个考生的成绩为83,91,62,50,74,68,70,65,85,试对该年级考生的该次成绩均值做区间估计(α=0.05)3、根据居民区100户抽样家计调查,居民用于食品费用占总收入的比例,平均为75%,比例的标准差为20%,求食品费用占居民总收入比例的区间估计(置信度为95%)?4、考察某区受教育程度,50人随机抽样的受教育年限调查结果如下:试求该区受教育年限均值的区间估计(α=0.01)总体方差的区间估计假定:总体服从正态分布可知,统计量:对于给定置信度1-
,双侧区间χ2的临界值满足:总体σ2在1-
置信水平下的置信区间为:例题设某村平均家庭购买化肥的支出服从正态分布,现根据十户支出的抽样调查结果:求方差σ2和标准差σ的置信区间(α=0.05)练习某校高中语文毕业考试中,随即抽取15份,成绩如下:75,68,72,89,86,78,91,92,79,83,88,90,85,77,82确定语文成绩的标准差在什么范围。(α=0.05)单个总体的参数估计:μ、π、σ(χ2分布)两个总体间差异的估计:μ1-μ2、π1-π2、大样本二总体均值差的区间估计设第一个总体的参数为第二个总体的参数为现从两个总体中独立的各抽取一个随机样本:来自第一总体的随机样本:来自第二总体的随机样本:于是样本的均值差:可以作为总体均值差的的点估计值。大样本二总体均值差的区间估计的值为例:为了解甲、乙两地中学毕业成绩的差别,两地作了抽样调查,结果有:甲地:乙地:求置信度为0.95两地平均成绩差的区间估计。大样本二总体成数差的区间估计大样本二总体成数差的区间估计的值为例:甲乙两地各作1000户抽样调查。其中甲地拥有汽车为825户;乙地拥有汽车为760户。求置信度为0.95两地汽车拥有成数差的置信区间。
样本容量的确定决定样本大小需考虑的几个因素:所能容忍的误差范围研究代价研究总体的情况日后作何种分析假设从一个随机样本n中计算出来的均值与总体的均值M的差为e,如用绝对值来表示,即根据总体均值M的区间估计公式因此估计总体均值时样本容量n为估计总体均值时样本容量的确定其中:估计总体均值时样本容量的确定
(例题分析)【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望误差为400元,应抽取多大的样本容量?估计总体均值时样本容量的确定
(例题分析)解:已知
=2000,E=400,1-=95%,z/2=1.96
根据公式得:即应抽取97人作为样本根据比例区间估计公式可得样本容量n为估计总体比例时样本容量的确定根据:估计总体比例时样本容量的确定
(例题分析)【例】根据以往的生产统计,某种产品的合格率约为90%,现要求边际误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?解:已知
=90%,
=0.05,Z/2=1.96,E=5%
应抽取的样本容量为
应抽取139个产品作为样本本章总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关联企业合同范例
- 2025年上海货运从业资格证考试答案
- 2025年崇左货运上岗证考试考哪些科目
- 2025年邯郸货车丛业资格证考试题
- 低压车回收合同范本
- 农村建房装修合同范本
- 养殖合作加盟协议合同范本
- 农耕地出租合同范本
- 传媒签约合同范本
- 加气站合同范本
- 酒店电子商务全套课件
- 质量体系的职能架构
- 《旅游经济学》全书PPT课件
- 中国医院质量安全管理 第3-5部分:医疗保障 消毒供应 T∕CHAS 10-3-5-2019
- 安全评价理论与方法第五章-事故树分析评价法
- 幼儿园一日活动流程表
- 中国民俗知识竞赛题(附答案和详细解析)
- 最后一分钟安全检查
- 散装水泥罐体标准资料
- 原发性肝癌临床路径最新版
- 2022年口腔医学主治医师(代码353)考试题库(汇总版)
评论
0/150
提交评论