3-33区间估计-PPT课件_第1页
3-33区间估计-PPT课件_第2页
3-33区间估计-PPT课件_第3页
3-33区间估计-PPT课件_第4页
3-33区间估计-PPT课件_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三节 区间估计四、大样本置信区间五、两个正态总体下的置信区间一、置信区间的定义二、置信区间的求法 枢轴量法三、单个正态总体参数的置信区间问题: 想象你经营一个食品商店.问能否根据下面的市场调查结果进行决策:(1) 点估计: 软饮料的每日平均需求量是 300 瓶;(2) 软饮料的每日平均需求量是每日 300 50 瓶.一、 区间估计的定义满足 定义1: 设是一个待估参数,对给定的 (01),若由样本 X1, X2, Xn 确定的两个统计量则称区间 是的置信水平(置信度)为1- 的置信区间(confidence interval).分别称为(双侧)置信下限和置信上限. 注1: 对参数作区间估计,

2、就是要设法找出两个只依赖于样本的界限(构造统计量) 一旦有了样本,就把估计在区间 内 .注2: 置信水平 1- 的频率解释: 在很多次的区间估计的观测值中, 至少有 100 (1- )% 次包含. 置信区间 (95% 的置信区间)重复构造出 的 20 个置信区间点估计值注3: 要求以很大的可能被包含在区间内,即概率 要尽可能大 .也就是要求估计尽量可靠. 估计的精度要尽可能的高. 即要求区间长度 尽可能短.可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.()()()()置信区间过宽,虽然包含真值,但抽样误差过大:置信区间也有可能不覆盖真值:实际工作时的情形,只有一次抽样:置信

3、度高,则结论更可靠置信区间的意义:估计抽样误差有时在实际中常用的还有单侧置信区间:则称 是的置信水平为 1- 的(单侧)置信下限. 定义3: 设 是统计量, 若对给定的(0 1),对任意的,有则称 是的置信水平为1- 的(单侧)置信上限. 定义4: 设 是统计量, 若对给定的(01), 对任意的, 有思考: 如果一条广告说,某药品的有效率为80%,其误差为正负3%,你相信这条广告吗?这条广告的发布者隐瞒了什么信息?在求置信区间时最常用的方法是枢轴量法. 步骤如下:二、置信区间的求法-枢轴量法1、设法构造一个样本和的函数 G = G( X1 ,., Xn ,) , 使得 G 的分布为已知(即不依

4、赖于未知参数). 称 G 为枢轴量.2、适当地选择两个常数 c、d, 使对给定的(0 1), 有3、将 进行不等式变形化为 , 则有最后的 就是的水平为1- 的置信区间.注: (常用点估计) 总体均值 的点估计为 ; 总体方差2 的点估计为 S 2 ; 总体方差 的点估计为 S 。求参数 的置信度为 的置信区间. 例如: 设 X1, Xn 是取自 的样本, 1、明确问题,是求哪个参数的置信区间?置信水平是多少?2、寻找未知参数的一个良好估计.解:三、单个正态总体的置信区间 选 的点估计为 , 3、寻找一个待估参数和样本的函数,要求其分布为已知.4、对于给定的置信水平, 根据G 的分布,确定一个

5、区间, 使得G取值于该区间的概率为置信水平. N(0, 1)对给定的置信水平1- ,查正态分布表得使 5、变形可得未知参数的置信区间.变形为也可简记为于是所求的置信度为1-的置信区间为注:我们总是希望置信区间尽可能短. 在概率密度为单峰且对称的情形,一般当 c =-d 时求得的置信区间的长度为最短.在概率密度不对称的情形,如 分布,F分布,习惯上仍取对称(即等尾)的分位点来计算未知参数的置信区间.注1: 满足置信度要求的 c, d 通常不唯一.若有可能, 应选择平均长度 达到最短的 c 与 d , 这在 G 的分布为单峰且对称分布通常容易实现. c =-d/2/2注2: 实际中, 选平均长度最

6、短的 c, d 很难实现. 因此常选择这样的 c, d, 使得两个尾部概率各为/2, 即:这样的置信区间称为等尾置信区间. 这是在G的分布为偏态分布场合常采用的方法. 如:由确定故 的置信区间为(2)推导 选取枢轴量(3)推导 选取枢轴量得 2 的置信区间为 则由单个正态总体置信区间常用公式(1) 方差 2已知, 的置信区间(2) 方差 2未知 , 的置信区间 (3) 当 未知时, 方差 2 的置信区间注:两边开方即得到 的置信区间(4) 当 已知时, 方差 2 的 置信区间(这种情况在实际中很少)取枢轴量 ,得 2 的置信度为 置信区间为 由概率总体均值的区间估计(例题分析)【 例1 】一家

7、食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。解:已知N(,102),n = 25, 1- = 95%, u1-/2=1.96。根据样本数据计算得: 。由于是正态总体,且方差已知。总体均值 在 1- 置信水平下的置信区间为 该食品平均重量的置信区间为101.44g109.28g。【例2】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命

8、(单位:h)如下。建立该批灯泡平均使用寿命95%的置信区间。总体均值的区间估计(例题分析)解:已知 N(,2),n=16, 1- = 95%,t1-/2=2.131 根据样本数据计算得: , 总体均值 在1- 置信水平下的置信区间为该种灯泡平均使用寿命的置信区间为1476.8h1503.2h。【例3】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间 。总体方差的区间估计(例题分析)解:已知n25,1-95% ,根据样本数据计算得 s2 =93.21 2置信度为9

9、5%的置信区间为 该企业生产的食品总体重量标准差的置信区间为7.54g13.43g。估计总体均值时样本量的确定 (例题分析)【例4】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本量?解: 已知 =2000,E=400, 1-=95%, u1-/2=1.96 应抽取的样本量为即应抽取97人作为样本。 四、大样本置信区间 若总体 X 的分布未知, 但样本容量很大, 由中心极限定理, 可近似地视为对给定的置信度1 - , 则 EX 的置信区间可取为若2 未知, 则 EX 的置信区间可取为总体均值的区间估计(例题

10、分析)【例5】一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间. 解:已知n=36, 1- = 90%,u1-/2=1.645。根据样本数据计算得: , 总体均值 在1- 置信水平下的置信区间为投保人平均年龄的置信区间为37.37岁41.63岁五. 总体比率的置信区间 (大样本)总体比率 Population Proportion : p样本比率 Sample Proportion: 如果是大样本,则: 其中 q = (1-p)因此总体比率的置信区间置信度为(1-)的置信区间为:由于 p 和 q 都是未知的,因此置信

11、区间近似为: 例6:某城市想要估计下岗职工中女性所占的比例,随机抽取了100名下岗职工,其中65人为女性。试估计该城市下岗职工中女性比例,并指出估计误差。置信水平要求为95%。已知 n=100, = 0.05, 置信区间为:65% 9.35%下岗职工中女性比例为65%。估计误差为9.35%。置信区间的内涵:区间 置信度降低置信度可以使置信区间变窄(误导读者)例题:一项有10000个人回答调查,同意某种观点的人的比例为70%(有7000人同意),可以算出总体中同意该观点的比例的95%置信区间为(0.691,0.709);另一个调查者调查了50个人。他声称有70%的比例反对该种观点,并说总体中反对

12、该观点的置信区间也是(0.691,0.709);所以,第二个调查的置信区间的置信度仅为11%。例题:如果在置信度不变的情况下,你要使目前所得到的置信区间的长度减少一半,样本量应增加到目前样本量的多少倍?如果保持置信区间的长度不变,样本量的增加会使什么发生变化?因此由于:样本量应增加到目前样本量的4倍。如果保持置信区间的长度不变,样本量的增加会使置信度增加。来自现实世界的数据量越大,我们对现实世界的了解就越清楚为取自总体 N ( 1 12 ) 的样本,为取自总体 N ( 2 22 ) 的样本,置信度为 1 ,以下分别讨论两均值差和两方差比的置信区间.分别表示两样本的均值与方差.五、两个正态总体的

13、置信区间的置信区间为(1) 已知时, 的置信区间(一)(2) 未知, 但的置信区间为相互独立的简单随机样本.则设与分别是来自正态总体与的两个总体均值之差的估计(例题分析)【例6】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12名工人,每个工人组装一件产品所需的时间(单位:min)下如表。假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间。21解: 根据样本数据计算得 合并估计量为两种方法组装产品所需平均时间之差的置信区间为0.14min7.26min。(二) 方差比的置信区间 ( 1 , 2 未知)

14、为两个总体方差比的区间估计(例题分析)【例7】为了研究男女学生在生活费支出(单位:元)上的差异,在某大学各随机抽取25名男学生和25名女学生,得到下面的结果 男学生: 女学生: 试以90%置信水平估计男女学生生活费支出方差比的置信区间。 解:根据自由度 n1=25-1=24 ,n2=25-1=24,查得 F/2(24)=1.98, F1-/2(24)=1/1.98=0.505 12 /22 置信度为90%的置信区间为男女学生生活费支出方差比的置信区间为0.471.84 。例8 某厂利用两条自动化流水线罐装番茄酱. 现分别 从两条流水线上抽取了容量分别为 13 与 17 的两个相互独立的样本 与

15、已知假设两条流水线上罐装的番茄酱的重量都服从正态分布, 其均值分别为 1与 2 , 若不知它们的方差是否相同, 求它们的方差比的置信度为0.95的置信区间.(1) 若它们的方差相同,求均值差的置信度为0.95 的置信区间;解查表得由公式 的置信区间为(1) 取枢轴量(2) 枢轴量为查表得 由公式得方差比 的置信区间为单侧置信区间设灯泡寿命服从正态分布. 求灯泡寿命均值的置信水平为 0.95 的同等单侧置信下限.例9 从一批灯泡中随机抽取 5 只作寿命试验,测得寿命 X(单位:小时)如下:1050,1100,1120,1250,1280方差 未知,解: 的点估计取为样本均值 , 对给定的置信水平

16、 确定分位点使即 由样本值得1065 小时。即的置信水平为1-的单侧置信下限为的置信水平为0.95的单侧置信下限是查表得EXCEL中命令说明: “=NORMSDIST(z)” 表示 N(0,1) 的分布函数值“=CHIDIST(x,deg_freedom)”表示卡方分布x 的概率“=TDIST(x,deg_freedom,tails)”表示t 分布x 的概率“=FDIST(x,deg_freedom1, deg_freedom2)” 表示F分布x 的概率“tails”取值为1或2EXCEL中命令说明: “=NORMSDIST(z)” 表示 N(0,1) 的分布函数值“=CHIDIST(x,de

17、g_freedom)”表示卡方分布x 的概率“=TDIST(x,deg_freedom,tails)”表示t 分布x 的概率“=FDIST(x,deg_freedom1, deg_freedom2)” 表示F分布x 的概率“tails”取值为1或2EXCEL中命令说明: “=NORMSINV(0.95)” 表示 N(0,1) 的0.95 分位数“=CHIINV(0.05, n)”表示卡方分布的0.95 分位数“=TINV(0.1, n)”表示 t 分布的 0.95 分位数“=FINV(0.05,m, n)” 表示 F 分布的0.95 分位数重要知识点:参数估计点估计矩估计点估计的评价标准:无偏性区间估计最大似然估计枢轴量法正态分布总体情形重要结论:矩估计三部曲求解总体矩(一般来说,有几个参数就求几阶矩,得到的一定是参数的函数)用样本矩

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论