版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
总体参数的区间估计
与假设检验第十三讲大纲参数的区间估计含义基本步骤总体均值、方差和比例的区间估计参数假设检验的基本概念基本思想p值否定域与接受域区间估计问题的提出例:已知来自正态总体的样本均值,如果我们进行大量的重复抽样,那么95%的
Xbar会落在一个什么样的关于
的对称区间中?根据,得到
r=normsinv(0.975)*
=1.96
当m已知时我们可以得到上式的含义:一次抽样后,我们得到一个来自正态总体的样本均值,它有95%的可能性落在区间(m-r,m+r)中但是m是未知的,如何根据
求m的区间?求m的区间当
已知,m未知时,把m作为未知数求解,得到上式的含义:区间
有95%的概率包含真实的参数m
每次抽样会有一个,从而区间会随样本的不同而变化,成为随机区间注意:
m不是随机变量总体均值的置信区间如果区间满足则称之为总体均值m置信度为95%的置信区间我们有95%的把握保证该区间包含真实的m反复抽取容量为n的样本,都可得一个置信区间,但每个置信区间不一定包含未知参数的真值,而包含真值的区间占95%注意:不能说,m有95%的可能性落在区间
内,因为m不是随机变量置信区间的一般定义如果
,则称为总体参数q的置信区间,其中,1-
a为置信度或置信水平,a为显著水平置信区间的理解要点根据一组样本观测值作出估计,给出估计值的范围用概率术语(置信度或置信水平)说明估计值与未知总体参数的接近程度区间估计的基本步骤区间估计就是求解置信区间确定待估参数和置信水平;确定估计量,并找出估计量的抽样分布;利用抽样分布给出置信区间重点是确定估计量,它含有待估参数,不含其它未知参数,它的分布已知,
且分布不依赖于待估参数关键是确定2已知时,总体均值的区间估计适用情形:来自正态总体的抽样,且方差已知
大样本情形,总体方差已知都有样本均值服从正态分布将该分布转化为标准正态分布,即推导置信区间半径r对于1-
a的置信区间,有90%置信度的区间半径为95%置信度的区间半径为99%置信度的区间半径为a越小,r越大要求的置信度越高,区间半径越大Excel中的Confidence函数运用Excel中的Confidence函数,直接求置信区间的半径rr又称之为极限误差
Confidence(a,standard_dev,size)a为显著水平Standard_dev:总体标准差(如果已知);或样本标准差(如果总体标准差未知,又是大样本情形)Size:样本容量
对置信区间的模拟与观察用Excel进行置信区间的计算从一个均值为5,标准差为3的正态总体进行1000次重复抽样,每个样本包含10个样本点。现在每个样本的均值已知总体均值未知,但总体方差已知观察在不同的置信度下,1000个置信区间包含真实总体均值的比例例假设样本取自50名乘车上班的员工,他们花在路上的平均时间为30分钟,总体标准差为2.5分钟。则总体均值落入下列区域内的置信度为95%:即:Confidence(0.05,2.5,50)=0.692951花在上班路上的平均时间为30±0.692951分钟,或29.3到30.7分钟说明在前面的估计中,我们都假定样本为简单随机样本,即为放回随机抽样得到的在不放回抽样的时候,我们需要引入一个有限总体修正系数
,其中N为总体单位数,n为样本容量。这时有限总体修正系数主要适用于当n占N比例很大时的不放回抽样例一个拥有50位员工的公司想了解员工每天上网的时间,抽样记录了10位员工,结果平均数为60分钟。已知该公司员工上网的时间为正态分布,标准差为20分钟,求总体均值90%的置信区间
=Confidence(a,standard_dev,size)*=Confidence(0.1,20,10)*(40/49)^0.5=9.4所以总体均值90%的置信区间为(50.6,69.4)如果不考虑有限总体修正系数,得到的置信区间为(49.6,70.4),区间变大根据误差,求样本容量接上题,如果希望误差不超过5分钟,应该选取多少人?根据
可知:2未知时,总体均值的区间估计当总体方差未知,又是正态总体时,有统计量当n很大时,近似服从标准正态分布置信区间半径
ta=tinv(a,df)有限总体修正系数例张先生是台湾某集团的企划部经理,在今年的规划中,集团准备在某地新建一家新的零售商店,设立商店要求行人数最低为520。张先生目前正在做这方面的准备工作。其中经过该地行人数量是他要考虑的一个很重要的方面。张先生委托他人进行了两个星期的观察,得到每天经过该地人数如下:544,468,399,759,526,212,256,456,553,259,469,366,197,178根据以上数据,张先生应该作出怎样的判断?张先生决策的依据就是经过此地的行人数是否平均每天达到520人需要计算总体均值的置信区间,取a=5%问题性质:小样本,总体方差未知,正态总体,n占N比例很小=tinv(0.05,13)*得到的置信区间为(306,500)含义:有95%的把握可以认为每天的平均行人数在(306,500)之间,没有达到520,不建议设店正态总体方差的区间估计当m已知时,,从而得到得2
置信度为1-
a的置信区间为
正态总体方差的区间估计当m未知时,有统计量置信区间为这种情形是最常见和常用的=Chiinv(a/2,n-1)某工厂生产一批滚珠,其直径X服从正态分布N(
2),现从某天的产品中随机抽取
6
件,测得直径为
15.1,
14.8,
15.2,
14.9,
14.6,
15.1
(1)若
2=0.06,求
的置信区间
(2)若
2未知,求
的置信区间
(3)求方差
2的置信区间练习总体比例的区间估计已知如果样本容量n足够大(np和n(1-p)都大于5),或者即使n不大,只要p接近0.5,样本比例的样本分布为:
标准化的结果为:
同理可以得出对总体比例p的区间估计半径总体参数的假设检验什么是假设检验利用样本所提供的信息判断各种说法的真伪,对总体参数进行一种推断基本思想:概率性质的反证法小概率事件在一次试验中几乎不可能发生,p≤0.05先假设某种说法成立,导出了不合理的现象,说明原假设不正确;没有导出不合理现象,不能拒绝原假设概率性质的反证法与反证法两者是有区别的反证法不合理是逻辑中的绝对矛盾概率性质的反证法基于小概率事件在一次观察中被认为基本不会发生不存在逻辑中的绝对矛盾如果原假设真的成立,而得到样本观测结果的概率很小,一个小概率的事件在一次实验中居然发生了,这是我们不能够接受的,在这种情况下我们只能拒绝原假设例子讨论一家速递公司声称该公司市内门到门的速递时间平均只有28分钟,为了证实该广告是否可靠,我们随机跟踪了100件业务,结果发现其平均投递时间为31.5分钟,标准差为5分钟。请问它的广告可信吗?假设广告可信,看看会不会产生不合理的现象令H0代表所提出的假设,H0:m=28;令H1代表与此对立的假设,H1:m≠28;先看一下置信区间因为n=100,为大样本情形,可以认为近似有当n=100,Xbar=31.5,a=5%时,m的置信区间为[30.5,32.5]因为28<30.5,因此原假设所声称的m=28不在95%的置信区间内我们有95%的把握可以拒绝H0,做出这样的结论并不是百分之百正确,但我们犯错误的可能性为a=5%再看一下概率如果H0:m=28真的成立的话,那么我们随机调查的结果为
的可能性为多少?=1-normdist(31.5,28,5/100^0.5,1)=0如果原假设真的成立,那么出现我们上述随机调查结果的概率几乎为零一个零概率的事件在一次实验中居然发生了,这是我们不能接受的,所以我们只能拒绝原假设假设检验中的两类错误零假设:又称原假设、基本假设,陈述的是需要检验的假设,用H0表示备择假设:又称被选假设、对立假设,陈述的是与零假设的对立情况,用H1表示第一类错误:以真为假,把正确的假设当作错误予以否定后果往往严重,出现第一类错误的概率记为a第二类错误:以假为真,把错误的假设认为正确予以接受,出现概率记作b
通常不易计算两类错误与司法审判裁决
实际情况裁决实际情况有罪无罪有罪无罪有罪正确第II类错误冤枉好人有罪正确第I类错误冤枉好人无罪第I类错误放走坏人正确无罪第II类错误放走坏人正确法院裁决H0
:有罪法院裁决H0
:无罪判断实际情况H0为真H0为假接受H01-a第二类错误(b),取伪拒绝H0第一类错误(a),弃真检验力(1-b)统计检验过程:H0
检验不能同时降低两类错误在一定的样本容量下,减小第一类错误发生的概率,必然增大第二类错误发生的概率在假设检验中,我们通常只关注第一类错误的发生,只对a的大小予以限制这是因为第一类错误发生的概率易于计算检验力(power):1-b减小第二类错误发生的概率,意味着提高检验力提高检验力的途径:增加样本容量,加大零假设与备择假设间的差异性,减少调查误差图示:
a
与b
的说明H0:m=m0;H1:m=m1当样本均值落在红线左边的阴影的区域内时,我们拒绝H0,此时我们犯错误的概率为a
当样本均值落在红线右边的阴影区域内时,其概率为b,我们不能拒绝H0,此时我们犯错误的概率为bp值p值是一个概率值;它是原假设为真时,样本统计量不同于(大于或小于,依情况而定)实测值的概率p值还被称为观察到的(或实测的)样本值的显著性水平,是H0能被拒绝的最小值
p值越小,表明原假设越有可能为假当p值大于显著水平时,拒绝原假设当p值小于显著水平时,不能拒绝原假设否定域与接受域给定统计量或p值的临界值,当统计量或p值超过临界值时,我们会拒绝原假设由统计量或p值临界值所确定的拒绝原假设的区域称为拒绝域,反之为接受域假设检验中通常选择显著水平a作为p值的临界值拒绝域的大小与显著水平a的大小有关同一组样本值,在不同的显著水平下,可能得出截然相反的结论否定域的分布通常而言,否定域位于统计量分布曲线的尾部,具体的方向取决于备择假设的具体内容对于H1:m≠m0,拒绝域在分布曲线的两侧,称为双尾或双侧检验对于H1:m>m0,拒绝域在分布曲线的右侧对于H1:m<m0,拒绝域在分布曲线的左侧建立检验假设的原则将样本观测值所支持的结论作为备择假设H1这是因为当我们拒绝零假设时,我们所犯的错误概率是可以控制的,所以应当把期望拒绝的结论作为零假设,期望保护的结论作为备择假设同时,根据概率意义下的反证法,拒绝原假设是有说服力的,而接受原假设是没有说服力的。因此应把希望否定的假设作为原假设例观察到样本均值
,可以建立的假设检验有:H0:m=
103;H1:m≠103
或H0:m≥
103;H1:m<103如果反过来会怎样?H0:m≤
103;H1:m>103拒绝域在右侧,由于样本均值≤103,这样我们永远没有机会拒绝原假设!双尾检验适用于检验无方向性的研究假设,这种假设表明的是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度安全生产文明工地安全防护设施设计及施工合同3篇
- 全国电子工业版初中信息技术第六册第3单元3.1活动3《垃圾智能分类的图像采集》说课稿
- 2024年酒店弱电设施升级改造工程合同范本
- 2025年度附期限个人信用贷款合同书(2025版)6篇
- 2025年度股权投资合同:初创企业投资与股权分配协议3篇
- 2025年上教版八年级地理上册阶段测试试卷含答案
- 2025年粤人版七年级科学上册月考试卷
- 2025年人教版(2024)六年级英语下册阶段测试试卷含答案
- 组合图形的面积(说课稿)-2024-2025学年六年级上册数学人教版
- 第一单元 主题活动三《舌尖上的蔬菜》(说课稿)-2023-2024学年一年级下册综合实践活动内蒙古版
- 牙龈癌护理查房课件
- (完整版)铝矾土进口合同中英文
- 《庖丁解牛》获奖课件(省级公开课一等奖)-完美版PPT
- 化工园区危险品运输车辆停车场建设标准
- 6月大学英语四级真题(CET4)及答案解析
- 气排球竞赛规则
- 电梯维修保养报价书模板
- 危险化学品目录2023
- FZ/T 81024-2022机织披风
- GB/T 33141-2016镁锂合金铸锭
- JJF 1069-2012 法定计量检定机构考核规范(培训讲稿)
评论
0/150
提交评论