




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三讲抽样误差与区间估计演示文稿当前第1页\共有26页\编于星期三\9点(优选)第三讲抽样误差与区间估计当前第2页\共有26页\编于星期三\9点100份样本的均数和标准差当前第3页\共有26页\编于星期三\9点
将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图3-1。图3-1随机抽样所得100个样本均数的分布当前第4页\共有26页\编于星期三\9点
100个样本均数的抽样分布特点:①μ=4.83≠
②100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。③样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。
④样本均数的标准差明显变小:当前第5页\共有26页\编于星期三\9点即样本均数的标准差,可用于衡量抽样误差的大小。因通常σ未知,计算标准误采用下式:标准误(standarderror,SE)
通过增加样本含量n来降低抽样误差。当前第6页\共有26页\编于星期三\9点3个抽样实验结果图示当前第7页\共有26页\编于星期三\9点抽样实验小结均数的均数围绕总体均数上下波动。
均数的标准差即标准误与总体标准差相差一个常数的倍数,即
从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n)
。当前第8页\共有26页\编于星期三\9点标准差与标准误的区别与联系1、概念不同:标准差是描述样本中个体值的变异程度的指标,其值越小,表示变量值围绕均数的波动越小;标准误是描述样本均数间变异度的指标,其值越小,表示样本均数围绕总体均数波动越小。2、用途不同:标准差用于表示变量值对均数波动的大小,当资料呈正态分布时,与均数结合可估计正常值范围,计算变异系数等;标准误用于表示样本统计量(样本均数、样本率)对总体参数(总体均数、总体率)的波动情况,可估计参数的可信区间,进行假设检验。当前第9页\共有26页\编于星期三\9点3、与样本例数关系不同:样本量足够大时,标准差趋向稳定,标准误随例数增加而减小,甚至趋近于0,若样本量趋向总例数,则标准误接近0;4、二者联系:均为变异指标,若把总体中各样本均数看作一个变量,则标准误可称为样本均数的标准差,当样本量不变时,均数的标准误与标准差成正比。二者均可与均数结合运用,但描述的内容各不相同。当前第10页\共有26页\编于星期三\9点第二节
t分布(t-distribution)随机变量XN(m,s2)标准正态分布N(0,12)Z变换均数标准正态分布N(0,12)Studentt分布自由度:n-1当前第11页\共有26页\编于星期三\9点t分布的特征
①以0为中心,左右对称的单峰分布;②t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近Z分布(标准正态分布);当趋于∞时,t分布趋近Z分布,Z分布是t分布的特例。当前第12页\共有26页\编于星期三\9点图4-2不同自由度下的t分布图当前第13页\共有26页\编于星期三\9点t界值表1.8122.228-2.228tf(t)ν=10的t分布图t0.05/2,10=t0.025,10=2.228当前第14页\共有26页\编于星期三\9点t界值表中的变化规律
相同自由度时,∣t∣值越大,概率P越小;在相同∣t∣值时,同一自由度的双侧概率是单侧概率的两倍,t0.05/2,10=t0.025,10
。当前第15页\共有26页\编于星期三\9点参数估计:用样本指标值(统计量)推断总体指标值(参数)。包括点估计和区间估计第三节总体均数的可信区间估计当前第16页\共有26页\编于星期三\9点
总体均数的点估计(pointestimation)与区间估计(intervalestimation)参数的估计点估计:由样本统计量直接估计总体参数区间估计:在一定可信度(Confidencelevel)下,同时考虑抽样误差按预先给定的概率(1),确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidenceinterval,CI)当前第17页\共有26页\编于星期三\9点
(1)称为可信度或置信度(confidencelevel),常取95%。置信区间通常两个数值即置信限(confidencelimit,CL)构成,较小的称为置信下限(lowerlimit,L),较大的称为置信上限(upperlimit,U),一、置信区间的有关概念当前第18页\共有26页\编于星期三\9点二、总体均数置信区间的计算s未知,且n较小,按t分布s已知,或s未知但n足够大,按Z分布当前第19页\共有26页\编于星期三\9点中心极限定理设从均值为μ,方差为的一个任意总体中抽取容量为n的样本,当n充分大(通常n≥50),样本均值的抽样分布服从均数为μ,方差为/n
的正态分布。当前第20页\共有26页\编于星期三\9点单一总体均数的置信区间当前第21页\共有26页\编于星期三\9点例3-2已知某地27名健康成年男子血红蛋白含量=125g/L,S=15g/L,试估计该地健康成年男子血红蛋白平均含量的95%和99%置信区间。
n=27,ν=27-1=26,查t界表,α=0.05,t0.05/2,26=2.056,α=0.01,t0.01/2,26=2.779,按公式计算当前第22页\共有26页\编于星期三\9点Z0.05/2=1.96Z0.05=1.645总体均数μ的单侧(1-α)置信区间为:μ>-Zαμ
<+Zα当前第23页\共有26页\编于星期三\9点当前第24页\共有26页\编于星期三\9点Z0.05/2=1.96Z0.05=1.645总体均数μ的单侧(1-α)置信区间为:μ>-Zασμ<+Zασ当前第25页\共有26页\编于星期三\9点三、置信区间的确切含义如果能够进行重复抽样试验,平均有(1-α)的可信区间包含了总体参数,而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年小学语文生动练习试题及答案
- 2025年小学一年级语文革新试题及答案
- 计算机基础基础知识提升技巧试题及答案
- 2024年古代文学史理论试题及答案
- 如何制定宠物营养计划考题及答案
- 汽车美容师团队发展策略试题及答案
- 小学六年级语文理解能力测验题及答案
- 汽车美容行业品牌建设知识试题及答案
- 食品检验的伦理与法律责任试题及答案
- 吉林省长春市农安县2021-2022学年高一下学期学情调研生物试题(含答案)
- 体育康养与心理健康促进的结合研究论文
- 天津市河东区2024-2025学年九年级下学期结课考试化学试题(含答案)
- 动物疾病的临床表现试题及答案
- 广东省广州市2025届高三下学期综合测试(一)英语试卷
- 山东省济南育英中学 2024-2025学年下学期七年级3月月考英语试题(原卷版+解析版)
- T-SDFA 049-2024 混合型饲料添加剂中安普霉素的测定 液相色谱-串联质谱法
- 2025技术服务合同模板
- 2025年保安证学习资源题及答案
- 公司事故隐患内部报告奖励制度
- 2025年甘肃甘南州国控资产投资管理集团有限公司面向社会招聘工作人员12人笔试参考题库附带答案详解
- 2025年高考数学第一次模拟考试(江苏卷1)(全解全析)
评论
0/150
提交评论