抽样误差与参数估计课件_第1页
抽样误差与参数估计课件_第2页
抽样误差与参数估计课件_第3页
抽样误差与参数估计课件_第4页
抽样误差与参数估计课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样误差与参数估计抽样误差与标准误Samplingerrorandstandarderrorpopulationsamplesamplinginferring统计学的分析思路样本1样本2样本99样本3样本100正常男子红细胞计数抽样实验结果No红细胞计数s123…991005.595.494.56…4.824.085.115.564.87…5.304.734.265.475.21…5.194.84………………5.045.194.71…5.304.660.440.420.33…0.390.46抽样误差通过对研究总体中随机抽取部分有代表性的样本,用统计量(样本均数)来推断总体参数。由于抽样的随机性而造成样本统计量(样本均数)与总体参数(总体均数)间的差别,称为均数的抽样误差。各样本均数未必等于总体均数各样本均数之间也存在差异样本均数的分布也是正态分布样本均数的变异范围较原变量的变异范围大大缩小样本均数的标准误统计上,将统计量(如样本均数、样本率等)的标准差称为标准误,用以衡量抽样误差的大小n固定时,标准差越大,标准误越大标准差固定时,n越大,标准误越小实际工作中,总体标准差常未知例7-2:已知某样本=5.03,s=0.52,n=10,试计算标准误。实际工作中,只能根据一份样本计算出一个标准误说明抽样误差的大小,即估计μ的可靠程度样本率的标准误率的标准误是衡量样本率的离散趋势和率的抽样误差的统计指标。总体:样本:例1:观察某医院产妇106人,其中行剖腹产者62人,剖腹产率为58.5%,试估计剖腹产率的标准误。样本均数的分布原分布为正态分布,则新分布也为正态分布,如原分布为非正态分布,当n足够大时(如n≥60),新分布也近似正态分布新分布可用样本均数的均数和均数的标准差来描述其特征,其理论值分别为t分布特征单峰分布,以t=0为中点,两侧对称;样本(自由度)越小,t分布曲线峰值越低,t值越分散;随着自由度的增大,t分布接近于标准正态分布,当ν→∞时,t分布的极限分布是标准正态分布。可(置)信区间Confidenceinterval,CI统计推断参数估计假设检验点估计区间估计点估计(pointestimation):就是用样本指标直接地估计总体指标。总体均数总体率即样本均数和样本率分别是总体均数和总体率的估计值。总体均数的可信区间1.未知时,按t分布的原理的概率之和为α或2.已知时,或未知但n足够大n足够大,用样本标准差S来估计σ可信区间的解释从总体中做随机抽样,据每个样本可算得一个可信区间,如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个包括μ,只有5个不包括。实际工作中,为估计总体均数,我们只做一次抽样,只算得一个可信区间,用以估计μ

的范围,理论上有95%的可能是正确的(1-α),只有5%的可能发生错误。可信区间两个要素准确度:反映可信度(1-α)的大小。1-α越接近1,越准确

如可信度99%比95%准确精确度:反映区间范围宽窄。范围越窄越好

95%可信区间精度优于99%在n确定的情况下,准确度↑,精确度↓;在兼顾准确度和精确度时,一般取95%可信区间;在可信度确定的情况下,增加样本例数,可提高精确度;

两样本均数之差的分布与标准误从两个正态总体中随机抽样,分别得n1、、s1和n2、、s2则:如果两总体标准差未知合并方差两总体均数之差的估计两总体均数之差μ1-μ2的1-α可信区间为:大样本时总体均数的可信区间自由度:例7-7:某药治疗流行性乙型脑炎,将72名患者随机分为试验组和对照组,得两组退热天数结果如下,试估计该药是否有效。分组nS试验组322.91.9对照组405.22.7μ1-μ2的95%可信区间即总体率的区间估计正态近似法

当n足够大,且样本率p

和(1-p)均不太小,如np和n(1-p)均大于5时,p的抽样分布接近正态分布,按正态分布的原理。

求例1中剖腹产率的95%可信区间:(0.585-1.96×0.048,0.585+1.96×0.048)

即(0.491,0.679)

查表法:当不满足正态分布应用条件时,可根据二项分布的原理直接计算概率。阳性数为X的概率例5-2:某妇幼保健院对当地38例育龄夫妇的筛查中,检出α-地中海贫血基因携带者3例,试估计当地α-地中海贫血基因总体携带率的95%可信区间。查附表7(P333),X=3,n=38,得2~21,即该地α-地中海贫血基因总体携带率的95%可信区间为2%-21%。注意:附表7只列出了发生数X≤n/2(发生率≤50%)的部分。当X>n/2时,应按n-X值查表,并相应地用100减去查得的数值,即为所求可信区间。两率之差的分布与标准误作为两率之差的标准误如果两总体率未知,则:两总体率之差的估计两总体率之差π1-π2的1-α可信区间为:例7-8标准差和标准误的比较标准差SD标准误SE意义个体变异大小抽样误差大小用途CV,参考值范围CI,假设检验计算随n增加渐趋于稳定渐趋于0(1-α)100%参考值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论