总体均数估计ppt课件_第1页
总体均数估计ppt课件_第2页
总体均数估计ppt课件_第3页
总体均数估计ppt课件_第4页
总体均数估计ppt课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第六章第六章 参数估计根底参数估计根底总体总体样本样本统计推断:用样本信息推断总体特征,包括参数统计推断:用样本信息推断总体特征,包括参数估计和假设检验。估计和假设检验。 图示:总体与样本图示:总体与样本1x1x3x1x2x5x4x 抽样实验抽样实验n=5n=5 抽样实验抽样实验n=10n=10 抽样实验抽样实验n=30n=30 10001000份样本抽样计算结果份样本抽样计算结果总体的总体的均数均数总体标总体标准差准差s s均数的均数的均数均数均数标准差均数标准差n n=5=55.005.000.500.504.994.990.22120.22120.22360.2236n n=10=10

2、5.005.000.500.505.005.000.15800.15800.15810.1581n n=30=305.005.000.500.505.005.000.09200.09200.09130.0913nsnS 3 3个抽样实验结果图示个抽样实验结果图示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数050

3、1001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数2212. 0; 5XSn0920. 0;30XSn1580. 0;10XSn 各样本均数未必等于总体均数;各样本均数未必等于总体均数; 各样本均数间存在差别;各样本均数间存在差别; 样本均数的分布为中间多,两边少,左右根本样本均数的分布为中间多,两边少,左右根本对称。对称。 样本均数的变异范围较之原变量的变异范围大样本均数的变异范围较之原变量的变异范围大大减少。大减少。 样本均数的抽样分布具有如下特点 中心极限定理:中心极限定理:1

4、1从正态总体中作随机抽样,那么样本均数服从正态总体中作随机抽样,那么样本均数服从正态分布;从偏态总体中作随机抽样,样本含从正态分布;从偏态总体中作随机抽样,样本含量量n n足够大足够大n n3030那么样本均数近似服从正态那么样本均数近似服从正态分布。分布。xs s2 2从总体均数为从总体均数为,规范差为,规范差为的正态总体中的正态总体中抽取例数为抽取例数为n n的样本,样本均数的总体均数为的样本,样本均数的总体均数为,规范差为规范差为 。 样本频率的抽样分与抽样误差样本频率的抽样分与抽样误差黑球的比例为黑球的比例为20%,反复摸球,反复摸球50次,次,计算摸到黑球的频率?计算摸到黑球的频率?

5、黑球比例黑球比例(%)样本频数样本频数样本频率样本频率(%)黑球比例黑球比例(%)样本频数样本频数样本频率样本频率(%)822.00221111.001044.00241111.001288.002666.001477.002833.00161111.003044.00181313.003211.00201919.00合计合计 100100.00 表表6-3 =20%的随机抽样结果的随机抽样结果n=50 一、抽样误差与规范误一、抽样误差与规范误1.1.抽样误差:由于抽样呵斥的样本统计量与总体抽样误差:由于抽样呵斥的样本统计量与总体参数以及样本统计量与样本统计量之间的差别。参数以及样本统计量与样

6、本统计量之间的差别。 抽样误差是不可防止的,但可以估计。抽样误差是不可防止的,但可以估计。2.2.规范误规范误(Standard error(Standard error,SE)SE):规范误为样本:规范误为样本均数的规范差,用均数的规范差,用 表示,是阐明样本均数抽表示,是阐明样本均数抽样误差的大小的目的,描画样本均数的离散程度,样误差的大小的目的,描画样本均数的离散程度,反映用样本均数估计或推断总体均数的可靠性。反映用样本均数估计或推断总体均数的可靠性。xs 3.规范误的计算规范误的计算nxs ss s nSSx 均数的规范误与规范差成正比,与样本例数的平均数的规范误与规范差成正比,与样本

7、例数的平方根成反比。方根成反比。 假设规范差固定不变时,可添加假设规范差固定不变时,可添加n n而减少抽样误而减少抽样误差。差。 对于二项分布,对于二项分布,XB(n,),那么样本频率那么样本频率其规范误:其规范误:nnXpp)1( s s nppnppSp)1(1)1( 实践中,实践中, 普通未知,普通未知,常用样本频率常用样本频率p近似替代近似替代那么其规范误:那么其规范误: 4. 规范误的运用规范误的运用1 1表示抽样误差大小,描画表示抽样误差大小,描画n n一样样本一样样本统计量的离散程度,反映用样本统计量估计或统计量的离散程度,反映用样本统计量估计或推断总体参数的可靠性;推断总体参数

8、的可靠性;2 2用于估计总体参数的可信区间;用于估计总体参数的可信区间;3 3用于进展样本均数用于进展样本均数/ /频率的假设检验。频率的假设检验。 二、二、t 分布的概念分布的概念 , 1XXXtnSSn 式中式中 为自在度为自在度(degree of freedom, df) 3实践任务中,由于实践任务中,由于 未知,用未知,用 替代,那么替代,那么 不再服从规范不再服从规范正态分布,而服从正态分布,而服从t 分布。分布。 XsXS() /XXS )1 , 0(),(2NzNXxxzx s s s s nSxSxtx/ )1 , 0(),(2NzNXxz s s s s 4. t 分布曲线

9、的特征:分布曲线的特征:1 1t t 分布是一簇曲线。它受自在度的影响,自在分布是一簇曲线。它受自在度的影响,自在度不同曲线外形不同。度不同曲线外形不同。2 2是是t t 分布曲线的参数:分布曲线的参数: n n越小,越小,越小,曲线越平缓越小,曲线越平缓 n n越大,越大,越大,曲线越峻峭越大,曲线越峻峭 nn,曲线近似于规范正态分布曲线。,曲线近似于规范正态分布曲线。3 3以以0 0为中心,左右对称呈钟形。为中心,左右对称呈钟形。4 4规范正态分布是规范正态分布是t t 分布的特例。分布的特例。 2 参参 数数 (on ly on e): 3 t界界 值值 表表 : 详详 见见 附附 表表

10、 2, 可可 反反 映映 t分分 布布 曲曲 下下 的的 面面 积积 。 单单 侧侧 概概 率率 或或 单单 尾尾 概概 率率 : 用用,t表表 示示 ; 双双 侧侧 概概 率率 或或 双双 尾尾 概概 率率 : 用用/2,t 表表 示示 。 t界值表:详见附表界值表:详见附表2,可反映,可反映t分布曲分布曲线下的面积。线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用 表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用 表示。表示。 2参数参数(only one): 3t 界界值表:详见附表值表:详见附表 2,可反映,可反映 t 分布曲下的面积。分布曲下的面积。 单侧概率或单尾概

11、率:用单侧概率或单尾概率:用,t 表示;表示; 双侧概率或双尾概率:用双侧概率或双尾概率:用/2,t表示。表示。 -tt0 三、总体参数的估计三、总体参数的估计1.1.参数估计:用样本统计量估计总体参数。包括点参数估计:用样本统计量估计总体参数。包括点估计和区间估计。估计和区间估计。1 1点估计点估计(Point Estimation)(Point Estimation):直接用样本目的:直接用样本目的作为总体参数的估计;作为总体参数的估计;2 2区间估计区间估计(Interval Estimation) (Interval Estimation) :用预先给:用预先给定的概率可信度、把握度定

12、的概率可信度、把握度1-1-估计总体参数所估计总体参数所在的范围。此范围称为置信区间可信区间:在的范围。此范围称为置信区间可信区间:Confidence Interval, CIConfidence Interval, CI 1点估计点估计(point estimation) 用相应样本统计量直接作为其总体参数用相应样本统计量直接作为其总体参数的估计值。的估计值。、S估计估计s s 代替代替,用,用代替代替如用如用sx其方法虽简单,但未思索抽样误差的大小。其方法虽简单,但未思索抽样误差的大小。 按预先给定的概率(1)所确定的包含未知总体参数的一个范围。 总体均数的区间估计:按预先给定的概率(1

13、)所确定的包含未知总体均数的一个范围。 如给定=0.05,该范围称为参数的95%可信区间或置信区间; 如给定=0.01,该范围称为参数的99%可信区间或置信区间。2区间估计区间估计(interval estimation): 总体均数置信区间的计算需思索:总体均数置信区间的计算需思索: 1总体规范差总体规范差能否知,能否知, 2样本含量样本含量n的大小的大小 通常有两类方法:通常有两类方法: 1 t分布法分布法 2z分布法分布法总体均数置信区间的计算总体均数置信区间的计算 总体均数置信区间的计算总体均数置信区间的计算1、t分布法分布法 当总体规范差当总体规范差未知且未知且n50时时)即即(xx

14、xstxstxstx ,2/,2/,2/, 总体均数的双侧总体均数的双侧1-置信区间置信区间总体均数的单侧总体均数的单侧1-置信区间置信区间xxstxstx ,2/,2/ LgstxLgstxtxx/)02.133,98.116(2715779. 2125/)94.130,06.119(2715056. 2125.779. 201. 0,056. 2t0.0526,1-n2 27,n26,2/01. 026,2/05. 0262/01. 00.05/2,26 ,时,时,时,双侧时,双侧,查附表查附表本例本例 2、正态分布近似法、正态分布近似法 当当知知 或或 未知,但未知,但 n50 时时)即

15、(即(xxxzxzxzxs ss ss s 2/2/2/, 总体均数的双侧总体均数的双侧1-置信区间置信区间)即即(xxxszxszxszx2/2/2/, 总体均数的单侧总体均数的单侧1-置信区间置信区间xxzxzxs s s s 或或xxszxszx 或或 例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,规范差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%置信区间。 故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47, 3.81)mmolL。 参数估计的方法:参数估计的方法:1 1知,根据正态分布原理,知,根据正态分布原理,

16、95%95%、99%CI99%CI:2 2未知,未知,n n较小,据较小,据t t分布原理:分布原理:95%95%、99%CI99%CI:xxs s96. 1 xSx58. 2 xStx ,05. 0 xStx ,01. 0 3 3未知,未知,n n较大,据近似正态分布原理,较大,据近似正态分布原理, xSx96. 1 xxs s58. 2 正态分布法 样本含量n足够大, np与n(1-p)均5时 ,pSzp2/ 总体概率的置信区间计算总体概率的置信区间计算 For example例例6-6 6-6 用某种仪器检查已确诊的乳腺癌患者用某种仪器检查已确诊的乳腺癌患者120120名,名,检出乳腺癌

17、患者检出乳腺癌患者9494例,检出率为例,检出率为78.3%78.3%。估计该仪。估计该仪器乳腺癌总体检出率的器乳腺癌总体检出率的95%95%置信区间。置信区间。 95%95%的置信区间为:的置信区间为: 该仪器乳腺癌总体检出率的该仪器乳腺癌总体检出率的95%95%置信区间置信区间 70.9%70.9%,85.7% 85.7% 857.0709.0120)783.01(783.096.1783.0)1(2/05.02/ nppZpSzpp 查表法查表法 当样本含量较小如当样本含量较小如n50n50,npnp或或n(1n(1p)5p)5时,样本率的分布呈二项分布,总体率的置信时,样本率的分布呈二

18、项分布,总体率的置信区间可据二项分布的实际求得。区间可据二项分布的实际求得。 例例6-7 6-7 某医院用某药治疗脑动脉硬化症某医院用某药治疗脑动脉硬化症2222例,例,其中显效者其中显效者1010例。问该药总显效率的例。问该药总显效率的95%95%置信置信区间为多少?区间为多少? 本例本例n=22, X=10, n=22, X=10, 查附表查附表6 6478478页,得此两页,得此两数相交处的数值为数相交处的数值为24246868,即该药总显效率的,即该药总显效率的95%95%置信区间为置信区间为24%24%,68%68%。 三置信区间确实切涵义三置信区间确实切涵义 1. 95%的置信区间的了解:的置信区间的了解:1所要估计的总体参数有所要估计的总体参数有95%的能够在我们所估的能够在我们所估计的置信区间内。计的置信区间内。2从正态总体中随机抽取从正态总体中随机抽取100个样本,可算得个样本,可算得100个样本均数和规范差,也可算得个样本均数和规范差,也可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论