总体均数估计PPT课件_第1页
总体均数估计PPT课件_第2页
总体均数估计PPT课件_第3页
总体均数估计PPT课件_第4页
总体均数估计PPT课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 1第六章第六章 参数估计基础参数估计基础总体总体样本样本统计推断:用样本信息推断总体特征,包括参数统计推断:用样本信息推断总体特征,包括参数估计和假设检验。估计和假设检验。 2图示:总体与样本图示:总体与样本1x1x3x1x2x5x4x 3抽样试验(抽样试验(n n=5=5) 4抽样试验(抽样试验(n n=10=10) 5抽样试验(抽样试验(n n=30=30) 610001000份样本抽样计算结果份样本抽样计算结果总体的总体的均数均数总体标总体标准差准差s s均数的均数的均数均数均数标准差均数标准差n n=5=55.005.000.500.504.994.990.22120.22120.2

2、2360.2236n n=10=105.005.000.500.505.005.000.15800.15800.15810.1581n n=30=305.005.000.500.505.005.000.09200.09200.09130.0913nsns 73 3个抽样实验结果图示个抽样实验结果图示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.57

3、5.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数2212. 0; 5xsn0920. 0;30xsn1580. 0;10xsn 8 各样本均数未必等于总体均数;各样本均数未必等于总体均数; 各样本均数间存在差异;各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本样本均数的分布为中间多,两边少,左右基本对称。对称。 样本均数的变异范围较之原变量的变异范围大样本均数的变异范围较之原变量的变异范围大大缩小。大缩小。 样本均数的抽样分布具有

4、如下特点样本均数的抽样分布具有如下特点 9 10中心极限定理:中心极限定理:(1 1)从正态总体中作随机抽样,则样本均数服从)从正态总体中作随机抽样,则样本均数服从正态分布;从偏态总体中作随机抽样,样本含量正态分布;从偏态总体中作随机抽样,样本含量n n足够大(足够大(n n3030)则样本均数近似服从正态分布。)则样本均数近似服从正态分布。xs s(2 2)从总体均数为)从总体均数为,标准差为,标准差为的正态总体中抽的正态总体中抽取例数为取例数为n n的样本,样本均数的总体均数为的样本,样本均数的总体均数为,标,标准差为准差为 。 11 12样本频率的抽样分与抽样误差样本频率的抽样分与抽样误

5、差黑球的比例为黑球的比例为20%,重复摸球,重复摸球50次,次,计算摸到黑球的频率?计算摸到黑球的频率?黑球比例黑球比例(%)样本频数样本频数样本频率样本频率(%)黑球比例黑球比例(%)样本频数样本频数样本频率样本频率(%)822.00221111.001044.00241111.001288.002666.001477.002833.00161111.003044.00181313.003211.00201919.00合计合计 100100.00 表表6-3 =20%的随机抽样结果(的随机抽样结果(n=50) 13一、抽样误差与标准误一、抽样误差与标准误1.1.抽样误差:抽样误差:由于抽样造

6、成的样本统计量与总体由于抽样造成的样本统计量与总体参数以及样本统计量与样本统计量之间的差异。参数以及样本统计量与样本统计量之间的差异。 抽样误差是不可避免的,但可以估计。抽样误差是不可避免的,但可以估计。2.2.标准误标准误(standard error,se):标准误为样本均标准误为样本均数的标准差,用数的标准差,用 表示,表示,是说明样本均数抽样是说明样本均数抽样误差的大小的指标,描述样本均数的离散程度,误差的大小的指标,描述样本均数的离散程度,反映用样本均数估计或推断总体均数的可靠性。反映用样本均数估计或推断总体均数的可靠性。xs 143.标准误的计算标准误的计算nxs ss s nss

7、x 均数的标准误与标准差成正比,与样本例数的平均数的标准误与标准差成正比,与样本例数的平方根成反比。方根成反比。 若标准差固定不变时,可增加若标准差固定不变时,可增加n而缩小抽样误差。而缩小抽样误差。 15对于二项分布,对于二项分布,xb(n,),则样本频率则样本频率其标准误:其标准误:nnxpp)1( s s nppnppsp)1(1)1( 实际中,实际中, 一般未知,一般未知,常用样本频率常用样本频率p近似代替近似代替则其标准误:则其标准误: 164. 标准误的应用标准误的应用(1 1)表示抽样误差大小,描述()表示抽样误差大小,描述(n n相同)样本相同)样本统计量的离散程度,反映用样本

8、统计量估计或统计量的离散程度,反映用样本统计量估计或推断总体参数的可靠性;推断总体参数的可靠性;(2 2)用于估计总体参数的可信区间;)用于估计总体参数的可信区间;(3 3)用于进行样本均数)用于进行样本均数/ /频率的假设检验。频率的假设检验。 17 18 二、二、t 分布的概念分布的概念 19 20, 1xxxtnssn 式中式中 为自由度为自由度(degree of freedom, df) 3实际工作中,由于实际工作中,由于 未知,用未知,用 代替,代替,则则 不再服从标准正态分布,而不再服从标准正态分布,而服从服从t t 分布。分布。 xsxs() /xxs 21)1 , 0(),(

9、2nznxxxzx s s s s nsxsxtx/ )1 , 0(),(2nznxxz s s s s 224. t 分布曲线的特征:分布曲线的特征:(1 1)t 分布是一簇曲线。它受自由度的影响,自由度分布是一簇曲线。它受自由度的影响,自由度不同曲线形状不同。不同曲线形状不同。(2 2)是是t 分布曲线的参数:分布曲线的参数: n n越小,越小,越小,曲线越平缓越小,曲线越平缓 n n越大,越大,越大,曲线越陡峭越大,曲线越陡峭 nn,曲线近似于标准正态分布曲线。,曲线近似于标准正态分布曲线。(3 3)以)以0为中心,左右对称呈钟形。为中心,左右对称呈钟形。(4 4)标准正态分布是)标准正

10、态分布是t 分布的特例。分布的特例。 23 242 参参 数数 (on ly on e): 3 t界界 值值 表表 : 详详 见见 附附 表表 2, 可可 反反 映映 t分分 布布 曲曲 下下 的的 面面 积积 。 单单 侧侧 概概 率率 或或 单单 尾尾 概概 率率 : 用用,t表表 示示 ; 双双 侧侧 概概 率率 或或 双双 尾尾 概概 率率 : 用用/2,t 表表 示示 。 t界值表:详见附表界值表:详见附表2,可反映,可反映t分布曲分布曲线下的面积。线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用 表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用 表示。表示。 2参数

11、参数(only one): 3t 界界值表:详见附表值表:详见附表 2,可反映,可反映 t 分布曲下的面积。分布曲下的面积。 单侧概率或单尾概率:用单侧概率或单尾概率:用,t 表示;表示; 双侧概率或双尾概率:用双侧概率或双尾概率:用/2,t表示。表示。 25-tt0 26三、总体参数的估计三、总体参数的估计1.1.参数估计参数估计:用样本统计量估计总体参数。包括点:用样本统计量估计总体参数。包括点估计和区间估计。估计和区间估计。(1 1)点估计)点估计(point estimation):直接用样本指标作:直接用样本指标作为总体参数的估计;为总体参数的估计;(2 2)区间估计)区间估计(in

12、terval estimation) :用预先给定:用预先给定的概率(可信度、把握度的概率(可信度、把握度1-1-)估计总体参数所在)估计总体参数所在的范围。此范围称为置信区间(可信区间):的范围。此范围称为置信区间(可信区间):confidence interval, ci 271点估计点估计(point estimation) 用相应样本统计量直接作为其总体参数的估计值。用相应样本统计量直接作为其总体参数的估计值。、s估计估计s s 代替代替,用,用代替代替如用如用sx其方法虽简单,但未考虑抽样误差的大小。其方法虽简单,但未考虑抽样误差的大小。 28 按预先给定的概率按预先给定的概率(1

13、)所确定的包含所确定的包含未知总体参数的一个范围。未知总体参数的一个范围。 总体均数的区间估计:总体均数的区间估计:按预先给定的按预先给定的概率概率(1 )所确定的包含未知总体均数的一所确定的包含未知总体均数的一个范围。个范围。 如给定如给定 =0.05,该范围称为参数的该范围称为参数的95%可信区可信区间或置信区间;间或置信区间; 如给定如给定 =0.01,该范围称为参数的该范围称为参数的99%可信区可信区间或置信区间。间或置信区间。2区间估计区间估计(interval estimation): 29 总体均数置信区间的计算需考虑:总体均数置信区间的计算需考虑: (1)总体标准差)总体标准差

14、s s是否已知,是否已知, (2)样本含量)样本含量n的大小的大小 通常有两类方法:通常有两类方法: (1) t分布法分布法 (2)z分布法分布法总体均数置信区间的计算总体均数置信区间的计算 30总体均数置信区间的计算总体均数置信区间的计算1、t分布法分布法 当总体标准差当总体标准差未知且未知且n50时时)即即(xxxstxstxstx ,2/,2/,2/, 总体均数的双侧(总体均数的双侧(1-)置信区间)置信区间总体均数的单侧(总体均数的单侧(1-)置信区间)置信区间xxstxstx ,2/,2/ 31 32lgstxlgstxtxx/)02.133,98.116(2715779. 2125

15、/)94.130,06.119(2715056. 2125.779. 201. 0,056. 2t0.0526,1-n2 27,n26,2/01. 026,2/05. 0262/01. 00.05/2,26 ,时,时,时,双侧时,双侧,查附表查附表本例本例 332、正态分布近似法正态分布近似法 当当已知已知 或或 未知,但未知,但 n50 时时)即(即(xxxzxzxzxs ss ss s 2/2/2/, 总体均数的双侧(总体均数的双侧(1-)置信区间)置信区间)即即(xxxszxszxszx2/2/2/, 34总体均数的单侧(总体均数的单侧(1-)置信区间)置信区间xxzxzxs s s s

16、 或或xxszxszx 或或 35 例例3-3 某地抽取正常成年人某地抽取正常成年人200名名,测得其,测得其血清胆固醇的均数为血清胆固醇的均数为3.64 mmol/l,标准差为,标准差为1.20mmol/l,估计该地正常成年人血清胆固醇,估计该地正常成年人血清胆固醇均数的均数的95%置信区间。置信区间。 36 故该地正常成年人血清胆固醇均数的双侧故该地正常成年人血清胆固醇均数的双侧95%可信区间为可信区间为(3.47, 3.81)mmol l。 37参数估计的方法:参数估计的方法:(1 1)已知,根据正态分布原理,已知,根据正态分布原理,95%、99%ci:(2 2)未知,未知,n较小,据较

17、小,据t分布原理:分布原理:95%、99%ci:xxs s96. 1 xsx58. 2 xstx ,05. 0 xstx ,01. 0 (3 3)未知,未知,n较大,据近似正态分布原理,较大,据近似正态分布原理, xsx96. 1 xxs s58. 2 38正态分布法 样本含量样本含量n n足够大,足够大, npnp与与n(1-p)n(1-p)均均55时时 ,pszp2/ 总体概率的置信区间计算总体概率的置信区间计算 39for example例例6-66-6 用某种仪器检查已确诊的乳腺癌患者用某种仪器检查已确诊的乳腺癌患者120120名,名,检出乳腺癌患者检出乳腺癌患者9494例,检出率为例

18、,检出率为78.3%78.3%。估计该仪。估计该仪器乳腺癌总体检出率的器乳腺癌总体检出率的95%95%置信区间。置信区间。 95%95%的置信区间为:的置信区间为: 该仪器乳腺癌总体检出率的该仪器乳腺癌总体检出率的95%95%置信区间置信区间( 70.9%70.9%,85.7% 85.7% ) 857.0709.0120)783.01(783.096.1783.0)1(2/05.02/ nppzpszpp 40 查表法查表法 当样本含量较小(如当样本含量较小(如n n5050),),npnp或或n n(1(1p p)5)5时,样本率的分布呈二项分布,总体率的置信时,样本率的分布呈二项分布,总体

19、率的置信区间可据二项分布的理论求得。区间可据二项分布的理论求得。 例例6-7 6-7 某医院用某药治疗脑动脉硬化症某医院用某药治疗脑动脉硬化症2222例,例,其中显效者其中显效者1010例。问该药总显效率的例。问该药总显效率的95%95%置信置信区间为多少?区间为多少? 本例本例n n=22, =22, x x=10, =10, 查附表查附表6 6(478478页),得此两页),得此两数相交处的数值为数相交处的数值为24246868,即该药总显效率的,即该药总显效率的95%95%置信区间为置信区间为(24%24%,68%68%)。 41(三)置信区间的确切涵义(三)置信区间的确切涵义 421. 95%的置信区间的理解:的置信区间的理解:(1)所要估计的总体参数有)所要估计的总体参数有95%的可能在我们所估的可能在我们所估计的置信区间内。计的置信区间内。(2)从正态总体中随机抽取)从正态总体中随机抽取100个样本,可算得个样本,可算得100个样本均数和标准差,也可算得个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论