参数估计基础_第1页
参数估计基础_第2页
参数估计基础_第3页
参数估计基础_第4页
参数估计基础_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 参数估计基础参数估计基础 抽样分布与抽样误差抽样分布与抽样误差 n抽样研究的目的是用样本信息推断总体特征,即用样本资料计算的统计指标推断总体参数n常用的统计推断方法有参数估计(总体均数和总体概率的估计)和假设检验 抽样分布与抽样误差抽样分布与抽样误差 n样本均数的抽样分布与抽样误差样本均数的抽样分布与抽样误差 假定某年某地所有13岁女学生身高服从总体均数 =155.4cm, 总体标准差 =5.3cm的正态分布N(,2)。在这样一个有限的总体中作随机抽样,共抽100次。每次均抽取30例(ni = 30)组成一份样本,可以算出每一份样本的平均身高.最终计算得到153.6, 153.1

2、, 154.9,157.7等100个样本均数,列于表5-1第2栏。现将这100个样本均数看成新的随机变量绘制频数分布表,如表5-2所示 抽样分布与抽样误差抽样分布与抽样误差样本均数的抽样分布具有以下特点:1. 各样本均数未必等于总体均数;2. 样本均数之间存在差异;3. 样本均数的分布很有规律,围绕着总体均数(155.4cm),中间多、两边少,左右基本对称,也服从正态分布。 4样本均数的变异较之原变量的变异大大缩小 抽样分布与抽样误差抽样分布与抽样误差 n抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。n标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差

3、,它反映了样本均数之间的离散程度。抽样分布与抽样误差抽样分布与抽样误差 抽样分布与抽样误差抽样分布与抽样误差 表5-2 从正态总体N (155.4, 5.32)抽样得到中的100个样本均数的频数分布(ni =30)组段下限值(cm)频数频率%152.6153.2153.8154.4155.0155.6156.2156.8157.4158.0 1 4 422252117 3 2 1 1.0 4.0 4.022.025.021.017.0 3.0 2.0 1.0合计 100 100.0抽样分布与抽样误差抽样分布与抽样误差n标准误的计算公式(5-1),(5-2):n样本均数标准误的大小与标准差成正比

4、,则与样本含量n的平方根成反比,即在同一总体中随机抽样,样本含量n越大,抽样误差越小。所以在实际应用中可通过增加样本含量n来减小样本均数的标准误,从而降低抽样误差。 XnXsns抽样分布与抽样误差抽样分布与抽样误差 非正态总体样本均数的抽样实验(实验5-2)。 图5-1(a)是一个正偏峰的分布, 用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图 抽样分布与抽样误差抽样分布与抽样误差n图5-1(b) (e) 显示,样本均数的总体均数也为仍等于原来的总体均数 ,样本均数的标准误为仍满足(5-1)式 ;n当样本量n较小时,样本均数的分布当然并非正态

5、分布,样本量足够大时(例如,n 50),样本均数的分布近似于正态分布。抽样分布与抽样误差抽样分布与抽样误差PERCENT030 x MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0抽样分布与抽样误差抽样分布与抽样误差n=5PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91

6、.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0抽样分布与抽样误差抽样分布与抽样误差n=10PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.4

7、4.54.64.74.84.95.0抽样分布与抽样误差抽样分布与抽样误差n=30PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0抽样分布与抽样误差抽样分布与抽样误差n=50PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31

8、.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0抽样分布与抽样误差抽样分布与抽样误差n例5-1 2000年某研究者随机调查某地健康成年男子27人,得到血红蛋白量的均数为125 g /L,标准差为15 g /L。试估计该样本均数的抽样误差。 = = = 2.89g /LXs/ sn15/ 27抽样分布与抽样误差抽样分布与抽样误差样本频率的抽样分布与抽样误差样本频率的抽样分布与抽样误差 实验4.2 :在一口袋内装有形状、重量完全

9、相同的黑球和白球,已知黑球比例为20%(总体概率=20%),从口袋中每摸一次看清颜色后放回去,搅匀后再摸,重复摸球35次(n=35),计算摸到黑球的百分比(样本频率p i)。重复这样的实验100次,每次得到100个黑球的比例分别为14.4%, 19.8%, 20.2%, 22.5%,等,将其频数分布列于表5-3。 表5-3 总体概率为20%时的随机抽样结果(ni = 35)黑球比例%样本频数% 5.0 3 3.0 8.0 7 7.011.0 5 5.014.0 8 8.017.0 1616.020.0 2222.022.0 1515.025.0 7 7.028.0 7 7.031.0 5 5.

10、034.0 3 3.040.0 2 2.0合计100 100.0抽样分布与抽样误差抽样分布与抽样误差n频率的抽样误差:这种样本率样本频率与样本率样本频率之间、样本率样本频率与总体率总体概率之间的差异。n频率的标准误:表示频率的抽样误差的指标抽样分布与抽样误差抽样分布与抽样误差样本频率 的总体均数参数为, 率的标准误计算公式(5-3):公式(5-4) nXp 1pnnppnppSp)1 (1)1 (抽样分布与抽样误差抽样分布与抽样误差例5-2 某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试估计该样本频率的抽样误差。p = 41.5% = 0.4

11、15,n = 776 =(1)pppns0.415 0.585.77%7760.01771 t分布分布t分布的概念分布的概念 从正态分布N(,2)抽得样本的均数也服从正态分布,记为N(, )。对正态变量 作变换 实际工作中,当 未知时,常用 来代替 对正态变量 采用的不是z 变换, 而是t变换 X2XXXzXXsXXXz/XXXtssnXt分布分布n英国统计学家W.S.Gosset于1908年以“Student”笔名发表论文,证明它服从自由度 = n 1的t分布,即 t分布, = n 1 (5-7) n又称Student t分布(Students t-distribution)。实际上,t分布

12、十分有用,它是总体均数的区间估计和假设检验的理论基础。/XXXtssnt分布分布t分布的图形和分布的图形和t分布表分布表 从前述实验4.1的13岁女学生身高这个正态总体中分别作样本量为 3和50的随机抽样,各抽取1000份样本,并分别得到1000个样本均数及其标准误。对它们分别作(5-6) 式的t转变换,并将t值绘制相应的直方图(见实验5-4)。如图5-12(a)、(b)所示。可以看出,这两个t值分布图并不完全一样,样本量为3的图(a)较之样本量为50的图(b)显得矮胖,两侧尾部稍高。 t分布分布FREQUENCY0200t3 MIDPOINT-12.0-11.5-11.0-10.5-10.0

13、-9.5-9.0-8.5-8.0-7.5-7.0-6.5-6.0-5.5-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.50.00.51.01.52.02.53.03.54.04.55.05.56.06.57.07.58.08.59.09.510.010.511.011.512.0t分布分布FREQUENCY0200t50 MIDPOINT-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.50.00.51.01.52.02.53.03.54.04.55.0t分布分布nt值的分布与自由度 有关(实际是样本含量n不同)。t 分布的图形不是一

14、条曲线,而是一簇曲线。 =(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3图5-3 不同自由度下的t分布图t分布分布t 分布的图形有如下特征:单峰分布,以0为中心,左右对称,类似于标准正态分布。 自由度 越小,则越大,t值越分散,曲线的峰部越矮,尾部越高; 随着自由度 逐渐增大,t分布逐渐逼近标准正态分布;当 趋于 时,t分布就完全成为标准正态分布,故标准正态分布是t分布的特例。t分布分布 统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间的关系编制了不同自由度 下的t界值表(附表2)。 t界值表:横标目为自由度 ,纵标目为概率P。 t临界值:表中数字表

15、示当 和P 确定时,对应的值。 单侧概率 (one-tailed probability):用t,表示 双侧概率 (two-tailed probability):用t/2,表示t分布分布n例如, 当 =16,单侧概率P =0.05时,由表中查得单侧t0.05,16=1.746;而当 =16,双侧概率P =0.05时,由表中查得双侧t0.05/2,16=2.120。按t分布的规律,理论上有单侧:P(t t0.05,16)=0.05 和 P(t t0.05,16)=0.05 双侧:P(t t0.05/2,16)P(t t0.05/2,16)=0.05 t分布分布更一般的表示方法如图5-4(a)和

16、(b)中阴影部分所示为:单侧:P(t t, )= 和 P(t t, )=双侧:P(t t/2, )P(t t/2, )=t分布分布从t界值表中或表的右上角图列亦可看出:在相同自由度时,t值越大,概率P越小;而在相同t值时,双侧概率P为单侧概率P的两倍,即t0.10/2,16 = t0.05,16 =1.746。 总体均数及总体概率的估计总体均数及总体概率的估计n参数估计的概念参数估计的概念参数估计:指用样本指标(统计量)估计参数估计:指用样本指标(统计量)估计总体指标(参数)。总体指标(参数)。参数估计有参数估计有 点估计(点估计(point estimation) 区间估计(区间估计(int

17、erval estimation)总体均数及总体概率的估计总体均数及总体概率的估计点估计:点估计:用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本均数作为总体均数 的点估计值, 用样本频率p作为总体概率 的点估计值。 用27例健康成年男性血红蛋白量的样本均数作为总体均数的点估计值, 用776名50岁以上的中老年妇女骨质疏松症的样本患病率作为总体患病率的点估计值缺点:没有考虑抽样误差,无法评价其可信度估计值它与真值之间的差距。 总体均数及总体概率的估计总体均数及总体概率的估计区间估计:区间估计:结合样本统计量和标准误可以确定一个具有较大的可信度置信度(如95%或99%)的包含总体参

18、数的区间,该区间称为总体参数的1 可信区间或置信区间(confidence interval , CI)。置信度: 值一般取0.05或0.01,故1 为0.95或0.99。 通常用样本均数和均数的标准误估计总体均数的95%(或99%)置信区间,或用样本频率和率的及其标准误估计总体概率的95%(或99%)置信区间。 如果没有特别说明,一般作双侧的区间估计 总体均数及总体概率的估计总体均数及总体概率的估计置信区间的计算置信区间的计算总体均数的置信区间总体均数的置信区间 根据总体标准差 是否已知及样本含量n的大小,总体均数置信区间的计算有t分布和Z分布(标准正态分布)两种方法。1. t分布方法 当总体标准差未知时,正态总体N(, 2)的样本均数的t变换结果 总体均数及总体概率的估计总体均数及总体概率的估计服从 t分布,若“砍去”t分布双侧尾部面积 = 0.05 = 5%,故有95%的t值满足不等式: t0.05/2, t0.05/2, t0.05/2, t/2, 或 n/2时,应以nX值查表,然后从100中减去查得的数值即为所求的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论