参数估计基础_第1页
参数估计基础_第2页
参数估计基础_第3页
参数估计基础_第4页
参数估计基础_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章总体均数的估计和假设检验

第一节均数的抽样误差与标准误第二节t分布第三节总体均数的估计第四节假设检验的一般步骤第五节均数的t检验和z检验第六节均数的区间估计与假设检验的关系第七节假设检验的两型错误和检验功效第五章总体均数的估计和假设检验第一节均数的抽样误差与标准误第二节t分布第三节总体均数的估计第四节假设检验的一般步骤第五节均数的t检验和z检验第六节均数的区间估计与假设检验的关系第七节假设检验的两型错误和检验功效第一节均数的抽样误差与标准误

常用的统计推断方法:参数估计和假设检验

总体μσ样本统计推断Ѕ随机抽样

N(155.4,5.32)156.7158.1155.6155.2…4.985.206.355.64…156.66.35Sii100个n=30假定某年某地所有13岁女学生身高服从正态分布N(155.4,5.32)图5-1某年某地13岁女生身高N(155.4,5.32)的抽样示意图

第一节均数的抽样误差与标准误

第一节均数的抽样误差与标准误

抽样误差

由于个体间存在差异及抽样造成的样本统计量与总体参数之间的差异。第一节抽样分布与抽样误差

表5-2从N(155.4,5.32)抽样得到中的100个样本均数的频数分布(ni=30)第一节均数的抽样误差与标准误

将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制直方图。图5-2从正态分布总体N(155.4,5.32)随机抽样所得样本均数分布151152153154155156157158159160根据正态分布原理,若随机变量X服从正态分布,则样本均数也服从正态分布1.各样本均数未必等于总体均数;2.样本均数之间存在差异;3.样本均数的分布很有规律,围绕着总体均数(155.4cm),中间多、两边少,左右基本对称,也服从正态分布。4.样本均数的变异较之原变量的变异大大缩小样本均数的抽样分布具有以下特点:第一节均数的抽样误差与标准误

用于表示均数抽样误差大小的指标,也叫样本均数的标准差,通常称为样本均数的标准误。用于衡量抽样误差的大小。标准误(SE)

第一节均数的抽样误差与标准误

标准误的计算公式因通常σ未知,计算标准误采用下式:均数的标准误意义:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。与样本量的关系:

S一定,n↑,标准误↓第一节均数的抽样误差与标准误

X1S1X2

S2

XiSiXnSnxσN(μσ2)

标准误示意图X服从什么分布?例5-1

为了解某地13岁女生的身高,在该地随机抽取了30名13岁女生测量身高,结果算出均数=156.70cm,标准差=4.98cm。求其标准误的大小。

第一节均数的抽样误差与标准误

中心极限定理:第一节均数的抽样误差与标准误

均数随机变量XN(μ,σ2)标准正态分布N(0,12)Z变换标准正态分布N(0,12)Studentt分布自由度:n-1第二节

t分布又称Studentt分布。实际上,t分布十分有用,它是总体均数的区间估计和假设检验的理论基础。英国统计学家W.S.Gosset于1908年以“Student”笔名发表论文,证明它服从自由度

=n

1的t分布,即t分布,

=n

1(5-7)

第二节

t分布一、t分布的概念从前述实验4.1的13岁女学生身高这个正态总体中分别作样本量为3和50的随机抽样,各抽取1000份样本,并分别得到1000个样本均数及其标准误。对它们分别作(5-6)式的t转变换,并将t值绘制相应的直方图(见实验5-4)。二、t分布的图形和t界值表第二节

t分布第二节

t分布第二节

t分布υ=∞(标准正态分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3图5-3不同自由度下的t分布图第二节

t分布

t值的分布与自由度

有关(实际是样本含量n不同)。t

分布的图形不是一条曲线,而是一簇曲线。二、t分布的图形和t界值表①单峰分布,以0为中心,左右对称,类似于标准正态分布。②自由度

越小,t值越分散,曲线的峰部越矮,尾部越高;③随着自由度

逐渐增大,t分布逐渐逼近标准正态分布;当趋于时,t分布就完全成为标准正态分布,故标准正态分布是t分布的特例。υ=∞(标准正态分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3图5-3不同自由度下的t分布图第二节

t分布t分布的特征:二、t分布的图形和t界值表统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间的关系编制了不同自由度下的t界值表(附表2)。单侧概率:用t,υ表示双侧概率:用t/2,υ表示第二节

t分布二、t分布的图形和t界值表-tt0当

=10,单侧概率P=0.05时,由表中查得单侧t0.05,10=2.228当

=10,双侧概率P=0.05时,由表中查得双侧t0.05/2,10=1.812二、t分布的图形和t界值表单侧:P(t

t0.05,10)=0.05

和P(t

t0.05,10)=0.05双侧:P(t

t0.05/2,10)+P(t

t0.05/2,10)=0.051.8122.228-2.228tν=10的t分布图二、t分布的图形和t界值表单侧:P(t

t,)=

和P(t

t,)=双侧:P(t

t/2,)+P(t

t/2,)=二、t分布的图形和t界值表从t界值表中或表的右上角图列亦可看出:①在相同自由度时,│t│值越大,概率P越小;②而在相同t值时,双侧概率P为单侧概率P的两倍,即t0.10/2,16=t0.05,16=1.746。-tt0二、t分布的图形和t界值表t分布又称Studentt分布,实际上十分有用,它是总体均数的区间估计和假设检验的理论基础。第二节

t分布第三节总体均数的估计参数估计:指用样本指标(统计量)估计总体指标(参数)。参数估计点估计区间估计缺点:没有考虑抽样误差根据样本均数计算出有(1)把握的包含总体均数的一个数值范围称为总体均数的置信区间(CI),1

称为置信度。第三节总体均数的估计总体均数的95%(或99%)置信区间置信度:

值一般取0.05或0.01,故1

为0.95或0.99。区间估计:第三节总体均数的估计当我们据一份样本对总体均数只作一次区间估计时,我们宣布“总体均数μ在此可信区间范围内”,这句话可信的程度为95%区间估计:总体均数的95%置信区间的确切含义为:第三节总体均数的估计

例5-1

为了解某地13岁女生的身高,在该地随机抽取了30名13岁女生测量身高,结果算出均数=156.70cm,标准差=4.98cm。求该地13岁女生平均身高的置信区间。

例5-2

均数=156.70cm,总体标准差=5.3cm。求该地13岁女生平均身高的置信区间。

例5-3

在某市成人中随机抽取400人测脉搏,计算得到均数=74.5次/分,标准差=6次/分。求该市成人平均脉搏的置信区间。

第三节总体均数的估计总体均数的置信区间的计算

未知,且n较小-------t分布法

已知,或

未知但n足够大--Z分布法1.t分布方法(未知,且n较小)第三节总体均数的估计总体均数的置信区间的计算解:本例n=30,

=30–1=29,查t界值表,

=0.05,t0.05/2,29=2.045,95%CL:156.72.045=(154.8,158.6)g/L第三节总体均数的估计

例5-1为了解某地13岁女生的身高,在该地随机抽取了30名13岁女生测量身高,结果算出均数=156.70cm,标准差=4.98cm。求该地13岁女生平均身高的置信区间。

该地13岁女生平均身高的95%置信区间:

(154.8,158.6)cm,第三节总体均数的估计2.正态分布近似方法(

已知,或

未知但n足够大)

z/2

总体均数的置信区间的计算总体均数的双侧(1-α)置信区间为

z/2

Z0.05/2=1.96Z0.05=1.645第三节总体均数的估计2.正态分布近似方法(

已知,或

未知但n足够大)总体均数的置信区间的计算Z0.05/2=1.96Z0.05=1.645

例5-3

在某市成人中随机抽取400人测脉搏,计算得到均数=74.5次/分,标准差=6次/分。求该市成人平均脉搏的置信区间。

第三节总体均数的估计1.96=74.51.96(73.9,75.1)例5-4某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,试估计该市2000年19岁健康男大学生平均身高的95%置信区间。第三节总体均数的估计该市2000年19岁健康男大学生平均身高的95%置信区间为(171.3,173.1)cm。1.96=172.21.96(171.3,173.1)Z0.05/2=1.96Z0.05=1.645可信区间的确切涵义(1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数。1.95%的可信区间的理解:(1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小。当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好。(2)精确度:即区间的宽度区间愈窄愈好,如95%的可信区间比99%的可信区间要好。可信区间的确切涵义2.可信区间的两个要素可信区间的确切涵义2.可信区间的两个要素当n确定时,上述两者互相矛盾。在实际应用中,95%可信区间更为常用。在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。总体均数可信区间与参考值范围的区别区别点总体均数可信区间参考值范围含义按预先给定的概率,确定未知参数

的可能范围。实际上,一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:当

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论