第四章抽样误差与区间估计_第1页
第四章抽样误差与区间估计_第2页
第四章抽样误差与区间估计_第3页
第四章抽样误差与区间估计_第4页
第四章抽样误差与区间估计_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、l从样本获取有关总体信息的过程称为统计推断从样本获取有关总体信息的过程称为统计推断(statistical inference)(statistical inference)。l由个体差异产生的,抽样造成的样本与样本、由个体差异产生的,抽样造成的样本与样本、样本与总体相应统计指标之间的差异,称为抽样本与总体相应统计指标之间的差异,称为抽样误差样误差(sampling error) (sampling error) 。标准误(标准误(standard error, SE):样本统计量的标准差。):样本统计量的标准差。均数的标准误(均数的标准误(SEM , X ) : 即样本均数的标准差。即样本均

2、数的标准差。样本观测值的标准差与样本均数的标准误的比较:样本观测值的标准差与样本均数的标准误的比较:1.标准差与标准误都反映数据的离散性;标准差与标准误都反映数据的离散性;2.标准差的大小反映各个个体的观测值标准差的大小反映各个个体的观测值X之间的变异之间的变异 程度(离散程度),标准误的大小反映各个样本均程度(离散程度),标准误的大小反映各个样本均 数数X间的变异程度(离散程度),也反映了样本均间的变异程度(离散程度),也反映了样本均 数代表总体均数的可靠性。数代表总体均数的可靠性。数理统计推出:数理统计推出:1.1.从正态总体从正态总体N N( , 2 2)中,随机抽取例数为)中,随机抽取

3、例数为n n的样的样本,样本均数本,样本均数X X也服从正态分布;即使从偏态总体随机也服从正态分布;即使从偏态总体随机抽样,当抽样,当n n足够大时,足够大时,X X也近似正态分布;也近似正态分布;2.2.从均数为从均数为 ,标准差为,标准差为 的正态或偏态总体,抽取例数的正态或偏态总体,抽取例数为为n n的样本,样本均数的样本,样本均数X X的总体均数也为的总体均数也为 ,标准差用,标准差用 X X 表示,则表示,则 X X可按下式计算:可按下式计算: X X = = n X N( , 2) X N( , ) 2n X = nS X =Sn一一. t. t分布的概念分布的概念X N( , 2

4、) X N( , ) 2nX- N(0, ) 2X- N(0, 1 ),即),即u分布。分布。 /n用用S代替代替 ,得到,得到 X- S/ n t分布分布nl以以0 0为中心,左右对称的单峰分布;为中心,左右对称的单峰分布;lt t分布曲线是一簇曲线,其形态变化与自由度分布曲线是一簇曲线,其形态变化与自由度 的大小有关。的大小有关。自由度自由度 越小,则越小,则t t值越分散,曲值越分散,曲线越低平;线越低平;自由度自由度 逐渐增大时,逐渐增大时,t t分布逐渐逼分布逐渐逼近近u u分布;当分布;当 = = 时,时,t t分布即为分布即为u u分布。分布。lt t分布曲线下总的面积等于分布曲

5、线下总的面积等于1 1,即,即t t值落入区间值落入区间(- - , )内的概率为)内的概率为1 1。t t值落入任一区间值落入任一区间 (t t1 1,t t2 2)内的概率等于该区间内曲线和横坐)内的概率等于该区间内曲线和横坐标轴所夹的面积。标轴所夹的面积。附表附表2 t2 t界值表通式:界值表通式:单侧:单侧:P P(t t -t -t , , )= )= , , 或或P P(t t t t , , )= )= 双侧双侧: : P P(t t -t -t /2,/2, ) + ) + P P(t t t t /2,/2, )= )= 图中非阴影部分面积的概率为图中非阴影部分面积的概率为:

6、 :P P( - -t t /2,/2, t t t t /2,/2, )= 1-)= 1- l参数估计是指用样本指标值估计总体指标值。参数估计是指用样本指标值估计总体指标值。l包括点估计和区间估计。包括点估计和区间估计。点估计:点估计:就是用样本统计量直接作为总体参数的估计值。就是用样本统计量直接作为总体参数的估计值。区间估计:区间估计:即按预先给定的概率(即按预先给定的概率(1-1- )确定包含未知总体)确定包含未知总体参数的可能范围。该范围称为参数的可信区间或参数的可能范围。该范围称为参数的可信区间或置信区间置信区间 ,预先给定的概率称为可信度或置信,预先给定的概率称为可信度或置信度,常

7、取度,常取95%95%或或99%99%。可信区间的确切含义指的是:有可信区间的确切含义指的是:有1- 1- 的可能认的可能认为计算出的可信区间包含了总体参数。为计算出的可信区间包含了总体参数。总体均数可信区间总体均数可信区间(confidence interval)的计算:的计算:1. 未知:按未知:按t分布。分布。由于由于P(-t /2, t t /2, )= 1- ,-t /2, t /2, X- S/ nX- t /2, Sn X + t /2, Sn2. 已知或已知或 未知但未知但n足够大时:按足够大时:按u分布分布双侧可信区间为:双侧可信区间为:(X u /2 n)或)或 (X u

8、/2 sn)均数的可信区间与参考值范围的区别:均数的可信区间与参考值范围的区别:1.1.意义不同意义不同均数的可信区间的统计意义:均数的可信区间的统计意义:(1 1)按预先给定的概率,确定的包含总体均数的可能范围,)按预先给定的概率,确定的包含总体均数的可能范围,因此它用于估计总体均数。因此它用于估计总体均数。(2 2)可信度要高,但精度不能下降。)可信度要高,但精度不能下降。参考值范围的统计意义:参考值范围的统计意义:“正常人正常人”的解剖、生理、生化某项指标的波动范围,可的解剖、生理、生化某项指标的波动范围,可以用于判断观察对象的某项指标正常与否。以用于判断观察对象的某项指标正常与否。2.

9、2.两者的计算公式有差别:可信区间用了标准误,参考值两者的计算公式有差别:可信区间用了标准误,参考值范围用了标准差。范围用了标准差。补充题补充题 152例麻疹患儿病后血清抗体滴度倒数的分布如下,试例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计和作总体几何均数的点值估计和95%区间估计。区间估计。 152例麻疹患儿病后血清抗体滴度倒数的分布例麻疹患儿病后血清抗体滴度倒数的分布滴度倒数滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计合计人人 数数 0 0 1 7 10 31 33 42 24 3 1 152可信区间:补充题可信区间:补充题 View Variable:View Data:Transform Compute Target Variable: logxNumeric Expression: LG10(x)OKData Weight Cases Wei

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论