参数估计课件_第1页
参数估计课件_第2页
参数估计课件_第3页
参数估计课件_第4页
参数估计课件_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计parameterestimation7参数估计统计学统计描述统计推断参数估计假设检验7参数估计总体、个体和样本

总体(population):调查研究的事物或现象的全体

个体(itemunit):组成总体的每个元素

样本(sample):从总体中所抽取的部分个体

样本容量(samplesize):样本中所含个体的数量7参数估计统计推断的过程总体样本抽样总体均值、比例、方差统计推断样本均数、率、标准差统计量参数7参数估计案例:研究2004年某地7岁男孩的身高情况。假如该地2004年的7岁男孩有10万人,则最直接的方法就是普查:调查这10万个儿童,测量他们的身高,然后进行统计分析。但是工作量非常大。我们可以通过随机抽样调查了解7岁男孩的身高情况。如调查200个儿童,测量他们的身高,通过分析这200个儿童的身高推断该地10万个7岁男孩身高情况。7参数估计总体:该地2004年10万个7岁男孩身高观察值的全体个体:每个7岁男孩样本:随机抽样所得到的200个7岁男孩身高观察值样本容量:200抽样实验:通过样本信息了解总体的情况。即:通过分析200个7岁男孩身高估计10万个7岁男孩身高情况,也就是用样本均数估计总体均数。7参数估计抽样误差抽样误差(samplingerror)

由于个体差异的存在,导致抽样时样本统计量与总体参数间的差别;或同一总体的相同统计量之间的差别。属于随机误差:无倾向性,不可避免。7参数估计抽样实验

假定正常成年男子的红细胞计数服从正态分布N(5.00,0.502),从该总体中随机抽样,样本含量n=10,计算其均数与标准差;重复抽取100次,获得100份样本;计算100份样本的均数与标准差,并对100份样本的均数作直方图。按上述方法再做样本含量n=5、n=30的抽样试验;比较计算结果。7参数估计思考题1各样本均数与总体均数相等吗?2各样本均数之间相等吗?3样本均数分布有何规律?4样本均数的变异较之原个体观察值的变异范围有何变化?5比较n=5、10、30“样本均数的标准差”。7参数估计表7-1正常男子红细胞计数抽样实验结果(m=5.00,s2=0.502,n=10)7参数估计7参数估计3个抽样实验结果图示7参数估计100份样本抽样计算结果已知总体标准差s:未知总体而知样本标准差S:总体均数总体标准差s均数的均数均数的标准差n=55.000.504.9870.23000.2236n=105.000.505.0110.15860.1581n=305.000.505.0000.09200.09137参数估计抽样实验小结

均数的均数围绕总体均数上下波动。

均数的标准差

与总体标准差s相差一个常数倍数,即。7参数估计第七章参数估计

第一节样本均数的标准误第三节两均数之差的可信区间7参数估计样本均数的标准误标准误(StandardError,SE):统计量的标准差样本均数的标准误:样本均数的标准差,测度样本均数的抽样误差,即样本均数的离散程度。理论值:

估计值:小于总体标准差影响抽样误差大小的主要因素是样本量7参数估计例7-32003年某地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,计算当地20岁应征男青年身高的标准误。即本次调查身高均数171.2cm抽样误差的估计值为0.57cm

。7参数估计标准差VS标准误7参数估计样本均值的分布1.来自于同一正态总体的样本均数的分布抽样分布总体分布m=50s=10X7参数估计2.来自于同一偏态总体的样本均数的分布

中心极限定理(centrallimittheorem):X当n足够大,样本均数逐渐趋于正态分布任一分布的总体7参数估计Studentt-分布自由度n=n-17参数估计Xt

分布与正态分布的比较N(0,1)t(n)0t

分布:形状与N(0,1)相似,但t分布中间较小,两侧较大。7参数估计t不同自由度的t分布0随着v增大,t分布逼近N(0,1);v

∞时,t分布演变成N(0,1)。7参数估计P3237参数估计t分布曲线下面积双侧t0.05/2,∞=1.96=单侧t0.025,∞1.96-1.960规律:1.同一

下,t值增加,P值减小

2.同一P值下,增加,t值减小1.6407参数估计参数估计(estimationofparameter):--用样本统计量估计总体参数。样本统计量

总体参数

利用样本信息计算一个区间,并给出重复试验时该区间包含总体参数的概率参数估计点估计区间估计7参数估计

2

未知

2已知均数方差率可信区间可信区间(confidenceinterval,CI)

7参数估计总体均数的估计置信上限可信/置信区间(区间估计)置信下限样本统计量

(点估计)点估计:pointestimation区间估计:intervalestimation7参数估计重复试验时该区间包含总体均数的概率表示为

1-a

或100(1-a)%

常用的有99%,95%,90%相应的a为0.01,0.05,0.10置信水平/可信度

7参数估计s未知:7参数估计例7-4由例7-1的第二个样本,求总体均数的95%可信区间。解:7参数估计2.s已知,或s未知但n足够大:

7参数估计例7-5估计例7-3中2003年当地20岁应征男青年身高总体均数的95%的可信区间。解:7参数估计影响区间宽度的因素数据的离散程度,用S或来测度样本容量,置信水平(1-

),影响

的大小7参数估计可信区间95%99%公式范围

窄宽估计错误概率

大(0.05)小(0.01)精密度(precision)准确度(accuracy)1-a增大样本量7参数估计重复试验时:(1-

)的区间包含了

的区间未包含

1-aa/2a/27参数估计95%可信区间的含义:

从总体中作随机抽样,例如作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括总体均数m(估计正确),只有5个可信区间不包括总体均数m(估计不正确)。

实际中,只作一次抽样,只得到一个可信区间,作为未知总体均数的可能范围的估计,理论上有95%的可能是正确的,而5%的可能发生错误。7参数估计选择:设某人群的身高值X~N(155.4,5.32),现从该总体中随机抽出一个n=10的样本,算的均数为158.36cm,S=3.83cm,求得m的95%可信区间为(155.62,161.10),发现该区间未包含总体均数m=155.4cm。若随机从该总体抽取n=10的样本200个,每次都求95%可信区间,问大约有多少个可信区间不包括总体均数m=155.4cm在内?

A5,B20,C10,D1,E37参数估计mm-1.64sm-1.96sm+1.96sm-2.58sm+2.58s90.00%95.00%99.00%N(m,s2)m+1.64s7参数估计95%

-1.96

x

+1.96

x99%

-2.58

x

+2.58x90%

-1.64

x

+1.64

x

x_XN(m,s2/n)7参数估计可信区间参考值范围含义

=0.05时,CI以95%的可能性包含总体均数。

“正常人”的解剖、生理、生化某项指标个体值的波动范围。计算公式s未知:

正态分布:

s已知或s未知但为大样本:

偏态分布:PX~P100

X

用途

总体均数的区间估计

绝大多数(如95%)观察对象某项指标的分布范围7参数估计被估计的总体参数总体参数符号表示样本统计量一个总体均值m比例p方差s2两个总体均值之差m1-m2比例之差p1-p2方差比s12/s227参数估计两均数之差7参数估计7参数估计两均数之差的估计7参数估计分组nS试验组322.91.9对照组405.22.7例7-7比较某药治疗流行性乙

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论