统计参数估计_第1页
统计参数估计_第2页
统计参数估计_第3页
统计参数估计_第4页
统计参数估计_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数估计parameterestimation统计学统计描述统计推断参数估计假设检验总体、个体和样本总体(population):调查研究的事物或现象的全体个体(itemunit):组成总体的每个元素样本(sample):从总体中所抽取的部分个体样本容量(samplesize):样本中所含个体的数量统计推断的过程总体样本抽样总体均值、比例、方差统计推断样本均数、率、标准差统计量参数案例:研究2004年某地7岁男孩的身高情况。假如该地2004年的7岁男孩有10万人,则最直接的方法就是普查:调查这10万个儿童,测量他们的身高,然后进行统计分析。但是工作量非常大。我们可以通过随机抽样调查了解7岁男孩的身高情况。如调查200个儿童,测量他们的身高,通过分析这200个儿童的身高推断该地10万个7岁男孩身高情况。总体:该地2004年10万个7岁男孩身高观察值的全体个体:每个7岁男孩样本:随机抽样所得到的200个7岁男孩身高观察值样本容量:200抽样实验:通过样本信息了解总体的情况。即:通过分析200个7岁男孩身高估计10万个7岁男孩身高情况,也就是用样本均数估计总体均数。抽样误差抽样误差(samplingerror)

由于个体差异的存在,导致抽样时样本统计量与总体参数间的差别;或同一总体的相同统计量之间的差别。属于随机误差:无倾向性,不可避免。抽样实验

假定某地所有13岁女学生身高服从正态分布N(155.4,5.32),从该总体中随机抽样,样本含量n=5,10,30计算其均数与标准差;重复抽取100次,获得100份样本;计算100份样本的均数与标准差,并对100份样本的均数作直方图。

思考题1各样本均数与总体均数相等吗?2各样本均数之间相等吗?3样本均数分布有何规律?4样本均数的变异较之原个体观察值的变异范围有何变化?5比较n=5、10、30“样本均数的标准差”。已知总体标准误:未知总体而知样本标准误:抽样实验小结

均数的均数围绕总体均数上下波动。

均数的标准差

与总体标准差s相差一个常数倍数,即。样本均数的标准误标准误(StandardError,SE):统计量的标准差样本均数的标准误:样本均数的标准差,测度样本均数的抽样误差,即样本均数的离散程度。理论值:

估计值:小于总体标准差影响抽样误差大小的主要因素是样本量例2003年某地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,计算当地20岁应征男青年身高的标准误。即本次调查身高均数171.2cm抽样误差的估计值为0.57cm

。标准差VS标准误样本率的标准误在抽样调查中,由抽样造成的样本率和总体率之差称为率的抽样误差。即样本率的标准差样本率p的标准差p

就称为率的标准误。率的样本标准误计算公式:

样本率样本含量率的样本标准误样本均值的分布1.来自于同一正态总体的样本均数的分布抽样分布总体分布m=50s=10X2.来自于同一偏态总体的样本均数的分布

中心极限定理(centrallimittheorem):X当n足够大,样本均数逐渐趋于正态分布任一分布的总体Studentt-分布自由度n=n-1Xt

分布与正态分布的比较N(0,1)t(n)0t

分布:形状与N(0,1)相似,但t分布中间较小,两侧较大。t不同自由度的t分布0随着n增大,t分布逼近N(0,1);n∞时,t分布演变成N(0,1)。P467t分布曲线下面积双侧t0.05/2,∞=1.96=单侧t0.025,∞1.96-1.960规律:1.同一下,t值增加,P值减小

2.同一P值下,增加,t值减小1.640参数估计(estimationofparameter):--用样本统计量估计总体参数。样本统计量

总体参数

利用样本信息计算一个区间,称为总体参数的(1)100%可信区间参数估计点估计区间估计

概念

参数估计(estimationofparameter):

用样本指标(统计量,statistic)估计

总体指标(参数,parameter)。

点估计(pointestimation)

总体均数的点估计

总体率的点估计

即样本均数和样本率分别是总体均数

和总体率的估计值。重复试验时该区间包含总体均数的概率表示为

1-a

或100(1-a)%

常用的有99%,95%,90%相应的a为0.01,0.05,0.103.(1)100%可信区间系指该区间包含总体均数的可能性是(1)100%。总体均数的估计置信上限可信/置信区间(区间估计)置信下限样本统计量

(点估计)点估计:pointestimation区间估计:intervalestimations未知或n较小时即t分布法:例某地2002年9名7岁正常发育男孩,测得其均数为121.44cm,标准差为5.75cm,求总体均数的95%可信区间。解:2.s已知,或s未知但n足够大:

例随机抽得某地90名正常成年女子,计算其红细胞数的均数为4.18(1012/L),标准差为0.29(1012/L),试估计总体均数的95%的可信区间。解:95%可信区间的含义:

从总体中作随机抽样,例如作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括总体均数m(估计正确),只有5个可信区间不包括总体均数m(估计不正确)。

实际中,只作一次抽样,只得到一个可信区间,作为未知总体均数的可能范围的估计,理论上有95%的可能是正确的,而5%的可能发生错误。选择:设某人群的身高值X~N(155.4,5.32),现从该总体中随机抽出一个n=10的样本,算的均数为158.36cm,S=3.83cm,求得m的95%可信区间为(155.62,161.10),发现该区间未包含总体均数m=155.4cm。若随机从该总体抽取n=10的样本200个,每次都求95%可信区间,问大约有多少个可信区间不包括总体均数m=155.4cm在内?

A5,B20,C10,D1,E3mm-1.64sm-1.96sm+1.96sm-2.58sm+2.58s90.00%95.00%99.00%N(m,s2)m+1.64s95%-1.96x+1.96x99%-2.58x+2.58x90%-1.64x+1.64xx_XN(m,s2/n)总体概率的估计查表法正态近似法例6-4某医院对39前列腺癌患者实施开放性手术治疗,术后合并症者2人,试估计该手术合并症发生概率的95%可信区间。

P478查表6例6-5用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率78.3%,试估计该仪器乳腺癌总体检出率的95%可信区间。

带入公式

几个重要概念的区别

(计量资料)标准差与标准误的区别SDSE性质表示个体变异大小表示抽样误差大小用途求参考值范围求可信区间计算

随n增大渐趋于稳定渐趋于0

(1)100%参考值范围与可信区间的区别

含义

前者指该区间包含了(1)100%的观察值

后者指该区间包含总体均数的可能性是

(1)100%

计算(双侧为例)

参考值范围

可信区间

可信区间与可信限的区别

前者区间,后者两点。可信区间参考值范围含义

当=0.05时,CI以95%的可能性包含总体均数。

“正常人”的解剖、生理、生化某项指标个体值的波

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论