医学统计学:第3章 总体均数的区间估计和假设检验_第1页
医学统计学:第3章 总体均数的区间估计和假设检验_第2页
医学统计学:第3章 总体均数的区间估计和假设检验_第3页
医学统计学:第3章 总体均数的区间估计和假设检验_第4页
医学统计学:第3章 总体均数的区间估计和假设检验_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章总体均数的区间估计和假设检验

第1节均数的抽样误差与标准误第2节t分布第3节总体均数的区间估计第4节假设检验的意义和基本步骤第5节均数的

u

检验第6节均数的

t检验第7节两个方差的齐性检验和t’检验第8节Ⅰ型错误和Ⅱ型错误第9节应用假设检验应注意的问题图示:总体与样本Populationμsample2sample1sample3sample4sample5一、标准误的意义及其计算统计推断(statisticalinference)

:根据样本信息来推论总体特征。均数的抽样误差:由抽样引起的样本均数与总体均数的差异称为均数的抽样误差。标准误(standarderror):反映均数抽样误差大小的指标。第1节均数的抽样误差与标准误σ已知:标准误计算公式σ未知:

实例:如某年某市120名12岁健康男孩,已求得均数为143.07cm,标准差为5.70cm,按公式计算,则标准误为:1.表示抽样误差的大小;2.进行总体均数的区间估计;3.进行均数的假设检验等。二、标准误的应用

一、t分布的概念正态变量X采用u=(X-

)/

变换,则一般的正态分布N(

,

)即变换为标准正态分布N(0,1)。从正态总体抽取的样本均数服从正态分布N(

,

),同样可作正态变量的u变换,即第2节t分布

实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,此时就不是u变换而是t变换了,即下式:

t分布于1908年由英国统计学家W.S.Gosset以“Student”笔名发表,故又称Studentt

分布(Students’t-distribution)。

二、t分布曲线的特征

t分布曲线是单峰分布,以0为中心,左右两侧对称,曲线的中间比标准正态曲线(u分布曲线)低,两侧翘得比标准正态曲线略高。t分布曲线随自由度υ而变化,当样本含量越小(严格地说是自由度υ=n-1越小),t分布与u分布差别越大;当逐渐增大时,t分布逐渐逼近于u分布,当υ=∞时,t分布就完全成正态分布。t分布曲线是一簇曲线,而不是一条曲线。t分布下面积分布规律:查t分布表。t分布示意图t分布曲线下双侧或单侧尾部合计面积我们常把自由度为

的t分布曲线下双侧尾部合计面积或单侧尾部面积为指定值

时,则横轴上相应的t界值记为t,

。如当

=20,

=0.05时,记为t0.05,20;当

=22,

=0.01时,记为t0.01,22。对于t,

值,可根据

值,查t界值表。t分布是t检验的理论基础。根据t值计算公式可知:│t│值与样本均数和总体均数之差成正比,与标准误成反比。在t分布中│t│值越大,其两侧或单侧以外的面积所占曲线下总面积的比重就越小,说明在抽样中获得此│t│值以及更大│t│值的机会就越小,这种机会的大小是用概率P来表示的。│t│值越大,则P值越小;反之,│t│值越小,P值越大。根据上述的意义,在同一自由度下,│t│≥t

,则P≤

;反之,│t│<t

,则P>

。第3节总体均数的区间估计

参数估计:用样本指标(统计量)估计总体指标(参数)称为参数估计。估计总体均数的方法有两种,即:点值估计(pointestimation)区间估计(intervalestimation)。一、点值估计

点值估计:是直接用样本均数作为总体均数的估计值。此法计算简便,但由于存在抽样误差,通过样本均数不可能准确地估计出总体均数大小,也无法确知总体均数的可靠程度。二、区间估计

区间估计是按预先给定的概率(1-

)所确定的包含未知总体参数的一个范围,该范围亦称总体参数的可信区间或置信区间(confidenceinterval,缩写为CI)。1-

称为可信度,常取1-

为0.95和0.99,即总体均数的95%可信区间和99%可信区间。95%CI:对于t分布而言,95%的t值在–t/2,

和t/2,

之间。总体均数的可信区间的计算

(1)未知

且n较小(n<60)按t分布的原理(2)已知

或n较大(n≥60)按u分布的原理1、单一总体均数的可信区间2、两总体均数之差的可信区间3、总体率的区间估计(1)小样本率的区间估计对于n小于50,且p接近于0或1时,可直接查附表6百分率的可信区间表得到其总体率的可信区间估计。(2)大样本率的区间估计当n较大,p和1-p均不太小,如np和n(1-p)均大于5时,利用样本率p近似服从正态分布的原理来估计。(3)两总体率差值的区间估计设两样本率分别为p1和p2,当n1和n2均较大,且p1,1-p1及p2,1-p2均不太小,如n1p1、n1(1-p1)、np2和n(1-p2)均大于5,可采用正态近似法对两总体率差值进行可信区间估计,其计算公式为:95%的可信区间为123.7±2.064×2.38,即(118.79,128.61)。故该地1岁婴儿血红蛋白平均值95%的可信区间为118.7~128.61(g/L)。例3-1为了了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7g/L,标准差为11.9g/L。试求该地1岁婴儿的血红蛋白平均值95%的可信区间。

例3-2

上述某市120名12岁健康男孩身高均数为143.07cm,标准误为0.52cm,试估计该市12岁健康男孩身高均数95%和99%的可信区间。

95%的可信区间为

143.07±1.96×0.52,即(142.05,144.09)。99%的可信区间为

143.07±2.58×0.52,即(141.73,144.41)。例3-3

评价复方缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度高血压的疗效,将102名患者随机分为两组,其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压,试验组平均下降15.77mmHg,标准差为13.17mmHg;对照组平均下降9.53mmHg,标准差为13.55mmHg。试估计两组收缩压平均下降的差值的95%的可信区间。

例3-4某区疾病预防控制中心2002年对该乡镇250名小学生进行贫血的检测,结果发现有86名贫者,检出率为34.40%,求贫血检出率95%的可信区间。例3-5某医院口腔科医生用极固宁治疗牙本质过敏症,以双氯涂料作对照,进行了1年的追踪观察,结果见下表所示,试估计两组有效率差别95%的可信区间。组别总牙数有效数有效率(%)试验组776179.22对照组693855.07合计1469967.81表3-1治疗牙本质过敏症两组有效率的比较可信区间的确切涵义如果能够进行重复抽样试验,平均有1-

的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为1-

。可信度1-

区间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论