医学卫生统计学总体均数的估计课件_第1页
医学卫生统计学总体均数的估计课件_第2页
医学卫生统计学总体均数的估计课件_第3页
医学卫生统计学总体均数的估计课件_第4页
医学卫生统计学总体均数的估计课件_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Chapter6总体均数与总体率的估计Chapter6总体均数与总体率的估计

【实例】欲了解某地2002年小学六年级学生智商的平均水平,随机抽取了150名六年级小学生作为样本,算得IQ的样本均数为107.5,据此可以认为该地2002年六年级小学生IQ的均值为107.5。本研究的目的是什么?采用的研究方法是什么?统计图表2【实例】欲了解某地2002年小学六年级学生智商的平均水平以上问题为统计推断内容参数估计:总体均数估计、总体率估计等假设检验:方差分析、秩和检验等统计图表3以上问题为统计推断内容统计图表3本章主要内容抽样误差与标准误

t分布总体均数的估计二项分布总体率的估计统计图表4本章主要内容抽样误差与标准误统计图表4第一节抽样误差与标准误统计图表5第一节统计图表5【例6-2】假设已知某地正常成年男性红细胞数的均值为5.00×1012/L,标准差为0.43×1012/L。现从该总体中进行随机抽样,每次抽取10名正常成年男子,并测得他们的红细胞数,抽取100份样本,计算出每份样本的均数。案例分析统计图表6【例6-2】假设已知某地正常成年男性红细胞数的均值为5.00样本号均数样本号均数样本号均数样本号均数14.87264.82515.22764.9825.09275.07525.06774.8634.98284.89535.06785.0045.10295.00545.08795.0555.18304.69555.04805.0764.95315.08565.27815.1674.83325.22575.06825.1084.71335.22584.86835.0494.92344.88595.13845.11104.97355.11604.86854.97115.11365.12614.64864.96125.01375.12624.94875.15135.00385.09634.85885.07145.06395.23644.97894.93155.12404.93654.98904.95表6-1随机抽取的100份样本红细胞数的计算结果(n=10)

统计图表7样本号均数样本号均数样本号均数样本号均数14.87264.81.1抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可避免、可以控制。表现:样本统计量与总体参数之间的差异样本统计量之间的差异产生原因:个体变异+抽样1.均数的抽样误差(samplingerror)统计图表81.1抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽2.1均数的分布2.均数的分布和标准误从正态分布总体抽取样本含量为n的若干样本,每个样本均可获得一个样本均数,这些均数服从什么样的分布呢?统计图表92.1均数的分布2.均数的分布和标准误从正态分布总体抽图6-1表6-1资料100个样本均数的频数分布图统计图表10图6-1表6-1资料100个样本均数的频数分布图统123456789(a)1234578n=5(b)123456789n=10(c)123456789n=20(d)123456789n=30(e)统计图表11123456789(a)1234578n=5(b)12345

中心极限定理从正态分布总体中固定样本含量n反复多次抽样,所得的各不相同,但它们以μ为中心呈正态分布。即使从偏态分布总体抽样,只要n足够大(n>50),也近似正态分布。统计图表12中心极限定理从正态分布总体2.均数的分布和标准误2.2标准误(standarderror)2.2.1样本统计量的标准差称为标准误2.2.2样本均数的标准差称为均数的标准误

统计图表132.均数的分布和标准误2.2标准误(standarder2.均数的分布和标准误

均数的标准误表示样本均数的变异度

总体标准差未知时,用样本标准差代替

统计图表142.均数的分布和标准误统计图表144.标准误的计算[例]随机抽取某市200名7岁男童的身高均数为124.0cm,标准差为4.6cm,估计抽样误差的大小。统计图表154.标准误的计算[例]随机抽取某市200名7岁男童的身高均2.2.3标准误的用途衡量样本均数的可靠性;估计总体均数的可信区间;用于均数的假设检验。统计图表162.2.3标准误的用途衡量样本均数的可靠性;统计图表16①含义不同:标准差:表示观测值的变异程度。标准误:反映抽样误差的大小。②用途不同:标准差:确定医学参考值范围。标准误:用于统计推断(参数估计、假设检验)。③公式不同:

标准差与标准误的区别统计图表17①含义不同:标准差与标准误的区别统计图表17第二节t分布统计图表18第二节t分布统计图表18样本均数,根据标准化变换,则实际工作中,总体方差未知。所以,用样本方差代替总体方差,此时=t,t值的分布如何?统计图表19样本均数,根据标准从N(0,1)中1000次抽样的t值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3.35均数为0.05696标准差为1.55827

统计图表20从N(0,1)中1000次抽样的t值的分布(n=4)Fr2.1概念:从正态总体N(μ,σ2)中进行无数次样本含量为n的随机抽样,每次均可得到一个和一个s,通过公式:

转换,可得无数个t值,t值的分布即为t分布统计图表212.1概念:从正态总体N(μ,σ2)中进行无数次统计图表21自由度为1、5、∞的t分布

近似标准正态分布统计图表22自由度为1、5、∞的t分布近似标准正态分布统计图表22

2.2特征

以0为中心,左右对称t分布是一簇曲线形状与自由度有关当趋于时,t分布逼近标准正态分布

t分布曲线下面积为1

t分布曲线下面积分布可由t值表中查出:

双侧P(t≤-tα/2·υ)+P(t≥tα/2·υ)=α

单侧P(t≤-t

α·υ)=α或

P(t≥tα·υ)=α统计图表232.2特征 统计图表23图6-3时单双侧界值的概率示意图统计图表24图6-3时单双侧界值的概率示意从界值表可看出(1)自由度相同时,界值越大其对应的值越小(2)概率相等时,越大,界值越小(3)值相等时,双侧概率为单侧概率的两倍(4)时,界值即为界值统计图表25从界值表可看出(1)自由度相同时,界值越大其对应的值越小统第三节总体均数的估计

统计图表26第三节统计图表26

点估计(pointestimation):用样本均数估计总体均数。

区间估计(intervalestimation):按一定的概率(可信度,1-α)估计总体均数所在范围亦称总体均数的可信区间。参数估计:点估计、区间估计统计图表27参数估计:点估计、区间估计统计图表27可信区间通常由两个数值即两个可信限(confidencelimit,CL)表示:较小者称为下限(lowerlimit,L)较大者称为上限(upperlimit,U)统计图表28可信区间通常由两个数值即两个可信限统计图表28总体均数可信区间的计算当σ已知

服从标准正态分布

统计图表29总体均数可信区间的计算当σ已知 服从标准正态分布统计图表2统计图表30统计图表30图6-4总体均数的双侧可信区间统计图表31图6-4总体均数的双侧总体均数可信区间的计算Ⅱ.未知但n足够大(n>50) 统计图表32总体均数可信区间的计算Ⅱ.未知但n足够大(n>50) 统

例6-3中,因n=120,,,试求该地正常成年男性血清胆固醇平均水平的95%可信区间。即(3.55,4.17)mmol/L

统计图表33例6-3中,因n=120,常用单双侧z值

α 单侧 双侧

0.10 1.282 1.645 0.05 1.645 1.960 0.02 2.054 2.326 0.01 2.326 2.578统计图表34常用单双侧z值统计图表34同理,可推导出相对应的单侧可信区间

统计图表35同理,可推导出相对应的单侧可信区间统计图表35总体均数可信区间的计算Ⅲ.当σ未知n较小 统计图表36总体均数可信区间的计算Ⅲ.当σ未知n较小 统计图表36同理,可推导出相对应的单侧可信区间

统计图表37同理,可推导出相对应的单侧可信区间统计图表37

从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。

可信区间的两个要素一是准确度:反映在可信度的大小二是精密度:反映在区间的长度

可信区间的涵义统计图表38从总体中作随机抽样,每个样本可以算得一个可信区间。如9图6-5从N(0,1)中随机抽样算得的100个95%可信区间(n=10)统计图表39图6-5从N(0,1)中随机抽样算得的100个95均数的可信区间与参考值范围的区别区别点均数的可信区间参考值范围意义按预先给定的概率,确定的未知参数的可能范围。“正常人”的解剖、生理、生化、某项指标的波动范围。计算公式σ未知:σ已知或σ未知但n较大正态分布:偏态分布:PX~P100-X用途估计总体均数判断观察对象的某项指标正常与否统计图表40均数的可信区间与参考值范围的区别区别点均数的可信区间参考值范

1.标准差与标准误有什么区别与联系?思考题2.可信区间与参考值范围有什么不同?统计图表411.标准差与标准误有什么区别与联系?思考题2.可信区间与参第四节二项分布与Poisson分布统计图表42第四节统计图表42

在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,如某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。统计学上将这类只具有两种互斥结果的随机试验称为贝努利试验(Bernoullitrial)。

二项分布统计图表43在医学领域中,有一些随机事件是只具有两种互斥【问题6-4】假设服用某药物后有10%的人出现过敏反应。若3人服药后,出现0、1、2或3个人过敏的概率分别是多少?统计图表44【问题6-4】假设服用某药物后有10%的人出现过敏反应。贝努利试验序列特点每次试验的结果只能是两种互斥结果中的一种;各次试验的结果互不影响;在相同试验条件下,各次试验中出现某一结果A具有相同的概率π。

统计图表45贝努利试验序列特点每次试验的结果只能是两种互斥结果中的一种统计图表46统计图表46一般地,在一个n重贝努利试验中,令X表示事件A发生的次数,则随机变量X所有可能的取值为0,1,2,…,n,且其概率函数为:贝努利试验序列中某一结果A出现次数的概率分布称二项分布(binomialdistribution),记为:统计图表47一般地,在一个n重贝努利试验中,令X表示n为独立的贝努利试验次数;π为阳性的概率;(1-π)为阴性的概率;X为在n次贝努利试验中出现阳性的次数;表示在n次试验中出现X的各种组合情况称二项系数。统计图表48n为独立的贝努利试验次数;统计图表48连续型分布:z分布、t分布和F分布等

离散型分布:二项分布和Poisson分布等在二项分布中,参数称为离散参数,只能取正整数;参数是事件A发生的概率。

统计图表49连续型分布:z分布、t分布和F分布等离散型分布:二项分布和(1)二项分布的概率之和等于1

统计图表50(1)二项分布的概率之和等于1统计图表50(2)单侧累积概率至多有例阳性的概率(下侧累积概率)统计图表51(2)单侧累积概率至多有例阳性的概率(下侧累积概率)(2)单侧累积概率至少有例阳性的概率(下侧累积概率)统计图表52(2)单侧累积概率至少有例阳性的概率(下侧累积概率)阳性结果发生数X的总体均数总体方差

总体标准差

统计图表53阳性结果发生数X的总体均数总体方差总体标准差统计图表53π=0.3时,不同n值对应的二项分布统计图表54π=0.3时,不同n值对应的二项分布统计图表54统计图表55统计图表55统计图表56统计图表56第五节总体率的估计统计图表57第五节统计图表57【例6-6】某市疾控中心对该市郊区200名小学生进行贫血的检测,结果发现有80名小学生贫血,则认为该市郊区小学生贫血率为40.0%。【问题6-6】

这是什么资料?该研究属于何种设计方案?40.0%来代表该市郊区小学生贫血率是否合适?怎样估计该市郊区小学生贫血率?统计图表58【例6-6】某市疾控中心对该市郊区200名小学生进行贫血的检率的抽样误差与标准误由于抽样而引起的样本率与总体率的差异称为率的抽样误差,用率的标准误度量。统计图表59率的抽样误差与标准误由于抽样而引起的样本率与总体率的差实际工作中,常用样本p作为π的估计值统计图表60实际工作中,常用样本p作为π的估计值统计图表60例6-6中:

统计图表61例6-6中:统计图表61总体率的估计查表法:正态分布法:统计图表62总体率的估计查表法:统计图表62【例6-7】某医院应用氨苄青霉素治疗呼吸道感染,45例患者中有2例发生过敏反应。试估计过敏反应发生率的95%可信区间。查附表5(百分率的可信区间表),的行与的列交叉处的数值为1-15,即氨苄青霉素过敏反应发生率的95%可信区间为(1%,15%)。统计图表63【例6-7】某医院应用氨苄青霉素治疗呼吸道感染,45例患者【例6-6】某市疾控中心对该市郊区200名小学生进行贫血的检测,结果发现有80名小学生贫血,检出率为40.0%。试估计该区贫血发生率的95%可信区间。统计图表64【例6-6】某市疾控中心对该市郊区200名小学生进行贫血的检THEEND统计图表65THEEND统计图表65Chapter6总体均数与总体率的估计Chapter6总体均数与总体率的估计

【实例】欲了解某地2002年小学六年级学生智商的平均水平,随机抽取了150名六年级小学生作为样本,算得IQ的样本均数为107.5,据此可以认为该地2002年六年级小学生IQ的均值为107.5。本研究的目的是什么?采用的研究方法是什么?统计图表67【实例】欲了解某地2002年小学六年级学生智商的平均水平以上问题为统计推断内容参数估计:总体均数估计、总体率估计等假设检验:方差分析、秩和检验等统计图表68以上问题为统计推断内容统计图表3本章主要内容抽样误差与标准误

t分布总体均数的估计二项分布总体率的估计统计图表69本章主要内容抽样误差与标准误统计图表4第一节抽样误差与标准误统计图表70第一节统计图表5【例6-2】假设已知某地正常成年男性红细胞数的均值为5.00×1012/L,标准差为0.43×1012/L。现从该总体中进行随机抽样,每次抽取10名正常成年男子,并测得他们的红细胞数,抽取100份样本,计算出每份样本的均数。案例分析统计图表71【例6-2】假设已知某地正常成年男性红细胞数的均值为5.00样本号均数样本号均数样本号均数样本号均数14.87264.82515.22764.9825.09275.07525.06774.8634.98284.89535.06785.0045.10295.00545.08795.0555.18304.69555.04805.0764.95315.08565.27815.1674.83325.22575.06825.1084.71335.22584.86835.0494.92344.88595.13845.11104.97355.11604.86854.97115.11365.12614.64864.96125.01375.12624.94875.15135.00385.09634.85885.07145.06395.23644.97894.93155.12404.93654.98904.95表6-1随机抽取的100份样本红细胞数的计算结果(n=10)

统计图表72样本号均数样本号均数样本号均数样本号均数14.87264.81.1抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可避免、可以控制。表现:样本统计量与总体参数之间的差异样本统计量之间的差异产生原因:个体变异+抽样1.均数的抽样误差(samplingerror)统计图表731.1抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽2.1均数的分布2.均数的分布和标准误从正态分布总体抽取样本含量为n的若干样本,每个样本均可获得一个样本均数,这些均数服从什么样的分布呢?统计图表742.1均数的分布2.均数的分布和标准误从正态分布总体抽图6-1表6-1资料100个样本均数的频数分布图统计图表75图6-1表6-1资料100个样本均数的频数分布图统123456789(a)1234578n=5(b)123456789n=10(c)123456789n=20(d)123456789n=30(e)统计图表76123456789(a)1234578n=5(b)12345

中心极限定理从正态分布总体中固定样本含量n反复多次抽样,所得的各不相同,但它们以μ为中心呈正态分布。即使从偏态分布总体抽样,只要n足够大(n>50),也近似正态分布。统计图表77中心极限定理从正态分布总体2.均数的分布和标准误2.2标准误(standarderror)2.2.1样本统计量的标准差称为标准误2.2.2样本均数的标准差称为均数的标准误

统计图表782.均数的分布和标准误2.2标准误(standarder2.均数的分布和标准误

均数的标准误表示样本均数的变异度

总体标准差未知时,用样本标准差代替

统计图表792.均数的分布和标准误统计图表144.标准误的计算[例]随机抽取某市200名7岁男童的身高均数为124.0cm,标准差为4.6cm,估计抽样误差的大小。统计图表804.标准误的计算[例]随机抽取某市200名7岁男童的身高均2.2.3标准误的用途衡量样本均数的可靠性;估计总体均数的可信区间;用于均数的假设检验。统计图表812.2.3标准误的用途衡量样本均数的可靠性;统计图表16①含义不同:标准差:表示观测值的变异程度。标准误:反映抽样误差的大小。②用途不同:标准差:确定医学参考值范围。标准误:用于统计推断(参数估计、假设检验)。③公式不同:

标准差与标准误的区别统计图表82①含义不同:标准差与标准误的区别统计图表17第二节t分布统计图表83第二节t分布统计图表18样本均数,根据标准化变换,则实际工作中,总体方差未知。所以,用样本方差代替总体方差,此时=t,t值的分布如何?统计图表84样本均数,根据标准从N(0,1)中1000次抽样的t值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3.35均数为0.05696标准差为1.55827

统计图表85从N(0,1)中1000次抽样的t值的分布(n=4)Fr2.1概念:从正态总体N(μ,σ2)中进行无数次样本含量为n的随机抽样,每次均可得到一个和一个s,通过公式:

转换,可得无数个t值,t值的分布即为t分布统计图表862.1概念:从正态总体N(μ,σ2)中进行无数次统计图表21自由度为1、5、∞的t分布

近似标准正态分布统计图表87自由度为1、5、∞的t分布近似标准正态分布统计图表22

2.2特征

以0为中心,左右对称t分布是一簇曲线形状与自由度有关当趋于时,t分布逼近标准正态分布

t分布曲线下面积为1

t分布曲线下面积分布可由t值表中查出:

双侧P(t≤-tα/2·υ)+P(t≥tα/2·υ)=α

单侧P(t≤-t

α·υ)=α或

P(t≥tα·υ)=α统计图表882.2特征 统计图表23图6-3时单双侧界值的概率示意图统计图表89图6-3时单双侧界值的概率示意从界值表可看出(1)自由度相同时,界值越大其对应的值越小(2)概率相等时,越大,界值越小(3)值相等时,双侧概率为单侧概率的两倍(4)时,界值即为界值统计图表90从界值表可看出(1)自由度相同时,界值越大其对应的值越小统第三节总体均数的估计

统计图表91第三节统计图表26

点估计(pointestimation):用样本均数估计总体均数。

区间估计(intervalestimation):按一定的概率(可信度,1-α)估计总体均数所在范围亦称总体均数的可信区间。参数估计:点估计、区间估计统计图表92参数估计:点估计、区间估计统计图表27可信区间通常由两个数值即两个可信限(confidencelimit,CL)表示:较小者称为下限(lowerlimit,L)较大者称为上限(upperlimit,U)统计图表93可信区间通常由两个数值即两个可信限统计图表28总体均数可信区间的计算当σ已知

服从标准正态分布

统计图表94总体均数可信区间的计算当σ已知 服从标准正态分布统计图表2统计图表95统计图表30图6-4总体均数的双侧可信区间统计图表96图6-4总体均数的双侧总体均数可信区间的计算Ⅱ.未知但n足够大(n>50) 统计图表97总体均数可信区间的计算Ⅱ.未知但n足够大(n>50) 统

例6-3中,因n=120,,,试求该地正常成年男性血清胆固醇平均水平的95%可信区间。即(3.55,4.17)mmol/L

统计图表98例6-3中,因n=120,常用单双侧z值

α 单侧 双侧

0.10 1.282 1.645 0.05 1.645 1.960 0.02 2.054 2.326 0.01 2.326 2.578统计图表99常用单双侧z值统计图表34同理,可推导出相对应的单侧可信区间

统计图表100同理,可推导出相对应的单侧可信区间统计图表35总体均数可信区间的计算Ⅲ.当σ未知n较小 统计图表101总体均数可信区间的计算Ⅲ.当σ未知n较小 统计图表36同理,可推导出相对应的单侧可信区间

统计图表102同理,可推导出相对应的单侧可信区间统计图表37

从总体中作随机抽样,每个样本可以算得一个可信区间。如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。

可信区间的两个要素一是准确度:反映在可信度的大小二是精密度:反映在区间的长度

可信区间的涵义统计图表103从总体中作随机抽样,每个样本可以算得一个可信区间。如9图6-5从N(0,1)中随机抽样算得的100个95%可信区间(n=10)统计图表104图6-5从N(0,1)中随机抽样算得的100个95均数的可信区间与参考值范围的区别区别点均数的可信区间参考值范围意义按预先给定的概率,确定的未知参数的可能范围。“正常人”的解剖、生理、生化、某项指标的波动范围。计算公式σ未知:σ已知或σ未知但n较大正态分布:偏态分布:PX~P100-X用途估计总体均数判断观察对象的某项指标正常与否统计图表105均数的可信区间与参考值范围的区别区别点均数的可信区间参考值范

1.标准差与标准误有什么区别与联系?思考题2.可信区间与参考值范围有什么不同?统计图表1061.标准差与标准误有什么区别与联系?思考题2.可信区间与参第四节二项分布与Poisson分布统计图表107第四节统计图表42

在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,如某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。统计学上将这类只具有两种互斥结果的随机试验称为贝努利试验(Bernoullitrial)。

二项分布统计图表108在医学领域中,有一些随机事件是只具有两种互斥【问题6-4】假设服用某药物后有10%的人出现过敏反应。若3人服药后,出现0、1、2或3个人过敏的概率分别是多少?统计图表109【问题6-4】假设服用某药物后有10%的人出现过敏反应。贝努利试验序列特点每次试验的结果只能是两种互斥结果中的一种;各次试验的结果互不影响;在相同试验条件下,各次试验中出现某一结果A具有相同的概率π。

统计图表110贝努利试验序列特点每次试验的结果只能是两种互斥结果中的一种统计图表111统计图表46一般地,在一个n重贝努利试验中,令X表示事件A发生的次数,则随机变量X所有可能的取值为0,1,2,…,n,且其概率函数为:贝努利试验序列中某一结果A出现次数的概率分布称二项分布(binomialdistribution),记为:统计图表112一般地,在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论