医学统计学(概率分布(正态分布))_第1页
医学统计学(概率分布(正态分布))_第2页
医学统计学(概率分布(正态分布))_第3页
医学统计学(概率分布(正态分布))_第4页
医学统计学(概率分布(正态分布))_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章概率分布教学目的与要求掌握内容:

1、正态分布的概率密度与分布2、正态分布面积规律3、正态曲线下面积的分布规律4、正态分布曲线特点5、标准正态分布6、参考值范围教学内容提要重点讲解:标准正态分布正态分布的特征参考值范围讲解:正态分布的概念正态曲线下面积的分布规律介绍:正态分布的应用

第一节正态分布与标准正态分布Gauss分布或常态分布,是以均数为中心,左右两侧对称的钟型分布,是统计学中最重要的分布。医学资料中有许多指标如身高、体重、红细胞数、血红蛋白、收缩压、脉搏数等频数分布都呈正态分布。

1、图形2、特征3、面积若指标x的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布。频率曲线或频数曲线一、正态分布

1.图形某地120例正常人血清铜含量直方图2.正态分布的密度函数f(x)f(x)=(–∞<x<∞)μ是总体平均值,σ是总体标准差,正态分布的密度函数f(x)

的图形即正态曲线。曲线关于μ对称、在x=μ处函数取得最大值,在x=μ±σ处是拐点,曲线下总面积为1。

μ+σμ-σ3.正态变量的分布函数F(x)正态变量在(-∞,x)内取值的累计概率。F(x)=P(X<x)=不同变量的正态分布曲线二、标准正态分布μ=0,σ=1的正态分布称为标准正态分布。标准正态曲线的方程即标准正态密度函数,记为

(z)(Z)=,(–∞<Z<∞)

1.标准正态分布的密度函数f(x)=(–∞<x<∞)2.标准正态分布的分布函数

标准正态变量的分布函数记为Ф(z)。

Ф(z)=P(Z<z)==3.标准正态变换:Z=(3-9)4.正态分布的特征*

(1)正态分布具有集中性、对称性和均匀变动性。(2)正态分布的图形由参数μ和σ确定。4.正态分布的特征(3)任何均数为μ、标准差为σ的正态分布N(μ,σ),都可通过式(3-9)变换为均数为0、σ为1的标准正态分布N(0,1)。Z=5.正态曲线下面积的分布规律*Xf(X)m曲线下对称于μ的区间面积相等,如区间(-∞,-1.96)与(1.96

,+∞)的面积相等。【例3-1】

已知某地120例正常人血浆铜含量(μM)的均数=14.48、s=2.27,试估计该地120例正常人血浆铜含量(μmol/L)在14.20~15.60范围内的人数。⑴计算z值:按μ,σ未知时的标准正态变换z=(x―)/s:x1=14.20,z1=(14.20-14.48)/2.27=-0.1233x2=15.60,z2=(15.60-14.48)/2.27=0.4934⑵查附表5,标准正态曲线下面积表:z=-0.12时,在表的左侧找到-0.1,在表的上方找到0.02,二者相交处为0.4522,标准正态曲线下,横轴上z值小于-0.12的面积Ф(-0.12)=45.22%,即标准正态变量z值小于-0.12的概率为0.4522;同样查得z=0.49时,标准正态曲线下横轴上z值小于0.49的面积Ф(0.49)=68.79%,即z值小于0.49的概率为0.6879。⑶z值在-0.12~0.49范围内的面积为Ф(0.49)-Ф(-0.12)=0.6879-0.4522=0.2357,即血清蛋白含量在14.20~15.60范围内的概率为23.57%。⑷120例正常人血浆铜含量(μmol/L)在14.20~15.60范围的人数为120×23.57%=28人。第二节正态分布的应用1)是统计学原理和统计分析方法的基础,很多抽样分布如2分布、t分布都是建立在正态分布基础上的。2)许多医药指标如人体的某些正常生理值都可看作和近似看作服从正态分布,从而可按正态分布规律估计参考值范围。3)很多资料,如毒物致死量、食物中毒潜伏期、剂量-效应曲线、正常成人血铅含量等,虽不服从正态分布,但经变量代换(如取对数)后则服从正态分布或近似正态分布,可按正态分布规律来处理。一、医学正常值范围的估计

定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。单双侧:根据指标的实际用途,有的指标有上下界值,过高过低均属异常;某些指标过高为异常,只需确定上限;某些指标过低为异常,只需确定下限。估计的方法:

1)正态分布法

2)百分位数法1.百分位数法

此法适用于任何分布资料,双侧95%的医学参考值范围是(P2.5,P97.5),单侧范围是P5之上(如肺活量),或P95之下(如血铅值)。Px

=L+d(nx%-∑fL)/fx

2.正态分布法

应用条件:正态分布或近似正态分布资料

●计算

双侧正常值(医学参考值)范围公式:

Zα/2

S,Zα/2

·S)即(±Zα/2

·S)(3-12)

单侧(1-α)参考值范围为:>(-ZαS),或<(+ZαS)(3-13)已知:=119.95cm,s=4.72cm.

试问:(1)估计该地7岁男童身高在110cm以下者

占该地7岁男童的百分比。

(2)估计该地7岁男童身高在130cm

以上者占该地7岁男童的百分比。

(3)估计该地7岁男童身高在107.77cm到

132.13cm之间的占该地7岁男童的百分比。

【例3-2】

某市1982年110名7岁男童的身高【例3-3】若已知健康女大学生血清总蛋白含量服从正态分布,均数μ=73.8g/L,标准差σ=3.9g/L,试估计168名健康女大学生血清总蛋白含量在72.0~78.6g/L范围内的人数。

①计算z值:按标准正态变换z=(x―μ)/σ:

x1=72.0g/L时,z1=(72.0-73.8)/3.9=-0.46x2=78.6g/L时,z2=(78.6-73.8)/3.9=1.23②查标准正态曲线下面积表(附表5):z=-0.46时,在表的左侧找到-0.4,在表的上方找到0.06,二者相交处为0.3228,标准正态曲线下,横轴上z值小于-0.46的面积为Ф(-0.46)=P(z<-0.46)=32.28%,即标准正态变量z值小于-0.46的概率为32.28%;同样查得z=1.23时,标准正态曲线下,横轴上z值小于1.23的面积为Ф(1.23)=P(z<1.23)=0.8907,即z值小于1.23的概率为89.07%。③

z值在-0.46~1.23范围内的面积:Ф(1.23)-Ф(-0.46)=0.8907-0.3228=0.5679,即血清蛋白含量在72.0g/L~78.6g/L范围内的概率为56.79%。④

168名健康女大学生血清总蛋白含量在72.0~78.6g/L范围的人数:168×56.79%=95人。小结习题:1.各观察值加同一数后:A.均数不变,标准差改变B.均数改变,标准差不变C.二者均不变D.均改变2.用均数和标准差可全面描述:A.正偏态资料B.负偏态资料C.正态分布和近似正态分布D.任何分布3.正态分布曲线下,从均数μ到μ

+1.96的面积为:A.95%B.45%C.97.5%D.47.5%1976年美国8岁男孩的平均身高为146厘米,标准差为8厘米,估计在该研究中有%多少的男孩平均身高在138厘米与154厘米之间?又有%多少在130厘米到162厘米之间?⑴计算z值:按μ,σ未知时的标准正态变换z=(x―x)/s:x1=138,z1=(138-146)/8=-1x2=154,z2=(154-146)/8=11.是非题(1)在整理实验数据时,如果随意将那些自认为"过大或过小"的数据舍弃掉,不仅使实验研究的真实性受到了破坏,有时还容易失去发现奇迹(如基因的突变)的机会。()(2)随机抽查100名50岁以下正常女性血清铁蛋白(mg/ml)的测定结果,计算得均数=30.18(mg/ml),标准差s=15.03(mg/ml),中位数Md=21.5(mg/ml)据此,判断该资料宜用均数描述集中趋势()2.选择题或最佳选择题(1)①某地18岁男大学生身高普查结果均数为171.85cm,标准差为4.12cm,后者反映的是()②从该地随机抽取15名18岁男大学生,测得身高均数为172.00cm,标准差为4.23cm,则172.00cm与①中的171.85cm不同,主要原因是()③又从该地随机抽取15名20岁男大学生,测得其身高的均数为173.12cm,标准差为3.98cm,则173.12cm与172.00cm不同,原因是()A.抽样误差B.个体变异C.总体均数不同D.A或C(2)随机抽得观察指标为数值变量的实验数据为21、23、25、27、28、20、22、23、25、24、求平均水平,最好选用()

A、中位数B、几何均数C、算术均数D、众数(3)有5人的血清滴度为:1:20,1:40,1:80,1:160,1:320则平均滴度是()

A.1:40

B.1:80

C.1:160

D.1:320(4)正常成年男子的血铅含量系偏态分布资料,对数变换后的呈正态分布。欲描述血铅的平均水平宜用……..………()

A.原始数据的算术均数

B.原始数据的几何均数

C.原始数据的中位数

D.原始数据的标准差(4)随机抽查100名50岁以下正常女性血清铁蛋白(mg/ml)的测定结果,计算得均数=30.18(mg/ml),标准差s=16.13(mg/ml),中位数Md=20.5(mg/ml)据此,判断该资料呈(),A、偏态分布B、对称分布C、正态分布D、以上均不是(5)偏态分布数值资料,对数变换后,分布仍呈偏态。描述数据的集中趋势宜用()

A.算术均数

B.几何均数

C.中位数

D.标准差(6)调查某市一所中学16岁男生,测量其身高1=161.87,s1=5.94,胸围2=74.38,s2=5.92。你认为何者的离散程度为大………………..()

A、二者离散度相等B、胸围的离散度大于身高的离散度C、身高的离散度大于胸围的离散度D、无法判定(7)关于标准差,下面哪个说法是正确的()

A.标准差可以是负数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论