医学统计学-正态分布与医学参考值范围_第1页
医学统计学-正态分布与医学参考值范围_第2页
医学统计学-正态分布与医学参考值范围_第3页
医学统计学-正态分布与医学参考值范围_第4页
医学统计学-正态分布与医学参考值范围_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正态分布与医学参考值范围医学统计学正态分布(Normal

Distribution)概念分布:随机变量取值的规律分布函数:描述分布的规律连续变量:正态分布变量类型离散变量:

⼆项分布,

泊松分布正态分布(normal

distribution)是自然界最常见的分布之⼀。医学研究中许多⽣理、⽣化指标;测量误差等数据多呈正态分布或近似正态分布。正态分布具有许多良好的性质。许多理论分布在⼀定条件下可用正态分布近似。⼀些重要的分布也可有正态分布导出。所以说正态分布是统计学中最重要的分布。正态分布的概念韦克斯勒(Wechsler)智商测验。140以上为非常优秀(天才)120-139为优秀;110-119为中上、聪慧;90-109为中等;80-89为中下;70-79为临界智能不⾜;69以下为智⼒缺陷。Aimhigh,gain

more正态分布的概念图3-1某市某年150名3岁⼥孩身⾼频数分布Histogram

ofFrequency051015202580 82 84 86 88 90 92 94 96 98 100 102 104 106Histogramof

xxFrequency-4 -2 024601000025000Histogramof

xxFrequency-4-2024020006000-4-20240.00.1 0.2 0.30.4Density正态分布的概念图3-2频数分布逐渐接近正态分布正态分布的概率密度函数若随机变量𝑥的概率密度函数(Probabilitydensity

function)可以表示为:𝑓 𝑥 =1𝜎 2𝜋𝑒+(-+.)0120其中𝑥

(−∞,

+∞)

,则称𝑥服从正态分布,记为𝑁(𝜇,

𝜎1

)正态分布的概率密度函数𝒇 𝒙 =𝟏𝝈 𝟐𝝅𝒆+(𝒙+𝝁)𝟐𝟐𝝈𝟐圆周率𝝅=𝟑.𝟏𝟒𝟏𝟓𝟗

…自然对数的底e=

2.71828…正态分布的两个参数,决定了曲线的位置和形状位置参数对曲线分布的影响-5050.00.10.20.30.4xy图3-3

位置参数对曲线分布的影响𝝈不变,𝝁 变⼤𝑵−𝟐,

𝟏𝑵(𝟎,

𝟏)𝑵(𝟐,

𝟏)-4-20 240.00.20.40.60.81.0xy𝝈变⼤𝑵𝟎,

𝟓𝑵(𝟎,

𝟏)𝑵(𝟎,𝟎.

𝟓)形状参数对曲线分布的影响图3-4

形状参数对曲线分布的影响正态分布有两个参数:

𝜇是均数;

𝜎是标准差。这两个参数可完全决定⼀个正态分布,

故常简记为𝑁(𝜇,

𝜎1

)𝜇是位置参数。当𝜎固定不变时,

𝜇越⼤,则曲线沿横轴越向右移动。反之,

𝜇越小,则曲线沿横轴越向左移动。𝜎是形状参数。当𝜇固定不变时,

𝜎越⼤,则曲线越平阔。反之,𝜎越小,则曲线越尖峭。0.20.100.30.40.60.5

-4-3234f(X)-2 -1 0 1图3-5

参数对曲线分X

布的影响N

(

1,0.82)N

(0,12)N

(1,1.22)位置参数μ决定曲线的位置,形状参数σ决定曲线的形状。特点:钟型最⾼处对应于X轴的值就是均数以均数为中⼼,左右对称曲线下面积为1均数决定了曲线的位置标准差决定了曲线的形状Xf(X)

正态曲线图3-6

正态分布的概率密度曲线标准正态分布(Standardnormal

distribution)均值𝜇

=

0

,

⽅差𝜎

=

1

的正态分布称为标准正态分布,记为𝑁(0,1)概率密度函数:𝑓 𝑥=12𝜋𝑒+

-010.40.200.6234f(X)-4 -3 -2 -1 0

X 1N(0,1)任何⼀个正态分布变量𝑥

~

𝑁(𝜇,

𝜎1)经过⼀个变换𝑧

= 𝑥−

𝜇𝜎便有

𝑧

~𝑁 0

1 ,称为标准正态变量。这个变换称为标准化变换。标准化变换⼀般正态分布为⼀个分布族𝑁(𝜇,

𝜎1)

;标准正态分布只有⼀个𝑁 0

1 .

这样简化了应用0.50.40.30.20.100.6234f(X)-4

-3

-2

-1

0

X

100.20.40.6234f(X)-4 -3 -2 -1 0

X 1N(0,1)标准正态变换上图中阴影部分 −∞,

𝑥 的面积称为正态分布的累积分布函数,记为:1𝜎 2𝜋𝑒+(-+.)0120-𝐹 𝑥 = N+O𝑑𝑥下图中阴影部分的面积,理论上可以计算如下:1𝜎 2𝜋𝑒+(-+.)0120𝐹 𝑏 −

𝐹(𝑎)S=

NT𝑑𝑥正态曲线下的面积分布规律-4-20240.00.10.20.30.4xStandard

Normaldnorm(x,0,

1)-40240.0 0.1 0.2 0.3 0.4dnorm(x,0,

1)b

x-2a对于标准正态分布,其累积分布函数,记为:V𝛷 𝑧 = N+O12𝜋V0𝑒+

1 𝑑𝑧标准正态曲线下的面积分布规律-4-20240.00.10.20.30.4Standard

Normalxdnorm(x,0,

1)𝚽

𝒛由概率密度曲线的对称性:𝛷 −𝑧 =1

−𝛷 𝑧借助表格可以得到任何区间上标准正态分布曲线下的面积,

即变量落在该区间上的概率。标准正态曲线下的面积分布规律标准正态分布表试着求出:P z

<

−2.58 =?P z

<

1.96 =?P z

>

2 =?P −2<z

<

1 =?标准正态曲线下面积分布规律-3-2-101230.0

0.1

0.2

0.3

0.4Standard

Normalxdnorm(x,0,

1)-3-2-101230.0

0.1

0.2

0.3

0.4Standard

Normalxdnorm(x,0,

1)-3-2-101230.0

0.1

0.2

0.3

0.4Standard

Normalxdnorm(x,0,

1)68.27%95%99%ƒ‰※

$

g0±10±1.960±2.5868.27%95%99%任何⼀个正态分布变量𝑥

~

𝑁(𝜇,

𝜎1)经过⼀个标准化变换𝑧

= 𝑥−

𝜇𝜎𝑧

= 𝑥−

𝑥𝑠再根据标准正态分布曲线下的面积分布表计算。一般正态分布曲线下的面积曲线下面积分布规律-1.96 -11 1.96-2.582.58µ-2.58σ68.27%95.00%99.00%0µ-1.96σ µ-σµ+σµ+1.96σµ+2.58σ68.27%95.00%99.00%µ𝒙

= 𝝁+

𝒛𝝈ƒ‰※

$

$

-1~1µ±ơ68.27%-1.96~1.96µ±1.96ơ95%-2.58~2.58µ±2.58ơ99%【例3-1】已知变量𝑥服从均数为𝜇,标准差𝜎为的正态分布.试估计:(1)𝑥取值在区间

𝜇

±

1.96𝜎上的概率;(2)𝑥取值在区间

𝜇

±

2.58𝜎上的概率。先做标准化变换:e𝑧 =𝑥e−

𝜇(𝜇−1.96𝜎)−

𝜇𝜎 𝜎= =

−1.96𝑧1=𝑥1−𝜇=(𝜇+1.96𝜎)−𝜇=

1.96𝜎 𝜎查标准正态分布表:Φ(𝑧e)

=

Φ −1.96 =

0.025正态曲线下面积对称,则区间 1.96,

∞ 的面积也是0.025.所以z取值在 −1.96,

1.96 的概率为1-2*0.025=0.95即𝑥取值在区间

𝜇

±

1.96𝜎上的概率为95%。【例3-2】已知某市1982年110名7岁男孩身⾼,均数为119.95cm,标准差为4.72cm。试着估计:该市7岁男孩身⾼在130以上者占该地7岁男孩总数的百分比;身⾼介于115-125者占该市7岁男孩总数的比例;该市居中80%男孩身⾼集中在哪个范围?先做标准化变换:𝑧=𝑥

−𝑥̅ =130−119.95=

2.13𝑠 4.72Φ −z =

Φ −2.13 =

0.0166理论上该市7岁男孩身⾼在130cm以上者占该市7岁男孩总⼈数的1.66%。先做标准化变换:e𝑧 =𝑥e−

𝑥̅115−

119.95𝑠 4.72= =

−1.05𝑧1=𝑥1

𝑥̅ =125−119.95=

1.07𝑠 4.72Φ −1.05 =0.1469,1

Φ −1.07 =

0.8572身⾼介于115-125者占该市7岁男孩总数的比例71.03%查标准正态分布表,标准正态分布曲线下左侧面积为0.1所对应的z值为-1.28.𝑥j±1.28𝑠=119.95±1.28∗4.72=119.95±

6.04所以80%的7岁男孩的身⾼值集中在

113.91~125.99【练习题1】随机抽取某市120名成年男⼦测红细胞计数,

得均数等于4.7168,标准差是0.5665。求红细胞计数在(4.0~5.0)

1012/L

之间的⼈数及所占比例。解:已知

𝒙j =4.7168,

S=0.5665𝒛=𝒙−

𝒙j𝒔X

=4时,Z1=(4-4.7168)/0.5665=-1.265X

=5时,Z2=(5-4.7168)/0.5665=

0.500P=

(0.5)-

(-1.265)=(1-0.3085)-0.1029

=0.5886人数:

120

0.5886

71正态性检验图示法:多采用分位数图(quantile-quantile

plot,Q-Q

plot)和概率图(probability-

probability

plot,P-P

plot)。计算法:常用偏度与峰度进⾏评定,其度量指标分别为偏度系数和峰度系数。正态分布的应用1、估计医学参考值范围2、质量控制3、正态分布是许多统计⽅法的理论基础小结1、正态分布概率密度函数2、标准正态转换3、正态分布曲线下的面积第二节医学参考值范围确定医学参考值范围参考值范围(Reference

range):指特定的“正常”⼈群的解剖,⽣理,⽣化指标及组织代谢产物含量等数据中⼤多数个体的取值所在的范围。制作参考值范围的步骤选择⾜够数量的正常⼈作为调查对象;确定单侧或双侧(根据专业知识);选择适当百分范围。常取90%, 95%,99%等;根据资料的分布特点,选定适当统计⽅法:正态分布法百分位数法医学参考值范围单侧下限---过低异常单侧上限---过⾼异常双侧---过⾼、过低均异常单侧下限异常正常单侧上限正常 异常异常正常双侧下限双侧上限异常参考值范围的估计方法1. 正态分布法:适于正态或近似正态分布资料单侧下界:𝑥̅

𝑧m𝑠单侧上界:𝑥̅

+

𝑧m𝑠双侧界值:

𝑥̅

±

𝑧m/1𝑠

$$z

Q

@@

((%)

800.8421.282901.2821.645951.6451.960992.3262.5762.百分位数法:适用于偏态分布资料$

@@

((%)

7

k80P_10~

P_90P_20P_8090P_5~

P_95P_10_9095P_2.5~

P_97.5P_5P_9599P_0.05~

P_0.95P_1P_99【例3-3】某地某年随机测量了118名健康成年男⼦的第⼀秒肺通⽓量(FEV1),结果如表所示。试估计该地成年男⼦FEV195%的参考值范围。表3-9

某年某地健康成年男子FEV1(L)FEV1

¼

$

2.0~2.2512.5~2.7533.0~3.25113.5~3.75274.0~4.25364.5~4.75265.0~5.25105.5~5.7536.0~6.56.251φ

118由以上资料计算得:𝒙j=

𝟒.

𝟐𝟒, 𝒔=𝟎.

𝟔𝟗本例参考值范围应为单侧下限,故95%参考值范围的下限为:𝒙j−𝟏.𝟔𝟒𝟓𝒔=𝟒.𝟐𝟒−𝟏.𝟔𝟒𝟓∗𝟎.𝟔𝟗=𝟑.

𝟏𝟎即该地健康成年男⼦第⼀秒肺通⽓量95%的参考值范围为不低于3.10L。【例3-4】某地调查正常成年男⼦144⼈的红细胞数,均数5.38×1012/L,标准差为0.44×1012/L。试估计该地成年男⼦红细胞数的95%参考值范围。下限:X

1.96s

5.38

1.96

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论