第三章正态分布与参考值范围_第1页
第三章正态分布与参考值范围_第2页
第三章正态分布与参考值范围_第3页
第三章正态分布与参考值范围_第4页
第三章正态分布与参考值范围_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章正态分布与医学参考值范围第一节正态分布正态分布正态分布 正态分布正态分布(normal distributionnormal distribution)也叫高斯分布()也叫高斯分布(Gaussian distributionGaussian distribution),是最常见、最重要的一种连),是最常见、最重要的一种连续型分布续型分布 一、正态分布的数学形式和正态曲线下面积的规律一、正态分布的数学形式和正态曲线下面积的规律 二二、正态分布的、正态分布的特征特征 三三、标准正态分布、标准正态分布 频数分布图频数分布逐渐接近正态分布示意图频数分布逐渐接近正态分布示意图(一)、(一)、正态分

2、布的概率密度函数正态分布的概率密度函数)正态曲线(就是为横坐标,绘制的曲线为纵坐标,以)称为概率密度函数(为总体标准差的总体均数,为为底的自然对数指数是以,curve normal)(functiondensity y probabilit)(),(72818. 2exp14159. 3,2)(exp21)(222XXfXfXNXXXXf正态分布的概率分布函数正态分布的概率分布函数(二)、正态曲线(二)、正态曲线( normal curve ) 正态曲线的定义 正态曲线是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线正态分布的特征 正态分布是单峰分布,曲线以均数为

3、中心,左右完全对称,正态曲线以X轴为渐近线,曲线两端无线接近X轴,但不相交; 正态曲线在均数处取得该概率密度函数的最大值,X越远离均数,f(X)值越小,在x=处有拐点,表现为钟形曲线; X取值范围理论上没有边界,应为:-+ ,X离离越远,函数f(X)值越接近0,但不会等于0。正态分布的特征 正态分布有两个参数, 决定曲线在横轴上的位置,增大,曲线沿横轴向右移;反之, 减小,曲线沿横轴向左移; 决定曲线的形状,当 恒定时,越大,数据越分散,曲线越“矮胖”;反之,越小,数据越集中,曲线越“瘦高”; 习惯上用N( ,2);表示均数为 、标准差为的正态分布;正态分布的特殊形式: 标准正态分布N(0 ,

4、1);正态分布的特征正态曲线下的面积分布有一定的规律: 1.曲线下的面积即为概率,可以通过式3-2求得。 2.曲线下的总面积为1或100%,以为中心左右两侧面积各占50%,越靠近处,曲线下面积越大,两边逐渐减少,超过一定范围以外的面积(概率)可以忽略。 3.所有正态曲线,在左右的任意个标准差范围内面积相同。正态分布曲线下面积规律图图2-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%96. 196. 196. 196. 1xsxxsx或 )1 , 0(2N)8 . 0 , 1(2N)2 . 1 , 1 (2N正态分布数列中的每个个体加上一个不为零的常数K后,均数的

5、变化 均数改变为原均数+K()iinxxKxKK xnn标准差的变化 标准差不变,等于原数列的标准差snxxnkxkxSiin11)()(22正态分布数列中的每个个体乘以一个不为零或一的常数K后,均数的变化 均数改变为原均数 K()iinxxKxKK xnn标准差的变化 标准差改变,等于原数列标准差的K倍ksnxxknkxkxSiin11)()(22 三三 标准正态分布标准正态分布标准正态分布标准正态分布 (standard normal distribution)的两个参数为:的两个参数为:=0,=1 记为记为 N(0,12) 任意一个服从任意一个服从N(,2)分布的随机变量)分布的随机变量

6、X经过经过标准化变换,也叫标准化变换,也叫z变换(变换(u变换),均可转换为变换),均可转换为=0,=1的标准正态分布。的标准正态分布。 sxxzxz或标准正态分布的概率密度函数标准正态分布的概率密度函数)(21)(22zezz标准正态分布的分布函数标准正态分布的分布函数 经常会用到正态分布曲线下一定范围的面积占总面积的百分数,用以估计落在该范围内的频数占总频数的百分比。 可通过对式(3-1)积分求得,表示从-到x或z的面积F(x)或(z)(总面积为1)。见图3-5。)(21)(22zdzezzzdXeXFXX)2()(2221)( 曲线下面积曲线下面积0.00.10.20.30.40.5-4

7、-3-2-101234Xf(X)u-附表1(P213)就是根据标准正态分布的分布函数制定的标准正态曲线下的面积特点 附表1 为标准正态分布曲线下的面积,表上所查到的面积为从-到z的面积; 假设横轴上曲线下的面积为1,即100 曲线下,横轴上对称于0的面积相等 实际工作中经常要用的面积分布规律有以下三点,68.27%,95%,99%的面积公式见表1和下图。标准正态分布曲线下面积规律标准正态分布曲线下面积规律0-11-1.961.96-2.582.5868.27%95.00%99.00%正态曲线下的面积特点 ,已知时,进行标准正态变换再查表 ,未知时,用样本均数 和样本标准差s代替总体参数进行标准

8、正态变换后再查表 95%,99%的面积公式见表1x xx正态分布曲线下面积规律的推导正态分布曲线下面积规律的推导双侧双侧95%的面积的公式的面积的公式96. 196. 1sxxx或96. 196. 1u正态分布曲线下面积规律图图2-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%96. 196. 196. 196. 1xsxxsx或表表1 正态分布曲线下面积规律正态分布曲线下面积规律标准正态分布标准正态分布 正态分布正态分布 面积或概率面积或概率 -11 68.27% -1.961.96 1.96 95.00% -2.582.58 2.58 99.00% szxz

9、或计算正态曲线下面积实例计算正态曲线下面积实例例例1 试估计该地正常女子血清甘油三脂在1.10 mmol/L以下者占正常女子血清甘油三脂总人数的百分比。 将X=1.10代入标准正态变量变换公式,得: 14. 029. 014. 110. 1zLmmolsLmmolx/298. 0,/14. 1计算正态曲线下面积实例计算正态曲线下面积实例 查附表1,在表的左侧找到0.1,在表的上方找到0.04,两者的相交处为0.4443=44.43%。 即该地正常女子血清甘油三脂在1.10mmol/L以下者,估计占总人数的44.43%。例3-1和3-2见P22。实例图示实例图示0.00.30.60.91.21.

10、51.800.511.52X44.43 概率密度函数与累积分布函数概率密度函数与累积分布函数三、 正态分布的应用 一种最常见、最重要的连续分布 很多正常人的生理、生化指标的理论分布 数理统计中发展得最为完善的一种分布 很多统计推断都是在正态分布条件下进行 很多非正态分布的资料,当观察例数足够多时,可以用正态分布作为它的极限分布 有时,也将非正态分布资料转化为正态分布来处理正态分布的应用 深入统计描述和推断的基础 计算参考值范围的基础 计算可信区间的基础 进行假设检验的基础 质量控制图 二项分布、Poisson分布的正态分布近似第二节医学参考值范围 由于存在个体变异,来自正常人群的由于存在个体变

11、异,来自正常人群的生理、生化指标在不同个体之间存在生理、生化指标在不同个体之间存在着差异,即使是同一个个体,某些指着差异,即使是同一个个体,某些指标也会因时间、空间的改变而有一定标也会因时间、空间的改变而有一定程度的波动。程度的波动。 因此,很有必要制定一个正常人群的因此,很有必要制定一个正常人群的参考值范围以判断某个个体某项指标参考值范围以判断某个个体某项指标正常与否。正常与否。一、医学参考值范围的概念 又称参考值范围又称参考值范围(reference range)(reference range),是指是指“正常正常”人的人的解剖,解剖,生理、生生理、生化化等等数据数据大多数个体值大多数个

12、体值的波动范围。的波动范围。 常用常用9595的参考值范围的参考值范围The Purpose of the Reference RangeJudge the index value of someone is normal or not? 因为参考值范围覆盖了绝大多数个体,所以因为参考值范围覆盖了绝大多数个体,所以 如果某个个体的测量值超出此范围,我们可以如果某个个体的测量值超出此范围,我们可以据此推断他的这项指标存在着异常。据此推断他的这项指标存在着异常。基于临床实践,从个体角度,作为临床上判定正基于临床实践,从个体角度,作为临床上判定正常与异常的参考标准常与异常的参考标准基于预防医学实践,

13、从人群角度,可用来评价儿基于预防医学实践,从人群角度,可用来评价儿童的发育水平童的发育水平正常人的手指血流正常人的手指血流呈呈黃藍黃藍色色 (perfusion unitperfusion unit約約215215)參參考值:考值:PU150PU150手指手指潰爛潰爛之病人血流之病人血流呈紫灰呈紫灰藍藍色色(PUPU約約为为1919)Index abnormalsick or unhealthiness? Help us to judge whether someone is sick . ?姚明:2.26米,身高高于正常 人参考值范围的上限,属于身高指标异常 。但是他很健康,并 没有相关的疾

14、病。Two、How to Make Reference Range First stepSampling from Normal Population确定同质的参照总体The choice of sample 首先,正常人不是指完全健康的首先,正常人不是指完全健康的人,而是指人,而是指符合特定健康水平的符合特定健康水平的人。在使用或指定临床参考值范人。在使用或指定临床参考值范围时,围时,“正常人正常人”是指是指相对于我相对于我们所研究的指标正常的人,即排们所研究的指标正常的人,即排除了除了对研究指标有对研究指标有影响的疾病或影响的疾病或有关有关因素的因素的同质人群同质人群。例如:例如:制定血清

15、谷丙转氨酶的参考值范围,你认为正常人的条件是什么呢?无肝肾心脑肌肉等疾病无肝肾心脑肌肉等疾病近期未服用对肝脏有损伤的药物如氯丙嗪,异烟近期未服用对肝脏有损伤的药物如氯丙嗪,异烟肼等肼等检测前未作剧烈运动检测前未作剧烈运动例如:如果我们想制定某市成人居民中血铅例如:如果我们想制定某市成人居民中血铅的参考值范围,我们规定凡是满足下列条的参考值范围,我们规定凡是满足下列条件的个体均可进入我们的研究:件的个体均可进入我们的研究:1: adult people wuho have stayed in the city for more than one year 2 : without obvious

16、liver or kidney diseases 3 : without the history of obvious lead contact or lead-related occupationSecond stepSelect enough sample选择足够例数的参照样本选择足够例数的参照样本The choice of sample 随机选取样本 Random 样本含量(n)Sample size: the bigger the better, but in common sense the sample should involve at least 100 individuals

17、.Third stepMinimize Measure Error 控制检测误差Minimize Measure Error Standardize 标准化 统一测量方法 统一仪器 统一试剂 统一精密度 统一操作熟练度 Fourth stepGrouping or not? 分组的原则:如果组间差异有统计学意义,而且分组具有实际意义,则一定应分组。 例如:如果我们想制定身高的参考值范围,不仅应考虑性别,年龄的差异,而且还应将地区之间的差异考虑在内。 For example, we we want to make a reference range of height. Not only gen

18、der, age, but also geographic factors should be considered. 婴儿身体发育的参考值婴儿身体发育的参考值( (均值均值) )男孩男孩女孩女孩头围头围(cm)体重体重kgkg身长身长cmcm头围头围(cm)cm)体重体重(kg)kg) 身长身长(cm)(cm)第一周第一周34.0034.003.003.0050.050.034.034.03.003.0050.050.0第一个月第一个月35.8135.813.823.8253.153.135.0835.083.643.6451.951.9第二个月第二个月 37.70 37.70 5.005.

19、0056.256.236.7036.704.604.6054.954.9第三个月第三个月39.5039.505.835.8359.659.638.2038.205.205.2057.757.7第四个月第四个月40.6040.606.436.4361.861.839.6039.606.056.0560.960.9第五个月第五个月41.7041.707.017.0164.264.240.7040.706.586.5863.163.1第六个月第六个月42.7342.737.687.6866.466.441.3841.386.926.9264.564.5第七个月第七个月43.2943.298.048.

20、0468.168.142.2242.227.497.4967.167.1第八个月第八个月43.8543.858.378.3769.969.942.7542.757.697.6968.168.1第九个月第九个月44.3544.358.778.7771.371.343.2343.238.058.0569.869.8第十个月第十个月44.9544.959.039.0372.972.943.6643.668.368.3670.870.8第十一个月第十一个月45.4845.489.279.2773.773.743.8643.868.538.5372.172.1Fifth stepA One-Side R

21、ange or A Two-Sides Range One side or two sides? 决定选用单侧范围还是双侧范围要根据我们的科研设计、积累的经验及指标的实际用途而定。 The choice of a one- or two-sides range is determined by your scientific research design or your experience. 如果某个指标(如身高)过高和过低均为异常,我们就应该制定它的双侧范围,即找到正常人群的上限和下限。 If an index is thought to be abnormal when it is t

22、oo high or too low, we must find the lower and upper limits of normal population, that means two sides range. 血清蛋白电泳扫描结果血清蛋白电泳扫描结果 正常参考值范围:正常参考值范围: Alb(Alb(白蛋白):57%-68%:57%-68% 1 : 11 : 1.0%-5.7%0%-5.7% 2 : 4.9%-11.2%2 : 4.9%-11.2% : 7.0%-13%: 7.0%-13% : 9.8%-18.2%: 9.8%-18.2%双白蛋白血症先天性白蛋白缺陷症Two-side

23、s rangeThese indexes include: height, weight, blood pressure,pulse, hb, et al.但是如果这个指标仅在过高或过低但是如果这个指标仅在过高或过低时异常,那我们就应找到正常人群时异常,那我们就应找到正常人群的上限或下限,即制定单侧范围。的上限或下限,即制定单侧范围。But if an index is abnormal only when it is too high (or too low), we then should make a one-side range with upper (lower )limit.One

24、 side range(one)Take blood lead (血铅)(血铅)for example, it is abnormal only when it is too high .The content of mercury(发汞发汞) in the hair is the same kind.One side range(another) Vital capacity(肺活量) is another kind of one-side range.It is abnormal only when it is too low, so we must find the lower limi

25、t of normal populationSixth step Choose an Appropriate Confidence (%) Level选择适当的百分数范围Determining the confidence level 原则:根据科学常规,选择合适的百分界限,最常用的范围为95。当然,我们也可以根据特定的研究目的做适当的调整。 Principal: According scientific regulations, choose an appropriate confidence level. 95% is used most frequently. It also can b

26、e adjusted according to your specific aim.Determining the confidence level 如果我们想降低漏诊率(the rate of missed diagnosis),也就是希望发现更多的病人,我们可以通过缩窄正常人群的范围,从具有较高的测量值的个体中找到潜在的病人,所以可以选择一个比较低的百分界值,90% 或 80%都可以95%, normal value5%,abnormal value(latent patient)90%, normal value10%,abnormal value(latent patient)Dete

27、rmining the confidence level 另一方面,如果我们希望降低误诊率(the rate of misdiagnosis),也就是希望诊断更精确,我们应该扩大参考值的范围。这样,具有更高的测量值的个体患相关疾病的概率就增加了,降低了误诊的概率。所以我们可以选择一个更高的百分界限,如99。95%, normal value5%,abnormal value(latent patient)99%, normal value1%,abnormal value(latent patient)Seventh stepDecide the Distribution Type 正态性检验

28、是决定这个资料是否满足正态分布的金标准。但是正态性检验必须通过统计软件在计算机上运算才可以实现。 我们可以通过经验公式大致判断资料的分布类型:正常人的各种生理、生化、解剖值数据分布比较均匀,而且算术平均数是标准差的3倍以上。算术平均数和中位数比较接近,中位数和算术平均数的比值在(0.95-1.05)之间。Last step Choose a Best Method to Compute It 计算方法:正态分布法、对数正态分布法和百分位数法。 选择何种方法依据我们的资料的类型,由第6步决定。 计算方法如下,以95参考值范围为例正态分布法sx96. 11.64xs1.64xs对数正态分布法1lglglg (1.96)xxxs1lglglg (1.64)xxxs1lglglg (1.64)xxxs百分位数法 应用条件 : 偏态分布资料 计算公式:95参考值范围: 双侧界值:P 2.5 P 97.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论