医学统计学:02 正态分布_第1页
医学统计学:02 正态分布_第2页
医学统计学:02 正态分布_第3页
医学统计学:02 正态分布_第4页
医学统计学:02 正态分布_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Medicalstatistics医学统计学正态分布NormalDistributionandit’sApplications2023/9/21柏建岭讲稿2正态分布的重要性医学上某些指标服从或近似服从正态分布;很多统计方法是建立在正态分布基础上的;很多其他分布的极限为正态分布。2023/9/21柏建岭讲稿3主要内容(Content)

正态分布的概念及图形正态分布的特征正态分布曲线下面积的规律标准正态分布正态分布的应用总结2023/9/21柏建岭讲稿4频数分布图2023/9/21柏建岭讲稿5正态分布的概念及图形(a)(b)(d)(c)2023/9/21柏建岭讲稿6正态分布的概念及图形NormaldistributionGauss发现最早用于物理学、天文学Gaussiandistribution2023/9/21柏建岭讲稿72023/9/21柏建岭讲稿8正态分布的概率密度函数如果随机变量X的概率密度函数

为总体均数,

为总体标准差

p为圆周率,e为自然对数的底X为变量,代表横轴的数值,f(X)为纵轴数值。则称X服从正态分布,记作X~N(,2),其中,

为分布的均数,

为分布的标准差。

(-

<X

<+

)

2023/9/21柏建岭讲稿9正态分布图示x0.1.2.3.4f(x)2023/9/21柏建岭讲稿10方差相等、均数不等的正态分布图示

3

1

22023/9/21柏建岭讲稿11均数相等、方差不等的正态分布图示

2

1

32023/9/21柏建岭讲稿12正态分布的特征单峰分布;高峰在均数处;以均数为中心,均数两侧完全对称。正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。正态曲线下的面积分布有一定的规律。2023/9/21柏建岭讲稿13正态曲线下的面积规律X轴与正态曲线所夹面积恒等于1。对称区域面积相等。S(-,

-X)S(

+X,

)=S(-,

-X)

2023/9/21柏建岭讲稿14正态曲线下的面积规律对称区域面积相等。

-x1

-x2

+x2

+

x1S(

-x1,

-x2)=S(

+x1,

+x2)

2023/9/21柏建岭讲稿15正态曲线下的面积规律

-4-3-2-101234

-3-2-++2+3

S(-,

-3

)=0.0013S(-,

-2

)=0.0228S(-,

-1

)=0.1587S(-,

)=0.5S(-,

+3

)=0.9987S(-,

+2

)=0.9772S(-,

+1

)=0.8413S(-,)=12023/9/21柏建岭讲稿16正态曲线下的面积规律

-4-3-2-101234

-3-2-++2+3

1-S(

-3

,+3)=0.00261-S(

-2

,+2)=0.04561-S(

-

,+)=0.31742023/9/21柏建岭讲稿17正态曲线下的面积规律

-4-3-2-101234-3-2-++2+3

S(-,

-3

)=0.0013S(-,

-2

)=0.0228S(-,

-1

)=0.1587S(-,

)=0.5S(-,

+3

)=0.9987S(-,

+2

)=0.9772S(-,

+1

)=0.8413S(-,)=12023/9/21柏建岭讲稿18

2

3

1X2=

-2X2X1=

-1X1X3=

-3X30.15870.15870.15872023/9/21柏建岭讲稿19正态曲线下的面积规律正态分布的一个显著特点

其曲线下面积完全决定于以标准差为单位从点X到µ的离差。2023/9/21柏建岭讲稿20正态曲线下的面积规律

-1.96

+1.96

2.5%2.5%95%2023/9/21柏建岭讲稿21正态曲线下的面积规律

-1.64

+1.64

5%5%90%2023/9/21柏建岭讲稿22

正态曲线下的面积规律

-2.58

+2.58

0.5%0.5%99%2023/9/21柏建岭讲稿23正态曲线下的面积规律正态曲线下面积总和为1;正态曲线关于均数对称;对称的区域内面积相等;对任意正态曲线,按标准差为单位,对应的面积相等;

-1.64~+1.64

内面积为90%;

-1.96~+1.96

内面积为95%;

-2.58~+2.58

内面积为99%。2023/9/21柏建岭讲稿24标准正态分布标准正态分布(standardnormaldistribution)是均数为0,标准差为1的正态分布。记为N(0,1)。标准正态分布是一条曲线。概率密度函数:

(-∞<u

<+∞)

2023/9/21柏建岭讲稿25正态分布转换为标准正态分布若

X~N(

,

2),作变换:则u服从标准正态分布。u称为标准正态离差(standardnormaldeviation)2023/9/21柏建岭讲稿26013-1-2-32μ+σμ-2σμμ-σμ+2σμ+σμ-2σμμ-σμ+2σ图一般正态分布变成标准正态分布示意X~N(

,

2)u~N(0,1)2023/9/21柏建岭讲稿270-u-u0.000.020.040.060.08-3.00.00130.00130.00120.00110.0010-2.50.00620.00590.00550.00520.0049-2.00.02280.02170.02070.01970.0188-1.90.02870.02740.02620.02500.0239-1.60.05480.05260.05050.04850.0465-1.00.15870.15390.14920.14460.1401-0.50.30850.30150.29460.28770.281000.50000.49200.48400.47610.4681标准正态分布曲线下面积

(u)2023/9/21柏建岭讲稿28正态分布的应用估计频数分布确定临床参考值范围2023/9/21柏建岭讲稿29估计频数分布出生体重低于2500g为低体重儿,某市婴儿出生体重均数3200g,标准差为s=350g。设该资料服从正态分布,试求该地低体重儿占该地所有出生婴儿的比例。

2023/9/21柏建岭讲稿30首先计算标准离差:查标准正态分布表:

(-2)=0.0228结果:估计低体重儿的比例为2.28%.2023/9/21柏建岭讲稿31思考题标准正态分布曲线下-2~2范围内的面积?标准正态分布曲线下-2~1范围内的面积?2023/9/21柏建岭讲稿32P(-2<u<2)=1-2×P(u≤-2)=1-2×0.0228=0.9544P(-2<u<1)=1-P(u≤-2)-P(u≥1)=1-P(u≤-2)-P(u≤-1)=1-0.0228-0.1587=0.81852023/9/21柏建岭讲稿33参考值范围(referenceinterval)参考值范围又称正常值范围(normalrange)。什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。绝大多数:90%,95%,99%等等。确定参考值范围的意义:用于判断正常与异常。“正常人”的定义:排除了影响所研究的指标的疾病和有关因素的同质的人群。2023/9/21柏建岭讲稿34参考值范围确定的原则选定足够例数的同质的正常人作为研究对象控制检测误差判断是否分组(性别,年龄组)单、双侧问题(onesidedortwosided)选择百分界值(90%,95%)确定可疑范围2023/9/21柏建岭讲稿35选定同质的正常人作为研究对象

同质正常“足够数量”例数过少,代表性差;例数过多增加成本,且易导致正常标准把握不严,影响数据的可靠性。一般认为每组100例以上;有人认为确定临床生化指标的正常值应取300~500例。2023/9/21柏建岭讲稿36控制检测误差

通过人员培训、控制检测条件、重复测定等措施,严格控制检测误差。2023/9/21柏建岭讲稿37判断是否分组

组间差别是否有统计学意义并有临床意义?各组的分布范围、高峰位置等是否基本一致?2023/9/21柏建岭讲稿38单侧与双侧参考值范围根据医学专业知识确定!双侧:白细胞计数,血清总胆固醇,单侧:上限:转氨酶,尿铅,发汞……

下限:肺活量,IQ,

单侧下限---过低异常单侧上限---过高异常双侧---过高、过低均异常

单侧下限异常正常单侧上限异常正常异常正常双侧下限双侧上限异常2023/9/21柏建岭讲稿39选择百分界值

参考值范围的涵义:绝大多数的正常人在该范围内

习惯上将“绝大多数”定义为80%、90%、95%或99%。应根据研究目的、研究指标的性质、数据分布特征等情况综合考虑百分界值的选择。2023/9/21柏建岭讲稿40确定可疑范围

若病人与正常人的数据重叠较多的情况下,为避免较大的假阳性和假阴性错误率,可设定可疑范围。2023/9/21柏建岭讲稿41正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图(单侧)

2023/9/21柏建岭讲稿42正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图(单侧)2023/9/21柏建岭讲稿43正常人病人假阳性率假阴性率病人正常人与病人的数据分布重叠示意图(双侧)2023/9/21柏建岭讲稿44参考值范围的估计方法:正态分布法

2.5%2.5%95%

-1.96

+1.96

2023/9/21柏建岭讲稿45参考值范围的估计方法:百分位数法P2.5P97.52023/9/21柏建岭讲稿46百分比(%)单侧双侧800.84241.2816901.28161.6449951.64491.9600992.32632.5758标准正态分布的u界值表参考值范围的估计方法2023/9/21柏建岭讲稿47参考值范围的估计方法方法双侧单侧下限单侧上限正态分布法百分位数法P2.5~P97.5>P5<P952023/9/21柏建岭讲稿48例:参考值范围的计算某地调查了200名成年女子的平均血清总蛋白为73.5(g/L),标准差3.9(g/L),试估计该地成年女子血清总蛋白95%的参考值范围

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论