正态分布及其应用2_第1页
正态分布及其应用2_第2页
正态分布及其应用2_第3页
正态分布及其应用2_第4页
正态分布及其应用2_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、正态分布及其应用重点掌握:正态分布的概念与特征标准正态分布的概念和标准化变换正态分布的应用估计频数分布确定医学参考值范围1正态分布的概念和特征一、正态分布(Normal Distribution)的概念频数分布图,当观察人数足够多,组段不断分细,图中直条将逐渐变窄,其顶端将逐渐接近于一条光滑的曲线。这条曲线称为频数曲线或频率曲线,略呈钟型,两头低,中间高、左右对称,近似数学上的正态分布。由于频率的总和等于100%或1,故横轴上曲线下的面积等于100%或1。正态分布又称高斯分布,是一种很重要的连续型随机变量分布,应用甚广。f(X)概率密度曲线示意图频数分布示意图2正态分布的图形有了正态分布的密度

2、函数f(X),即正态分布的方程,就可给出图形 -x+为均数为标准差为圆周率,3.14159为自然对数的底,2.71828以上均为常量,仅X为变量,当X确定后,就可由此式求得其密度函数f(X),也就是相应的纵坐标高度。已知和,就能绘出正态曲线的图形。 f(x) F(X) (u) (u)0uA 正态分布B 标准正态分布3正态分布的特征正态分布是单峰分布,以均数为中心,左右对称。正态曲线在横轴上方均数处最高。正态分布有两个参数,即均数和标准差。是位置参数:当恒定后,越大,则曲线沿横轴向右移动;反之,越小,则曲线沿横轴向左移动。 是变异度参数:当恒定时,越大,表示数据越分散,曲线越“胖”;越小,表示数

3、据越集中,曲线越“瘦”。N(,2)表示均数为,方差为2的正态分布。正态曲线下面积的分布有一定规律。 4标准正态分布为了应用方便,常作如下变换将图A的原点移到的位置,横轴尺度以为单位,使=0,=1,则将正态分布变为标准正态分布(standard normal distribution)u或z称为标准正态变量或标准正态离差(standard normal deviate)。标准正态分布的密度函数 -x+分布函数为 -x0)u在区间(u1,u2)内概率的计算公式为: P(u1uu2)= (u2)- (u1)6概率-曲线下的面积f(X)cd7Z.00.01-0.3.3821.3783.3745.420

4、7.4168-0.1.4602.4562.45220.0.5000.4960.4920.4168.02-0.2.4129Z = -0.21举 例8举 例正态分布标准正态分布9当和未知时,要用样本均数x和样本标准差S来估计u值。u=(x-x)/S例1: 若x(,2),试计算x取值在区间1.96上的概率。u1=(x1- )/=(-1.96 )- / =-1.96u2=(x2- )/=(+1.96 )- / =1.96P(-1.96u1.96)= (1.96)- (-1.96) =1-2 (-1.96)=1-2x0.025=0.95即x 取值在区间1.96上的概率为95%。同理, P(-2.58u0

5、.50),并编制对数值频数表,再利用正态分布法求95%参考值范围。按左侧表,设x为对数组段的组中值,n=100,fx=118.2684, fx2=145.7359,则对数的均数和标准差为:x= (fx)/n=1.1827, S=0.2433因为血铅含量仅过高为异常,参考值范围应为单侧95%上限值:lg-1(x+1.645S)=38.28 (ug/dl)即该地正常成人血铅含量95%参考值范围小于38.28ug/dl。17摄取比值人数0.7510.8020.85130.90150.95261.00261.05181.10151.1531.201.251例4. 某年某地测得120名2050岁正常成人

6、血浆结合125碘-三碘甲腺原氨酸树脂摄取比值的资料如下,试估计95%参考值范围。正态性检验,P0.10 x=1.0054,S=0.0873因125I-T3过高或过低均异常,取双侧95%参考值范围xu0.05/2S=1.0054 1.960.0873=(0.8343,1.1765)即该地2050岁正常成人血浆125碘-三碘甲腺原氨酸树脂摄取比值的95%参考值范围为0.83431.1765。18百分位数法不满足正态分布时,可用百分位数法估计参考值范围例5. 某年某地996名女学生月经初潮年龄分布,确定95%参考值范围。呈正偏态分布。计算双侧95%界值P2.5和P97.5P2.5=11+1/44(9

7、96 2.5%-7)=11.41(岁)P97.5=17+1/16(996 97.5%-969)=17.13(岁)该地女学生月经初潮年龄95%参考值范围为11.4117.13。年龄(岁)人数累计人数累计频率(%)10770.71144515.11215320420.51324444845.01426971772.01519190891.2166196997.3171698598.918899399.719199499.8202996100.0合计99619正态分布的应用质量控制:为了控制实验中的检测误差,常以x2S作为上、下警戒值,以x3S作为上、下控制值。正态分布是很多统计方法的理论基础2分布

8、、t分布、F分布等,都是在正态分布的基础上推导出来的。某些分布,如t分布、二项分布、Poisson分布等的极限均为正态分布,在一定条件下,均可按正态近似的原理来处理。常用的u检验,就是以正态分布为理论基础。20小 结正态分布是一种很重要的连续性分布,不少医学现象服从正态分布或近似正态分布,或经变量变换转换为正态分布,可按正态分布规律来处理,它也是许多统计方法的理论基础。正态分布的特征是:1)曲线在横轴上方,均数处最高;2)以均数为中心,左右对称;3)确定正态分布的两个参数是均数和标准差。正态分布用N(,2)表示,为了应用方便,常对变量X作u=(X-)/变换,使=0,=1,则正态分布转换为标准正

9、态分布,用N(0,1)表示。正态曲线下面积的分布有一定规律。理论上1 ,1.96和2.58区间的面积(观察单位数)各占总面积(总观察单位)的68.27%,95%和99%,可用于估计医学参考值范围和质量控制等方面。医学参考值范围的估计方法:正态分布法: 适用于正态或近似正态分布资料双侧95%的界限值为: 对数正态分布法: 适用于对数正态或近似正态分布资料,双侧95%的界限值为: 百分位数法 适用于偏态分布或资料的分布不明, 则求百分位数。双侧95%的界限值为:P2.5 和 P97.521实习一22习题1:某地101例3049岁健康男子血清总胆固醇值(mmol/L)。请根据上表:(1)计算均数、标准差、变异系数(2)计算中位数M,并与均数比较(3)计算P2.5及P97.5,并与x1.96S的范围比较(4)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L),若按95%正常值范围估计,其血清总胆固醇值是否正常?23习题224某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝肾疾病,无汞作业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论