




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1正态分布及其应用正态分布及其应用Normal Distribution and its ApplicationsMedical statistics医学统计学公共卫生学院公共卫生学院 赵华硕赵华硕Department of Public Health 2主要内容主要内容(Content)v随机变量的概率分布随机变量的概率分布v正态分布的概念及图形正态分布的概念及图形v正态分布的特征正态分布的特征v正态分布曲线下面积的规律正态分布曲线下面积的规律v标准正态分布标准正态分布v正态分布的应用正态分布的应用v总结总结3随机变量v变量和随机变量v变量取值的相对频率说明了具有某个性质的观察对象的出现的可
2、能性。v随机变量离散型:性别、血型、子女数、事故数连续型:身高、体重4例:密度函数和分布函数v抛两枚硬币,0.250.25AB0.25AB0.250.750.5PPPPPP两 枚 均 正 面 朝 上两 枚 均 反 面 朝 上正 面反 面 朝 上反 面正 面 朝 上至 少 有 一 枚 正 面 朝 上恰 好 有 一 枚 正 面 朝 上密度函数分布函数5例:密度函数和分布函数x6随机变量的概率分布v概率函数(Probability Function),或者说概率密度函数(Probability Density Function) 、密度函数。v在统计学中,我们说变量具有分布函数(Distributi
3、on Function)。用此函数的大小来说明变量取某些值的可能性。v当变量的取值包括了所有可能的取值时,分布函数为1。v当变量具备了以上两个函数之后,称它具有某种分布(Distribution)7正态分布的概念及图形(a)(b)(d)(c)8正态分布的概念及图形vNormal distributionvGauss发现v最早用于物理学、天文学vGaussian distribution9正态分布的概率密度函数v如果随机变量X的概率密度函数 则称X服从正态分布,记作XN(,2),其中, 为分布的均数, 为分布的标准差。Xf Xe22()21()2 (- X +) 10正态分布图示x0.1.2.3
4、.4f(x)11方差相等、均数不等的正态分布图示213312Xf Xe22()21()2 12均数相等、方差不等的正态分布图示213312Xf Xe22()21()2 13正态分布的特征v单峰分布;高峰在均数处;v以均数为中心,均数两侧完全对称。v正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。v有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。v正态曲线下的面积分布有一定的规律。 14正态曲线下的面积规律正态曲线下的面积规律vX轴与正态曲线所夹面积恒等于轴与正态曲线所夹面积恒等于1 。v对称区域面积相等。对称区域面积相等。S(-, -X)S( +
5、X,)S(-, -X)15正态曲线下的面积规律v对称区域面积相等。S( -x1, -x2)-x1 -x2 +x2 + x1S( -x1, -x2)= S( +x1, +x2)16正态曲线下的面积规律 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 S(- , -3 )=0.0013S(- , -2 )=0.0228S(- , -1 )=0.1587S(- , )=0.5S(- , +3 )=0.9987S(- , +2 )=0.9772S(- , +1 )=0.8413S(- , )=117正态曲线下的面积规律 -4 -3 -2 -1 0 1 2 3 4 -3 -2
6、 - + +2 +3 1-S( -3 , +3 )=0.00261-S( -2 , +2 )=0.04561-S( - , + )=0.317418正态曲线下的面积规律 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 S(- , -3 )=0.0013S(- , -2 )=0.0228S(- , -1 )=0.1587S(- , )=0.5S(- , +3 )=0.9987S(- , +2 )=0.9772S(- , +1 )=0.8413S(- , )=119正态曲线下的面积规律v正态分布的一个显著特点 其曲线下面积完全决定于以标准差为单位从点x到的离差。2023
7、1X2=-2X2X1=-1X1X3=-3X30.15870.15870.158721正态曲线下的面积规律-1.96+1.962.5%2.5%95%22正态曲线下的面积规律-1.64+1.645%5%90%23正态曲线下的面积规律-2.58+2.580.5%0.5%99%24正态曲线下的面积规律正态曲线下的面积规律v正态曲线下面积总和为正态曲线下面积总和为1;v正态曲线关于均数对称;对称的区域内面积相等;正态曲线关于均数对称;对称的区域内面积相等;v对任意正态曲线,按标准差为单位,对应的面积相等对任意正态曲线,按标准差为单位,对应的面积相等v -1.64 +1.64 内面积为内面积为90%;v
8、-1.96 +1.96 内面积为内面积为95%;v -2.58 +2.58 内面积为内面积为99%。next25S(-,2-1.101.5)?S(-,2-1.11.5)2S(-,-1.10)05 . 11 . 1 1 . 1问问 题题 的的 提提 出?出?26标准正态分布v标准正态分布(standard normal distribution)是均数为0,标准差为1的正态分布。v记为N(0,1)。v标准正态分布是一条曲线。v概率密度函数:uXe221()2 (- u +) 27正态分布转换为标准正态分布v若 XN(,2),作变换: 则u服从标准正态分布。vu称为标准正态离差(standard
9、normal deviation)Xu28标准正态分布曲线下面积(u) u 0.00 0.02 0.04 0.06 0.08-3.00.0013 0.0013 0.0012 0.0011 0.0010-2.50.0062 0.0059 0.0055 0.0052 0.0049-2.00.0228 0.0217 0.0207 0.0197 0.0188-1.90.0287 0.0274 0.0262 0.0250 0.0239-1.60.0548 0.0526 0.0505 0.0485 0.0465-1.00.1587 0.1539 0.1492 0.1446 0.1401-0.50.3085
10、 0.3015 0.2946 0.2877 0.2810 00.5000 0.4920 0.4840 0.4761 0.46810uback29正态分布的判定 许多统计方法都要求数据服从正态分布或近似正态分布,在进行指标选择和应用这些统计方法之前对数据进行正态分布的判定就显得很有必要 v判定方法图示法,正态性假设检验 30(一)图示法 1. 直方图 在样本比较大时,可根据直方图和对应正态概率密度曲线的形状大致判断资料是否服从正态分布,如图3-1。 图图3-1 1403-1 140例疑诊冠心病患者平例疑诊冠心病患者平板运动后心率(次板运动后心率(次/ /分)的直方图分)的直方图312. P-P图
11、和Q-Q图 vP-P图是指频率-频率图(proportion-proportion plot,P-P图),是以实际观测值的累计频率为横轴,以正态分布的理论或期望累计概率为纵轴绘制散点图;v Q-Q图是指分位数-分位数图(quantile-quantile plot,Q-Q 图),是以实际观测值的分位数(PX)为横轴,以正态分布的理论或期望分位数为纵轴绘制散点图,采用样本均数和标准差估计正态分布的总体均数和标准差 32图3-6 140例疑诊冠心病患者平板运动后心率的P-P图和Q-Q图 33图3-7 704名60岁以上居民体内稀有元素硒含量的P-P图和Q-Q图34(二)检验法 可以根据偏度系数(c
12、oefficient of skewness)和峰度系数(coefficient of kurtosis)对资料的对称性和正态峰进行检验,理论上,总体偏度系数为0为对称,大于0为正偏态,小于0为负偏态;总体峰度系数等于0为正态峰,大于0为尖峭峰,小于0为平阔峰, 35图3-8 偏度的形状 图3-9 峰度的形状36正态分布的应用正态分布的应用v估计频数分布估计频数分布v确定临床参考值范围确定临床参考值范围37总结v正态分布是描述个体变异的重要分布之一,也是统计学理论中的重要分布之一;v正态分布是由两个参数决定:均数和标准差;v正态分布曲线下的面积是有规律的,且与标准正态分布曲线下的面积对应(以标
13、准正态离差为单位)。38估计频数分布v某市婴儿出生体重均数某市婴儿出生体重均数3200g,标准差为,标准差为s=350g。设该资料服从正态分布,试求该地。设该资料服从正态分布,试求该地低体重儿占该地所有出生婴儿的比例。低体重儿占该地所有出生婴儿的比例。(低体重儿标准:出生体重低于低体重儿标准:出生体重低于2500g2500g为低体重儿为低体重儿) 39首先计算标准离差:查标准正态分布表: (-2)=0.0228结果:估计低体重儿的比例为2.28%.250032002350u 40参考值范围(reference interval)v参考值范围又称正常值范围参考值范围又称正常值范围(normal
14、range)。v什么是参考值范围:什么是参考值范围:是绝大多数正常人的某观察指标所在的范围。是绝大多数正常人的某观察指标所在的范围。vMost of the observations! 90%,95%,99%等等vNormal People!41v“正常人正常人”的定义:的定义:排除了影响所研究的指标的疾病和有关因素的同排除了影响所研究的指标的疾病和有关因素的同质的人群。质的人群。v确定参考范围的意义:确定参考范围的意义:用于判断正常与异常。用于判断正常与异常。42参考值范围确定的原则参考值范围确定的原则v选定足够例数的同质的正常人作为研究对象选定足够例数的同质的正常人作为研究对象 v控制检测
15、误差控制检测误差v判断是否分组判断是否分组(性别性别,年龄组年龄组) v单、双侧问题单、双侧问题 (one sided or two sided)v选择百分界值选择百分界值(90%,95%) v确定可疑范围确定可疑范围43参考值范围的估计方法:正态分布法2.5%2.5%95%-1.96+1.9644参考值范围的估计方法:百分位数法P2.5P97.545参考值范围的估计方法 方法 双侧 单侧下限单侧上限正态分布法百分位数法 P2.5P97.5 P5 P95Xus/2 Xu s Xu s 46例:参考值范围的计算v某地调查了200名成年女子的平均血清总蛋白为73.5(g/L),标准差3.9 (g/L),试估计该地成年女子血清总蛋白95的参考值范围。由得95参考值范围:下限: 1.96s=73.51.963.9=65.9(g/L)上限: 1.96s=73.51.963.9=81.1(g/L)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年七夕情人节酒吧派对策划方案总结
- 白酒销售工作方案2025年
- 2025年个人月工作方案演讲稿
- 汽车使用与维护 课件 项目二 燃油供给系统的维护
- 汽车使用与维护 课件 项目三 转向系统的使用与维护3-3 转向器总成的检查与维护
- 2025年生发雾液项目可行性研究报告
- 2025年玉佛项目可行性研究报告
- 2025春新版六年级下册科学期中易错判断题
- 闽南理工学院《合唱与合唱指挥常识》2023-2024学年第二学期期末试卷
- 唐山幼儿师范高等专科学校《云计算》2023-2024学年第二学期期末试卷
- 2025年新高考历史预测模拟试卷3(含答案)
- 【新课标】Unit 1 C Story time第7课时单元整体课件
- 附件6工贸高风险企业高危领域较大以上安全风险管控清单
- 演出经纪人考试模拟试题及答案
- 2025年公务员考试《公共基础知识》全真模拟试题1000题及答案
- 浙江省宁波三锋教研联盟2022-2023学年高二下学期数学期中联考试卷(含答案)
- 第19课《十里长街送总理》 统编版语文(五四学制)六年级上册
- 电子政务平台的维护与技术支持策略
- 【MOOC】航空航天材料概论-南京航空航天大学 中国大学慕课MOOC答案
- 清洁工具使用及动作规范
- VTE防治基础知识
评论
0/150
提交评论