医学统计学第二章正态分布及其应用参考PPT_第1页
医学统计学第二章正态分布及其应用参考PPT_第2页
医学统计学第二章正态分布及其应用参考PPT_第3页
医学统计学第二章正态分布及其应用参考PPT_第4页
医学统计学第二章正态分布及其应用参考PPT_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,正态分布 (normal distribution,又称Gauss分布( Gaussian distribution )是一个重要的连续型概率分布,2,正态分布的重要性,医学研究中的某些观察指标服从或近似服从正态分布; 很多统计方法是建立在正态分布的基础之上的; 很多其他分布的极限为正态分布。因此,正态分布是统计分析方法的重要基础,3,记作: X N(,2) 例如: X N(120,8.22) X N(5,32,正态分布的数学形式,back,4,X N(0,1) 标准正态分布的均数为0,标准差为1,5,正态分布曲线的三个特点,集中性 对称性 均匀变动性,6,集中性 中等大小的数据居多,较大

2、的和较小的数据少些,即例数集中在中等大小的数据附近,7,对称性 以均数为中心,大于它和小于它的数据的例数是对称的,8,均匀变动性 例数由少增多或由多减少的过程是逐渐变化的,即均匀分布的。在分析数据时,均匀性是一个很重要的特点,如果,随着变量值的变异,例数突然地增多或突然地减少,或长距离地间断,都表示资料的同质性可能较差,应进一步查明原因,9,正态分布的特征 正态分布是单峰分布:X= (峰) 正态分布以均数为中心,左右完全对称 。 正态分布有两个参数(parameter)。 某些指标经变换后服从正态分布 正态曲线下的面积分布有一定的规律,10,正态曲线下的面积分布示意,11,标准正态分布曲线下的

3、面积的计算,求u值,用u值查表,得到所求区间面积占总面积的比例。 曲线下对称于0的区间,面积相等。 曲线下总面积为100或1,12,例2.11 在例2.1中已求得某市120名岁男童身高均数为142.67cm,标准差为6.00cm。设该资料服从正态分布,试求,该地12岁男童身高在132cm以下者占该地12岁男童总数的比例。 分别求均数1s、均数1.96s和均数2.58s范围内12岁男童占该组儿童总数的实际百分数,并与理论百分数比较,13,查 u 值表,3.75,120 名 12 岁男孩身高分布 身高范围 实际分布( cm ) (cm) 人数 百分数 (%) 136.67148.67 86 71.

4、67 68.27 130.91154.43 114 95.00 95.00 127.19158.15 118 98.33 99.00,理论分布 (,14,参考值范围(reference interval,又称正常值范围(normal range) 正常人的形态、功能、生化等各种指标的波动 范围。简称正常值。 为什么波动? “个体变异” 同一指标的数据因人而异 同一个体的数据随环境、时间等改变而变,15,为什么要确定一个范围? 既然同属正常人,就不能以甲的数据为标准,认为乙异常,亦不能以甲此时的数据为标准,认为彼时的异常。所以必须确定一个波动范围。如WBC:400010000个/mm3 “正常”

5、是一个相对的概念 “正常人”是指排除了影响所研究指标的疾病和有关因素的人,16,意义,横向分析 划界、分类临床医生判断正常与异常的参考依据 动态分析 如某个地区不同时期发汞的正常值可反映环境污染 的动态变化或环保效果,17,参考值范围确定的原则,选定同质的正常人作为研究对象 控制检测误差 判断是否分组 单、双侧问题 选择百分界值,18,选定同质的正常人作为研究对象,同质 正常 “足够数量” 例数过少,代表性差;例数过多增加成本,且易导致正常标准把握不严,影响数据的可靠性。 一般认为每组100例以上 ;有人认为确定临床生化指标的正常值应取300500例,19,控制检测误差,通过人员培训、控制检测

6、条件、重复测定等措施,严格控制检测误差,20,判断是否分组,组间差别是否有统计学意义并有临床意义? 例:红细胞、白细胞 各组的分布范围、高峰位置等是否基本一致? 例:表2.11发汞资料,21,单、双侧问题,过大或过小均属异常 :双侧界值 例:白细胞计数 仅过大或过小为异常:单侧界值 例:肺活量仅过低异常 下限 尿铅仅过高为异常 上限,22,选择百分界值,参考值范围的涵义:绝大多数的正常人在该范围内 习惯上将“绝大多数”定义为正常人的80%、90%、95%或99% 。 应根据研究目的、研究指标的性质、数据分布特征等情况综合考虑百分界值的选择,23,确定可疑范围,若病人与正常人的数据重叠较多的情况下,为避免较大的假阳性和假阴性错误率,可设定可疑范围,24,图2.9 正常人与病人的数据分布重叠示意图,25,参考值范围的估计方法,正态分布法 百分位数法 对数正态分布法,26,正态分布法,适于正态或近似正态分布的资料 公式,双侧,单侧,高侧,低侧,27,例:某地调查了 360 名成年男子的平均血红蛋白 如何估计该地成年男子血红蛋白 95 的参考值范围? 95 的参考值范围,该地成年男子血红蛋白 95 的参考值范围: 12.06 14.84 ( g/100ml,28,百分比 双侧 单侧 95% P2.5 P97.5 90% P5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论