




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.,1,中南大学公共卫生学院 卫生统计学教研室 曾小敏 副教授 Tel: 84805466 Email: ,第二章 计量资料的统计描述,.,2,第二章 计量资料的统计描述,讲述内容: 第一节 频数分布 第二节 集中趋势的描述 第三节 离散趋势的描述 第四节 正态分布 第五节 医学参考值范围的制定,.,3,例 从某单位某年的职工体检资料中获得101名正常成年女子的血清总胆固醇( )的测量结果如下。,.,4,计量资料(定量资料、数值变量资料),总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值: X1, X2, X3, , Xn n为样本例数(样本大小、样本含量),.,5,统计描述
2、描述其分布规律 1、频数分布表、分布图 要求:大样本 如 n30 2、统计指标 描述 集中趋势 离散趋势,.,6,第一节 频数分布,频数分布:通常是针对样本而言。 连续变量频数分布为n个变量值在各变量值区间内的变量值个数的分配。 离散变量频数分布为n个变量值在各(或各几个)变量值处的变量值个数的分配。,.,7,例 从某单位某年的职工体检资料中获得101名正常成年女子的血清总胆固醇( )的测量结果如下,试编制频数分布表。,一、频数分布表(frequency table),.,8,制表步骤 了解分布,1. 求极差(range) 极差也称全距,即最大值和最小值之差,记作R。本例,.,9,2确定组距(
3、i) : 组段数通常取组 10-15组 本例组距,.,10,3写组段(区间): 组段下限(L):每个组段的起点 组段上限(U):每个组段的终点,.,11,4归组、统计频数,第1组段 2.30 第2组段 2.60 第3组段 2.90 第4组段 3.20 第5组段 3.50 第末组段 5.605.90,.,12,例年龄分组(常用的两种方式):,(开口型 闭口型),.,13,表 101名正常成年女子的血清总胆固醇(mmol/L)频数分布,.,14,表 某医院1123名产后出血孕妇的人流次数分布,(离散变量),.,15,二、频数分布图,横坐标指标 纵坐标频数,形象化,.,16,三、频数表和频数分布图用
4、途,(1)对称分布 :若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布 (2)偏态分布 :,1描述频数分布的类型*,.,17,右偏态分布(正偏态分布):右侧的组段中频数多于左侧的组段中频数,频数向右侧拖尾。,表 115名正常成年女子血清转氨酶(mmol/L)含量分布,.,18,左偏态分布(负偏态分布):,左侧的组段中频数多于右侧的组段中频数,频数向左侧拖尾。,表 101名正常人的血清肌红蛋白( )含量分布,.,19,2描述频数分布的特征,变异的范围在2.305.90 有明显的统计分布规律,数据主要集中在3.504.70 之间,尤以组段的人数3.
5、804.10 最多,且上下组段数的频数分布基本对称。,101名正常成年女子的血清总胆固醇(mmol/L)频数分布,.,20,3便于发现一些特大或特小的可疑值*,4便于进一步做统计分析和处理,.,21,第二节 集中趋势的描述,用平均数(average)来描述一组变量值的集中位置或平均水平: 不同的分布使用不同的平均数 (算术)均数 几何均数 中位数,.,22,一、均数(mean),意义:可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。,适用范围:对称分布,尤其是正态分布,符号:,.,23,1、计算方法,(1)直接法,举例:试计算4,4,4,6,6,8,8,8,10的均
6、数?,.,24,例 用直接法计算某单位101名正常成年女子的血清总胆固醇的均数。,.,25,(2)加权法(频数表法):,k:频数表的组段数, f :频数, X:组中值。,.,26,计算结果:,例 利用频数表资料计算101名正常成年女子的血总胆固醇的均数。,.,27,二、 几何均数(geometric mean),意义:可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。,适用范围:对数转换后呈对称分布,尤其是对数正态分布,符号: (样本),.,28,1、计算方法,(1)直接法 公式: 或,例:某公司五名职员的薪水分别是:10,100,1000,10000,100000。,.,29,
7、例 某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为,10,20,40,160,求几何均数。,.,30,(2)加权法,公式:,.,31,例 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。,故例类风湿关节炎患者血清EBV-VCA-lgG抗体的平均滴度为:1:150.6。,.,32,三、中位数与百分位数,.,33,(一)中位数(median),意义:是将n个变量值从小到大排列(排序),位置居于中间的那个变量值。,适用范围: 理论上:任何分布资料; 实际上:偏态分布资料,和一端或两端无确 切数值的资料,
8、分布不明的资料。,符号: (样本),.,34,1,3,7,55,86,100,中位数为多少?,1,3,7,55,100,中位数为多少?,.,35,计算公式:,n为奇数时 n为偶数时,.,36,例 7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。,本例n=7,为奇数 例 8名患者食物中毒的潜伏期分别为1,2,2,3,5, 8,15,24小时,求其中位数。 本例n=8,为偶数,.,37,例 试计算某医院1123名产后出血孕妇人工流产次数的中位数。,.,38,(二)百分位数(percentile),.,39,1直接计算法,设有X个原始数据从小到大排列,第X百分位数的计算公式为
9、: 当 带有小数位: 当 为 整数时:,求整数函数,.,40,例 对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。,患 者: 住院天数:,.,41,(2) 带有小数, 故取整后trunc(118.8)= 118,.,42,2频数表法,当 时,公式(2-9)即为中位数的计算公式,公式(2-9),.,43,例 某地118名链球菌咽喉炎患者的潜伏期频数表见下表第(1)、(2)栏,试分别求中位数及第25、第75百分位数。,关键: 确定所计算的百分位数所在的组段,.,44,.,45,.,46,小结: 集中趋势的描述平均数,平均数:描述一
10、组变量值的集中位置或平均水平的指标体系。 不同的分布使用不同的指标 (算术)均数:对称分布,尤其是正态分布 几何均数:对数转换后呈对称分布,尤其是 对数正态分布 中位数 :一般偏态分布,.,47,第三节 离散趋势的描述,用变异指标来描述一组变量值的变异程度或离散趋势: 不同的分布使用不同的变异指标 极差 四分位数间距 方差或标准差 变异系数,.,48,例 试计算下面三组同龄男孩的身高均数和极差。 甲组: 乙组: 丙组:,.,49,一、 极差 极差(R):即一组变量值最大值与最小值之差。,适用范围:任何计量资料,是参考变异指标,.,50,二、四分位数(quartile)间距,四分位数(quart
11、ile):把全部变量值按序分为四等份的百分位数。 四分位数间距,用QR表示: 下四分位数: 上四分位数:,适用范围:与中位数配套用,.,51,四分位数间距可以看成大小在中间的一半变量值的极差。,.,52,三、方差与标准差,1.方差(variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 总体方差、标准差用 、 表示; 样本方差、标准差用 、 表示.,适用范围:与均数配套用。,例 试计算下面三组同龄男孩的身高均数和极差。 甲组: 乙组: 丙组:,.,53,2. 总体标准差公式: 样本标准差公式:,.,54,标准差的公式还可以写成 : 利用频数表计
12、算标准差的公式为,.,55,例 (续例)计算三组资料的标准差。,甲组:,.,56,1.直接计算法 S,2.频数表法 S=,.,57,四、变异系数(coefficient of variation),变异系数记为 ,多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。其计算公式为,主要用于描述对称分布(特别是正态分布)资料的相对变异程度,.,58,某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.29kg,标准差为2.26kg,比较其变异度。,.,59,小结: 离散趋势的描述变异指标,变异指标:描述一组变量值的离
13、散趋势或变异程度的指标体系。 不同的分布使用不同的变异指标 极差:任何计量资料,是参考变异指标 四分位数间距:与中位数配套用 标准差 :与均数配套用 变异系数 :描述对称分布(特别是正态分布)资料的相对变异程度,比较用,.,60,正态分布,第四节,.,61,频数分布图是以变量值(X)为横坐标,各组段频数为纵坐标所绘制的直方图。若以各组段频率密度(频率/组距)为纵坐标绘制直方图(和前种直方图形状相同),使各直方面积相应于频率,其和为1(100%),设想当例2-1的原始数据个数逐渐增加且组段不断分细时,这种直方图的直方就不断变窄,其顶端则逐渐接近于一条光滑的曲线。,.,62,正态分布是最常见、最重
14、要的一种连续型分布,为对称分布,实际频数分布:中间频数多,两端频数 越来越少,且左右大致对称 理论频数分布:正态曲线(高斯曲线),.,63,一、正态分布的概念和特征,1正态分布曲线的数学函数表达式 ,,X,f(X),.,64,2正态分布的特征,( ),.,65,.,66,正态曲线下的面积分布有一定的规律,面积通过积分得来 :,.,67,图 正态曲线面积分布示意图,.,68,二、标准正态分布,x:x1,x2,4.00,5.00,xn u转换: u:u1,u2,u4.00,u5.00,un,.,69,.,70,据此公式已制成附表,欲求一定区间标准正态分布曲线下的面积查表即可。且 (u0),.,71
15、,x:x1,x2,4.00,5.00,xn u转换 u:u1,u2,u4.00,u5.00,un,.,72,.,73,正态分布的理论除了可估计频数分布外,还是许多统计方法的基础,并可应用于质量控制及制定医学参考值范围。,一、基本概念,第五节 医学参考值范围的制定,.,75,1、意义:医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。 由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。,.,76,2.单、双侧问题,常依据医学专业知识而定。,双侧 :血清总胆固醇无论过低或过高均属异常 白细胞数无论过低或过高均属异常 单侧 :1)血清转氨酶仅过高异常 2)肺活量仅过低异常,3. 医学参考值范围有90%、95%、99% 等,最常用的为95% 。,.,77,计算医学参考值范围的常用方法: 正态分布法 百分位数法,.,78,要求:,双侧:双侧参考值范围: 常用双侧95参考值范围: 单侧:单侧参考
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公路养护合同范本
- 人力资源外包合同范例
- 代理旗舰店合同范本
- 农户种植水稻合同范本
- 2024年中国移动招聘考试真题
- 个人债权抵押合同范本
- 2024年西安工业大学专任教师招聘考试真题
- 企业签订劳务合同范本
- 供热站拆除合同范本
- 兼职技术总工合同范本
- 小学三年级下册综合实践活动.水果拼盘-(14张)ppt
- 部编版二年级语文下册第三单元课文《传统节日》PPT课件
- 北京市城市建设节约用地标准
- 开学第一课我们开学啦主题班会PPT课件(带内容)
- 电源线检验报告RVV
- 体育训练队队规
- 八字命理漫画版
- 电梯工程开工报告(直梯)(共1页)
- 五年级第二学期体育知识结构图
- 复件德力西质量奖自评报告2战略
- 自主改善的活动方案
评论
0/150
提交评论