版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章计量资料的统计描述第一节频数分布第二节集中趋势的描述第三节离散趋势的描述第四节正态分布第五节医学参考值范围的制定第二讲计量资料的统计描述第一节频数分布
一、频数分布表(frequencytable)
以表格的形式同时列出观察指标可能取值及其出现的频数。
第二讲计量资料的统计描述例2-1测得130名健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876第二讲计量资料的统计描述(1)求极差(range):即最大值与最小值之差,又称为全距。R=84–57=27(次/分)(2)决定分组组数、组距:根据研究目的和样本含量n确定分组组数,通常分为10~15个组。组距=极差/组数,为方便计,组距为极差的十分之一,再略加调整。27/10=2.7≈3
(3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。56~59~……80~83~85(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。频数表的编制步骤第二讲计量资料的统计描述表2-1130名健康成年男子脉搏(次/分)的频数分布表N=∑f第二讲计量资料的统计描述
二、频数分布图第二讲计量资料的统计描述三、频数表和频数分布图用途1.描述频数分布的类型(对称分布、偏态分布)
(1)对称分布:就是集中位置在中间,左右两侧频数大体对称。第二讲计量资料的统计描述是否为对称分布?第二讲计量资料的统计描述(2)偏态分布:
1)正偏态分布(右偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。
第二讲计量资料的统计描述表2-2115名正常成年女子血清转氨酶(mmol/L)含量分布
第二讲计量资料的统计描述2)负偏态分布(左偏态分布):
左侧的组段数多于右侧的组段数,频数向左侧拖尾。第二讲计量资料的统计描述表2-3101名正常人的血清肌红蛋白含量分布第二讲计量资料的统计描述2.描述频数分布的特征表2-1数据的频数分布特征:①数据变异(离散)的范围在57~84(次/分)②数据集中(平均)的组段在68~73(次/分)之间,尤以组段的人数71~(次/分)最多。且上下组段的频数分布基本对称。第二讲计量资料的统计描述3.便于发现一些特大或特小的可疑值
4.便于进一步做统计分析和处理第二讲计量资料的统计描述第二节集中趋势的描述
统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有:
算术均数(均数)(mean)几何均数(geometricmean)中位数(median)与百分位数(percentile)
第二讲计量资料的统计描述一、算术均数算术均数:简称均数(mean)
可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。总体均数用μ
表示,样本均数用表示。第二讲计量资料的统计描述1、计算方法(1)直接计算法
公式:举例:试计算4,4,4,6,6,8,8,8,10的均数?第二讲计量资料的统计描述例2-1测得130健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。75767269667257687172697273828082676973647458706460776677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876第二讲计量资料的统计描述(2)加权法(利用频数表):公式:k:频数表的组段数,f:频数,X:组中值。第二讲计量资料的统计描述表2-2130名健康成年男子脉搏(次/分)的频数分布表N=∑f∑fX∑fX2第二讲计量资料的统计描述2、应用
均数适用于对称分布,特别是正态分布资料。第二讲计量资料的统计描述二、几何均数(geometricmean)
可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。第二讲计量资料的统计描述几何均数(geometricmean)几何均数:变量对数值的算术均数的反对数。
其他对数(如自然对数)变换获得相同的几何均数第二讲计量资料的统计描述例2-2有8份血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。平均抗体效价为:1:57第二讲计量资料的统计描述(2)加权法公式:第二讲计量资料的统计描述
例2-369例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。第二讲计量资料的统计描述2、应用:
适用于成等比数列的资料,特别是服从对数正态分布资料。第二讲计量资料的统计描述三、
中位数与百分位数11个大鼠存活天数:4,10,7,50,3,15,2,9,13,>60,>60平均存活天数?(一)中位数(median)是将每个变量值从小到大排列,位置居于中间的那个变量值。
第二讲计量资料的统计描述计算公式:
n为奇数时
n为偶数时
第二讲计量资料的统计描述例2-49名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,16,16,17,19天,求其中位数。第二讲计量资料的统计描述频数表资料的中位数L为中位数所在组段的下限;i为频数表中的组距;fm为中位数所在组段的频数;fL为中位数所在组段以前的累积频数。第二讲计量资料的统计描述例2-1频数表中位数的计算N=∑f中位数=71+3x[(130x50%-59)/26]=71.69第二讲计量资料的统计描述应用①明显偏态分布;②总体分布型不明的资料;
③开放型数据。第二讲计量资料的统计描述
百分位数示意图(二)百分位数(percentile)第二讲计量资料的统计描述百分位数:是一种位置指标,将数据从小到大排序后,位于x百分位置的数值,记为Px。它将全部数据分成两部分,在不包括Px的数据中,有x%的数据小于Px
,有(100-x)%的数据大于Px。第二讲计量资料的统计描述频数表法
公式:
第二讲计量资料的统计描述
当时,公式(2-9)即为中位数的计算公式第二讲计量资料的统计描述
例2-5试分别求例2-1频数表的第25、第75百分位数。P25=65+3/15[(130x25%-19)]=65.90P75=74+3/19[(130x75%-85)]=74.66第二讲计量资料的统计描述
例2-6某市大气中SO2的日平均浓度(μg/m3)见表2.5第(1)、(2)栏,分别求第25、75、95百分位数和中位数。
表2.5某市大气中SO2日平均浓度的百分位数和中位数计算第二讲计量资料的统计描述计算累计频数及累计频率,见第(3)、(4)栏;P25=50+25/67(361×25%-39)=69.12
P75=125+25/45(361×75%-233)=145.97P95=250+25/6(361×95%-341)=258.12
P50=M=100+25/63(361/2–170)=104.17第二讲计量资料的统计描述
设有甲、乙、丙三名医生,分别对相同的5份血样进行红细胞计数(万/mm3),甲得出了560、540、500、460、440,乙得出了520、510、500、490、480,丙得出了510、505、500、495、490,见下图2,三名医生的计数结果得到的均数均为500,5个数值之和均为2500。第三节离散趋势的描述甲医生得出的5个观察值间的差异(离散程度)较大,而丙医生得出的5个观察值间的差异(离散程度)较小。第二讲计量资料的统计描述常用统计指标:极差、四分位数间距、方差和标准差、变异系数。一、极差(Range)
极差,用R表示:即一组变量值最大值与最小值之差。对于书中例2-1数据,有简单,但仅利用了两端点值,稳定性差。第二讲计量资料的统计描述适用条件
该指标适用于任何分布类型的资料。但因其只受两侧极端值的影响,故反映一组观察值的变异程度时较粗糙。第二讲计量资料的统计描述二、四分位数间距
(quartilerange)
四分位数间距,用Q表示:
Q=下四分位数:上四分位数:例2-1数据P25=65+3x[(130x25%-19)/15]=65.90P75=74+3x[(130x75%-85)/19]=74.66第二讲计量资料的统计描述适用条件
该指标的适用条件同中位数,而且通常与中位数(亦称第50百分位数)结合,全面描述偏态及不明分布资料的特征。应用时需注意:当样本含量不够大时,该指标不够稳定,故不宜选用。第二讲计量资料的统计描述三、方差与标准差
1.方差(variance)也称均方差(meansquaredeviation),反映一组数据的平均离散水平。
总体方差
样本方差
离均差平方和SS第二讲计量资料的统计描述
2.
公式:
样本标准差用表示,其度量单位与均数一致,所以最常用。公式:ν:自由度第二讲计量资料的统计描述
标准差的公式还可以写成:利用频数表计算标准差的公式为适用于描述对称分布资料的离散趋势。第二讲计量资料的统计描述例2-7对例2-1的前10个数据:75,76,72,69,66,72,57,68,71,72,用直接法计算标准差。第二讲计量资料的统计描述例2-8
利用表2-2中的数据和频数表法计算标准差。N=∑f∑fX∑fX2第二讲计量资料的统计描述标准差的意义和用途说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差。标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。用于计算变异系数。用于计算标准误。结合均值与正态分布的规律,估计参考值的范围。第二讲计量资料的统计描述四、变异系数
变异系数(coefficientofvariation,CV)常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。第二讲计量资料的统计描述与其他四个指标的不同之处描述的不是数据分布的绝对离散程度,而是相对离散程度无单位第二讲计量资料的统计描述
某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,
比较其变异度?
第二讲计量资料的统计描述第四节正态分布第二讲计量资料的统计描述
一、正态分布的概念和特征
1.正态分布曲线的数学表达式(概率密度函数,probabilitydensityfunction,pdf
)
,第二讲计量资料的统计描述正态分布的概念正态分布(normaldistribution),又称高斯分布,是医学和生物界最常见的分布。该分布是以均数为中心,低于均数的频数与高于均数的频数大致相等,越接近均数,频数越多,离均数越远,频数逐渐减少,形成以均数为中心两侧基本对称的钟型分布。这种资料在临床中很常见,称为正态分布。用N(μ,σ2)表示。第二讲计量资料的统计描述2.正态分布的特征
正态曲线下面积分布有一定的规律,总面积=1。第二讲计量资料的统计描述第二讲计量资料的统计描述累积面积可通过对概率密度函数f(X)积分求得(累积)分布函数:第二讲计量资料的统计描述图2-7正态曲线面积分布示意图
第二讲计量资料的统计描述3.正态分布的应用1、正态分布是很多统计方法的理论基础:
后面要讨论到的χ2分布、t分布、F分布等都是在正态分布的基础上推导出来的。某些分布,如t分布、二项分布、Poisson分布等的极限均为正态分布,在一定条件下,均可按正态近似的原理来处理。2、制作质量控制图
利用正态分布规律检查和确认可疑值的性质。正常波动或系统误差。3、估计医学参考值范围第二讲计量资料的统计描述二、标准正态分布第二讲计量资料的统计描述第二讲计量资料的统计描述例2-1的130名健康成年男子脉搏资料的均数、标准差分别为:71.32与5.80(次/分);问在正态分布假下,脉搏在65~75(次/分)之间有多少人?第二讲计量资料的统计描述
正态分布
标准正态分布第二讲计量资料的统计描述第五节医学参考值范围的制定第二讲计量资料的统计描述
1.定义:医学参考值范围(referencerange)是指特定的“正常”人群的解剖、生理、生化、免疫等各种数据的波动范围。习惯上取95%该人群的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校安全疏散设施维护管理制度
- 厦门2024年01版小学英语第二单元测验卷
- 幼儿园饮食安全监管制度
- 电子商务运营(第二版) 课件 项目1 认识电商运营
- 2024-2025学年河南省天一大联考高三上学期检测(二)语文试题及答案
- 暴聋与耳鸣的中医综合方案
- 酒店行业安全生产管理体系
- 医疗保险信息系统数据安全应急预案
- 加油站运营安全与应急管理方案
- 《电瓶车专卖店财务预算管理制度》-记账实操
- DB63-T 2109-2023 湟水流域水生植物繁育技术规程
- 中药煎药质量评估检查表
- 房树人基础知识
- 戴姆勒产品开发质量体系
- GB/T 25217.11-2019冲击地压测定、监测与防治方法第11部分:煤层卸压爆破防治方法
- 通过全球化与世界空间学习的收获
- GB 17675-2021汽车转向系基本要求
- 决策理论7-多目标决策的基本概念课件
- 交互设计-课件
- CAD培训课件(基础教程)
- 化工企业安全生产隐患排查检查表
评论
0/150
提交评论