医学统计学:第四章 定量资料的统计描述_第1页
医学统计学:第四章 定量资料的统计描述_第2页
医学统计学:第四章 定量资料的统计描述_第3页
医学统计学:第四章 定量资料的统计描述_第4页
医学统计学:第四章 定量资料的统计描述_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章定量资料的统计描述

根据变量取值特点,计量资料分为:

连续性资料:变量值可以在实数轴上连续变动。如红细胞数、身高、体重。离散型资料:变量取值能一一列举。只能取整数。统计图表如:频数分布表(图)集中趋势的统计描述离散趋势的统计描述一、定量资料的统计描述:一、频数分布表和频数分布图1、频数分布表分组频数频数表一、频数分布表和频数分布图1、频数分布表的编制:离散型计量资料的频数表:以变量取值为标志分组,并列出各组的频数例4.1例4.1临床常用格拉斯哥昏迷评分(GlasgowComaScale,GCS)来综合评价意识状态,­将刺激所引起的眼睛、言语和运动三方面的反应结果分值相加,总分最高为15分,最低为3分,分值越低说明意识障碍越重,GCS处于13~15分者为轻度意识障碍,9~12分为中度意识障碍,3~8分为重度意识障碍。某急救中心用GCS对164名道路交通事故伤员的意识状态进行了评价,根据该资料制作频数表。连续型计量资料的频数表:按变量取值范围划分成几个区间,每个区间为一个组段。例4.2(P45)

①确定全距(range)全部观察值中最大值与最小值之差,用符号R表示。②划分组段确定组数:根据观察单位的多少及其全距来定,组数不宜太多或者太少。确定组距:一般采用等距分组,组距=R/组数。确定各组段上下限:每个组段的起点称为该组的下限(lowlimit),终点称为上限(upperlimit)。第一组段必须包含最小值。注意各组段不能重叠。③统计各组频数采用计算机或手工划记汇总,得到各组段相应的频数。表4.2155名6月龄婴儿SOS值(m/s)的频数分布3、频数分布图

以横轴为观测变量,纵轴为频数(或频率)所作的直方图,用直方的面积表示频数的多少,用直方面积占总面积的比例表示频率的大小,其用途与频数表类似,但更直观、形象。

图4.1155名6月龄婴儿SOS值的频数分布2、频数表的用途揭示频数分布的特征揭示频数分布的类型便于发现特大或特小的可疑值便于进一步计算统计指标和进行统计分析1)频数分布的特征集中趋势:一组数据向某一个位置聚集或集中的倾向。离散程度:一组数据的分散性和变异度。2)频数分布的类型对称分布:集中位置在正中,左右两侧大体对称。偏态分布:集中位置偏向一侧,频数分布不对称。

*分布类型不同,采用的统计方法不同负偏态分布正偏态分布图4.1155名6月龄婴儿SOS值的频数分布图4.22004年我国麻疹患者的年龄分布图4.3某市219名乳腺癌患者术后康复期生存质量评分的分布

频数评分二、集中趋势的统计描述

描述一组同质观察值的平均水平或集中位置的指标。常用以下三种指标:算术均数几何均数中位数现有1、2、3、4、5共5个数数值,求其平均数

1、算术均数(arithmeticmean)

简称均数(mean)。均数描述一组数据在数量上的平均水平。符号:表示样本均数,希腊字母

表示总体均数。1)计算方法:直接法:将所有数据直接相加,再除以总例数。见教材P49,例4.3加权法(weightingmethod):相同观察值较多时,可将相同观察值的个数(频数f)乘以该观察值x,以代替相同观察值逐个相加。见教材P49,表4.22)均数的特性:各观察值与均数之差(离均差)的总和等于零,即。各观察值得离均差平方和最小,即

。以上两个特性表明均数是一组观察值最理想的代表值。3)均数的应用均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本进行比较。均数适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势。均数在描述正态分布特征方面具有重要意义。表某抗体滴度原始数据作直方图表对数变换后的数据作直方图2、几何均数(geometricmeanG)

适用条件:原始数据分布不对称,但经对数转换后对称分布的资料各观察值之间呈倍数变化(等比关系)的资料例如:医学上血清滴度;食品中农药含量;疾病的潜伏期等。1)几何均数的计算直接法:见教材P50,例4.4加权法:当相同观察值较多时,如频数表资料见教材P50,例4.5~4.72)几何均数的应用

常用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料。因为0不能取对数,所以数据中若有0则不宜直接使用几何均数,此时可将所有观察值加上一个常数k,使,计算出结果后再还原,即。观察值不能同时有正有负。3、中位数(Median.M)

一组观察值从小到大排列,位次居中的观察值即中位数,是一个位置指标。符号:P50

或M1)计算方法直接法:n为奇数时:n为偶数时:频数表法(weightingmethod):见教材P452,例4.8、例4.9~4.102)中位数的应用注意事项中位数可用于各种分布的资料在正态分布资料中,M=;在对数正态分布资料中,M=G。

中位数不受极端值得影响,因此,实际工作中主要用于不对称分布类型的资料、两端无确切值或分布不明确的资料。

三、离散趋势地描述

3组同年龄、同性别中年知识分子的躯体功能维度得分甲组88910111212乙组56810121415丙组125101518191、极差(Range,R):可用于各种分布的资料

甲组:R=12-8=4(分)

乙组:R=15-5=10(分)

丙组:R=19-1=18(分)缺点:①不能反映所有数据的变异程度。②样本例数相差悬殊时不宜比较级差。2、四分位数间距

常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。

1)百分位数(percentile):是指将观察值从小到大排列后处于第x百分位置上的数值,亦是位置指标,用Px

表示。Px

表示将全部观察值分为两部分,有x%的观察值比Px

小,有(100–x)

%的观察值比Px大。P50

即中位数。直接法:当当频数表法:见教材P48,例4.13见教材P54,例4.14

特定的百分位数,P25

为下四分位数QL,表示全部观察值中有25%的观察值比QL小,P75

为上四分位数QU,表示有25%的观察值比QU大。

四分位间距:QU

—QL,包括全部观察值的一半。可看作中间一般观察值的极差。它比极差稳定,但仍未考虑每个观察值的变异。见教材P55,例4.15对于单峰对称分布资料,为了全面反映一组资料中每个观察值的变异情况,需要先寻找一个可供比较的标准,由于均数具有的优良性质(见本章第二节),所以选择均数作为一组单峰对称分布观察值的代表值,然后衡量每个观察值相对均数的偏差,构造出综合描述资料离散程度的指标。3、方差(Variance)

方差说明观察值的变异程度,方差越大,观察值得变异程度较大,反之,观察值得变异程度较小。

样本方差

式中n–1称为自由度(Degreeoffreedom),反映了均数确定时n个数据中能自由变动的数据(变量值)的个数。见教材P56,例4.164、标准差(Standarddeviation)

直接法

方差(variance)和标准差(standarddeviation)是描述对称分布,特别是正态分布或近似正态分布资料离散趋势(变异程度)的常用指标。

见教材P56,例4.17加权法:用于频数表资料见教材P56,例4.184、变异系数(CoefficientofVariation,CV)

特点:数据的变异相对于其平均水平来说的,大小没有单位。①比较单位不同的多组资料的变异度②比较均数相差悬殊的多组资料的变异度例4.19,某年某市城区120名5岁女孩身高均数为110.15(cm),标准差为5.86(cm);体重均数为17.71(kg),标准差为1.44(kg),比较其离散程度。

身高

体重该市城区5岁女孩体重的变异大于身高的变异。

例4.20

某年某市城区120名5岁女孩体重均数为17.71(kg),标准差为1.44(kg),同年该地120名5个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论