数值变量资料的统计分析变异程的描述_第1页
数值变量资料的统计分析变异程的描述_第2页
数值变量资料的统计分析变异程的描述_第3页
数值变量资料的统计分析变异程的描述_第4页
数值变量资料的统计分析变异程的描述_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

离散趋势(dispersiontendency)指标三组同年龄、同性别儿童的体重(kg)

甲组2628303234乙组2427303336丙组2629303134

303030本文档共28页;当前第1页;编辑于星期二\2点7分标准差的意义

标准差是表示一组观察者离散程度或变异程度的统计指标;描述一个变量的所有观察值与均数的平均离散程度的指标。

本文档共28页;当前第2页;编辑于星期二\2点7分

全距表示一群变量值的最大值与最小值之差,反映个体差异的范围,用R表示。全距大,说明变异度大;反之,说明变异度小。甲组2628303234

乙组2427303336R=8R=12一、全距(range)本文档共28页;当前第3页;编辑于星期二\2点7分1.不能全面反映资料的离散程度;2.不稳定,易受极端值的影响,抽样误差大。优点缺点1.表示变异范围,简单明了、容易使用,如用于说明传染病、食物中毒等的最短、最长潜伏期等;2.各种分布类型的资料均可用。全距(range)本文档共28页;当前第4页;编辑于星期二\2点7分二、四分位数间距(quartileinterval)

四分位数间距是上四分位数(QU=P75)和下四分位数(QL=P25)之差,用Q表示(QU-QL)。该数值越大,说明变异度越大;反之,说明变异度越小。本文档共28页;当前第5页;编辑于星期二\2点7分某地630名正常女性血清甘油三脂含量(mg/dl)本文档共28页;当前第6页;编辑于星期二\2点7分L:组段的下限;iM:组距;fx:频数;

fL:Px所在组段之前的累积频数。

本文档共28页;当前第7页;编辑于星期二\2点7分1.与中位数配套,用于偏态分布资料及分布的一端或两端无确切数值的资料;2.比全距稳定。未考虑到每个观察值的变异度。优点缺点

四分位数间距(quartileinterval)本文档共28页;当前第8页;编辑于星期二\2点7分

三、平均差距指标(一)平均偏差(MeanDifference)

甲班:

乙班:

特点:直观,易理解;但由于用了绝对值,不便于数学处理,实际中很少使用。

本文档共28页;当前第9页;编辑于星期二\2点7分(二)离均差平方和(SumofSquare,SS)

为了克服平均偏差的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其计算公式为

SS通常作为一个中间统计量使用。本文档共28页;当前第10页;编辑于星期二\2点7分(三)方差(Variance)方差是将离均差平方和再取平均,即

注意:对于样本资料,分母用的是n-1,称为自由度(degreeoffreedom,df)。方差的特点:便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。本文档共28页;当前第11页;编辑于星期二\2点7分方差(variance)自由度=n-限制条件的个数,用ν表示。(n-1):当选定时,n个变量值中能自由变动的变量值的个数。本文档共28页;当前第12页;编辑于星期二\2点7分

方差越大,资料的离散程度越大(全面考虑了每个观察值);不受观察值个数的影响。优点缺点

一些资料不适用于以平方表示。方差(variance)本文档共28页;当前第13页;编辑于星期二\2点7分

四、标准差(StandardDeviation)

将方差取平方根,还原成与原始观察值单位相同的变异量度即为标准差:

例如对于例3.1经计算有甲患者:

同理乙患者:本文档共28页;当前第14页;编辑于星期二\2点7分例三组同年龄、同性别儿童的体重(kg)甲组2628303234乙组2427303336丙组2629303134标准差直接法本文档共28页;当前第15页;编辑于星期二\2点7分标准差加权法本文档共28页;当前第16页;编辑于星期二\2点7分本文档共28页;当前第17页;编辑于星期二\2点7分标准差应用1.表示观察值分布的离散程度。均数相近、度量单位相同的条件下,S越大,观察值的变异程度越大,均数的代表性越差。2.结合均数计算CV。3.结合均数描述正态分布资料的分布特征和估计医学参考值范围4.结合样本含量计算标准误。本文档共28页;当前第18页;编辑于星期二\2点7分

五、变异系数(CoefficientofVariation

)

主要用于对均数相差较大或单位不同的几组观察值的变异程度进行比较。例3.3测得某地成年人舒张压均数为77.5mmHg,标准差为10.7mmHg;收缩压均数为122.9mmHg,标准差为17.1mmHg。试比较舒张压和收缩压的变异程度。本文档共28页;当前第19页;编辑于星期二\2点7分变异系数

Coefficientofvariation(CV)应用1.表示数据分布的相对离散程度2.比较均数相差悬殊的两组或多组资料的离散程度3.比较度量衡单位不同的两组或多组资料的变异程度本文档共28页;当前第20页;编辑于星期二\2点7分

某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.72kg,标准差为4.96kg。比较身高与体重的变异程度。20岁男子体重的变异程度比身高的变异程度大。本文档共28页;当前第21页;编辑于星期二\2点7分

某地不同年龄女童的身高(cm)资料如下表所示。试比较不同年龄身高的变异程度。某地不同年龄女童身高的变异程度年龄组人数均数标准差CV(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5岁30096.13.13.25~5.5岁400107.83.33.1本文档共28页;当前第22页;编辑于星期二\2点7分小结全距与四分位数间距:后者较稳定,但均不能综合反映各观察值的变异程度。标准差:最为常用,对正态分布尤为重要变异系数:可用于多组资料间度量衡单位不同或均数相差悬殊时作变异度的比较。以上指标都是数值越小,说明观察值的变异度越小,均数的代表性越好。平均指标和变异指标常配套使用

如正态分布:均数、标准差;偏态分布:中位数、四分位间距本文档共28页;当前第23页;编辑于星期二\2点7分练习:

某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞含量(μmol/kg)如下:

用何种指标说明本资料的集中位置和变异程度较好?并计算之。发汞值1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~人数2066604818166103本文档共28页;当前第24页;编辑于星期二\2点7分

某检验师测定了10名正常成年钢铁工人的血红蛋白值(g/dl)和红细胞数(万/mm3)如下,试比较这两个检测项目的结果哪个变异性大?血红蛋白(g/dL)13.013.614.014.514.614.715.215.515.816.0血细胞数(万/mm3)510515517518520522524525528530本文档共28页;当前第25页;编辑于星期二\2点7分本文档共28页;当前第26页;编辑于星期二\2点7分小结1.描述一组观察值,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论