第二计量资料的统计描述_第1页
第二计量资料的统计描述_第2页
第二计量资料的统计描述_第3页
第二计量资料的统计描述_第4页
第二计量资料的统计描述_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

会计学1第二计量资料的统计描述

统计描述的意义

社会活动看似杂乱无章,对个体来说有很多不确定性,但总体上都是服从一些统计规律的。医学工作有很多数据,统计学描述就是对这些数据进行加工和提炼,找出规律、预测未知。统计描述是最简洁有力的语言。第1页/共50页

第二章计量资料的统计描述

概念:即用少量几个统计指标刻画出原始数据的特征称为统计描述。计量资料的统计描述方法:(单变量)1.通过频数表描述数据特征

2.用统计指标定量描述数据的特征。

第2页/共50页表100例高血压患者治疗后临床记录编号年龄性别治疗组舒张压体温疗效

X1

X2

X3

X4X5

X6137男A11.2737.5显效

245女B12.5337.0有效

343男A10.9336.5有效

459女B14.6737.8无效

10054男B16.8037.6无效第3页/共50页

第一节频数分布

一、频数分布表频数分布表:将变量值分为不同数量的组段,清点各组段的例数。意义:概括了解变量值在各组段的分布和规律。例:表2-1第4页/共50页例2-1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果

2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.52.74.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.83.414.123.955.084.533.923.585.353.843.63.514.063.073.554.233.574.833.523.844.53.964.53.274.523.194.593.753.984.134.263.633.875.713.34.734.175.133.784.573.83.933.783.994.484.284.065.265.253.985.033.513.863.023.74.333.293.254.154.364.953.003.26第5页/共50页

计量资料频数表的编制步骤例2-1数据

1.确定全距(R)=最大值—

最小值2.定组数(8-15组)和组距:例:3.36/10=0.336≈0.33.写出组段的下限:第1组段值小于或等于最小变量值,并以整数(0,5或2,4,6,8)较好。如2.3~4.划计并计数:变量(x)归为L≤x<U(见表2-1)组距(i)=全距(R)/组数第6页/共50页表2-1101名正常成年女性血清总胆固醇频数表

组段频数(f)f(%)

2.3-11.02.6-33.02.9-66.03.2-88.03.5-1717.03.8-2020.04.1-1717.04.4-1212.04.7-99.05.0-55.05.3-22.05.6-5.911.0

合计101100.0第7页/共50页二频数表及分布图的用途1.通过频数表了解数据的分布特征。

X值分布情况:偏态或正态分布取值情况:变量值取值范围集中趋势:变量值集中位置。2.便于发现资料中的可疑值。3.组段的频率作为概率的估计。第8页/共50页例:表2-1资料频数分布图—直方图图2-1

101名正常成年女性血清总胆固醇频数分布

频数血清总胆固醇正态分布第9页/共50页图2-259名链球菌咽喉炎患者潜伏期正偏态分布第10页/共50页讲义表2-4数据图2-3负偏态分布第11页/共50页例:某院出院患者住院天数的频数表组段(天)频数(f)

0-65-2110-1415-1320-625-230-335-140及以上13合计79第12页/共50页

第二节集中趋势的描述

平均数指标的概念和作用概念:平均数表示一组同质计量数据集中趋势的位置和平均水平。作用:是一组计量数据平均水平的代表值;可作为不同组间的比较值。医学中常用的平均数指标有:算数均数、几何均数、中位数第13页/共50页一、算术均数(mean)

简称均数,用表示.

公式适用频数为正态或近似正态分布的计量资料.基本公式(2-1,2-2)加权法公式(例数多)适用条件第14页/共50页表2-1101名正常成年女性血清总胆固醇频数表

组段频数(f)组中值XfX

2.3-12.452.452.6-32.758.252.9-63.0518.303.2-83.35…

3.5-173.653.8-203.954.1-174.254.4-124.554.7-94.855.0-55.155.3-25.455.6-5.915.75

合计101——409.7第15页/共50页加权法公式计算频数(f)作为X值的权数第16页/共50页二、几何均数(Geometricmean)

适用条件:X值呈倍数增长或部分数据偏离过大偏态分布(正偏态)资料。计算公式:直接法,例数较少用(2-3)加权法,(2-4)或第17页/共50页例2-4某地5例微丝蚴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度分别为1/10,1/20,1/40,1/80,1/160,求几何均数。结论:平均抗体滴度为1:34(几何均数法)第18页/共50页表2-569例RA患者血清EBV-lgG抗体测定结果

滴度倒数

X人数

flgXflgX1041.00004.00002031.30103.903040101.602116.021080101.903119.0310160112.204124.2451320152.505137.5765640142.806239.2868128023.10726.2144合计69150.2778第19页/共50页几何均数计算例2-5:例数合计

结论:69例RA患者血清EBV-lgG抗体平均滴度为1:150.6

第20页/共50页三、中位数和百分位数(一)中位数(Median,

M):适用于描述偏态分布资料的平均水平。如潜伏期、病程资料。计算定义:将一组变量值由小到大依次排列,居以中间位次的观察值即为中位数,为这组数据的平均数。

X:5,5,6,7,20(d)位次12345第21页/共50页中位数的计算1.例数较少(公式2-5,2-6)n为偶数n为奇数中位数优点:不受数据中极大或极小值的影响,取决于中间位置的数。第22页/共50页(二)百分位数百分位数(percentile)是一种位置指标,用表示。例计算定义:将一组变量值由小到大依次排列,为第x百分位数的秩次,其对应的变量值(x)为第x百分位数,记为Px。X:15810……48….105秩次123450100x%1%2%3%4%50%100%一组数据(n=100),由小到大排列例:第23页/共50页百分位数计算方法1.直接法(不要求)将样本值由小到大排队,用确定Px的位次和PX。当为带有小数位时用式2.7:当为整数时用式2.8trunc(a)表示对数字取其整数。式2.8式2.7第24页/共50页例:8位患者某病的住院天数:

22233456求50%位数和80%位数。解:第50%位次:nX%=8×0.5=4,用式2.8

中位数=P50=3(天)第80%位次:nX%=8×0.8=6.4,用公式2.7第25页/共50页2.频数表法(例数较多)Lx:第X%位数所在组段的下限值ix:第X%位数所在组段的组距fx:第X%位数所在组段的频数:第X%位数所在组段上个组段的累计频数式中:(2-9)第26页/共50页表2-5118名链球菌咽喉炎患者的潜伏期

天数人数累计频数累计频数%12~41-43.424~175-2117.836~3222-5344.948~2454-7765.360~189580.572~1210790.784~511294.996~411698.3108-2118100.0中位数所在组段第27页/共50页计算频数表资料P25、P50和P951.计算x=25%和50%的位次2.按公式2-9计算Px第28页/共50页百分位数计算结果的应用1.常计算P25、P50、P75、和P95,为临床治疗提供依据。例2-9:120名细菌性痢疾治愈的住院天数

P5=3.5(天),即只有5%的人住院低于3.5天。

P95=15(天)2.确定医学指标的参考值第29页/共50页如P25=39.2天P50=51天(中位数)118名链球菌咽喉炎患者的潜伏期第30页/共50页第三节、离散趋势的描述

描述计量资料数据间离散(变异)程度的指标

—变异指标第31页/共50页例2-11三组同龄男孩的身高(cm)

R

甲组909510010511010020乙组96981001021041008丙组96991001011041008

三组男孩身高值的变异一样吗?第32页/共50页三个指标测定值分布变异不同变异的大小反映某组指标的稳定性第33页/共50页

几个常用的变异指标一、极差(Range):用(R)表示即R=最大值–

最小值意义:

R值越大,表示该组数据的变异越大。缺点:数据利用不全,部分信息损失,在例数少时结果不稳定。极差、四分位数间距、方差、标准差、变异系数第34页/共50页二、四分位数间距(quartilerange)

四分位数间距:常用QR表示常计算:QR=P75%-P25%

作为变异指标比极差稳定。常用于表示偏态分布资料的变异。例:QR=P75%-P25%=67.7-39.2=28.5天表示方法:Md(QR)

M=51天,(QR=28.5天)第35页/共50页

三、标准差和方差

(Standarddeviationandvariance)

公式总体方差(σ2)(2-11)(2-12)总体标准差(σ)样本标准差(s)(2-13)第36页/共50页

标准差的简化计算公式:

(2-14)例数较少(2-15)频数表资料第37页/共50页例2-11甲组5名同龄男孩的身高值(cm)

XX2908100959025100100001051102511012100

标准差的计算第38页/共50页表2-1101名正常女子血清胆固醇值组段(X)

频数(f)fXfx22.30~2.4512.456.002.60~2.7538.2522.692.90~3.05618.3055.823.20~3.358…

….3.50~3.65173.80~3.95204.10~4.25174.40~4.55124.70~4.8595.00~5.1555.30~5.4525.6~5.751409.751705.09

合计101第39页/共50页统计描述:某地101名正常女子血清胆固醇值平均为4.06(mmol/L),标准差为0.654

(mmol/L)第40页/共50页例2-10三组同龄男孩的身高值(cm)

RS甲组9095100105110100207.91乙组969810010210410083.16丙组969910010110410082.92标准差的意义:

反映一组变量值变异程度,组间单位相同时,S越小,表示数据的变异程度越小。第41页/共50页四、变异系数(CV)应用:1.组间单位不同时变异程度的比较。

2.比较组单位相同,但均数相差悬殊的组间变异程度.意义:CV越大,表示数据变异越大。常用于衡量方法、仪器的精密度。公式:(2-16)第42页/共50页1.单位不同时组间变异程度的比较。

某地7岁年龄组男童身高与体重

指标SCV(%)身高(cm)123.104.713.83体重(kg)22.292.2610.14结论:7岁年龄组男童身高与体重值指标比较,体重指标的变异大于身高指标。第43页/共50页

某地不同年龄组男童身高(cm)年龄组SCV%1-2月56.32.13.735-6月66.52.23.313-3.5岁96.13.13.225-5.5岁107.83.33.06结论:随着年龄增加,身高的变异变小。2.比较组单位相同,但均数相差悬殊的组间变异程度比较第44页/共50页计量数据的统计描述小结

1.在医学杂志中正态或近似正态的资料,常以的形式表达,描述和比较数据的平均水平和离散程度。

两组患者年龄(岁)的比较组别n范围值试

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论