医学统计学 计量资料的统计描述_第1页
医学统计学 计量资料的统计描述_第2页
医学统计学 计量资料的统计描述_第3页
医学统计学 计量资料的统计描述_第4页
医学统计学 计量资料的统计描述_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一篇

基本统计方法1

第二章

计量资料的统计描述

DescriptionsofMeasurementData

23

concent

RangeofreferencevalueNormaldistributionMeasuresofdispersion

Descriptionofcentraltendency

Frequencydistribution

Chapt2Summary4描述计量资料的思路BeginHere原始数据编制频数分布表或直方图分布类型相应描述指标对称分布或偏态分布集中趋势或离散趋势第一节频数分布例2-1某医院用随机抽样方法检查138名成年女子红细胞数

,测量结果如下,试编制频数分布表。53.964.234.423.595.124.024.323.724.764.164.614.263.774.204.363.07

4.893.974.283.644.664.044.554.254.633.914.413.525.034.014.304.194.754.144.574.264.563.793.894.214.953.984.293.674.694.124.564.264.664.283.834.205.244.024.333.764.814.173.963.274.614.263.964.233.764.014.293.673.394.124.273.614.984.243.834.203.714.034.344.693.624.184.264.365.284.214.424.363.664.024.314.833.593.973.964.495.114.204.364.543.723.974.284.763.214.044.564.254.924.234.473.605.234.024.324.684.763.694.614.263.894.214.363.425.014.014.293.684.714.134.574.264.035.464.163.644.163.76

6

频数分布表

1.求全距(range)R=Xmax–Xmin

=5.46–3.07=2.392.确定组段数和组距:通常10-15组i=R/组数

i=2.39/12=0.199cm所以,i=0.2cm3.确定组段:第一组段包括最小值,如本例为3.07

最后组段包括最大值,如本例为5.46L≤X<U4.列表划记7组段(1)频数f(2)

组中值X(3)f·X(4)3.07~23.176.343.27~33.3710.113.47~93.5732.133.67~143.7752.783.87~223.9787.344.07~304.17125.104.27~214.3791.774.47~154.5768.554.67~104.7747.704.87~5.07~5.27~5.476424.975.175.3729.8220.6810.74合计∑f=138∑fX=583.068

右偏态分布(skewedtotherightdistribution)也称正偏态分布(positiveskewnessdistribution)右侧组段数多于左侧组段数,频数向右侧拖尾。9左偏态分布(skewedtotheleftdistribution)也称负偏态分布(negativeskewnessdistribution)左侧的组段数多于右侧的组段数,频数向左侧拖尾。作为陈述资料的形式描述频数分布的类型描述频数分布的特征便于发现特大或特小离群值(outlier)10

频数表和频数分布图的用途11

三、中位数与百分位数第二节集中趋势的描述

集中趋势指标

二、几何均数geometricmean

一、算术均数mean

四、众数mode

五、调和平均数harmonicmean

意义:反映一组呈对称分布的变量值在数量上的平均水平。均数代表每组观察值的平衡点,也就是重心。

如:(1,4,7,8)则均数为5,图示如下:

均数的重要特性:离均差(各观察值与均数之差)总和等于零∑(X-)=012345678mean13

直接计算法频数表法例2-2用直接法计算例2-1某医院随机抽查

138名成年女子红细胞数均数。

14

例2-3利用表2-1计算某医院随机抽查138名成

年女子红细胞数均数。

意义:用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。适用条件:呈倍数关系的等比资料或对数正态分布资料;如抗体滴度资料。16geometricmean,G17直接法公式18例2-4某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为10,20,40,40,160,求几何均数。19

加权法公式2021=150.6注意事项(补充)1.变量值中不能有02.同一组变量值不能同时存在正、负值若变量值全为负值,可先将负号除去,算出

结果后再冠以负号

3.同一组资料几何均数小于算术均数22

此例的算术均数为22222,显然不能代表滴度的平均水平。同一资料,几何均数<均数血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。=100024

3.

中位数:将n个变量值按照大小顺序排列,位置居中的值当n为奇数时:当n为偶数时:

medianandpercentile

例2-67名病人患某病的潜伏期分别为2、3、4、5、8、15、24天,求其中位数

25例2-78名患者食物中毒的潜伏期分别为1、2、2、

3、5、8、15、24小时,求其中位数。27

0%

PX100%

M即50%分位数就是中位数

百分位数(percentile)1.直接计算法

2829例2-9对某医院细菌性痢疾治愈者的住院天数统计,119名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数

患者住院天数30其中

LX:PX所在组下限

iX:PX所在组组距

fX:PX所在组频数

n:样本例数

ΣfL:小于PX所在组的各组段累计频数

2频数表法

例2-10某地118名链球菌咽喉炎患者的潜伏期频数表见表2-6第(1)、(2)栏,求中位数及第25百分位数、第75百分位数。

数人数

累计频数累计频率(%)12~443.424~172117.836~325344.948~247765.360~189580.572~1210790.784~511294.996~411698.3118~1202118100.03132

1.众数指一组数据中出现频率最高的数值。2.众数的确定1)一组数据2)频数表资料3.特殊性:无或双众数众数(mode,Mo)33调和均数:一组观察值倒数的算术均数的倒数特点:原始数据大小相差越悬殊,调和均数的调和作用越明显调和均数(harmonicmean,H)34

1.算术均数适合对称分布,尤其是正态分布;几何均数适用于等比资料或对数正态分布;中位数适合于偏态分布或分布不明资料或分布两端无确定值资料。2.当数据呈对称分布时,均数和中位数接近。3.均数、中位数二者关系

正态分布时:mean=median

正偏态分布时:mean>median负偏态分布时:mean<median集中趋势小结1.8例某病患者血液尿素氮(mmol/l)的测定结果为4.65.13.05.64.43.55.05.2,平均值为()2.4例感染者血清抗体滴度之倒数为101010001000,其平均值为()3.有一化验员记录了化验结果为6.2;小于2有4个;8.3;

大于10有3个;7.5,平均值为()4.均数通常是指()A.算术均数B.几何均数C.中位数D.众数5.正偏态又称为()A.左偏态B.右偏态C.正态D.斜偏态测试题第三节离散趋势的描述

三组同性别、同年龄儿童体重(kg)36全距1四分位数间距2方差3标准差4变异系数5离散趋势的常用指标

离散趋势的常用指标

RA=34-26=8kgRB=36-24=12kgRC=34-26=8kgRB>RA=RC38RangeCalculated:HighestminusLowestProperties:EasytocalculateVerysensitivetotheextreme-mostscores

1.极差(Range)39QR=QU-QL=

P75

-P25四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。2.四分位数间距(inter-quartilerange)

Inter-quartilerange

DifferencebetweentwoQuartiles=UpperQuartile-LowerQuartileLowerQuartile:25percentileUpperQuartile:75percentile

Calculated:ComputetheMeanSubtracteachscorefromtheMeanSquarethedifferenceSumallthesquaresDividetheresultby(n-1)forsamples)--(dividebyNforpopulations)

3.方差(Variance)

41

公式:样本标准差用表示公式:4.标准差(StandardDeviation)

标准差(StandardDeviation)42SA=3.16kgSB=4.74kgSC=2.92kgSB>SA>SCCalculated:ComputetheVarianceTakethesquareroot43

直接法公式频数表法公式标准差的应用1.表示变量值的离散程度2.结合均数描述正态分布特征3.求医学参考值范围4.计算变异系数及标准误44Thecoefficientofvariationisameasureofrelativevariation计算:应用:单位不同多组数据比较均数相差悬殊多组资料5.变异系数CV46某地20岁男子100人,身高均数166.06cm,标准差为4.95cm;体重均数为53.7kg,标准差为4.96kg,试比较身高和体重的变异。

身高体重

47测得某地成年人舒张压的均数为77.5mmHg,标准差为10.7mmHg;收缩压的均数为122.9mmHg,标准差17.1mmHg。试比较舒张压和收缩压的变异程度。舒张压收缩压48

1.R计算简便但稳定性差,适合于任何分布;2.S最常用,适合于近似正态分布资料;3.CV用于单位不同或均数相差悬殊资料;4.QR常与M一同使用,描述偏态分布资料;5.集中趋势与离散趋势一起描述资料的分布特征。

离散趋势小结49正态曲线:是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线。50f(X) = frequencyofrandomvariableXp = 3.14159;e=2.71828s = populationstandarddeviation

X = valueofrandomvariablem = populationmean第四节正态分布

Normaldistribution

正态分布的特征钟型曲线,以均数x=μ为对称轴左右对称1在x=μ处,f(x)取最大值2正态分布有两个参数N(μ,)即位置和形状参数3正态曲线下面积分布有一定规律4正态曲线下面积规律5354StandardizetheNormalDistribution

Normal

DistributionStandardizedNormalDistribution55标准正态分布曲线下的面积唯一由u值决定,可通过查附表1获得。二、标准正态分布(u分布)56正态分布曲线下的面积的计算

进行u变换,求u值用u值查表,得到所求区间面积占总面积的比例。57

例2-15某医院随机抽样138名正常成年女性红细胞正态分布应用估计医学参考值范围估计可信区间的范围正态分布是许多统计方法理论基础估计频数分布第五节医学参考值范围的制定

概念:又称参考值范围,是指绝大多数正常人的人体形态、功能和代谢产物等各种生理、生化指标波动范围,也称正常值。

单双侧:根据指标的实际用途。

估计的方法:

1.正态分布法

2.百分位数法60确定参考值范围原则

1选定同质的正常人作为研究对象2确定样本的含量,最好在100例以上3控制测量误差4决定单、双侧问题5选择合适的百分界值6根据资料分布类型选定适当的方法62

双侧1-α参考值范围单侧1-α参考值范围双侧95%正常值范围单侧95%正常值范围应用条件:正态分布或近似正态分布资料1.正态分布法双侧界值:P2.5-P97.5

通式:P100α/2-P100-

100α/2

单侧上界:P95

通式:P100-

100α

单侧下界:P5

通式:P100α百分位数法例2-17

测得某地

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论