变异程度的统计描述_第1页
变异程度的统计描述_第2页
变异程度的统计描述_第3页
变异程度的统计描述_第4页
变异程度的统计描述_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

变异程度的统计描述第1页,共65页,2023年,2月20日,星期三掌握:描述数据分布离散趋势的指标;正态分布的概念和特征、标准正态分布下面积分布规律。熟悉:医学参考值范围的意义和计算;了解:正态分布表、正态分布的应用。学习目的和要求第2页,共65页,2023年,2月20日,星期三描述数值变量资料的分布特征必须从集中趋势和离散趋势两方面来进行,缺一不可。例:三组同年龄女大学生体重(kg)如下,试分析其分布特征。

甲组4648515357=51

乙组4447525557=51

丙组4549505556=51R=11R=13R=11第3页,共65页,2023年,2月20日,星期三一、极差和四分位数间距(一)极差(range)R,也称全距。例:甲、乙两人高血压患者测量5天的收缩压(mmHg)得:甲162145178142186=162.6乙164160163159166=162.4第一节衡量变异程度的指标

R甲=186-142=44R乙=166-159=7第4页,共65页,2023年,2月20日,星期三四分位数间距(quartileinterval,Q)就是上四分位数QU(即P75)与下四分位数间距QL(即P25)之差。其间包含了全部观察值的一半,单位与原观察值相同。四分位数间距越大,则数据的变异度越大;反之,说明变异度越小。(二)四分位数间距(quartile)Q第5页,共65页,2023年,2月20日,星期三

0255075100四分位数间距与中位数一起可全面描述偏态分布资料的分布特征。Q=135.7-63.2=72.5(mg/dl)第6页,共65页,2023年,2月20日,星期三例2.4某地630名正常女性血清甘油三酯含量的频数表甘油三酯(mg/dl)频数累积频数累积频率(1)(2)(3)(4)10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合计630--第7页,共65页,2023年,2月20日,星期三(一)平均偏差(meandifference)

二、离均差平方和、方差、标准差和变异系数第8页,共65页,2023年,2月20日,星期三例:对甲乙两名高血压患者连续观察5天,测得的收缩圧分别为:甲患者(mmHg)162145178142186=162.6乙患者(mmHg)164160163159166=162.4甲患者的血压波动较乙患者大。第9页,共65页,2023年,2月20日,星期三平均偏差是一个很直观的变异度量,但由于使用了绝对值,在数学上不便于继续处理,使它在应用上受到很大的限制,实际中很少使用。为了克服平均偏差使用绝对值不便进一步运算的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和。第10页,共65页,2023年,2月20日,星期三(二)离均差平方和(sumofsquare,SS)第11页,共65页,2023年,2月20日,星期三(三)方差与标准差(variance,standarddeviation,S或SD)N-1称自由度Degreeoffreedom第12页,共65页,2023年,2月20日,星期三第13页,共65页,2023年,2月20日,星期三例3.1对甲乙两名高血压患者连续观察5天,测得的收缩压分别为:甲患者(mmHg)162145178142186=162.6乙患者(mmHg)164160163159166=162.4甲患者:ΣX=162+145+178+142+186=813

ΣX2=1622+1452+...+1862=133713甲乙第14页,共65页,2023年,2月20日,星期三大样本频数表资料可用下列公式计算标准差:第15页,共65页,2023年,2月20日,星期三例3.2根据第2章表2-2资料计算其标准差红细胞数组中值(x)频数(f)fxfx2

(1)(2)(3)(4)=(2)(3)(5)=(2)(4)3.80~3.9027.8030.424.00~4.10624.60100.864.20~4.301147.30203.394.40~4.5025112.50506.254.60~4.7032150.40706.88.....5.80~5.9015.9034.81

合计140669.803224.20(×1012/L)第16页,共65页,2023年,2月20日,星期三在所有的变异指标中,标准差或方差是其它变异指标所不能比拟的。标准差能够直接用于代数运算,如根据来自总体的几个样本的标准差可以直接求得合并样本的标准差,而不必根据合并样本重新计算。第17页,共65页,2023年,2月20日,星期三计量资料的主要描述性指标及其适用条件主要指标适用条件

、s

对称分布、正态或近似正态分布资料G、lg-1Slgx

等比级数或对数正态分布资料

M、Q

偏态分布、分布不明或分布末端无确

定值的资料

第18页,共65页,2023年,2月20日,星期三用标准差比较两个样本的变异程度时需注意:1.两组数据的均数相差不大2.单位相同(标准差使用的度量衡单位与原始数据相同)第19页,共65页,2023年,2月20日,星期三(五)变异系数(coefficientofvariation,CV)例3.3已知:舒张压均数为77.5标准差为10.7收缩压均数为122.9标准差为17.1舒张压

可见两种指标的变异度几乎没有什么差别。收缩压第20页,共65页,2023年,2月20日,星期三例7.10某地调查110名20男大学生,其身高均数为172.73cm,标准差为4.09cm;其体重均数为55.04kg,标准差为4.10kg,试比较两者变异程度。身高体重第21页,共65页,2023年,2月20日,星期三指高峰位于中央(均数所在处)、两测逐渐降低且左右对称、不与横轴相交的光滑的曲线。以某地140名正常男子红细胞数资料为例:第二节正态分布及其应用正态分布曲线:第22页,共65页,2023年,2月20日,星期三表2-2某地140名正常男子红细胞数的频数表红细胞数划记组中值频数频率(1)(2)(3)(4)(5)3.80~T3.9021.44.00~正一4.1064.34.20~正正一4.30117.94.40~正正正正正4.502517.94.60~正正正正正正T4.703222.94.80~正正正正正T4.902719.35.00~正正正T5.101712.15.20~正正T5.30139.35.40~5.5042.95.60~T5.7021.45.80~6.00一5.9010.7第23页,共65页,2023年,2月20日,星期三第24页,共65页,2023年,2月20日,星期三若横坐标为红细胞数(变量值X),第i组的组距和人数分别用△Xi和fi表示,则在(X,X+△Xi)区间内每单位红细胞数的频率为:

f(X)称作密度函数

将前图表示人数的纵坐标换成f(X)后可以得到下图:第25页,共65页,2023年,2月20日,星期三矩形面积等于红细胞在这一区间内出现的频率第26页,共65页,2023年,2月20日,星期三第27页,共65页,2023年,2月20日,星期三第28页,共65页,2023年,2月20日,星期三第29页,共65页,2023年,2月20日,星期三正态分布的密度函数:

在μ

和σ

未知的情况下,可用和S作为μ和σ

的估计值。-∝<x<∝第30页,共65页,2023年,2月20日,星期三正态分布的几个特征以均值μ为中心,左右对称曲线下的面积集中在以均数为中心的部分,越远离中心,曲线下面积越小。正态曲线下面积分布有一定规律:范围内的面积为68.3%范围内的面积为95.0%范围内的面积为99.0%正态分布有两个参数,μ和σ第31页,共65页,2023年,2月20日,星期三第32页,共65页,2023年,2月20日,星期三第33页,共65页,2023年,2月20日,星期三第34页,共65页,2023年,2月20日,星期三二、标准正态分布(Standardnormaldistribution)是均数为0,标准差为1的正态分布。对任何参数μ和σ的正态分布,都可以通过一个简单的变量变化转成标准正态分布,即第35页,共65页,2023年,2月20日,星期三标准正态分布的密度函数-<u<分布函数求标准正态曲线下的面积。标准正态分布的分布函数当均数为0,标准差为1时第36页,共65页,2023年,2月20日,星期三第37页,共65页,2023年,2月20日,星期三第38页,共65页,2023年,2月20日,星期三

例如:成年男子红细胞数近似服从正态分布,均数为4.78(×1012/L),标准差为0.38(×1012/L)。现想知道红细胞数在4×

1012/L以下所占的比例?一旦完成了这种变换,就可以利用标准正态分布表求出与原始变量X有关的概率值。可以先将变换为相应的u值,即:第39页,共65页,2023年,2月20日,星期三例:已知均数为4.78,标准差为0.38

查附表1(P194),标准正态曲线下左侧尾部面积,得Φ(-2.05)=0.0202,即在4×1012/L以下者占总人数的2.02%。第40页,共65页,2023年,2月20日,星期三若需要求出在4×1012/L~5.5×1012/L范围内所占的比例,可以通过下面计算获得。总体平均数总体标准差即在4×1012/L~5.5×1012/L范围内占总人数的95.04%。第41页,共65页,2023年,2月20日,星期三例:成年男子红细胞数近似服从正态分布,均数为4.78(×1012/L)标准差为0.38(×1012/L),现想知道红细胞数在4×1012/L~5.5×1012/L范围内所占的比例。第一步:进行U变换第42页,共65页,2023年,2月20日,星期三第二步:查附表1,标准正态分布曲线下面积。Φ(-2.05)=0.0202Φ(-1.89)=0.0294(1.89查不到)第43页,共65页,2023年,2月20日,星期三第44页,共65页,2023年,2月20日,星期三正态分布的应用是各种统计推断方法的理论基础可进行医学参考值范围的估计可进行误差分析和检测的质量控制第45页,共65页,2023年,2月20日,星期三第三节医学参考值范围医学参考值范围(refrencevaluerange)又称正常值范围(normalrange)。指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。一、医学参考值范围的概念第46页,共65页,2023年,2月20日,星期三1、临床实践:着眼于个体,作为划分正常人与异常人的界线。2、预防医学实践:着眼于群体,如评价儿童的发育水平。参考值范围的应用:第47页,共65页,2023年,2月20日,星期三二、医学参考值范围的制定方法1.选择足够数量的正常人作为参照样本2.对选定的正常人进行准确的测定3.决定取单侧范围还是双侧范围值4.选择适当的百分范围5.选择适当的方法估计参考值范围的界限第48页,共65页,2023年,2月20日,星期三第49页,共65页,2023年,2月20日,星期三青光眼病人和正常人眼内压分布图

受检人数正常人患者14161820222426283032343638眼内压重叠区若将眼内压的阳性诊断标准定为22mmHg,所有患者均被判为阳性。但是,眼内压在22-26mmHg之间的正常人被误判为阳性(假阳性),造成误诊。若将眼内压的阳性诊断标准定为26mmHg,所有的正常人均被判为阴性。但是,眼内压在22-26mmHg之间的患者被误判为阴性(假阴性),造成漏诊。第50页,共65页,2023年,2月20日,星期三表3-2参考值范围所对应的百分位数百分范围(%)单侧双侧(对称)下限上限下限上限

95P5P95P2.5P97.599P1P99P0.5P99.5

表3-3参考值范围所对应的正态分布区间百分范围(%)单侧双侧(对称)下限上限下限上限

95-1.645s+1.645s-1.96s+1.96s99-2.33s+2.33s-2.58s+2.58s

第51页,共65页,2023年,2月20日,星期三医学参考值计算方法1.正态分布法适用于正态或近似正态分布资料

双侧界值:单侧上界:单侧下界:

第52页,共65页,2023年,2月20日,星期三求:该地成年男子红细胞数的95%参考值范围。

下限:

上限:例:已知第53页,共65页,2023年,2月20日,星期三2.对数正态分布法适用于对数正态分布资料双侧界值:单侧上界:单侧下界:3.百分位数法常用于偏态分布资料

双侧界值:P2.5和P97.5

单侧上界:P95

单侧下界:P5例:第二章表2-4资料。估计血清甘油三酯含量的95%单侧参考值范围第54页,共65页,2023年,2月20日,星期三例2.4某地630名正常女性血清甘油三酯含量的频数表甘油三酯(mmol/L)

频数累积频数累积频率(1)(2)(3)(4)

0.10~27274.3

0.40~16919631.1

0.70~16736357.61.00~9445772.51.30~8153885.41.60~4258092.11.90~2860896.52.20~1462298.72.50~462699.42.80~362999.83.10~1630100.0合计630--第55页,共65页,2023年,2月20日,星期三第56页,共65页,2023年,2月20日,星期三不同方法比较:正态分布法:资料必须服从正态或近似正态分布。特点:是结果比较稳定,在样本含量不是很大的情况下(n<100)仍然能够处理;百分位数法:不符合正态分布法或对数正态分布法的资料。特点:适用范围较广,故在实际中较为常用。但因两端数据波动较大,使用百分位数法必须有较大样本含量,否则结果不稳定。第57页,共65页,2023年,2月20日,星期三例8-11某年某市调查了200例正常成人血铅含量(g/100g)如下,试估计该市成人血铅含量95%医学参考值范围。

第58页,共65页,2023年,2月20日,星期三200个血铅测量值第59页,共65页,2023年,2月20日,星期三组段频数f

3~368~3913~4718~2023~1828~1633~338~743~148~153~158~621

200名血铅频数表第60页,共65页,2023年,2月20日,星期三组段频数f累计频数f累计频率(%)3~363618.08~397537.513~4712261.018~2015276.023~1817085.028~1618693.033~318994.538~719698.043~119798.548~119899.053~119999.558~621200100.0

200名血铅频数表及P95计算表第61页,共65页,2023年,2月20日,星期三求95%的单侧上界:第62页,共65页,2023年,2月20日,星期三对数组段频数f组中值(lgX)flgXf(lgX)20.45~10.50.50.250.55~50.63.01.800.65~100.77.04.900.75~

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论