医学统计学第2讲-计量资料的统计描述-课件_第1页
医学统计学第2讲-计量资料的统计描述-课件_第2页
医学统计学第2讲-计量资料的统计描述-课件_第3页
医学统计学第2讲-计量资料的统计描述-课件_第4页
医学统计学第2讲-计量资料的统计描述-课件_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章定量资料的统计描述第二章定量资料的统计描述1个体变异是同质观察对象间表现出的差异。变异是生物体在一种或多种、已知或未知的不可控因素作用下所产生的综合反映。就每个观察单位而言,其观察指标的变异是不可预测的,或者说是随机的(random)。就总体而言,个体变异是有规律的。个体变异是同质观察对象间表现出的差异。就每个观察单位而言,其2变异规律的体现:分布(distribution)何为分布?熊猫分布在温暖多雨的山区,尤以中国西南部刀鱼分布在长江下游水域

长寿村的由来变异规律的体现:分布(distribution)何为分布?熊3统计描述统计描述(descriptivestatistics)统计分析统计推断(inferentialstatistics)统计描述:用统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述。统计描述统计描述(descriptivestatisti4

频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。

频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。频数分布表频数:当汇总大量的原始数据时,把数据按类型分组,其中5某市1997年12岁男童120人的身高(cm)

142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154147.7152.3146.6132.1145.9146.7144135.5144.4143.4137.4143.6150143.3146.5149142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.9某市1997年12岁男童120人的身高(cm)142.316(1)求极差(range):即最大值与最小值之差,又称为全距。本例极差:R=160.9-125.9=35(cm)(2)决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分8-15个组,为方便计,组距常取整数或一位小数。本例i=R/10=35/10=3.5≈4。列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。(3)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。频数表的编制步骤(1)求极差(range):即最大值与最小值之差,又称为全距71997年某市120名12岁男童身高的频数分布

段频

数频

率百分率124~10.00830.83128~20.01671.67132~100.08338.33136~220.183418.34140~370.308330.83144~260.216721.67148~150.12512.5152~40.03333.33156~20.01671.67160~10.00830.83合

计12011001997年某市120名12岁男童身高的频数分布组段频8某市120名12岁男童身高的频数分布

124132140148156164010203040某市120名12岁男童身高的频数分布124132140149频数表的分布特征①集中趋势(centraltendency):变量值集中位置。本例在组段“140~”。——集中趋势指标②离散趋势(tendencyofdispersion):变量值围绕集中位置的分布情况。本例132~148,共有114人,占95%;离“中心”位置越远,频数越小;且围绕“中心”左右对称。——离散趋势指标频数表的分布特征①集中趋势(centraltendency10120名7岁男童身高的频数分布图124132140148156164010203040人数身高(cm)120名7岁男童身高的频数分布图1241321401481511239人发汞含量的频数分布70

3

5

7

9

11

13

15

17

19

21

10

20

30

40

50

60

0

1

发汞含量(mol/kg)人数239人发汞含量的频数分布703579111312某市892名老年人生存质量自评分频数分布

0

10

20

30

40

50

60

70

80

90

100

100

200

300

0

400

自评分人数某市892名老年人生存质量自评分频数分布01020313102名黑色素瘤患者的生存时间频数分布

0

5

10

15

20

25

30

35

40

45

0

10203040

生存时间(月)人数102名黑色素瘤患者的生存时间频数分布05101514某地某年10000例死亡者年龄分布0102030405060708001000200030004000死亡年龄(岁)人数某地某年10000例死亡者年龄分布01020304050615频数分布的类型对称分布频数分布的类型对称分布16偏态分布正偏态负偏态长尾向右延伸长尾向左延伸偏态分布正偏态负偏态长尾向右延伸长尾向左延伸17频数分布表的用途揭示资料的分布类型看出频数分布的两个重要特征集中趋势离散趋势便于发现某些特大或特小的可疑值便于进一步计算指标和统计分析处理频数分布表的用途揭示资料的分布类型看出频数分布的两个重要特征18集中趋势指标1.算术均数:简称均数,是用得最多的统计描述指标。总体均数样本均数μx集中趋势指标1.算术均数:简称均数,是用得最多的统计描述19计算方法:直接法:例:10名七岁儿童体重(kg)分别为:17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5,求平均体重x=17.3+18+…25.5

10=21.35(kg)计算方法:直接法:例:10名七岁儿童体重(kg)分别为:x=20加权法:x=f1x1+f2x2+f3x3+…fnxn

f1+f2+f3+…fn=fx

f权数加权法:x=f1x1+f2x2+f3x3+…fn21均数的特性各观察值与均数之差(离均差)的总和等于零,即,各观察值的离均差平方和最小,即,均数是一组观察值最理想的代表。均数的特性各观察值与均数之差(离均差)的总和等于零,即22均数的应用:均数能全面反映全部观察值的平均数量水平,应用甚广,最适于对称分布资料,特别是正态分布资料,对于偏态资料,均数不能较好地反映其集中趋势。均数的应用:均数能全面反映全部观察值的平均数232.几何均数计算方法:G=或者G=直接法:加权法:flgx

fG=lg-12.几何均数计算方法:G=或者G=直接法:加权法:fl24例:5人的血清滴度为1:10,1:20,1:40,1:80,1:160,求平均滴度?G==40故平均滴度为1:40。例:5人的血清滴度为G==40故平均滴度为1:40。25例:某医院预防保健科用流脑疫苗为75名儿童进行免疫接种后,抗体滴度测定结果见下表,求平均滴度。抗体滴度滴度倒数xlgx频数fflgx1:440.602142.40841:880.903198.12791:16161.20412125.28611:32321.50512030.10201:64641.80621221.67441:1281282.1072510.53601:2562562.408249.6328合计--75107.767675名儿童的平均抗体滴度计算表例:某医院预防保健科用流脑疫苗为75名儿童进行免疫接种后,抗2675名儿童进行流脑疫苗免疫接种后,平均抗体滴度为1:27.3575名儿童进行流脑疫苗免疫接种后,平均抗体滴度为1:2727几何均数的应用:1.等比资料,如抗体平均滴度2.对数正态分布资料Remember!几何均数的应用:1.等比资料,如抗体平均滴度2.对数正态分布28使用几何均数时的注意点:1)观察值不能有0。2)观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。Becareful!使用几何均数时的注意点:1)观察值不能有0。2)观察值不293.中位数和百分位数中位数指将一组观察值从小到大按顺序排列,位次居中的观察值,常用M表示。反映一批观察值在位次上的平均水平。百分位数是一个位置指标,以Px表示,一个Px将总体或样本的全部观察值分为两部分。理论上有x%的观察值比它小,有(100-x)%的观察值比它大,而P50就是中位数,因此,中位数也是一个特定的百分位数。3.中位数和百分位数中位数指将一组观察值从小到大按顺序排列,30适合各种类型的资料。尤其适合于①偏态分布的资料;②资料的一端或两端有不确定数值(开口资料);③资料分布不明等。中位数和百分位数的适用条件:适合各种类型的资料。尤其适合于中位数和百分位数的适用条件:31中位数计算方法:当n为奇数时,M=当n为偶数时,M=中位数计算方法:当n为奇数时,M=当n为偶数时,M=32例:某病患者5人,其潜伏期分别为2,3,5,8,20,求中位数?n=5,M=x3=5(天)例:8名新生儿身长(cm)依次为50,51,52,53,54,56,55,58,求中位数?n=8,M=(x4+x5)/2=(53+54)/2=53.5(cm)例:某病患者5人,其潜伏期分别为2,3,5,8,20,求中位33对于频数表资料:fx为Px所在组频数i为组距ΣfL为小于L各组段的累计频数M=P50L为Px所在组的下限值对于频数表资料:fx为Px所在组频数i为组距ΣfL为小于L34组段(1)划记(2)频数,f(3)累计频数Sf(4)累计频率(%)0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8合计

3160100.0(98.1~100)160中位数=1.1+0.1x[(160x50%-72)/20]=1.14组段划记频数,f累计频数Sf累计频35组段(1)划记(2)频数,f(3)累计频数Sf(4)累计频率(%)0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8合计

3160100.0(98.1~100)160P25=0.9+0.1x[(160x25%-37)/17]=0.92P75=1.3+0.1x[(160x75%-110)/17]=1.36组段划记频数,f累计频数Sf累计频36中位数的应用:中位数常用于描述偏态资料的集中趋势,它和均数、几何均数不同的是,不是由全部观察值的数据综合得到,而只受居中变量波动的影响。中位数的应用:中位数常用于描述偏态资料的集中趋势,它和均数、37百分位数的计算直接法当

时,

。当时,

。百分位数的计算直接法38举例例根据表2.1资料求某地区434名少数民族已婚妇女现有子女数的第80%位数。本例,n=434,434×80%=347.2,,按式(人)。举例例根据表2.1资料求某地区434名少数民族已39频数表法频数表法40百分位数的应用:百分位数用于描述某个观察序列在某百分位置上的水平。常用于确定参考值范围,亦称正常值范围。正常值范围指特定健康状况的人群的解剖、生理、生化等各种数据的波动范围。常用95%范围百分位数的应用:百分位数用于描述某个观察序列在某百分位置上的41平均数平均数算术均数几何均数中位数加权均数众数平均数平均数算术均数几何均数中位数加权均数众数42组别均数甲组262930313430乙组242730333630丙组262830333630例:三组同性别、同年龄儿童的体重(kg)如下,试分析该三组资料的异同。离散趋势指标组别均数甲组262930313430乙组24273033343医学统计学第2讲-计量资料的统计描述-课件441.全距(range)(极差)优点:简单方便缺点:除了最大、最小值,不能反应组内其他数据的变异。两样本例数相差悬殊时,不适用全距比较变异度。R=max-min1.全距(range)(极差)优点:简单方便缺点452.四分位数间距:P75上四分位数P25下四分位数QUQLP100(max)P75P50(中位数)P25P0(min)Px2.四分位数间距:P75上四分位数P2546组段(1)划记(2)频数,f(3)累计频数Sf(4)累计百分率0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8合计

3160100.0(98.1~100)160P25=0.9+0.1x[(160x25%-37)/17]=0.92P75=1.3+0.1x[(160x75%-110)/17]=1.36Q=1.36-0.92=0.44组段划记频数,f累计频数Sf累计百473.方差和标准差:(X-μ)离均差平方和2SSN2=总体方差样本方差自由度3.方差和标准差:(X-μ)离均差平方和2SSN2=48标准差(standarddeviation)即方差的正平方根;其单位与原变量X的单位相同。标准差(standarddeviation)即方差的正平49例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数50盘编号甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合计250025002500126040012510001250250标准差50.9915.817.91盘编号甲乙丙甲2乙2丙21440480490193600251标准差的用途:①表示观察值的离散度。(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好)②结合均数描述正态分布特征。③计算标准误、变异系数等。④估计正常值范围标准差的用途:①表示观察值的离散度。(越大说明围绕均数越离524.变异系数:①比较单位不同的多组资料的变异度②比较均数相差悬殊的多组资料的变异度均数标准差变异系数青年男子身高170cm6cm3.5%体重60kg7kg11.7%4.变异系数:①比较单位不同的多组资料的变异度均数53平均数与变异度的关系它们都是定量资料统计描述的两个指标,分别描述集中趋势与离散趋势分布越集中,变异度越小,平均数代表性就越好;反之,变异度大,代表性就越差。平均数与变异度的关系它们都是定量资料统计描述的两个指标,分别54集中趋势指标的正确应用算数均数:适用于单峰对称分布资料;几何均数:适合于作对数变换后单峰对称分布资料;中位数和百分位数:适用于任何分布的资料;中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。不同质的资料应考虑分别计算平均数。集中趋势指标的正确应用算数均数:适用于单峰对称分布资料;55离散趋势指标的正确应用极差不稳定,不灵敏标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、概括地、平均地描述了变量值的离散程度。在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。离散趋势指标的正确应用极差不稳定,不灵敏56平均数与变异度均数±标准差(min,max)中位数±四分位数间距(min,max)变异度小,则均数代表性好!变异度大,数据分散,则均数代表性差!平均数所表示的集中性与变异度所表示的离散性,从两个不同的角度阐明计量资料的特征!平均数与变异度均数±标准差(min,max)57总结每个观察指标均有其特定的变异规律;描述变异:图形描述:直方图(频数表)统计量描述平均数:均数、几何均数、中位数变异度:标准差、四分位数间距、变异系数、极差不同分布的指标,用不同的统计量描述;用平均数与变异度共同描述。总结每个观察指标均有其特定的变异规律;58第二章定量资料的统计描述第二章定量资料的统计描述59个体变异是同质观察对象间表现出的差异。变异是生物体在一种或多种、已知或未知的不可控因素作用下所产生的综合反映。就每个观察单位而言,其观察指标的变异是不可预测的,或者说是随机的(random)。就总体而言,个体变异是有规律的。个体变异是同质观察对象间表现出的差异。就每个观察单位而言,其60变异规律的体现:分布(distribution)何为分布?熊猫分布在温暖多雨的山区,尤以中国西南部刀鱼分布在长江下游水域

长寿村的由来变异规律的体现:分布(distribution)何为分布?熊61统计描述统计描述(descriptivestatistics)统计分析统计推断(inferentialstatistics)统计描述:用统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述。统计描述统计描述(descriptivestatisti62

频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。

频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。频数分布表频数:当汇总大量的原始数据时,把数据按类型分组,其中63某市1997年12岁男童120人的身高(cm)

142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154147.7152.3146.6132.1145.9146.7144135.5144.4143.4137.4143.6150143.3146.5149142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.9某市1997年12岁男童120人的身高(cm)142.3164(1)求极差(range):即最大值与最小值之差,又称为全距。本例极差:R=160.9-125.9=35(cm)(2)决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分8-15个组,为方便计,组距常取整数或一位小数。本例i=R/10=35/10=3.5≈4。列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。(3)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。频数表的编制步骤(1)求极差(range):即最大值与最小值之差,又称为全距651997年某市120名12岁男童身高的频数分布

段频

数频

率百分率124~10.00830.83128~20.01671.67132~100.08338.33136~220.183418.34140~370.308330.83144~260.216721.67148~150.12512.5152~40.03333.33156~20.01671.67160~10.00830.83合

计12011001997年某市120名12岁男童身高的频数分布组段频66某市120名12岁男童身高的频数分布

124132140148156164010203040某市120名12岁男童身高的频数分布1241321401467频数表的分布特征①集中趋势(centraltendency):变量值集中位置。本例在组段“140~”。——集中趋势指标②离散趋势(tendencyofdispersion):变量值围绕集中位置的分布情况。本例132~148,共有114人,占95%;离“中心”位置越远,频数越小;且围绕“中心”左右对称。——离散趋势指标频数表的分布特征①集中趋势(centraltendency68120名7岁男童身高的频数分布图124132140148156164010203040人数身高(cm)120名7岁男童身高的频数分布图1241321401481569239人发汞含量的频数分布70

3

5

7

9

11

13

15

17

19

21

10

20

30

40

50

60

0

1

发汞含量(mol/kg)人数239人发汞含量的频数分布703579111370某市892名老年人生存质量自评分频数分布

0

10

20

30

40

50

60

70

80

90

100

100

200

300

0

400

自评分人数某市892名老年人生存质量自评分频数分布01020371102名黑色素瘤患者的生存时间频数分布

0

5

10

15

20

25

30

35

40

45

0

10203040

生存时间(月)人数102名黑色素瘤患者的生存时间频数分布05101572某地某年10000例死亡者年龄分布0102030405060708001000200030004000死亡年龄(岁)人数某地某年10000例死亡者年龄分布01020304050673频数分布的类型对称分布频数分布的类型对称分布74偏态分布正偏态负偏态长尾向右延伸长尾向左延伸偏态分布正偏态负偏态长尾向右延伸长尾向左延伸75频数分布表的用途揭示资料的分布类型看出频数分布的两个重要特征集中趋势离散趋势便于发现某些特大或特小的可疑值便于进一步计算指标和统计分析处理频数分布表的用途揭示资料的分布类型看出频数分布的两个重要特征76集中趋势指标1.算术均数:简称均数,是用得最多的统计描述指标。总体均数样本均数μx集中趋势指标1.算术均数:简称均数,是用得最多的统计描述77计算方法:直接法:例:10名七岁儿童体重(kg)分别为:17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5,求平均体重x=17.3+18+…25.5

10=21.35(kg)计算方法:直接法:例:10名七岁儿童体重(kg)分别为:x=78加权法:x=f1x1+f2x2+f3x3+…fnxn

f1+f2+f3+…fn=fx

f权数加权法:x=f1x1+f2x2+f3x3+…fn79均数的特性各观察值与均数之差(离均差)的总和等于零,即,各观察值的离均差平方和最小,即,均数是一组观察值最理想的代表。均数的特性各观察值与均数之差(离均差)的总和等于零,即80均数的应用:均数能全面反映全部观察值的平均数量水平,应用甚广,最适于对称分布资料,特别是正态分布资料,对于偏态资料,均数不能较好地反映其集中趋势。均数的应用:均数能全面反映全部观察值的平均数812.几何均数计算方法:G=或者G=直接法:加权法:flgx

fG=lg-12.几何均数计算方法:G=或者G=直接法:加权法:fl82例:5人的血清滴度为1:10,1:20,1:40,1:80,1:160,求平均滴度?G==40故平均滴度为1:40。例:5人的血清滴度为G==40故平均滴度为1:40。83例:某医院预防保健科用流脑疫苗为75名儿童进行免疫接种后,抗体滴度测定结果见下表,求平均滴度。抗体滴度滴度倒数xlgx频数fflgx1:440.602142.40841:880.903198.12791:16161.20412125.28611:32321.50512030.10201:64641.80621221.67441:1281282.1072510.53601:2562562.408249.6328合计--75107.767675名儿童的平均抗体滴度计算表例:某医院预防保健科用流脑疫苗为75名儿童进行免疫接种后,抗8475名儿童进行流脑疫苗免疫接种后,平均抗体滴度为1:27.3575名儿童进行流脑疫苗免疫接种后,平均抗体滴度为1:2785几何均数的应用:1.等比资料,如抗体平均滴度2.对数正态分布资料Remember!几何均数的应用:1.等比资料,如抗体平均滴度2.对数正态分布86使用几何均数时的注意点:1)观察值不能有0。2)观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。Becareful!使用几何均数时的注意点:1)观察值不能有0。2)观察值不873.中位数和百分位数中位数指将一组观察值从小到大按顺序排列,位次居中的观察值,常用M表示。反映一批观察值在位次上的平均水平。百分位数是一个位置指标,以Px表示,一个Px将总体或样本的全部观察值分为两部分。理论上有x%的观察值比它小,有(100-x)%的观察值比它大,而P50就是中位数,因此,中位数也是一个特定的百分位数。3.中位数和百分位数中位数指将一组观察值从小到大按顺序排列,88适合各种类型的资料。尤其适合于①偏态分布的资料;②资料的一端或两端有不确定数值(开口资料);③资料分布不明等。中位数和百分位数的适用条件:适合各种类型的资料。尤其适合于中位数和百分位数的适用条件:89中位数计算方法:当n为奇数时,M=当n为偶数时,M=中位数计算方法:当n为奇数时,M=当n为偶数时,M=90例:某病患者5人,其潜伏期分别为2,3,5,8,20,求中位数?n=5,M=x3=5(天)例:8名新生儿身长(cm)依次为50,51,52,53,54,56,55,58,求中位数?n=8,M=(x4+x5)/2=(53+54)/2=53.5(cm)例:某病患者5人,其潜伏期分别为2,3,5,8,20,求中位91对于频数表资料:fx为Px所在组频数i为组距ΣfL为小于L各组段的累计频数M=P50L为Px所在组的下限值对于频数表资料:fx为Px所在组频数i为组距ΣfL为小于L92组段(1)划记(2)频数,f(3)累计频数Sf(4)累计频率(%)0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8合计

3160100.0(98.1~100)160中位数=1.1+0.1x[(160x50%-72)/20]=1.14组段划记频数,f累计频数Sf累计频93组段(1)划记(2)频数,f(3)累计频数Sf(4)累计频率(%)0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8合计

3160100.0(98.1~100)160P25=0.9+0.1x[(160x25%-37)/17]=0.92P75=1.3+0.1x[(160x75%-110)/17]=1.36组段划记频数,f累计频数Sf累计频94中位数的应用:中位数常用于描述偏态资料的集中趋势,它和均数、几何均数不同的是,不是由全部观察值的数据综合得到,而只受居中变量波动的影响。中位数的应用:中位数常用于描述偏态资料的集中趋势,它和均数、95百分位数的计算直接法当

时,

。当时,

。百分位数的计算直接法96举例例根据表2.1资料求某地区434名少数民族已婚妇女现有子女数的第80%位数。本例,n=434,434×80%=347.2,,按式(人)。举例例根据表2.1资料求某地区434名少数民族已97频数表法频数表法98百分位数的应用:百分位数用于描述某个观察序列在某百分位置上的水平。常用于确定参考值范围,亦称正常值范围。正常值范围指特定健康状况的人群的解剖、生理、生化等各种数据的波动范围。常用95%范围百分位数的应用:百分位数用于描述某个观察序列在某百分位置上的99平均数平均数算术均数几何均数中位数加权均数众数平均数平均数算术均数几何均数中位数加权均数众数100组别均数甲组262930313430乙组242730333630丙组262830333630例:三组同性别、同年龄儿童的体重(kg)如下,试分析该三组资料的异同。离散趋势指标组别均数甲组262930313430乙组242730333101医学统计学第2讲-计量资料的统计描述-课件1021.全距(range)(极差)优点:简单方便缺点:除了最大、最小值,不能反应组内其他数据的变异。两样本例数相差悬殊时,不适用全距比较变异度。R=max-min1.全距(range)(极差)优点:简单方便缺点1032.四分位数间距:P75上四分位数P25下四分位数QUQLP100(max)P75P50(中位数)P25P0(min)Px2.四分位数间距:P75上四分位数P25104组段(1)划记(2)频数,f(3)累计频数Sf(4)累计百分率0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论