chapter2定量资料的统计描述课件_第1页
chapter2定量资料的统计描述课件_第2页
chapter2定量资料的统计描述课件_第3页
chapter2定量资料的统计描述课件_第4页
chapter2定量资料的统计描述课件_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Healthstatistics卫生统计学第二章定量资料的统计描述1QualitativedataanalysisQuantitativedataanalysisStatisticaldescriptionStatisticalInferenceStatisticalInferenceStatisticaldescriptionCollectionofdataStatisticalanalysisSortingdataDesignDesignCollectionofdataSortingdataStatisticalanalysisStatisticalanalysisStatisticaldescriptionStatisticaldescriptionStatisticalInferenceStatisticalInferenceParameterEstimationHypothesisTestStatisticaldescription2

学习目标:1、熟悉频数表的划记步骤,频数表的用途。2、掌握均数、几何均数、中位数的定义、方差、标准差、变异系数的适用范围。3、掌握均数、几何均数、中位数、变异系数的计算方法。

3Outline频数分布表、频数分布图统计指标描述集中趋势的指标描述离散趋势的指标正确应用总结4定量资料?统计分析包括哪两个内容?回顾统计描述

统计推断

5

频数(frequency)在一批样本中,相同情形出现的次数称该情形的频数。频数表(frequencytable)将所有“互相排斥的情形”的频数毫无遗漏地排列在一起。由频数与组段组成。7一、离散型定量资料的频数分布如1998年某山区96名孕妇产前检查次数资料:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…4,7。这是什么类型的资料?8根据表2-1频数的分布可绘出频数分布图。图中横坐标表示产前检查次数,纵坐标表示各检查次数的孕妇例数占总孕妇数的频率(比例)。从直条高度和分布情况看出,产前检查次数分布呈负偏态分布。10二、连续型定量资料的频数分布11例2:乱七八糟的原始数据某地120名18岁~35岁健康男性居民血清铁含量,数据如下:7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.5212频数表的划记步骤:

1、找出最大值和最小值,

2、求全距,又称极差R(Range)R=最大值-最小值R=29.64-7.42=22.22

3、定组段数与组距:(1)确定组数K:根据样本例数n大小而定,一般分10-15组之间,如样本较小,可少于10组;如样本较大时,可大于10组,以能反映出分布规律为原则。14(2)定组距i:组距即组与组间的距离,一般等距分组。i=R/K(极差/组数)=22.22/10=2.222最终原则是取整、取偶数,所以本例i=2(3)定组段的上下限并划记:每个组段的起点(最小值)称为该组的下限(lowlimit),终点(最大值)称为该组的上限(upperlimit)。注意第一组段把最小值包括进去,最后一组把最大值包括进去。4、列表:统计各组段的频数:见表2-2

15表2-2120名正常成年男子血清铁含量频数表组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.00合计120100.0017频数表制表步骤1:找出最小值和最大值7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.5218R=最大值-最小值=29.64-7.42=22.22制表步骤2:计算全距(range,R)即极差19制表步骤3:确定组段数和组距组段数一般取10~15,本例取12组段组距=R/组段数=22.22/12=1.85≈220制表步骤4:列表组段划记频数6~/18~///310~/,/////612~///,/////814~//,/////,/////1216~/////,/////,/////,/////,/////2018~//,/////,/////,/////,/////,/////2720~///,/////,/////,/////1822~//,/////,/////1224~///,/////826~////428~30/1合计120最小值最大值21制表步骤4:列表组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)频率密度(%)(3)/组距6~10.8310.830.428~32.5043.331.2510~65.00108.332.5012~86.671815.003.3414~1210.003025.005.0016~2016.675041.678.3418~2722.507764.1711.2520~1815.009579.177.5022~1210.0010789.175.0024~86.6711595.833.3426~43.3311999.171.6728~3010.83120100.000.42合计120100.0022对称分布偏态分布:即分布不对称者。正偏态(峰)分布:分布的长尾在峰的右侧,又称右偏分布。负偏态(峰)分布:分布的长尾在峰的左侧,又称左偏分布。三、频数分布表的用途1、揭示资料的分布类型24图2-3某地居民238人发汞含量分布(频率密度=频率/组距)253、便于发现特大或特小的可疑值。以确定取舍。4、便于进一步选择方法计算统计指标。27第二节描述集中位置的指标平均数(Average)算术均数(Mean)几何均数(GeometricMean)中位数(Median)百分位数(Percentile)28描述集中位置的指标1:算术均数算术均数(arithmeticmean,mean,)均数适用于:对称分布的资料,尤其是正态分布资料29例2-3测得8只正常大鼠血清总酸性磷酸酶含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。求其算术均数。

=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8

=3.9075(U/L)30某地120名18岁~35岁健康男性居民血清铁含量7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.5231加权法计算均数组段(1)组中值(x0)(2)f(3)fx0(4)=(2)*(3)6~7178~932710~1166612~13810414~151218016~172034018~192751320~211837822~231227624~25820026~27410828~3029129合计120222832加权均数(weightedmean)f:组段的频数:组段的组中值,即(组段上限+组段下限)/233加权法计算均数组段(1)组中值(x0)(2)f(3)fx0(4)=(2)*(3)6~7178~932710~1166612~13810414~151218016~172034018~192751320~211837822~231227624~25820026~27410828~3029129合计120222834公式比较:原始资料频数表资料加权法35描述集中趋势的指标2:几何均数几何均数(geometricmean,G)几何均数适用于:观察值变化范围跨越多个数量级的资料,尤其对数正态分布资料。7名慢性迁延性肝炎患者的HBsAg滴度资料

1:16,1:32,1:64,1:128,1:256,1:51237抗体滴度频数(f)1:1621:3271:64111:128131:256121:5127合计52表2-452例慢性肝炎患者的HBsAg滴度资料

38加权法计算几何均数39表2-452例慢性肝炎患者的HBsAg滴度资料抗体滴度频数(f)滴度倒数(X)lgXf(lgX)1:162161.204122.408241:327321.5051510.536051:6411641.8061819.867981:128131282.1072127.393731:256122562.4082428.898881:51275122.7092718.96489合计52

108.0697740公式比较:原始资料频数表资料加权法41描述集中趋势的指标3:中位数(median,M)

是指一组观察值从小到大顺序排列后居于中间位置的数。即总数中有一半的数低于它,一半的数高于它。

42M的计算方法:小样本计算法:当n为奇数时M=x(中间)

当n为偶数时M=(中间两位)/2注:按升序排列后的如今有5名工人接触某有害物质后,引起中毒的潜伏期分别是:1天,3天,5天,4天,8天。该5位工人的平均潜伏期是多少天?43大样本频数表资料,可用百分位数法计算:百分位数(percentile,Px):它表示一组观察值按升序排列,并等分为100等份,位居第x%位置的数。其中,中位数M=P5044中位数示例9例正常人的发汞值:1.1,1.83.54.24.85.65.97.110.5

M=4.810例正常人的发汞值:1.1,1.83.54.24.85.65.97.110.516.3

M=(4.8+5.6)/2=5.245中位数示例对于某项风险较高的新手术术后的生存时间进行跟踪,共调查了7人,6人死亡之前分别生存了5天、6天、10天、16天、25天、29天,还有一人术后30天随访时仍存活。本资料属于“开口”资料。本例数据已经按从小到大的升序排列,n=7,为奇数,其中位数为16天。46中位数的适用条件中位数适用于:理论上适用于任何分布的定量资料资料,

实际上适用于:偏态分布资料;开口资料;分布类型不清的资料。

47百分位数(percentile,PX)

将N个观察值从小到大依次排列,再分成100等份,对应于X位的数值即为第X百分位数。中位数是百分位的特殊形式。同样的例子还有四分位数、十分位数等。X%

PX(100-X)%中位数是百分位的特殊形式,P50分位数就是中位数四分位数:上四分位数(

P75),下四分位数(

P25)。

描述集中趋势的指标4:百分位数48百分位数的计算公式:描述集中趋势的指标4:百分位数PX:为百分位数L:为欲求的百分位数所在组段的下限i:为该组段的组距fx:为该组段的频数n:为总频数fL:为该组段之前的累计频数49组段(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.00合计120100.0050只用平均数描述资料的弊病甲组2629303134均数30kg乙组2427303336均数30kg丙组2628303234均数30kg丙乙甲三组儿童体重的离散程度51第三节、离散程度的描述描述一组数据参差不齐的程度

52描述离散趋势的指标变异度极差(Range)四分位数间距(interquartilerange)方差(Variance)标准差(StandardDeviation)变异系数(

coefficientofvariation)53描述离散趋势的指标1:极差全距(range),极差

R=max-min极差反映反映一组数据的变化范围极差适用于:任何分布资料54计算极差:甲组2629303134乙组2427303336丙组262830323455极差优点和缺点优点:简便缺点:1.只利用了两个极端值2.n大,R也会大3.不稳定56描述离散趋势的指标2:四分位数间距P75、P25分别表示上、下四分位数四分位数间距(quartilerange)Q

=P75-P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论