计量资料汇总统计描述_第1页
计量资料汇总统计描述_第2页
计量资料汇总统计描述_第3页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图(1)频数表的编制。(2)频数分布的类型。(3)频数分布表的用途。2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。算术均数、几何均数、中位数。3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般 均有计量单位。常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是 频数分布表(图);另一类是

2、选用适当的统计指标。(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频 繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0, 1, 2,20个病人的天数。如描述某学校学生性别分布情况,男、女生的人数即为各自 的频数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个 组段对应一个频数。制作连续型数据频数表一般步骤如下:1. 求数据的极差(range )。R = Xmax-Xmin( 2-1 )2. 根据极差选定适当“组段”数(通常810个)。确定组段和组距。每个组段都有下限L

3、和上限U,数据x归组统一定为 Lw x <U。3. 写出组段,逐一划记。频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现 某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。1. 算术均数算术均数(arithmeticmean)简称均数,描述一组数据在数量上的平均水平。总体均数用卩表示,样本均数用 X表示,其计算方法如下:(1)直接法:直接用原始观测值计算。(2-2)n(2) 加权法:在频数表基础上计算,其中X为组中值,f为频数。一 ' fXX

4、 fX( 2-3)送f2. 几何均数几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。记为G其计算公式为:(1)直接法G廿代X(2)加权法G =lg 丄 lgX g I送f丿3. 中位数中位数(median)将一组观察值由小到大排列,数时,取位次居中的两个变量的平均值。为奇数时为偶数时(2-4)(2-5 )n为奇数时取位次居中的变量值;为偶(2-6 )(2-7 )2-1常用平均数的意义及其应用场合平均数意义应用场合应用甚广,最适用于对称分布,特别是正均数平均数量水平态分布几何均数平均增(减)倍数等比资料;对数正态分布中位数位次居中的观察值水平偏态分布;分

5、布不明;分布末端无确定值(一)反映数据变异程度大小的变异指标变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。1. 极差极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但 稳定性较差。R = Xmax "min( 2-1 )2. 百分位数与四分位数间距(1)百分位数(percentile )是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学正常参考值范围。百分位数用Px表示,Ov x v 100,如25%位数表示

6、为P25。在频数表上,百分位数的计算公式为:ixPX - Lx f n x% - ' f_x(2-8)(2)四分位数间距(inter-quartilerange )是由第3四分位数(Q3= p75)和第1四分位数(Ql= P25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极 差稳定。其计算公式:QR=Q3-Q(2-9)3. 方差方差(varianee )表示一组数据的平均离散情况,其计算公式为:S名词解释:平均数答案:平均数(average )是描述数据分布集中趋势的指标,在卫生领域中最常用的平均数指标:算术均数、几何均数和中位数。评析本题考察平均数的概念。平均数

7、是一类统计指标,并不单纯指算术均数。 描述一组偏态分布资料的变异度,以()指标较好。A. 全距B.标准差C.变异系数D.四分位数间距答案:D评析标准差和变异系数均用于描述正态分布资料的变异度,全距和四分位数间距可用 于任何资料,而四分位数间距更为稳定,故选D。 用均数和标准差可以全面描述()资料的特征。A. 正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布答案:C评析本题考察均数和标准差的应用条件。 同一资料的标准差是否一定小于均数? _ £(X _ 叮(2-10)n _14. 标准差标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相

8、同,适用于 近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为:x2 LX) nn 1L2(2-11)x X -Xn 15. 变异系数变异系数(eoeffieient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV表示,计算公式为:CV S 100 %(2-12)X平均指标和变异指标分别反映资料的不同特征,作为资料的总结性统计量,两类指标要 求一起使用。如常用 X二S或M(QR。三、典型试题分析答案:均数和标准差是两类不同性质的统计指标。标准差用于描述数据的变异程度,变 异程度大,则该值大,变异程度小,则该值小。标准差可大于均数,也可小

9、于均数。5. 试述极差、四分位数间距、标准差及变异系数的适用范围。答案:这三个指标均反映计量资料的离散程度。极差与四分位数间距可用于任何分布, 后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似 服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比 较。四、习 题一)名词解释1. 频数表 2. 算术均数 3.6. 百分位数 7. 四分位数间距 8.几何均数 4. 中位数 方差 9. 标准差5. 极差10. 变异系数(二)单项选择题1. 各观察值均加(或减)同一数后( A. 均数不变,标准差改变B.C. 两者均不变D.)。 均数改变,标准

10、差不变 两者均改变2. 比较身高和体重两组数据变异度大小宜采用( )。A. 变异系数B. 差C.极差D.标准差3. 以下指标中( )可用来描述计量资料的离散程度。A. 算术均数 B.C. 中位数D.4. 偏态分布宜用(A. 算术均数B.C. 中位数 D.几何均数标准差 描述其分布的集中趋势。标准差四分位数间距5. 各观察值同乘以一个不等于 0 的常数后,( )不变。A.算术均数B.标准差C. 几何均数D. 中位数6. ( )分布的资料,均数等于中位数。A. 对称B.左偏态C. 右偏态 D. 偏态7. 对数正态分布是一种( )分布。A. 正态B.近似正态C. 左偏态 D. 右偏态)描述其集中趋势

11、。8. 最小组段无下限或最大组段无上限的频数分布资料,可用(A. 均数B.标准差C. 中位数D.四分位数间距9. ( )小,表示用该样本均数估计总体均数的可靠性大。A. 变异系数 B. 标准差C. 标准误 D. 极差10. 血清学滴度资料最常用来表示其平均水平的指标是( A. 算术平均数 B.C. 几何均数11. 变异系数CV的数值(A. 一定大于 1C. 可大于 1 ,也可小于12. 数列 8、-3、5、0、1、D.D.中位数平均数)。4、-1B. 一定小于 1D. 定比标准差小的中位数是()。)。A. 2B. 0C. 2.5D. 0.513. 关于标准差 , 那项是错误的(A. 反映全部观

12、察值的离散程度C. 反映了均数代表性的好坏)。B.D.度量了一组数据偏离平均数的大小不会小于算术均数14. 中位数描述集中位置时 , 下面那项是错误的 A. 适合于偏态分布资料 C. 不适合等比资料15. 5 人的血清滴度为 <1:20 、1:40 、 较好( )。D.B.1:80 、)。 适合于分布不明的资料 分布末端无确定值时 , 只能用中位数 1:160 、 1 :320 描述平均滴度,用那种指标A.平均数B.几何均数C. 算术均数 D.中位数16. 数列 0、48、49、50、52、100的标准差为()。A. 50B. 26.75C. 28.90D. 70.7817. 一组变量的

13、标准差将( )。A. 随变量值的个数 n 的增大而增大B. 随变量值的个数n的增加而减小C. 随变量值之间的变异增大而增大D. 随系统误差的减小而减小18. 频数表计算中位数要求( )。A. 组距相等B.原始数据分布对称C. 原始数据为正态分布或近似正态分布D. 没有条件限制19. 一组数据中 20%为 3,60%为 2,10%为 1,10%为 0, 则平均数为( )。A. 1.5B. 1.9C. 2.1D.不知道数据的总个数 , 不能计算平均数20. 某病患者 8人的潜伏期如下 :2、3、3、3、4、5、6、30 则平均潜伏期为()。A. 均数为 7 天, 很好的代表了大多数的潜伏期B. 中

14、位数为 3 天C. 中位数为 4 天D. 中位数为3.5天,不受个别人潜伏期长的影响21. 某地调查20岁男大学生100名,身高标准差为4.09cm,体重标准差为4.10kg,比较两 者的变异程度,结果()。A. 体重变异度大B. 身高变异度较大C. 两者变异度相同D. 由单位不同,两者标准差不能直接比较(三)判断正误并简述理由1. 均数总是大于中位数。()g)如下,试(1)编制频数表,(2)求2. 均数总是比标准差大。()mg/m3ug/m3123451000 2000 3000 4000 50003. 变异系数的量纲和原量纲相同。()4. 样本均数大时,标准差也一定会大。()5. 样本量增

15、大时,极差会增大。()(四)计算题1.某卫生防疫站测得大气中的二氧化硫的浓度,用两种计量单位表示:分别计算几何均数及标准差,会发现两种不同单位得标准差相等,试解释其原因。2.尸检中测得北方成年女子80人的肾上腺重量中位数、均数和标准差。19.012.014.014.08.213.06.512.015.017.212.012.725.08.520.017.08.48.013.015.020.013.013.014.015.07.910.59.510.012.06.511.012.57.514.517.512.010.011.011.516.013.010.511.014.07.514.011.4

16、9.011.110.010.58.012.011.519.010.09.019.010.022.09.012.08.014.010.011.511.015.016.08.015.09.98.512.59.618.511.012.012.03.测得某地300名正常人尿汞值,其频数表如下。试计算均数、中位数、何者代表性较 好。表2-2 300例正常人尿汞值(卩g/L )频数表尿汞值例数尿汞值例数尿汞值例数0-4924-1648-34-2728-952-8-5832-956-212-5036-460-16-4540-564-20-2244-68-14. 有5个变量值 乙9, 10, 14 ,15,试

17、计算X及、' X - X。5. 下表为10例垂体催乳素微腺瘤经蝶手术前后的血催乳素浓度,试分别求术前、术后的均数,标准差及变异系数。应以何指标比较手术前后数据的变异情况?能说明手术前数据的变异大吗?为什么?表2-3手术前后患者血催乳素浓度(mg/ml)例号一血催乳素浓度 例号-血催乳素浓度术前术后术前术后127641626643288011075002531600280817003004324619500215539810510220926.某地微丝蚴血症者42例治疗后7年用间接荧光抗体试验测得抗体滴度如下。求平均滴度。抗体滴度的倒数10204080160例数5121375五、习题答案

18、要点(一) 名词解释1. 答案:频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0, 1 , 220个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布 区间由若干组段组成,每个组段对应一个频数。2. 答案:算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用 卩表示,样本均数用 X表示。3. 答案:几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的 水平。记为G。4. 答案:中位数(media

19、n)将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。5. 答案:极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计 算简便但稳定性较差。6. 答案:百分位数(percentile )是将n个观察值从小到大依次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。7. 答案:四分位数间距(inter-quartile range)是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。8. 答案:方差(varianee ):方差表示一组数据的平均

20、离散情况,由离均差的平方和除以样本个数得到。9. 答案:标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同, 适用于近似正态分布的资料,大样本、小样本均可,最为常用。10. 答案:变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV表示。(二)单项选择题1. B 2.A3.D 4.C5.B6.A 7.C8.C9.C10.C 11.C12.B 13.D 14.C 15.B 16.C 17.C 18.D 19.B20.D 21.D(三)判断正误并简述理由1. 错。均数和中位数的大小关系取

21、决于所描述资料的分布状况。对于负偏态的资料来说,均数大于中位数;对于正偏态的资料来说,均数小于中位数;对称分布的均数和中位数相等。2. 错。3. 错。变异系数无量纲,是一个相对数。4. 错。5. 正确。样本例数越多,抽到较大或较小变量值的可能性越大,因而极差可能越大。(四)计算题1. 答案:用第一组资料计算得几何均数为2.61 mg/m3,标准差为0.27 mg/m 3;第二组资料算得几何均数为 2605.17 ug/m 3,标准差为0.27 ug/m 3。两组资料均数不等,标准差相等,可见标准差的大小只与资料的离散程度有关,而与均数的大小无关。2. 答案:(1)编制频数表 求极差:R = X

22、 max - X min =25.0-6.5=18.5 。 根据极差确定组距为2.0,组段数为10。 编制频数表。表2-4 80名北方成年女子肾上腺重量(g)频数分布表肾上腺重量(g)组中值(X)频 数(f )fXfX2累计频数累计频率(%6.00-7.00535.00245.0056.258.00-9.0014126.001134.001923.7510.00-11.0019209.002299.003847.5012.00-13.0017221.002873.005568.7514.00-15.0012180.002700.006783.7516.00-17.00585.001445.00

23、7290.0018.00-19.00476.001444.007695.0020.00-21.00242.00882.007897.5022.00-23.00123.00529.007998.7524.00-25.00125.00625.0080100.00合计801022.0014176.0080100.00(2 )求中位数,均数和标准差。求中位数卫送 fL 1=12.0+ 20 (80 50%-38) =12.24g2 丿 17求均数X =12.78Z f求标准差S 任(XX2=' fX2 'fX 'f2=3.77g-1f3.答案:表 2-5 300例正常人尿汞值(卩g/L )频数表尿汞值(卩 g/L)组中值(X)频 数(f )累计频数累计频率(%0.00-2.00494916.334.00-6.0027762

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论