定量资料统计描述2_第1页
定量资料统计描述2_第2页
定量资料统计描述2_第3页
定量资料统计描述2_第4页
定量资料统计描述2_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定量资料统计描述授课教师:殷菲第四章定量资料的统计描述

频数分布表和频数分布图集中位置的描述离散程度的描述例4.2续频数表和直方图显示:某市2005年9岁男孩的肺活量的数据分布具有两种趋势:集中趋势与离散趋势。总体中个体具有同质性:同一地区,同一年份,同一年龄,相同的性别与类似的健康状况,使得该人群的肺活量趋向同一数值,即集中趋势。例4.2续总体中个体存在差别:遗传、营养、行为、发育等各种因素在个体之间都不会完全相同。因此,某市9岁男孩的肺活量不会均取同一个数值,而是呈现或大或小的离散趋势。集中趋势与离散趋势同时存在,是总体的重要特征。因此,定量描述集中趋势和离散趋势是统计描述的重要内容。集中位置的描述

平均数:用于描述一组同质定量资料的集中位置,用来说明数据的平均水平。要求:平均数的计算和应用必须具备同质基础。example为调查城市青少年的生长发育规律,对各个年龄组城市青少年的身高和体重分别求均数,最后绘制城市青少年的生长发育曲线。平均数的计算必须具备同质基础,必须先合理分组,否则其计算毫无意义。描述集中趋势的统计指标均数几何均数中位数均数(mean)适用条件:单峰对称分布,特别是正态或近似正态分布的定量资料。均数(mean)符号:表示样本均数,希腊字母

表示总体均数。均数计算方法直接法加权法直接法计算均数43页例4.3均数计算方法直接法加权法加权法计算均数相同观察值较多时使用:X1,X2,

,Xk与f1,f2,

,fk分别为频数表资料中各组段的组中值和相应组段的频数(或相同观察值与其对应的频数)。表4.2120名9岁男孩肺活量均数的计算肺活量组段(1)频数f(2)组中值x

(3)fx(4)=(2)(3)0.980~51.0455.2251.110~51.1755.8751.240~71.3109.1701.370~141.43520.091.500~191.56529.735............均数的特征1、各观察值与均数之差(离均差)的和为0,即

均数的特征2、离均差平方和小于各观察值与其他任何数a(a≠)之差的平方和,即:使用均数应注意1、均数的适用范围。2、均数的使用只能在合理分组的基础上,对同质事物求均数。描述集中趋势的统计指标均数几何均数中位数几何均数适用条件:原始观察值呈正偏态分布,但数据经过对数变换后呈正态分布或近似正态分布的资料(抗体滴度;食品中农药含量;疾病的潜伏期)符号:用G表示表某抗体滴度原始数据作直方图表对数变换后的数据作直方图几何均数适用条件:原始观察值呈正偏态分布,但数据经过对数变换后呈正态分布或近似正态分布的资料(抗体滴度;食品中农药含量;疾病的潜伏期)符号:用G表示几何均数计算方法法1:直接法(P44例4.4)几何均数计算方法法2:加权法(P45例4.5)几何均数注意事项P45各种情况的处理方案描述集中趋势的统计指标均数几何均数中位数中位数和百分位数中位数(median):一组观察值,按由小到大顺序排列,位次居中的数值。符号:M在全部观察值中,小于和大于中位数的观察值个数相等。中位数和百分位数

百分位数(percentile):是一种位置指标,用Px表示。一个百分位数Px将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。P50就是中位数中位数和百分位数适用条件适用于任意分布的资料,尤其适用于:1、明显偏态分布的资料2、分布类型不清的资料3、分布末端无确定数据的资料example某指标测量值如下(单位:mg):0.2

0.4

4.3

5.6

6.8

9.0

>50

<0.3

0.4

4.3

5.6

6.8

9.0

9.3

0.2

0.4

4.3

>5.6

6.8

9.0

9.3

中位数和百分位数计算方法直接计算法频数表法中位数的直接计算法n为奇数时(例4.6):n为偶数时(例4.7):百分位数的直接计算法教材P48自学中位数和百分位数计算方法直接计算法频数表法频数表法步骤:1)按所分组段,从小到大计算累计频数和累计频率2)确定Px所在组段3)代入下式计算L为Px所在组段的下限i为Px所在组段的组距fx为Px所在组段的频数为小于L各组段的累计频数教材P46例4.8频数表法按所分组段,从小到大计算累计频数和累计频率确定Px所在组段

代入公式计算评分频数累计频数累计频率(%)频率范围0~220.910~0.9130~241.830.92~1.8340~373.201.84~3.2050~11188.223.21~8.2260~304821.928.23~21.9270~6311150.6821.93~50.6880~6017178.0850.69~78.0890~10048219100.0078.09~100.00表4.4219名乳腺癌患者康复期生存质量评分中位数、百分位数的应用百分位数用于描述一组数据某一百分位的位置,最常用的百分位数是P50,即中位数;也可用多个百分位数的结合来描述一组观察值的分布特征,如P25和P75合用时,反映中间50%观察值的分布情况。第四章定量资料的统计描述

频数分布表和频数分布图集中位置的描述离散程度的描述

三组同性别、同年龄儿童的体重(kg)如下:甲组2628303234乙组2427303336丙组2629303134三组同性别、同年龄儿童的体重(kg)如下:甲组2628303234乙组2427303336丙组2629303134离散趋势的统计描述

概念:反映一组同质观察值的变异程度。常用指标:极差、四分位数间距、方差、标准差和变异系数。极差(range,简记为R)概念:亦称全距,为一组同质观察值中最大值与最小值之差。它反映了个体差异的范围,全距大,说明变异度大;反之,全距小,说明变异度小。计算:全距适用条件:任何分布优点:简单明了不足:1)只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度2)样本含量越大,抽到较大或较小观察值的可能性越大,则全距可能越大,因此样本含量悬殊时不宜用全距。四分位数间距(quartile,简记为Q)涵义:为上四分位数QU(即P75)与下四分位数QL(即P25)之差。其间包括了一组观察值的一半,故四分位数间距可看成是中间50%观察值的极差。四分位数间距数值越大,变异度越大,反之,变异度越小。计算:Q=QU-QLP48例4.13四分位数间距适用条件:同百分位数优点:四分位数间距较全距稳定不足:未考虑全部观察值的变异度三组同性别、同年龄儿童的体重(kg)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论