n2计量资料描述(sun).ppt_第1页
n2计量资料描述(sun).ppt_第2页
n2计量资料描述(sun).ppt_第3页
n2计量资料描述(sun).ppt_第4页
n2计量资料描述(sun).ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 计量资料的统计描述,第一节 频数分布,一、频数分布表: 频数(frequency):不同组别内的观察 值个数称为频数,表示观察值在各组内出 现的频繁程度。 频数表:将分组标志和相应的频数列表,即为频数分布表,简称频数表。,频数表编制: 1.求全距(极差): R = MAX MIN 2.定组数和组距:一般815组为宜 i=R/组数 3.写组段:第一组段应包括MIN 最末组段应包括MAX,下限(lower limit):每个组段的起点称为该组的下限。 上限(upper limit):每个组段的终点称为该组的上限。 4.列表划记、数频数,二、频数分布图 直方图:适合描述连续型资料的频数分布。,三、用途: 1.描述频数分布类型: 对称分布:集中位置在中间。左右两侧频数基本对称。 偏态分布 正偏态分布:集中位置偏向数值较小的一侧。 负偏态分布:集中位置偏向数值较大的一侧。,2. 描述频数分布的特征: 集中趋势和离散趋势 3. 便于发现资料中的可疑值 4. 便于进一步计算统计指标和进 行统计分析。,第二节 计量资料集中趋势的描述,平均数(average):是一类描述计量资料集中位置或平均水平的统计指标。 常用的平均数算术平均数、几何均数、中位数,(一)算术均数 算术均数简称均数(mean),描述一组同质资料的平均水平。 总体均数: 样本均数: 计算方法 1.直接法:适用于样本量较小的计量资料。,2.加权法:适用于样本量较大的计量资料。,均数的应用: 1.均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本进行比较。 2.均数适用于描述单峰对称分布,特别 是正态或近似正态分布资料的集中趋势。,(二 )几何均数(geometric mean) 计算方法 1.直接法:适用于样本量较小的计量资 料。 或,2.加权法:适用于样本量较大的计量资料,如频数表资料。,几何均数的应用注意事项 1.几何均数常用于等比资料或对数正态分布资料,如血清抗体滴度、细菌计数等。 2.观察值中若有0或负值,则不宜直接使用几何均数。 3.观察值一般不能同时有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。,(三)中位数(median) 中位数是将一组观察值按大小顺序排列后, 位次居中的观察值。 计算方法 1.直接法:适用于样本量较小的计量资料。 当 为奇数时 当 为偶数时,2.频数表法(百分位数法):适用于样本量较大的计量资料,如频数表资料。,中位数的应用注意事项 1.中位数可用于各种分布的资料。 2.中位数不受极端值的影响,因此,实际工作中主要用于: (1)偏态分布资料 (2)端点无确切值的资料 (3)分布不明确的资料,百分位数,1.定义:百分位数(percentile)是指将观 察值从小到大排列后处于第x百分位置上的 数值。用符号表示为 ,它是个位置指标。 2.计算方法:,0 P25 P50 P75 100%,第三节 计量资料离散趋势的描述,公式:R=Mix-Min 性质:R大(小) 变异度大(小),(一)极差(全距)(range),应用:适用于任何分布的计量资料 (端点无确切值者除外) 优点:简单明了,应用广泛,如用于说明传染病 、食物中毒等的最短、最长潜伏期等。,缺点: a.除Max和Min外,不能反映组内其它数据 变异度 。 b. 极差抽样误差大,受两个极端值影响, 不够稳定,通常只用于资料的粗略分析和小样本数据。,(二)四分位数间距(quartile,简记为Q 公式: 性质: Q 越大,说明数据的变异越大; 反之,Q 越小,说明变异越小。 应用:适用于任何分布的计量资料,计 算结果较稳定,尤其适用于大样本偏态 分布资料。,Q=P75-P25,特点:比极差稳定,但仍未考虑到每个观察值的 变 异度,在统计分析中应用得不普遍。,(三)方差(variance) 方差计算公式: (1)总体方差: (2)样本方差:,方差性质:方差越大说明数据变异越大 自由度(degree of freedom,简记为DF) (1)定义:随机变量能自由取值的个数 (2)计算公式:=n-限制条件个数,(四)标准差(standard deviation) 方差是用取平方后的单位来表示的, 如果原始数据用毫米汞柱表示,则方差 就是毫米汞柱的平方。在统计分析中为了 方便,通常将方差取平方根,还原成与原 始观察值单位相同的变异量度。,计算公式 (1)总体标准差: (2)样本标准差: 直接法: 或,加权法(频数表资料),性质:一组观察值的标准差愈大说明其变异程度愈大; 应用:适合于正态分布或近似正态分布的资料。标准差与正态分布有明确的关系,它与均数结合能够完整地概括一个正态分布。,式中x和 f 分别为各组段的组中值及出现的频数。,变异系数(coefficient of variation,简记为CV),又称为离散系数(coefficient of dispersion) 计算方法:,(五)变异系数,应用: a.比较度量衡单位不同的多组资料的变异程度。 b. 比较均数相差悬殊的多组 资料 的变异程度(如舒张压和收缩压 ; 儿童身高与成人身高) 。,第四节 正态分布,正态分布 简记为N(,2),1.正态分布的概率密度函数:,2.正态分布函数:与f(x)相对应的曲线下面积分布函数为F(x),为曲线下自到x面积,表达式为:,3正态分布特征: 正态密度函数曲线在横轴上方均数处最高。 正态分布以均数为中心,左右对称。 正态分布中的X取值范围理论上没有 边界。,正态分布有两个参数,即位置参数和变异参数 。 当固定后,增大,曲线沿横轴向右 移动。 减小,曲线沿横轴向左 移动。,当固定后,越大,曲线的形状越“矮胖”,表示数据分布越分散; 越小,曲线的形状越“瘦高”, 表示数据分布越集中。,正态分布曲线下的面积分布有 一定的规律。 在(-,+)内的面积约为68.27% ; 在(-1.96,+1.96)内约为95.00% ; 在(-2.58,+2.58)内约为99.00% .。,标准正态分布(standard normal distribution)是总体均数为0、标准差为1的正态分布。简记为N(0,1) 1. 标准正态分布的概率密度函数:,2.标准正态分布函数:与(u)相对应的曲线下面积分布函数为(u),为曲线下自到u的面积,表达式为: 且有 (u)=1- (-u),标准正态分布曲线下面积查表时注意 事项: (1) (和已知) (2) (和未知) 以0为中心,左右两侧曲线下对称于0的区间面积相等。,第五节 医学参考值范围 医学参考值 (reference value )也称正常值,指正常人(或动物)的解剖、生理、生化、免疫等各种指标常数。由于存在个体差异,常用正常值的波动范围来判定正常和异常。,方法: (1)百分位数法 应用:适用于任何分布,特别是偏态分布的资料。 公式:双侧1-参考值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论