《预防医学》计量的统计分析课件_第1页
《预防医学》计量的统计分析课件_第2页
《预防医学》计量的统计分析课件_第3页
《预防医学》计量的统计分析课件_第4页
《预防医学》计量的统计分析课件_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量资料的统计分析第1页,共34页。练习1以下哪些属于计量资料身高的测定值体重的测定值血压的测定值脉搏数白细胞数第2页,共34页。练习2下列属于分类资料的是 A. 人群红细胞水平的实测值 B. 药物对血压的降低水平(mmHg) C. 药物治愈情况 D. 女生身高平均水平(cm) E. 药物退热速度(单位时间内体温下降的度数) 第3页,共34页。 统计推断在医学科学研究中通常应用抽样研究的方法,即对总体中随机抽取的部分观察单位(样本)进行研究,然后用样本信息推断总体特征。 统计描述是用统计图(表)、统计指标来描述资料的分布规律及其数量特征。第4页,共34页。标准正态分布示意图第5页,共34页。一

2、、概述 统计描述(descriptive statistics):是用统计指标、统计表、 统计图等方法,对资料的数量特征及其分布规律 进行测定和描述。计量资料的统计描述指标包括: (1)描述集中趋势指标 :描述数据分布中心位置 (平均水平)的指标 (2)描述离散趋势指标 :描述数据分布的离散程 度(变异程度)的指标 第6页,共34页。二、描述集中趋势指标1、算术均数(arithmetic mean) 简称均数(mean)。样本均数常用 表示,总体均数用希腊字母 表示适用条件:适用于对称分布,特别是正态或近似正态分布 的数值变量计算方法 (1)直接法:用于样本例数较少(如 n30) 第7页,共3

3、4页。(2)加权法:当样本例数较大(如 n30),可先编制频数 表,然后采用加权法求均数 频数表常分为离散型和连续型两种连续型频数表的编制步骤求全距R:R=MAX-MIN确定组距I 组距I=R/K,一般取整数 K为组数,一般取815,常取10确定组段 组段的起点和终点分别称为下限和上限关键是第 一个组段下限的确定(一般为MIN的整数部分)列出频数表 第8页,共34页。频数表的主要用途揭示频数分布的两个重要特征:集中趋势和离散 趋势揭示频数的分布类型: 对称分布 偏态分布: (1)正偏态分布:高峰位置偏向小的一侧 (2)负偏态分布:高峰位置偏向大的一侧便于发现某些特大或特小的可疑值 便于进一步计

4、算统计指标和作统计处理 第9页,共34页。加权法的计算公式其中,f为各个组段对应的频数,X为组中值 X=(下限+上限)/2 n为各个组段对应的频数之和 第10页,共34页。2、几何均数(geometric mean,简记为G) 适用条件:适用于呈偏态分布,但经对数转换后呈对称分布的资料;也适用于观察值之间呈倍数或近似倍数变化(等比关系)的资料。计算方法 (1)直接法:用于样本例数较少(如 n30) 第11页,共34页。(2)加权法:用于样本例数较大(如n30)或样 本中相同观察值较多或频数表资料 其中,f为各个组段对应的频数,X为组中值 X=(下限+上限)/2 n为各个组段对应的频数之和 第1

5、2页,共34页。3、中位数(median,简记为M) 指将一组观察值从小到大排序后居于中间位置的那个数值 适用条件:适用于偏态分布、分布不明确或分布末端 无确定数据的资料计算方法 (1)直接法:用于样本例数较少(如 n30) 第13页,共34页。(2)百分位数法:用于样本例数较大(如n30) 或样本中相同观察值较多或频数 表资料 其中,L为百分位数 Px 所在组段的下限 i 为百分位数 Px 所在组段的组距 f 为百分位数 Px 所在组段的频数 为小于 L 的各组段的累计频数 第14页,共34页。描述变异程度例:两个资料如下: A:1 3 5 7 9 11 13 B:6 6 6 7 8 8 8

6、 两资料均为对称分布,可选用均数描述平均水平,且均为7,但资料A的数据分布较资料B分散,7对资料A的代表性相对较差。第15页,共34页。变异程度是指各观察值之间参差不齐的程度,反映资料的离散趋势。 反映平均水平和变异程度的指标结合起来,全面认识事物。 常用指标:极差、四分位间距、离均差平方和、方差、标准差、变异系数等。第16页,共34页。极差(R,又称全距) 一组观察值中最大值与最小值之差,单位与观察值相同。适用于分布末端有确定数据的资料 极差越大,变异程度越大。如上例: A:1 3 5 7 9 11 13 R12 B:6 6 6 7 8 8 8 R2 优点:方法简单明了缺点:不够稳定;不能反

7、映组内其他观察值的变异情况。 如上例资料B改为: B:1 6 6 7 8 8 13 R12,则无法区分与资料A的变异程度谁大。样本含量相差较大时,不宜用极差来比较其离散程度.。 第17页,共34页。四分位数间距(quartile interval,简记为Q) 适用条件:适用于描述偏态分布、分布不明确或 分布末端无确定数据资料的离散趋势计算方法 Q=QU-QL 其中, QU=P75 QL=P25 第18页,共34页。A:1 3 5 7 9 11 13 B:1 6 6 7 8 8 13 由于极差不能反映每个观察值对数据变异程度的影响,拟改用离均差之和(每个观察值与均数的差称为离均差) 由于离均差有

8、正有负,离均差之和肯定为0。 改用离均差平方和: A资料(17)2(37)2(137)2112 B资料(17)2(67)2(137)272 离均差平方和能反映每一个观察值对变异程度的影响,但还有不足。把资料B作如下修改: B:1 66 7 88 13(共40个6和40个8) 计算离均差平方和得:(17)2(137)2152 离均差平方和不能消除观察值个数对指标的影响。第19页,共34页。将离均差平方和进一步修改,考虑观察值个数对指标的影响,得方差: 总体方差2 : 样本方差 : 资料A: =18.66,资料B: =1.85 方差的优点:可以反映每个观察值对变异程度的影响;考虑了观察值个数对指标

9、的影响。 方差仍有不足:单位是原观察值单位的平方。 进一步修改,得标准差: 总体标准差 : 第20页,共34页。样本标准差S 直接法:用于样本例数较少(如 n30)加权法:用于样本例数较大的频数表资料 第21页,共34页。 资料A: S =4.32, 资料B: S =1.36标准差越大,变异程度越大,数据越分散。 标准差的优点: 可以反映每个观察值对变异程度的影响 考虑了观察值个数对指标的影响单位与观察值相同适用于对称分布的资料,通常与均数结合使用。 第22页,共34页。标准差的用途 反映观察值间的离散程度(变异程度)衡量均数的代表性结合均数描述正态分布的特征结合均数估计医学参考值范围(正常值

10、范围)结合样本含量 n 计算标准误、变异系数 第23页,共34页。变异系数(coefficient of variation,简记为CV)适用条件比较度量衡单位不同的两组或多组资料的变 异程度比较均数相差悬殊的两组或多组资料的变异 程度 计算方法 第24页,共34页。描述计量资料的指标的正确选择: 对称分布的资料:均数和标准差 偏态分布的资料:中位数和四分位数间距 等比级数或对数正态分布的资料: 几何均数第25页,共34页。小结频数表的绘制描述集中趋势的指标描述离散趋势的指标第26页,共34页。练习均数是表示变量值的()平均水平变化范围频数分布相互间差别大小离散趋势第27页,共34页。练习二计算中位数时,要求()组距相等组距相等或不等数据分布对称数据呈对数正态分布数据呈标准正态分布第28页,共34页。练习三描述一组偏态分布资料的平均水平,以下列哪个指标较好()算术均数几何均数百分位数四分位数间距中位数第29页,共34页。练习计算某抗体滴度的平均水平,一般宜选择()算术平均数几何均数中位数百分位数极差第30页,共34页。练习当原始数据分布不明时,表示其集中趋势的指标()用几何均数合理用均数合理用中位数和均数都合理用几何均数和中位数都合理用中位数合理第31页,共34页。练习频数分布的两个重要特征是(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论