医学统计学完全(课件分享)_第1页
医学统计学完全(课件分享)_第2页
医学统计学完全(课件分享)_第3页
医学统计学完全(课件分享)_第4页
免费预览已结束,剩余651页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学完全(课件分享) 作者:作者:Dr.FengDr.Feng 医学统计学完全(课件分享) 医学统计学完全(课件分享)2 医学统计学总目录医学统计学总目录 q 第第1 q 第第2章定量资料统计描述章定量资料统计描述 q 第第3章总体均数的区间估计和假设检验章总体均数的区间估计和假设检验 q 第第4章方差分析章方差分析 q 第第5章定性资料的统计描述章定性资料的统计描述 q 第第6章总体率的区间估计和假设检验章总体率的区间估计和假设检验 q 第第7章二项分布与泊松分布章二项分布与泊松分布 q 第第8章秩和检验章秩和检验 q 第第9章直线相关与回归章直线相关与回归 q 第第10章实验设计章实

2、验设计 q 第第11章调查设计章调查设计 q 第第12章统计表与统计图章统计表与统计图 医学统计学完全(课件分享)3 第第1章绪论章绪论 目录目录 q 第五节第五节 学习统计学应注意的几个问题学习统计学应注意的几个问题 q 第二节第二节 统计工作的基本步骤统计工作的基本步骤 q 第三节第三节 统计资料的类型统计资料的类型 q 第四节第四节 统计学中的几个基本概念统计学中的几个基本概念 q 第一节第一节 医学医学统计学的定义和内容统计学的定义和内容 医学统计学完全(课件分享)4 第一章第一章 绪论绪论 第一节第一节 医学统计学的定义和内容医学统计学的定义和内容 医学统计学医学统计学(medica

3、l statistics)(medical statistics) - -是以医学理论为指导,是以医学理论为指导, 运用数理统计学的原理和方法研究医学资料的搜集、整理与分运用数理统计学的原理和方法研究医学资料的搜集、整理与分 析,从而掌握事物内在客观规律的一门学科。析,从而掌握事物内在客观规律的一门学科。 医学统计学完全(课件分享)5 医学研究的对象医学研究的对象-主要是人以及与其健康有关的各种影响因主要是人以及与其健康有关的各种影响因 素。素。 医学统计学的主要内容医学统计学的主要内容 : : 1.1.统计设计统计设计 包括实验设计和调查设计,它可以合理地、科学地包括实验设计和调查设计,它可

4、以合理地、科学地 安排实验和调查工作,使之能较少地花费人力、物力和时间,安排实验和调查工作,使之能较少地花费人力、物力和时间, 取得较满意和可靠的结果。取得较满意和可靠的结果。 2.2.资料的统计描述和总体指标的估计资料的统计描述和总体指标的估计 通过计算各种统计指标和通过计算各种统计指标和 统计图表来描述资料的集中趋势、离散趋势和分布特征况(如统计图表来描述资料的集中趋势、离散趋势和分布特征况(如 正态分布或偏态分布);利用样本指标来估计总体指标的大小。正态分布或偏态分布);利用样本指标来估计总体指标的大小。 医学统计学完全(课件分享)6 3.3.假设检验假设检验 是通过统计检验方法(如是通

5、过统计检验方法(如t t检验、检验、u u检验、检验、F F检验、检验、 卡方检验、秩和检验等)来推断两组或多组统计指标的差异是卡方检验、秩和检验等)来推断两组或多组统计指标的差异是 抽样误差造成的还是有本质的差别。抽样误差造成的还是有本质的差别。 4.4.相关与回归相关与回归 医学中存在许多相互联系、相互制约的现象。如医学中存在许多相互联系、相互制约的现象。如 儿童的身高与体重、胸围与肺活量、血糖与尿糖等,都需要利儿童的身高与体重、胸围与肺活量、血糖与尿糖等,都需要利 用相关与回归来分析。用相关与回归来分析。 医学统计学完全(课件分享)7 5. 5.多因素分析多因素分析 如多元回归、判别分析

6、、聚类分析、正交设计如多元回归、判别分析、聚类分析、正交设计 分析、主成分分析、因子分析、分析、主成分分析、因子分析、logisticlogistic回归、回归、CoxCox比例风险比例风险 回归等,都是分析医学中多因素有效的方法(本书不涉及,请回归等,都是分析医学中多因素有效的方法(本书不涉及,请 参考有关统计书籍)。这些方法计算复杂,大部分需借助计算参考有关统计书籍)。这些方法计算复杂,大部分需借助计算 机来完成。机来完成。 6.6.健康统计健康统计 研究人群健康的指标与统计方法,除了用上述的研究人群健康的指标与统计方法,除了用上述的 某些方法外,他还有其特有的方法,如寿命表、生存分析、死

7、某些方法外,他还有其特有的方法,如寿命表、生存分析、死 因分析、人口预测等方法因分析、人口预测等方法 医学统计学完全(课件分享)8 医学统计工作可分为四个步骤:医学统计工作可分为四个步骤: 统计设计、搜集资料、整理资料和分析资料。统计设计、搜集资料、整理资料和分析资料。 这四个步骤密切联系,缺一不可,任何一个步骤的缺陷和失误,这四个步骤密切联系,缺一不可,任何一个步骤的缺陷和失误, 都会影响统计结果的正确性。都会影响统计结果的正确性。 第二节第二节 统计工作的基本步骤统计工作的基本步骤 医学统计学完全(课件分享)9 设计(设计(designdesign)是统计工作的第一步,也是关键的一步,是对

8、是统计工作的第一步,也是关键的一步,是对 统计工作全过程的设想和计划安排。统计工作全过程的设想和计划安排。 统计设计统计设计就是根据研究目的确定试验因素、受试对象和就是根据研究目的确定试验因素、受试对象和 观察指标,并在现有的客观条件下决定用什么方式和方法来获观察指标,并在现有的客观条件下决定用什么方式和方法来获 取原始资料,并对原始资料如何进行整理,以及整理后的资料取原始资料,并对原始资料如何进行整理,以及整理后的资料 应该计算什么统计指标和统计分析的预期结果如何等。应该计算什么统计指标和统计分析的预期结果如何等。 一、统计设计一、统计设计 医学统计学完全(课件分享)10 搜集资料搜集资料(

9、collection of date) 是根据设计的要求,获取准是根据设计的要求,获取准 确可靠的原始资料,是统计分析结果可靠的重要保证。确可靠的原始资料,是统计分析结果可靠的重要保证。 医学统计资料的来源主要有以下三个方面:医学统计资料的来源主要有以下三个方面: 1.统计报表统计报表 统计报表是医疗卫生机构根据国家规定的报告制度,统计报表是医疗卫生机构根据国家规定的报告制度, 定期逐级上报的有关报表。如法定传染病报表、出生死亡报表、定期逐级上报的有关报表。如法定传染病报表、出生死亡报表、 医院工作报表等,报表要完整、准确、及时。医院工作报表等,报表要完整、准确、及时。 二、搜集资料二、搜集资

10、料 医学统计学完全(课件分享)11 2.2.医疗卫生工作记录医疗卫生工作记录 如病历、医学检查记录、卫生监测记录等。如病历、医学检查记录、卫生监测记录等。 3.3.专题调查或实验研究专题调查或实验研究 它是根据研究目的选定的专题调查或实它是根据研究目的选定的专题调查或实 验研究,搜集资料有明确的目的与针对性。它是医学科研资料验研究,搜集资料有明确的目的与针对性。它是医学科研资料 的主要来源。的主要来源。 医学统计学完全(课件分享)12 整理资料(整理资料(sorting data)的目的就是将搜集到的原始资料进行反的目的就是将搜集到的原始资料进行反 复核对和认真检查,纠正错误,分类汇总,使其系

11、统化、条理化,复核对和认真检查,纠正错误,分类汇总,使其系统化、条理化, 便于进一步的计算和分析。整理资料的过程如下:便于进一步的计算和分析。整理资料的过程如下: 1.审核:认真检查核对,保证资料的准确性和完整性。审核:认真检查核对,保证资料的准确性和完整性。 2.分组:归纳分组,分组方法有两种:分组:归纳分组,分组方法有两种: 质量分组质量分组,即将观察单位按其类别或属性分组,如按性别、职业、,即将观察单位按其类别或属性分组,如按性别、职业、 阳性和阴性等分组。阳性和阴性等分组。 数量分组数量分组,即将观察单位按其数值的大小分组,如按年龄的大小、,即将观察单位按其数值的大小分组,如按年龄的大

12、小、 药物剂量的大小等分组。药物剂量的大小等分组。 三、整理资料三、整理资料 医学统计学完全(课件分享)13 3.汇总汇总: 分组后的资料要按照设计的要求进行分组后的资料要按照设计的要求进行 汇总,整理成统计表。原始资料较少时用手工汇汇总,整理成统计表。原始资料较少时用手工汇 总,当原始资料较多时,可使用计算机汇总。总,当原始资料较多时,可使用计算机汇总。 四、分析资料四、分析资料 分析资料分析资料(analysis of data) 是根据设计的要求,对整理后是根据设计的要求,对整理后 的数据进行统计学分析,结合专业知识,作出科学合理的解释。的数据进行统计学分析,结合专业知识,作出科学合理的

13、解释。 医学统计学完全(课件分享)14 1.1.统计描述统计描述(descriptive statistics)(descriptive statistics) 将计算出的统计指标与统计将计算出的统计指标与统计 表、统计图相结合,全面描述资料的数量特征及分布规律。表、统计图相结合,全面描述资料的数量特征及分布规律。 2.2.统计推断统计推断(inferential statistics)(inferential statistics) 使用样本信息推断总使用样本信息推断总 体特征。通过样本统计量进行总体参数的估计和假设检验,以达到体特征。通过样本统计量进行总体参数的估计和假设检验,以达到 了解

14、总体的数量特征及其分布规律,才是最终的研究目的。了解总体的数量特征及其分布规律,才是最终的研究目的。 统计分析包括以下两大内容:统计分析包括以下两大内容: 医学统计学完全(课件分享)15 v 医学统计资料按研究指标的性质一般分为定量资料、定性资料医学统计资料按研究指标的性质一般分为定量资料、定性资料 和等级资料三大类。和等级资料三大类。 一、一、定量资料定量资料 v 定量资料(定量资料(quantitative data) 亦称计量资料(亦称计量资料(measurement data),是用定量的方法测定观察单位(个体)某项指标数值),是用定量的方法测定观察单位(个体)某项指标数值 的大小,所

15、得的资料称定量资料。如身高()、体重()、的大小,所得的资料称定量资料。如身高()、体重()、 脉搏(次脉搏(次/分)、血压(分)、血压(kPa)等为数值变量,其组成的资料为)等为数值变量,其组成的资料为 定量资料。定量资料。 第三节第三节 统计资料的类型统计资料的类型 医学统计学完全(课件分享)16 v 定性资料(定性资料(qualitative dataqualitative data) 亦称计数资料亦称计数资料 (enumeration dataenumeration data)或分类资料()或分类资料(categorical datacategorical data),), 是将观察单

16、位按某种属性或类别分组,清点各组的观察单位数,是将观察单位按某种属性或类别分组,清点各组的观察单位数, 所得的资料称定性资料。所得的资料称定性资料。 v 定 性 资 料 的 观 察 指 标 为定 性 资 料 的 观 察 指 标 为 分 类 变 量 (分 类 变 量 ( c a t e g o r i c a l c a t e g o r i c a l variablevariable)。如人的性别按男、女分组;化验结果按阳性、阴。如人的性别按男、女分组;化验结果按阳性、阴 性分组;动物实验按生存、死亡分组;调查某人群的血型按性分组;动物实验按生存、死亡分组;调查某人群的血型按A A、 B

17、B、O O、ABAB分组等,观察单位出现的结果为分类变量,分类变量分组等,观察单位出现的结果为分类变量,分类变量 没有量的差别,只有质的不同,其组成的资料为定性资料。没有量的差别,只有质的不同,其组成的资料为定性资料。 二、定性资料二、定性资料 医学统计学完全(课件分享)17 三、等级资料三、等级资料 v等级资料(等级资料(ranked dataranked data)亦称有序分类资料(亦称有序分类资料(ordinal ordinal categorical datacategorical data),是将观察单位按属性的等级分组,清点各),是将观察单位按属性的等级分组,清点各 组的观察单位数

18、,所得的资料为等级资料。组的观察单位数,所得的资料为等级资料。 v如治疗结果分为治愈、显效、好转、无效四个等级。如治疗结果分为治愈、显效、好转、无效四个等级。 医学统计学完全(课件分享)18 v 根据需要,根据需要,各类变量可以互相转化各类变量可以互相转化。若按贫血的诊断标准将血。若按贫血的诊断标准将血 红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常, 可按等级资料处理。有时亦可将定性资料或等级资料数量化,如可按等级资料处理。有时亦可将定性资料或等级资料数量化,如 将等级资料的治疗结果赋以分值,分别用将等级资料的治疗结果赋以分值,

19、分别用0 0、1 1、22等表示,则等表示,则 可按定量资料处理。可按定量资料处理。 v 如调查某人群的尿糖的情况,以人为观察单位,结果可分如调查某人群的尿糖的情况,以人为观察单位,结果可分、 、五个等级。、五个等级。 医学统计学完全(课件分享)19 同质(同质(homogeneity) 是指观察单位或研究个体间被研究指标是指观察单位或研究个体间被研究指标 的主要影响因素相同或基本相同。如研究儿童的生长发育,同的主要影响因素相同或基本相同。如研究儿童的生长发育,同 性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。 变异变异(varia

20、tion) 由于生物个体的各种指标所受影响因素极由于生物个体的各种指标所受影响因素极 为复杂,同质的个体间各种指标存在差异,这种差异称为变异。为复杂,同质的个体间各种指标存在差异,这种差异称为变异。 如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。 第四节第四节 统计学中的几个基本概念统计学中的几个基本概念 一、同质与变异一、同质与变异 医学统计学完全(课件分享)20 二、总体与样本二、总体与样本 样本(样本(sample):是从总体中随机抽取的部分观察单位变量值是从总体中随机抽取的部分观察单位变量值 的集合。样本的例数称为样本含

21、量的集合。样本的例数称为样本含量(sample size)。 注意:注意: 1。总体是相对的,总体的大小是根据研究目的而确定的。总体是相对的,总体的大小是根据研究目的而确定的。 2。样本应有代表性,即应该随机抽样并有足够的样本含量。样本应有代表性,即应该随机抽样并有足够的样本含量。 医学统计学完全(课件分享)21 图示:总体与样本图示:总体与样本 医学统计学完全(课件分享)22 三、参数与统计量三、参数与统计量 参数(参数(parameterparameter): :由总体计算或得到的统计指标称为参数。由总体计算或得到的统计指标称为参数。 总体参数具有很重要的参考价值。如总体均数总体参数具有很

22、重要的参考价值。如总体均数,总体标准差,总体标准差 等。等。 统计量(统计量(statisticstatistic): :由样本计算的指标称为统计量。如样本由样本计算的指标称为统计量。如样本 均数,样本标准差均数,样本标准差s s等。等。 注意:注意:一般不容易得到参数,而容易获得样本统计量。一般不容易得到参数,而容易获得样本统计量。 医学统计学完全(课件分享)23 四、抽样误差四、抽样误差 v 抽样误差(抽样误差(sample error): 由于随机抽样所引起的由于随机抽样所引起的样本统计样本统计 量与总体参数之间的差异量与总体参数之间的差异以及样本统计量之间的差别称为抽样以及样本统计量之

23、间的差别称为抽样 误差。如样本均数与总体均数之间的差别,样本率与总体率的误差。如样本均数与总体均数之间的差别,样本率与总体率的 差别等。差别等。 v 注意:注意:抽样误差是抽样误差是不可避免的不可避免的。无论抽样抽得多么好,也会存。无论抽样抽得多么好,也会存 在抽样误差。在抽样误差。 医学统计学完全(课件分享)24 五、概率五、概率 概率(概率(probability):是描述随机事件发生可能性大小的量值。是描述随机事件发生可能性大小的量值。 用英文大写字母用英文大写字母P来表示。概率的取值范围在来表示。概率的取值范围在01之间。当之间。当P 0时,称为不可能事件;当时,称为不可能事件;当P1

24、时,称为必然事件。时,称为必然事件。 小概率事件:小概率事件:统计学上一般把统计学上一般把P0.05或或P0.01的事件称为小概的事件称为小概 率事件。率事件。 小概率原理:小概率原理:小概率事件在一次试验中几乎不可能发生。利用小概率事件在一次试验中几乎不可能发生。利用 该原理可对科研资料进行假设检验。该原理可对科研资料进行假设检验。 医学统计学完全(课件分享)25 第五节第五节 学习医学统计学应注意的问题学习医学统计学应注意的问题 v 1.1.重点掌握医学统计学的基本知识、基本技能、基本概念和基重点掌握医学统计学的基本知识、基本技能、基本概念和基 本方法,掌握使用范围和注意事项。本方法,掌握

25、使用范围和注意事项。 v 2.2.要培养科学的统计思维方法,提高分析问题、解决问题的能要培养科学的统计思维方法,提高分析问题、解决问题的能 力。力。 v 3.3.掌握调查设计和实验设计的原则,培养搜集、整理、分析统掌握调查设计和实验设计的原则,培养搜集、整理、分析统 计资料的系统工作能力。计资料的系统工作能力。 医学统计学完全(课件分享)26 课后作业课后作业 列举出计量资料、分类资料、等级资料各列举出计量资料、分类资料、等级资料各10个实例。个实例。 列举出可能事件、必然事件、不可能事件及小概率事件各列举出可能事件、必然事件、不可能事件及小概率事件各10个。个。 认真复习本章已学过的基本概念

26、认真复习本章已学过的基本概念23遍。遍。 医学统计学完全(课件分享)27 Best Wishes to All of You! Thank You for Listening! THE END 医学统计学完全(课件分享)28 医学本科生用医学本科生用 主讲主讲 王守英王守英 新乡医学院公共卫生学系综合实验室 医学统计学医学统计学 医学统计学完全(课件分享)29 第第2 2章定量资料的统计描述章定量资料的统计描述 目录目录 q 第二节第二节 集中趋势的描述集中趋势的描述 q 第三节第三节 离散趋势的描述离散趋势的描述 q 第四节第四节 正态分布正态分布 q 第一节第一节 频数分布表频数分布表 医

27、学统计学完全(课件分享)30 统计描述:是用统计图表、统计指标来描述资料的分布规律及统计描述:是用统计图表、统计指标来描述资料的分布规律及 其数量特征。其数量特征。 频数分布表频数分布表(frequency distribution table):主要由组段和频数主要由组段和频数 两部分组成表格。两部分组成表格。 第一节第一节 频数分布表频数分布表 第二章第二章 定量资料的统计描述定量资料的统计描述 医学统计学完全(课件分享)31 二、频数分布表的编制 编制步骤 : 1. 计算全距 (range): 一组变量值最大值和最小值之差称为 全距(range),亦称极差,常用R表示。 2. 确定组距(

28、class interval): 组距用i表示; 3. 划分组段: 每个组段的起点称组下限,终点称组上限。一 般分为815组。 ; 4. 统计频数: 将所有变量值通过划记逐个归入相应组段 ; 5.频率与累计频率: 将各组的频数除以n所得的比值被称为频 率。累计频率等于累计频数除以总例数。 医学统计学完全(课件分享)32 表2-2 某年某市120名12岁健康男孩身高(cm)的频数分布 身高组段 (1) 频数 (2) 频率(%) (3) 累计频数 (4) 累计频率 (%) (5) 12510.83 10.83 12943.33 54.17 133108.34 1512.50 合计120100.00

29、 医学统计学完全(课件分享)33 医学统计学完全(课件分享)34 二、频数分布表的用途二、频数分布表的用途 1.1.揭示资料的分布类型揭示资料的分布类型 2.2.观察资料的集中趋势和离散趋势观察资料的集中趋势和离散趋势 3.3.便于发现某些特大或特小的可疑值便于发现某些特大或特小的可疑值 4.4.便于进一步计算统计指标和作统计处理便于进一步计算统计指标和作统计处理 医学统计学完全(课件分享)35 医学统计学完全(课件分享)36 第二节第二节 集中趋势的描述集中趋势的描述 v集中趋势集中趋势 :代表一组同质变量值的集中趋势:代表一组同质变量值的集中趋势 或平均水平。或平均水平。 v常用的平均数有

30、算术均数、几何均数和中位数。常用的平均数有算术均数、几何均数和中位数。 v另外不常用的有:众数,调和平均数和调整均数等。另外不常用的有:众数,调和平均数和调整均数等。 医学统计学完全(课件分享)37 一、算术均数一、算术均数 算术均数算术均数 (arithmetic mean)(arithmetic mean): 简称均数。简称均数。 适用条件:适用条件:对称分布或近似对称分布的资料。对称分布或近似对称分布的资料。 习惯上以希腊字母习惯上以希腊字母表示总体均数表示总体均数(population mean)(population mean),以英文字母,以英文字母 表示样本均数表示样本均数(sa

31、mple mean)(sample mean) 医学统计学完全(课件分享)38 1. 1. 直接法:用于观察值个数不多时直接法:用于观察值个数不多时 n X X 计算方法计算方法 医学统计学完全(课件分享)39 2.2.加权法加权法(weighting method)(weighting method):用于变量值个数:用于变量值个数 较多时。较多时。 f fX fff fff k kk 21 2211 XXX X 注意:权数即频数f,为权重权衡之意。 医学统计学完全(课件分享)40 身高 (1) 组中值X (2) 频数f (3) fX (4)=(2)(3) fX2 (5)=(2)(4) 12

32、5127112716129 129131452468644 133135101350182250 合计 120 17168 2460040 表表2-4 120名名12岁健康男孩身高岁健康男孩身高(cm)均数和标准差加权法计算表均数和标准差加权法计算表 医学统计学完全(课件分享)41 医学统计学完全(课件分享)42 120名名12岁健康男孩身高均数为岁健康男孩身高均数为143.07cm。 07.143 120 17168 X 计算结果计算结果 医学统计学完全(课件分享)43 几何均数几何均数(geometric mean(geometric mean,简记为,简记为) ): :表示其平均水平。表

33、示其平均水平。 适用条件:适用条件:对于变量值呈倍数关系或呈对数正态分布对于变量值呈倍数关系或呈对数正态分布( (正偏态正偏态 分布分布) ),如抗体效价及抗体滴度,某些传染病的潜伏期,细菌,如抗体效价及抗体滴度,某些传染病的潜伏期,细菌 计数等。计数等。 计算公式:计算公式:有直接法和加权法。有直接法和加权法。 二、几何均数二、几何均数 医学统计学完全(课件分享)44 1.1.直接法:直接法: 用于用于变量值的个数变量值的个数n n较少时较少时 n n XXXXG 321 n X n XXX G n lg lg lglglg lg 1211 医学统计学完全(课件分享)45 31.116432

34、16842 6 G 31.110536. 1lg 6 64lg32lg16lg8lg4lg2lg lg 11 G 直接法计算实例直接法计算实例 医学统计学完全(课件分享)46 2.2.加权法加权法 : 用于资料中相同变量值的个数用于资料中相同变量值的个数f f(即频数)较多时。(即频数)较多时。 f Xf G lg lg 1 医学统计学完全(课件分享)47 抗体滴度 (1) 频数f (2) 滴度倒数X (3) lgX (4) flgX (5)=(2)(4) 1:4240.60201.2040 1:8680.90315.4186 1:167161.20418.4287 合计 50 89.1045

35、 表表2-5 50名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算 表表 医学统计学完全(课件分享)48 医学统计学完全(课件分享)49 55.607821. 1lg 50 1045.89 lg 11 G 50名儿童麻疹疫苗接种后平均血凝抑制抗体滴度为1:60.55。 计算结果:将有关已知数据代入公式有 医学统计学完全(课件分享)50 变量值中不能有变量值中不能有0 0; 不能同时有正值和负值;不能同时有正值和负值; 若全是负值,计算时可先把负号去掉,得出结果后再加上负号。若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 计算几何均数注意

36、事项:计算几何均数注意事项: 医学统计学完全(课件分享)51 中位数中位数 定义:定义:将一组变量值从小到大按顺序排列,位次居中的变量值称将一组变量值从小到大按顺序排列,位次居中的变量值称 为中位数为中位数( (medianmedian,简记为,简记为M M) )。 适用条件:适用条件:变量值中出现个别特小或特大的数值变量值中出现个别特小或特大的数值; ;资料的分布资料的分布 呈明显偏态,即大部分的变量值偏向一侧呈明显偏态,即大部分的变量值偏向一侧; ;变量值分布一端或两变量值分布一端或两 端无确定数值,只有小于或大于某个数值端无确定数值,只有小于或大于某个数值; ;资料的分布不清。资料的分布

37、不清。 三、中位数及百分位数三、中位数及百分位数 医学统计学完全(课件分享)52 定义:定义:百分位数百分位数( (percentilepercentile) )是一种位置指标,以是一种位置指标,以P Px x表示。百分表示。百分 位数是将频数等分为一百的分位数。一组观察值从小到大按顺序位数是将频数等分为一百的分位数。一组观察值从小到大按顺序 排列,理论上有排列,理论上有x%x%的变量值比的变量值比P Px x小,有小,有(100-(100-x x)%)%的变量值比的变量值比P Px x大。大。 故故P P50 50分位数也就是中位数,即 分位数也就是中位数,即P P50 50=M =M 。

38、百分位数百分位数 医学统计学完全(课件分享)53 v 描述一组资料在某百分位置上的水平;描述一组资料在某百分位置上的水平; v 用于确定正常值范围;用于确定正常值范围; v 计算四分位数间距。计算四分位数间距。 百分位数的应用条件:百分位数的应用条件: 医学统计学完全(课件分享)54 计算方法:有直接法和加权法计算方法:有直接法和加权法 1.1.直接法:用于例数较少时直接法:用于例数较少时 ) 2 1 ( n XM 2/ )1 2 () 2 ( nn XXM n为奇数时 n为偶数时 医学统计学完全(课件分享)55 2.2.频数表法:频数表法: 用于例数较多时用于例数较多时 ) 2 ( L m

39、f n f i LM )%( L x x fxn f i LP 中位数 百分位数 医学统计学完全(课件分享)56 潜伏期(小时) (1) 频数f (2) 累计频数 (3) 累计频率() (4) 0171711.7 6 466343.4 12 3810169.9 合计 145 表表2-6 145例食物中毒病人潜伏期分布表例食物中毒病人潜伏期分布表 医学统计学完全(课件分享)57 医学统计学完全(课件分享)58 先找到包含先找到包含PxPx的最小累计频率;的最小累计频率; 该累计频率同行左边的组段值为该累计频率同行左边的组段值为L L; L L同行右边的频数为同行右边的频数为fx(fx(或或fm)

40、fm); L L前一行的累计频数为前一行的累计频数为fLfL; 将上述已知条件代入公式计算将上述已知条件代入公式计算PxPx或或P50 P50 。 计算中位数及百分位数的步骤:计算中位数及百分位数的步骤: 医学统计学完全(课件分享)59 计算结果:计算结果: 5 .13)63%50145( 38 6 12M 51. 8)17%25145( 46 6 6 25 P 45.19)101%75145( 32 6 18 75 P 医学统计学完全(课件分享)60 定义:定义:用来说明变量值的离散程度或变异程度。用来说明变量值的离散程度或变异程度。 注意:注意:仅用集中趋势尚不能完全反映一组数据的特征。故

41、应将集中仅用集中趋势尚不能完全反映一组数据的特征。故应将集中 趋势和离散趋势结合起来才能更好地反映一组数据的特征。趋势和离散趋势结合起来才能更好地反映一组数据的特征。 常用离散指标有:常用离散指标有:极差、四分位数间距、标准差、方差、变异系数。极差、四分位数间距、标准差、方差、变异系数。 第三节第三节 离散趋势的描述离散趋势的描述 医学统计学完全(课件分享)61 甲组:甲组: 184 186 188 190 192184 186 188 190 192 乙组:乙组: 180 184 188 192 196180 184 188 192 196 两组球员的平均身高都是两组球员的平均身高都是188

42、188cmcm,但甲组球员身高比较集中,但甲组球员身高比较集中, 乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。 实例分析实例分析 医学统计学完全(课件分享)62 极差极差 极差极差(range,(range,简记为简记为R)R)亦称全距亦称全距,即一组变量值中最大值与,即一组变量值中最大值与 最小值之差最小值之差 。 特点:特点:计算简单,不稳定,不全面,易变化;可用于各种分布计算简单,不稳定,不全面,易变化;可用于各种分布 的资料。的资料。 一、极差和四分位数间距一、极差和四分位数间距 医学统计学完全(课件分享)63 四分位

43、数间距四分位数间距 公式:公式: Q= P75P25 特点:特点:比极差稳定,只反映中间两端值的差异。比极差稳定,只反映中间两端值的差异。 计算不太方便。可用于各种分布的资料。计算不太方便。可用于各种分布的资料。 医学统计学完全(课件分享)64 二、方差和标准差二、方差和标准差 方差(方差(variancevariance) N X 2 2 )( 1 )( 2 2 n XX S 总体方差总体方差 样本方差样本方差 医学统计学完全(课件分享)65 自由度自由度(degree of freedom)(degree of freedom)的概念的概念 v n-1n-1是自由度是自由度,用希腊小写字母

44、,用希腊小写字母表示,读作表示,读作nju:nju:。 v 定义:在定义:在N N维或维或N N度空间中能够自由选择的维数或度数。度空间中能够自由选择的维数或度数。 v 例:例:A AB BC C,共有,共有n=3n=3个元素,其中只能任选个元素,其中只能任选2 2个元素的值,个元素的值, 故自由度故自由度n-1=3-1=2n-1=3-1=2。 医学统计学完全(课件分享)66 方差的特点方差的特点 充分反映每个数据间的离散状况,意义深刻;充分反映每个数据间的离散状况,意义深刻; 指标稳定,应用广泛,但计算较为复杂,不易理解;指标稳定,应用广泛,但计算较为复杂,不易理解; 方差的单位与原数据不同

45、,有时使用时不太方便;方差的单位与原数据不同,有时使用时不太方便; 在方差分析中应用甚广而极为重要。在方差分析中应用甚广而极为重要。 医学统计学完全(课件分享)67 (二)标准差(二)标准差(standard deviation) (standard deviation) N X 2 )( 1 )( 2 n XX S 总体标准差总体标准差 样本标准差样本标准差 医学统计学完全(课件分享)68 牢记:离均差平方和展开式:牢记:离均差平方和展开式: n x xxxl 2 22 )( )( 医学统计学完全(课件分享)69 标准差的特点:标准差的特点: 意义同方差,是方差的开平方;意义同方差,是方差的

46、开平方; 标准差的单位与原数据相同,使用方便,意义深刻,应用广标准差的单位与原数据相同,使用方便,意义深刻,应用广 泛;故一般已作为医学生物学领域中反映变异的标准,故称泛;故一般已作为医学生物学领域中反映变异的标准,故称 标准差。标准差。 医学统计学完全(课件分享)70 标准差的计算方法:可分为直接法和加权法。标准差的计算方法:可分为直接法和加权法。 1.直接法直接法 1 )( 22 n nXX S 2.加权法加权法 1 )( 22 f ffXfX S 医学统计学完全(课件分享)71 直接法:标准差计算实例:直接法:标准差计算实例: 例例2.12 例例2.2中中7名正常男子红细胞数(名正常男子

47、红细胞数(1012/L)如下)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.92,计算其标准差。,计算其标准差。 v x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46 v x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99 医学统计学完全(课件分享)72 计算结果:计算结果: 089. 0 17 7/46.3399.159 . 2 S 医学统计学完全(课件分享)73 例例2.13 对表对表2-4资料用加权法计算资料用加权法计算120名名12岁健康男孩身高值岁健康男孩身高值

48、的标准差。的标准差。 加权法:标准差计算实例:加权法:标准差计算实例: )(70. 5 1120 120/171682460040 2 cmS 在表在表2-42-4中已算得中已算得fx=17168,fxfx=17168,fx2 2 =2460040, =2460040, 代入公式代入公式 医学统计学完全(课件分享)74 变异系数变异系数(coefficient of variation): 简记为简记为CV ; 特征:特征:变异系数为无量纲单位,可以比较不同单位指标间变异系数为无量纲单位,可以比较不同单位指标间 的变异度;的变异度;变异系数消除了均数的大小对标准差的影响,变异系数消除了均数的大

49、小对标准差的影响, 所以可以比较两均数相差较大时指标间的变异度。所以可以比较两均数相差较大时指标间的变异度。 三、变异系数三、变异系数 %100 X S CV 医学统计学完全(课件分享)75 例例2.14 2.14 某地某地2020岁男子岁男子160160人,身高均数为人,身高均数为166.06166.06cmcm,标准差为,标准差为 4.954.95cmcm; ; 体重均数为体重均数为53.7253.72kgkg, , 标准差为标准差为4.964.96kgkg。试比较身高与体重的变异程度。试比较身高与体重的变异程度。 变异系数变异系数 计算实例计算实例 医学统计学完全(课件分享)76 身高身

50、高 %98. 2%100 06.166 95. 4 CV 体重 %23. 9%100 72.53 96. 4 CV 变异系数变异系数 计算结果计算结果 医学统计学完全(课件分享)77 第四节第四节 正态分布正态分布 一、正态分布的概念和特征一、正态分布的概念和特征 v 正态分布(正态分布(normal distributionnormal distribution):):也称高斯分布,是医也称高斯分布,是医 学和生物学最常见的连续性分布。如身高、体重、红细胞数、学和生物学最常见的连续性分布。如身高、体重、红细胞数、 血红蛋白等。血红蛋白等。 医学统计学完全(课件分享)78 图图2-1 120名

51、名12岁健康男孩身高的频数分布岁健康男孩身高的频数分布 医学统计学完全(课件分享)79 正态分布的函数和图形正态分布的函数和图形 2 2 1 2 1 X e)X(f 正态分布的密度函数,即正态曲线的方程为:正态分布的密度函数,即正态曲线的方程为: 医学统计学完全(课件分享)80 图图2-2 2-2 频数分布逐渐接近正态分布示意频数分布逐渐接近正态分布示意 医学统计学完全(课件分享)81 为了应用方便,常按公式(为了应用方便,常按公式(2.192.19)作变量变换)作变量变换 X u u u值称为标准正态变量或标准正态离差,有的参考书也将值称为标准正态变量或标准正态离差,有的参考书也将u u值称

52、值称 为为z z值。值。 医学统计学完全(课件分享)82 这样将正态分布变换为标准正态分布这样将正态分布变换为标准正态分布 (standard normal distributionstandard normal distribution) 2 2 2 1 u e)u( 医学统计学完全(课件分享)83 图图2-3 正态分布的面积与纵高正态分布的面积与纵高 医学统计学完全(课件分享)84 正态分布的特征正态分布的特征 1. 集中性集中性 正态曲线的高峰位于正中央,正态曲线的高峰位于正中央, 即均数所在的位置。即均数所在的位置。 对称性对称性 正态曲线以均数为中心,左右对称,正态曲线以均数为中心,

53、左右对称, 3. 正态分布有两个参数正态分布有两个参数,即均数和标准差。,即均数和标准差。 4. 正态曲线下面积正态曲线下面积有一定的分布规律有一定的分布规律 医学统计学完全(课件分享)85 图图2-4 2-4 不同标准差的正态分布示意不同标准差的正态分布示意 医学统计学完全(课件分享)86 二、正态曲线下面积的分布规律二、正态曲线下面积的分布规律 医学统计学完全(课件分享)87 标准正态分布表(标准正态分布表(u值表)值表) v 标准正态分布曲线下的面积,由此表可查出曲线下某区间的面标准正态分布曲线下的面积,由此表可查出曲线下某区间的面 积。查表时应注意:积。查表时应注意: 表中曲线下面积为

54、表中曲线下面积为-到到u u 的下侧累计面积;的下侧累计面积; 当已知当已知、和、和X X时,先按公式(时,先按公式(2.192.19)求得)求得u u值,再查表;当值,再查表;当 和未知时,并且样本例数在和未知时,并且样本例数在100100例以上,常用样本均数和标准差例以上,常用样本均数和标准差S S分分 别代替别代替和和 ,按公式(,按公式(2.192.19)求得)求得u u值;值; 曲线下横轴上的总面积为曲线下横轴上的总面积为100%100%或或1 1 医学统计学完全(课件分享)88 例例2.162.16 前例前例2.12.1中,某年某市中,某年某市120120名名1212岁健康男孩身高

55、,已知岁健康男孩身高,已知 均数均数=143.07cm=143.07cm,标准差,标准差S S=5.70cm,=5.70cm, 估计该地估计该地1212岁健康男孩身高在岁健康男孩身高在135cm135cm以下者占该地以下者占该地1212岁男孩总岁男孩总 数的百分数;数的百分数; 估计身高界于估计身高界于135cm135cm150cm150cm范围内范围内1212岁男孩的比例;岁男孩的比例; 分别求出均数分别求出均数1 1S S、均数、均数1.961.96S S、均数、均数2.582.58S S范围内范围内1212岁岁 男孩人数占该男孩人数占该120120名男孩总数的实际百分数,说明与理论百分数

56、名男孩总数的实际百分数,说明与理论百分数 是否接近。是否接近。 医学统计学完全(课件分享)89 根据题意,按公式(根据题意,按公式(2.192.19)作)作u u变换变换 421 705 70143135 1 . . . u 221 705 07143150 2 . . . u 医学统计学完全(课件分享)90 身高范围所占面积身高范围所占面积 v 故估计该地故估计该地12男孩身高在男孩身高在135cm以下者约占以下者约占7.78; v 身高界于身高界于135cm150cm范围内者约占范围内者约占81.10。 医学统计学完全(课件分享)91 三、正态分布的应用三、正态分布的应用 制定医学参考值范

57、围制定医学参考值范围 参考值范围也称为正常值范围。医学上常把绝大数正常人的某参考值范围也称为正常值范围。医学上常把绝大数正常人的某 指标范围称为该指标的正常值范围。这里的指标范围称为该指标的正常值范围。这里的“绝大多数绝大多数”可以是可以是90、 95、99,最常用的是,最常用的是95。 质量控制质量控制 常以均数常以均数2S作为上、下警戒值,以均数作为上、下警戒值,以均数3S作为上、下控制值。作为上、下控制值。 正态分布是很多统计方法的理论基础正态分布是很多统计方法的理论基础 XX 医学统计学完全(课件分享)92 THE END THANK YOU FOR LISTENING 医学统计学完全

58、(课件分享)93 本科生用本科生用 医学统计学教案医学统计学教案 主讲主讲 王守英王守英 新乡医学院公共卫生学系综合实验室 医学统计学完全(课件分享)94 第第3 3章总体均数的区间估计和假设检验章总体均数的区间估计和假设检验 目录目录 q 第五节第五节 均数的均数的 u 检验检验 q 第二节第二节 t 分布分布 q 第三节第三节 总体均数的区间估计总体均数的区间估计 q 第四节第四节 假设检验的意义和基本步骤假设检验的意义和基本步骤 q 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 q 第六节第六节 均数的均数的 t 检验检验 q 第七节两个方差的齐性检验和第七节两个方差的齐性

59、检验和t检验检验 q 第八节第八节 型错误和型错误和型错误型错误 q 第九节第九节 应用假设检验应注意的问题应用假设检验应注意的问题 医学统计学完全(课件分享)95 图示:总体与样本图示:总体与样本 医学统计学完全(课件分享)96 一、标准误的意义及其计算一、标准误的意义及其计算 统计推断统计推断( (statistical inference) ) :根据样本信息来推论总体特征。:根据样本信息来推论总体特征。 均数的抽样误差均数的抽样误差 :由抽样引起的样本均数与总体均数的差异称为:由抽样引起的样本均数与总体均数的差异称为 均数的抽样误差。均数的抽样误差。 标准误标准误(standard e

60、rror)(standard error):反映均数抽样误差大小的指标。:反映均数抽样误差大小的指标。 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 医学统计学完全(课件分享)97 已知:已知: n X n S S X 标准误计算公式标准误计算公式 未知: 医学统计学完全(课件分享)98 实例:如某年某市120名12岁健康男孩,已求得 均数为143.07cm, 标准差为5.70cm,按公式计算,则标准误为: 52 . 0 120 70 . 5 X S 医学统计学完全(课件分享)99 1.表示抽样误差的大小 ; 2.进行总体均数的区间估计; 3.进行均数的假设检验等 。 二、标准误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论