《医学统计学》完全版_第1页
《医学统计学》完全版_第2页
《医学统计学》完全版_第3页
《医学统计学》完全版_第4页
《医学统计学》完全版_第5页
已阅读5页,还剩649页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学本科生用医学本科生用医医 学学 统统 计计 学学医学统计学完全版第1页 共654页医学统计学总目录医学统计学总目录q 第第1章绪论章绪论q 第第2章定量资料统计描述章定量资料统计描述q 第第3章总体均数的区间估计和假设检验章总体均数的区间估计和假设检验q 第第4章方差分析章方差分析 q 第第5章定性资料的统计描述章定性资料的统计描述q 第第6章总体率的区间估计和假设检验章总体率的区间估计和假设检验q 第第7章二项分布与泊松分布章二项分布与泊松分布 q 第第8章秩和检验章秩和检验q 第第9章直线相关与回归章直线相关与回归q 第第10章实验设计章实验设计q 第第11章调查设计章调查设计q 第第

2、12章统计表与统计图章统计表与统计图医学统计学完全版第2页 共654页第第1章绪论章绪论 目录目录q 第五节第五节 学习统计学应注意的几个问题学习统计学应注意的几个问题q 第二节第二节 统计工作的基本步骤统计工作的基本步骤q 第三节第三节 统计资料的类型统计资料的类型q 第四节第四节 统计学中的几个基本概念统计学中的几个基本概念q 第一节第一节 医学医学统计学的定义和内容统计学的定义和内容医学统计学完全版第3页 共654页第一章第一章 绪论绪论第一节第一节 医学统计学的定义和内容医学统计学的定义和内容 医学统计学医学统计学(medical statistics)(medical statist

3、ics) - -是以是以医学理论为指导,运用数理统计学的原理和方医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理与分析,从而掌法研究医学资料的搜集、整理与分析,从而掌握事物内在客观规律的一门学科。握事物内在客观规律的一门学科。 医学统计学完全版第4页 共654页 医学研究的对象医学研究的对象-主要是人以及与其健康有关的各主要是人以及与其健康有关的各种影响因素。种影响因素。 医学统计学的主要内容医学统计学的主要内容 : :1.1.统计设计统计设计 包括实验设计和调查设计,它可以合理地、包括实验设计和调查设计,它可以合理地、科学地安排实验和调查工作,使之能较少地花费人力、科学地安

4、排实验和调查工作,使之能较少地花费人力、物力和时间,取得较满意和可靠的结果。物力和时间,取得较满意和可靠的结果。2.2.资料的统计描述和总体指标的估计资料的统计描述和总体指标的估计 通过计算各种统通过计算各种统计指标和统计图表来描述资料的集中趋势、离散趋势计指标和统计图表来描述资料的集中趋势、离散趋势和分布特征况(如正态分布或偏态分布);利用样本和分布特征况(如正态分布或偏态分布);利用样本指标来估计总体指标的大小。指标来估计总体指标的大小。 医学统计学完全版第5页 共654页3.3.假设检验假设检验 是通过统计检验方法(如是通过统计检验方法(如t t检验、检验、u u检验、检验、F F检验、

5、卡方检验、秩和检验等)来推检验、卡方检验、秩和检验等)来推断两组或多组统计指标的差异是抽样误差造成断两组或多组统计指标的差异是抽样误差造成的还是有本质的差别。的还是有本质的差别。4.4.相关与回归相关与回归 医学中存在许多相互联系、相互医学中存在许多相互联系、相互制约的现象。如儿童的身高与体重、胸围与肺制约的现象。如儿童的身高与体重、胸围与肺活量、血糖与尿糖等,都需要利用相关与回归活量、血糖与尿糖等,都需要利用相关与回归来分析。来分析。医学统计学完全版第6页 共654页 5. 5.多因素分析多因素分析 如多元回归、判别分析、聚类如多元回归、判别分析、聚类分析、正交设计分析、主成分分析、因子分析

6、、分析、正交设计分析、主成分分析、因子分析、logisticlogistic回归、回归、CoxCox比例风险回归等,都是分比例风险回归等,都是分析医学中多因素有效的方法(本书不涉及,请析医学中多因素有效的方法(本书不涉及,请参考有关统计书籍)。这些方法计算复杂,大参考有关统计书籍)。这些方法计算复杂,大部分需借助计算机来完成。部分需借助计算机来完成。 6.6.健康统计健康统计 研究人群健康的指标与统计方法,研究人群健康的指标与统计方法,除了用上述的某些方法外,他还有其特有的方除了用上述的某些方法外,他还有其特有的方法,如寿命表、生存分析、死因分析、人口预法,如寿命表、生存分析、死因分析、人口预

7、测等方法测等方法医学统计学完全版第7页 共654页 医学统计工作可分为四个步骤:医学统计工作可分为四个步骤: 统计设计、搜集资料、整理资料和分析资料。统计设计、搜集资料、整理资料和分析资料。 这四个步骤密切联系,缺一不可,任何一个步骤这四个步骤密切联系,缺一不可,任何一个步骤的缺陷和失误,都会影响统计结果的正确性。的缺陷和失误,都会影响统计结果的正确性。第二节第二节 统计工作的基本步骤统计工作的基本步骤 医学统计学完全版第8页 共654页 设计(设计(designdesign)是统计工作的第一步,也是关是统计工作的第一步,也是关键的一步,是对统计工作全过程的设想和计划键的一步,是对统计工作全过

8、程的设想和计划安排。安排。 统计设计统计设计就是根据研究目的确定试验因就是根据研究目的确定试验因素、受试对象和观察指标,并在现有的客观条素、受试对象和观察指标,并在现有的客观条件下决定用什么方式和方法来获取原始资料,件下决定用什么方式和方法来获取原始资料,并对原始资料如何进行整理,以及整理后的资并对原始资料如何进行整理,以及整理后的资料应该计算什么统计指标和统计分析的预期结料应该计算什么统计指标和统计分析的预期结果如何等。果如何等。 一、统计设计一、统计设计 医学统计学完全版第9页 共654页 搜集资料搜集资料(collection of date) 是根据设是根据设计的要求,获取准确可靠的原

9、始资料,是统计计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。分析结果可靠的重要保证。 医学统计资料的来源主要有以下三个方面:医学统计资料的来源主要有以下三个方面:1.统计报表统计报表 统计报表是医疗卫生机构根据国家统计报表是医疗卫生机构根据国家规定的报告制度,定期逐级上报的有关报表。规定的报告制度,定期逐级上报的有关报表。如法定传染病报表、出生死亡报表、医院工作如法定传染病报表、出生死亡报表、医院工作报表等,报表要完整、准确、及时。报表等,报表要完整、准确、及时。 二、搜集资料二、搜集资料医学统计学完全版第10页 共654页2.2.医疗卫生工作记录医疗卫生工作记录 如病历、医

10、学检查如病历、医学检查记录、卫生监测记录等。记录、卫生监测记录等。 3.3.专题调查或实验研究专题调查或实验研究 它是根据研究目它是根据研究目的选定的专题调查或实验研究,搜集资的选定的专题调查或实验研究,搜集资料有明确的目的与针对性。它是医学科料有明确的目的与针对性。它是医学科研资料的主要来源。研资料的主要来源。医学统计学完全版第11页 共654页 整理资料(整理资料(sorting data)的目的就是将搜集到的原始资的目的就是将搜集到的原始资料进行反复核对和认真检查,纠正错误,分类汇总,使其料进行反复核对和认真检查,纠正错误,分类汇总,使其系统化、条理化,便于进一步的计算和分析。整理资料的

11、系统化、条理化,便于进一步的计算和分析。整理资料的过程如下:过程如下:1.审核:认真检查核对,保证资料的准确性和完整性。审核:认真检查核对,保证资料的准确性和完整性。 2.分组:归纳分组,分组方法有两种:分组:归纳分组,分组方法有两种: 质量分组质量分组,即将观察单位按其类别或属性分组,如按性别、,即将观察单位按其类别或属性分组,如按性别、职业、阳性和阴性等分组。职业、阳性和阴性等分组。数量分组数量分组,即将观察单位按其数值的大小分组,如按年龄,即将观察单位按其数值的大小分组,如按年龄的大小、药物剂量的大小等分组。的大小、药物剂量的大小等分组。三、整理资料三、整理资料 医学统计学完全版第12页

12、 共654页3.汇总汇总: 分组后的资料要按照设计的要求进行分组后的资料要按照设计的要求进行汇总,整理成统计表。原始资料较少时用手工汇汇总,整理成统计表。原始资料较少时用手工汇总,当原始资料较多时,可使用计算机汇总。总,当原始资料较多时,可使用计算机汇总。四、分析资料四、分析资料 分析资料分析资料(analysis of data) 是根据设计是根据设计的要求,对整理后的数据进行统计学分析,结的要求,对整理后的数据进行统计学分析,结合专业知识,作出科学合理的解释。合专业知识,作出科学合理的解释。 医学统计学完全版第13页 共654页1.1.统计描述统计描述(descriptive statis

13、tics)(descriptive statistics) 将计算出将计算出的统计指标与统计表、统计图相结合,全面描述的统计指标与统计表、统计图相结合,全面描述资料的数量特征及分布规律。资料的数量特征及分布规律。 2.2.统计推断统计推断(inferential statistics)(inferential statistics) 使使用样本信息推断总体特征。通过样本统计量进行用样本信息推断总体特征。通过样本统计量进行总体参数的估计和假设检验,以达到了解总体的总体参数的估计和假设检验,以达到了解总体的数量特征及其分布规律,才是最终的研究目的。数量特征及其分布规律,才是最终的研究目的。 统计分

14、析包括以下两大内容:统计分析包括以下两大内容: 医学统计学完全版第14页 共654页v 医学统计资料按研究指标的性质一般分为定量资料、医学统计资料按研究指标的性质一般分为定量资料、定性资料和等级资料三大类。定性资料和等级资料三大类。一、一、定量资料定量资料v 定量资料(定量资料(quantitative data) 亦称计量资料亦称计量资料(measurement data),是用定量的方法测定观察),是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定单位(个体)某项指标数值的大小,所得的资料称定量资料。如身高()、体重()、脉搏(次量资料。如身高()、体重()、脉搏(次/分

15、)、分)、血压(血压(kPa)等为数值变量,其组成的资料为定量资)等为数值变量,其组成的资料为定量资料。料。 第三节第三节 统计资料的类型统计资料的类型 医学统计学完全版第15页 共654页v 定性资料(定性资料(qualitative dataqualitative data) 亦称计数资料亦称计数资料(enumeration dataenumeration data)或分类资料()或分类资料(categorical categorical datadata),是将观察单位按某种属性或类别分组,清点),是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料称定性资料。各组的观察单

16、位数,所得的资料称定性资料。v 定性资料的观察指标为定性资料的观察指标为分类变量(分类变量(categorical categorical variablevariable)。如人的性别按男、女分组;化验结果按。如人的性别按男、女分组;化验结果按阳性、阴性分组;动物实验按生存、死亡分组;调查阳性、阴性分组;动物实验按生存、死亡分组;调查某人群的血型按某人群的血型按A A、B B、O O、ABAB分组等,观察单位出现的分组等,观察单位出现的结果为分类变量,分类变量没有量的差别,只有质的结果为分类变量,分类变量没有量的差别,只有质的不同,其组成的资料为定性资料。不同,其组成的资料为定性资料。二、定

17、性资料二、定性资料 医学统计学完全版第16页 共654页三、等级资料三、等级资料v等级资料(等级资料(ranked dataranked data)亦称有序分类亦称有序分类资料(资料(ordinal categorical dataordinal categorical data),是),是将观察单位按属性的等级分组,清点各组将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。的观察单位数,所得的资料为等级资料。v如治疗结果分为治愈、显效、好转、无效如治疗结果分为治愈、显效、好转、无效四个等级。四个等级。 医学统计学完全版第17页 共654页v 根据需要,根据需要,各类变量

18、可以互相转化各类变量可以互相转化。若。若按贫血的诊断标准将血红蛋白分为四个等按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。有时亦可将定性常,可按等级资料处理。有时亦可将定性资料或等级资料数量化,如将等级资料的资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用治疗结果赋以分值,分别用0 0、1 1、22等表等表示,则可按定量资料处理。示,则可按定量资料处理。v 如调查某人群的尿糖的情况,以人为观如调查某人群的尿糖的情况,以人为观察单位,结果可分察单位,结果可分、五个等级。五个等级。 医学统计学完全版第1

19、8页 共654页 同质(同质(homogeneity) 是指观察单位或研究是指观察单位或研究个体间被研究指标的主要影响因素相同或基本个体间被研究指标的主要影响因素相同或基本相同。如研究儿童的生长发育,同性别、同年相同。如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿龄、同地区、同民族、健康的儿童即为同质儿童。童。 变异变异(variation) 由于生物个体的各种指标由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。如同质的儿标存在差异,这种差异称为变异。如同质的儿童身高、体重、血压、脉

20、搏等指标会有一定的童身高、体重、血压、脉搏等指标会有一定的差别。差别。第四节第四节 统计学中的几个基本概念统计学中的几个基本概念一、同质与变异一、同质与变异医学统计学完全版第19页 共654页二、总体与样本二、总体与样本 样本(样本(sample):是从总体中随机抽取的部分是从总体中随机抽取的部分观察单位变量值的集合。样本的例数称为样本观察单位变量值的集合。样本的例数称为样本含量含量(sample size)。 注意:注意: 1。总体是相对的,总体的大小是根据研究目。总体是相对的,总体的大小是根据研究目的而确定的。的而确定的。 2。样本应有代表性,即应该随机抽样并有足。样本应有代表性,即应该随

21、机抽样并有足够的样本含量。够的样本含量。 医学统计学完全版第20页 共654页图示:总体与样本图示:总体与样本医学统计学完全版第21页 共654页三、参数与统计量三、参数与统计量参数(参数(parameterparameter): :由总体计算或得到的统计由总体计算或得到的统计指标称为参数。总体参数具有很重要的参考价指标称为参数。总体参数具有很重要的参考价值。如总体均数值。如总体均数,总体标准差,总体标准差等。等。统计量(统计量(statisticstatistic): :由样本计算的指标称为由样本计算的指标称为统计量。如样本均数,样本标准差统计量。如样本均数,样本标准差s s等。等。注意:注

22、意:一般不容易得到参数,而容易获得样本一般不容易得到参数,而容易获得样本统计量。统计量。医学统计学完全版第22页 共654页四、抽样误差四、抽样误差v抽样误差(抽样误差(sample error): 由于随机抽样所由于随机抽样所引起的引起的样本统计量与总体参数之间的差异样本统计量与总体参数之间的差异以及以及样本统计量之间的差别称为抽样误差。如样本样本统计量之间的差别称为抽样误差。如样本均数与总体均数之间的差别,样本率与总体率均数与总体均数之间的差别,样本率与总体率的差别等。的差别等。v注意:注意:抽样误差是抽样误差是不可避免的不可避免的。无论抽样抽得。无论抽样抽得多么好,也会存在抽样误差。多么

23、好,也会存在抽样误差。医学统计学完全版第23页 共654页五、概率五、概率 概率(概率(probability):是描述随机事件发生可是描述随机事件发生可能性大小的量值。用英文大写字母能性大小的量值。用英文大写字母P来表示。来表示。概率的取值范围在概率的取值范围在01之间。当之间。当P0时,称时,称为不可能事件;当为不可能事件;当P1时,称为必然事件。时,称为必然事件。 小概率事件:小概率事件:统计学上一般把统计学上一般把P0.05或或P0.01的事件称为小概率事件。的事件称为小概率事件。 小概率原理:小概率原理:小概率事件在一次试验中几乎不小概率事件在一次试验中几乎不可能发生。利用该原理可对

24、科研资料进行假设可能发生。利用该原理可对科研资料进行假设检验。检验。医学统计学完全版第24页 共654页第五节第五节 学习医学统计学应注意的问题学习医学统计学应注意的问题 v1.1.重点掌握医学统计学的基本知识、基本技能、重点掌握医学统计学的基本知识、基本技能、基本概念和基本方法,掌握使用范围和注意事基本概念和基本方法,掌握使用范围和注意事项。项。v2.2.要培养科学的统计思维方法,提高分析问题、要培养科学的统计思维方法,提高分析问题、解决问题的能力。解决问题的能力。 v3.3.掌握调查设计和实验设计的原则,培养搜集、掌握调查设计和实验设计的原则,培养搜集、整理、分析统计资料的系统工作能力。整

25、理、分析统计资料的系统工作能力。 医学统计学完全版第25页 共654页课后作业课后作业 列举出计量资料、分类资料、等级资料列举出计量资料、分类资料、等级资料各各10个实例。个实例。 列举出可能事件、必然事件、不可能事列举出可能事件、必然事件、不可能事件及小概率事件各件及小概率事件各10个。个。 认真复习本章已学过的基本概念认真复习本章已学过的基本概念23遍。遍。医学统计学完全版第26页 共654页 Best Wishes to All of You! Thank You for Listening!医学统计学完全版第27页 共654页共654页医学本科生用医学本科生用主讲主讲 王守英王守英新乡

26、医学院公共卫生学系综合实验室医学统计学医学统计学医学统计学完全版第28页共654页第第2 2章定量资料的统计描述章定量资料的统计描述 目录目录q 第二节第二节 集中趋势的描述集中趋势的描述q 第三节第三节 离散趋势的描述离散趋势的描述q 第四节第四节 正态分布正态分布q 第一节第一节 频数分布表频数分布表医学统计学完全版第29页共654页 统计描述:是用统计图表、统计指标来描述资统计描述:是用统计图表、统计指标来描述资料的分布规律及其数量特征。料的分布规律及其数量特征。 频数分布表频数分布表(frequency distribution table):主要由组段和频数两部分组成表格。主要由组段

27、和频数两部分组成表格。第一节第一节 频数分布表频数分布表第二章第二章 定量资料的统计描述定量资料的统计描述医学统计学完全版第30页共654页二、频数分布表的编制 编制步骤 : 1. 计算全距 (range): 一组变量值最大值和最小值之差称为全距(range),亦称极差,常用R表示。 2. 确定组距(class interval): 组距用i表示; 3. 划分组段: 每个组段的起点称组下限,终点称组上限。一般分为815组。 ; 4. 统计频数: 将所有变量值通过划记逐个归入相应组段 ; 5.频率与累计频率: 将各组的频数除以n所得的比值被称为频率。累计频率等于累计频数除以总例数。 医学统计学完

28、全版第31页共654页表2-2 某年某市120名12岁健康男孩身高(cm)的频数分布 身高组段 (1) 频数 (2)频率(%) (3)累计频数 (4)累计频率 (%) (5)12510.83 10.8312943.33 54.17133108.34 1512.50合计120100.00医学统计学完全版第32页共654页医学统计学完全版第33页共654页二、频数分布表的用途二、频数分布表的用途 1.1.揭示资料的分布类型揭示资料的分布类型 2.2.观察资料的集中趋势和离散趋势观察资料的集中趋势和离散趋势 3.3.便于发现某些特大或特小的可疑值便于发现某些特大或特小的可疑值 4.4.便于进一步计算

29、统计指标和作统计处理便于进一步计算统计指标和作统计处理 医学统计学完全版第34页共654页医学统计学完全版第35页共654页第二节第二节 集中趋势的描述集中趋势的描述 v集中趋势集中趋势 :代表一组同质变量值的集中趋势:代表一组同质变量值的集中趋势 或平均水平。或平均水平。 v常用的平均数有算术均数、几何均数和中位数。常用的平均数有算术均数、几何均数和中位数。v另外不常用的有:众数,调和平均数和调整均另外不常用的有:众数,调和平均数和调整均数等。数等。医学统计学完全版第36页共654页一、算术均数一、算术均数算术均数算术均数 (arithmetic mean)(arithmetic mean)

30、: 简称均数。简称均数。适用条件:适用条件:对称分布或近似对称分布的资料。对称分布或近似对称分布的资料。 习惯上以希腊字母习惯上以希腊字母表示总体均数表示总体均数(population (population mean)mean),以英文字母表示样本均数,以英文字母表示样本均数(sample mean)(sample mean)医学统计学完全版第37页共654页1. 1. 直接法:用于观察值个数不多时直接法:用于观察值个数不多时 nXX计算方法计算方法医学统计学完全版第38页共654页2.2.加权法加权法(weighting method)(weighting method):用于变量值个数:

31、用于变量值个数 较多时。较多时。 ffXffffffkkk212211XXXX注意:权数即频数f,为权重权衡之意。医学统计学完全版第39页共654页 身高 (1) 组中值X (2) 频数f (3) fX(4)=(2)(3) fX2(5)=(2)(4) 125127112716129129131452468644133135101350182250合计 120 17168 2460040 表表2-4 120名名12岁健康男孩身高岁健康男孩身高(cm)均数和标准差加权法计算表均数和标准差加权法计算表 医学统计学完全版第40页共654页医学统计学完全版第41页共654页 120名名12岁健康男孩身高

32、均数为岁健康男孩身高均数为143.07cm。 07计算结果计算结果医学统计学完全版第42页共654页 几何均数几何均数(geometric mean(geometric mean,简记为,简记为) ): :表示表示其平均水平。其平均水平。 适用条件:适用条件:对于变量值呈倍数关系或呈对数正对于变量值呈倍数关系或呈对数正态分布态分布( (正偏态分布正偏态分布) ),如抗体效价及抗体滴度,如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等。某些传染病的潜伏期,细菌计数等。 计算公式:计算公式:有直接法和加权法。有直接法和加权法。 二、几何均数二、几何均数 医学统计学完全

33、版第43页共654页1.1.直接法:直接法: 用于用于变量值的个数变量值的个数n n较少时较少时 nnXXXXG321nXnXXXGnlglglglglglg1211医学统计学完全版第44页共654页31.116432168426G31.110536. 1lg664lg32lg16lg8lg4lg2lglg11G直接法计算实例直接法计算实例医学统计学完全版第45页共654页2.2.加权法加权法 : 用于资料中相同变量值的个数用于资料中相同变量值的个数f f(即频数)较多时。(即频数)较多时。 fXfGlglg1医学统计学完全版第46页共654页 抗体滴度 (1)频数f (2)滴度倒数X (3)

34、 lgX (4) flgX (5)=(2)(4) 1:4240.60201.20401:8680.90315.41861:167161.20418.4287合计 50 89.1045 表表2-5 50名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算表名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算表医学统计学完全版第47页共654页医学统计学完全版第48页共654页55.607821. 1lg501045.89lg11G50名儿童麻疹疫苗接种后平均血凝抑制抗体滴度为1:60.55。 计算结果:将有关已知数据代入公式有医学统计学完全版第49页共654页变量值中不能有变量值中不能有0 0;不能同时

35、有正值和负值;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结若全是负值,计算时可先把负号去掉,得出结果后再加上负号。果后再加上负号。计算几何均数注意事项:计算几何均数注意事项:医学统计学完全版第50页共654页中位数中位数v 定义:定义:将一组变量值从小到大按顺序排列,位次将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数居中的变量值称为中位数( (medianmedian,简记为,简记为M M) )。v适用条件:适用条件:变量值中出现个别特小或特大的数变量值中出现个别特小或特大的数值值; ;资料的分布呈明显偏态,即大部分的变量值资料的分布呈明显偏态,即大部分的变量值偏

36、向一侧偏向一侧; ;变量值分布一端或两端无确定数值,变量值分布一端或两端无确定数值,只有小于或大于某个数值只有小于或大于某个数值; ;资料的分布不清。资料的分布不清。 三、中位数及百分位数三、中位数及百分位数 医学统计学完全版第51页共654页 定义:定义:百分位数百分位数( (percentilepercentile) )是一种位置是一种位置指标,以指标,以P Px x表示。百分位数是将频数等分表示。百分位数是将频数等分为一百的分位数。一组观察值从小到大按为一百的分位数。一组观察值从小到大按顺序排列,理论上有顺序排列,理论上有x%x%的变量值比的变量值比P Px x小,小,有有(100-(1

37、00-x x)%)%的变量值比的变量值比P Px x大。故大。故P P5050分位数分位数也就是中位数,即也就是中位数,即P P5050=M=M 。 百分位数百分位数 医学统计学完全版第52页共654页v描述一组资料在某百分位置上的水平;描述一组资料在某百分位置上的水平;v用于确定正常值范围;用于确定正常值范围;v计算四分位数间距。计算四分位数间距。百分位数的应用条件:百分位数的应用条件:医学统计学完全版第53页共654页计算方法:有直接法和加权法计算方法:有直接法和加权法1.1.直接法:用于例数较少时直接法:用于例数较少时 )21(nXM2/ )12()2(nnXXMn为奇数时 n为偶数时

38、医学统计学完全版第54页共654页2.2.频数表法:频数表法: 用于例数较多时用于例数较多时 )2(LmfnfiLM)%(LxxfxnfiLP中位数百分位数医学统计学完全版第55页共654页 潜伏期(小时) (1)频数f (2)累计频数 (3) 累计频率() (4) 0171711.76 466343.412 3810169.9合计 145 表表2-6 145例食物中毒病人潜伏期分布表例食物中毒病人潜伏期分布表 医学统计学完全版第56页共654页医学统计学完全版第57页共654页先找到包含先找到包含PxPx的最小累计频率;的最小累计频率;该累计频率同行左边的组段值为该累计频率同行左边的组段值为

39、L L;L L同行右边的频数为同行右边的频数为fx(fx(或或fm)fm);L L前一行的累计频数为前一行的累计频数为fLfL;将上述已知条件代入公式计算将上述已知条件代入公式计算PxPx或或P50 P50 。计算中位数及百分位数的步骤:计算中位数及百分位数的步骤:医学统计学完全版第58页共654页计算结果:计算结果:5 .13)63%50145(38612M51. 8)17%25145(466625P45.19)101%75145(3261875P医学统计学完全版第59页共654页 定义:定义:用来说明变量值的离散程度或变异程度。用来说明变量值的离散程度或变异程度。 注意:注意:仅用集中趋势

40、尚不能完全反映一组数据的仅用集中趋势尚不能完全反映一组数据的特征。故应将集中趋势和离散趋势结合起来才能特征。故应将集中趋势和离散趋势结合起来才能更好地反映一组数据的特征。更好地反映一组数据的特征。 常用离散指标有:常用离散指标有:极差、四分位数间距、标准差、极差、四分位数间距、标准差、方差、变异系数。方差、变异系数。第三节第三节 离散趋势的描述离散趋势的描述 医学统计学完全版第60页共654页 甲组:甲组: 184 186 188 190 192184 186 188 190 192 乙组:乙组: 180 184 188 192 196180 184 188 192 196 两组球员的平均身高

41、都是两组球员的平均身高都是188188cmcm,但甲组球员,但甲组球员身高比较集中,乙组球员身高比较分散。为了身高比较集中,乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。说明离散趋势,就要用离散指标。 实例分析实例分析医学统计学完全版第61页共654页极差极差v 极差极差(range,(range,简记为简记为R)R)亦称全距亦称全距,即一组变,即一组变量值中最大值与最小值之差量值中最大值与最小值之差 。v特点:特点:计算简单,不稳定,不全面,易变化;计算简单,不稳定,不全面,易变化;可用于各种分布的资料。可用于各种分布的资料。一、极差和四分位数间距一、极差和四分位数间距 医学统计学

42、完全版第62页共654页四分位数间距四分位数间距 公式:公式: Q= P75P25 特点:特点:比极差稳定,只反映中间两端值的差异。比极差稳定,只反映中间两端值的差异。 计算不太方便。可用于各种分布的资计算不太方便。可用于各种分布的资料。料。医学统计学完全版第63页共654页二、方差和标准差二、方差和标准差 方差(方差(variancevariance) NX22)(1)(22nXXS总体方差总体方差 样本方差样本方差 医学统计学完全版第64页共654页自由度自由度(degree of freedom)(degree of freedom)的概念的概念vn-1n-1是自由度是自由度,用希腊小写

43、字母,用希腊小写字母表示,读作表示,读作nju:nju:。v定义:在定义:在N N维或维或N N度空间中能够自由选择的维数度空间中能够自由选择的维数或度数。或度数。v例:例:A AB BC C,共有,共有n=3n=3个元素,其中只能任选个元素,其中只能任选2 2个元素的值,故自由度个元素的值,故自由度n-1=3-1=2n-1=3-1=2。 医学统计学完全版第65页共654页方差的特点方差的特点充分反映每个数据间的离散状况,意义深刻;充分反映每个数据间的离散状况,意义深刻;指标稳定,应用广泛,但计算较为复杂,不指标稳定,应用广泛,但计算较为复杂,不易理解;易理解;方差的单位与原数据不同,有时使用

44、时不太方差的单位与原数据不同,有时使用时不太方便;方便;在方差分析中应用甚广而极为重要。在方差分析中应用甚广而极为重要。医学统计学完全版第66页共654页(二)标准差(二)标准差(standard deviation) (standard deviation) NX2)(1)(2nXXS总体标准差总体标准差 样本标准差样本标准差 医学统计学完全版第67页共654页牢记:离均差平方和展开式:牢记:离均差平方和展开式: nxxxxl222)()(医学统计学完全版第68页共654页标准差的特点:标准差的特点:意义同方差,是方差的开平方;意义同方差,是方差的开平方;标准差的单位与原数据相同,使用方便,

45、标准差的单位与原数据相同,使用方便,意义深刻,应用广泛;故一般已作为医意义深刻,应用广泛;故一般已作为医学生物学领域中反映变异的标准,故称学生物学领域中反映变异的标准,故称标准差。标准差。医学统计学完全版第69页共654页标准差的计算方法:可分为直接法和加权法。标准差的计算方法:可分为直接法和加权法。 1.直接法直接法 1)(22nnXXS 2.加权法加权法 1)(22fffXfXS医学统计学完全版第70页共654页直接法:标准差计算实例:直接法:标准差计算实例:例例2.12 例例2.2中中7名正常男子红细胞数(名正常男子红细胞数(1012/L)如)如下下:4.67, 4.74, 4.77,

46、4.88,4.76, 4.72, 4.92,计,计算其标准差。算其标准差。v x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46 vx2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99 医学统计学完全版第71页共654页计算结果:计算结果:089. 0177/46.3399.159.2S医学统计学完全版第72页共654页 例例2.13 对表对表2-4资料用加权法计算资料用加权法计算120名名12岁岁健康男孩身高值的标准差。健康男孩身高值的标准差。加权法:标准差计算实例:加权法:标准差计算实例:)(70. 511

47、20120/1716824600402cmS在表在表2-42-4中已算得中已算得fx=17168,fxfx=17168,fx2 2 =2460040, =2460040, 代入公式代入公式 医学统计学完全版第73页共654页 变异系数变异系数(coefficient of variation): 简记为简记为CV ; 特征:特征:变异系数为无量纲单位,可以比较变异系数为无量纲单位,可以比较不同单位指标间的变异度;不同单位指标间的变异度;变异系数消除变异系数消除了均数的大小对标准差的影响,所以可以比了均数的大小对标准差的影响,所以可以比较两均数相差较大时指标间的变异度。较两均数相差较大时指标间的

48、变异度。 三、变异系数三、变异系数%100XSCV医学统计学完全版第74页共654页 例例2.14 2.14 某地某地2020岁男子岁男子160160人,身高均数为人,身高均数为166.06166.06cmcm,标准差为,标准差为4.954.95cmcm; ; 体重均数为体重均数为53.7253.72kgkg, , 标准差为标准差为4.964.96kgkg。试比较身高与体重的。试比较身高与体重的变异程度。变异程度。变异系数变异系数 计算实例计算实例医学统计学完全版第75页共654页身高身高 %98. 2%10006.16695. 4CV 体重%23. 9%10072.5396. 4CV变异系数

49、变异系数 计算结果计算结果医学统计学完全版第76页共654页第四节第四节 正态分布正态分布一、正态分布的概念和特征一、正态分布的概念和特征v 正态分布(正态分布(normal distributionnormal distribution):):也称也称高斯分布,是医学和生物学最常见的连续性分高斯分布,是医学和生物学最常见的连续性分布。如身高、体重、红细胞数、血红蛋白等。布。如身高、体重、红细胞数、血红蛋白等。 医学统计学完全版第77页共654页图图2-1 120名名12岁健康男孩身高的频数分布岁健康男孩身高的频数分布医学统计学完全版第78页共654页 正态分布的函数和图形正态分布的函数和图形

50、22121Xe)X(f正态分布的密度函数,即正态曲线的方程为:正态分布的密度函数,即正态曲线的方程为:医学统计学完全版第79页共654页图图2-2 2-2 频数分布逐渐接近正态分布示意频数分布逐渐接近正态分布示意 医学统计学完全版第80页共654页为了应用方便,常按公式(为了应用方便,常按公式(2.192.19)作变量变换)作变量变换 Xuu u值称为标准正态变量或标准正态离差,有的参值称为标准正态变量或标准正态离差,有的参考书也将考书也将u u值称为值称为z z值。值。 医学统计学完全版第81页共654页这样将正态分布变换为标准正态分布这样将正态分布变换为标准正态分布(standard no

51、rmal distributionstandard normal distribution) 2221ue)u(医学统计学完全版第82页共654页图图2-3 正态分布的面积与纵高正态分布的面积与纵高 医学统计学完全版第83页共654页正态分布的特征正态分布的特征 1. 集中性集中性 正态曲线的高峰位于正中央,正态曲线的高峰位于正中央, 即均数所在的位置。即均数所在的位置。对称性对称性 正态曲线以均数为中心,左右对正态曲线以均数为中心,左右对称,称, 3. 正态分布有两个参数正态分布有两个参数,即均数和标准差。,即均数和标准差。 4. 正态曲线下面积正态曲线下面积有一定的分布规律有一定的分布规律

52、 医学统计学完全版第84页共654页图图2-4 2-4 不同标准差的正态分布示意不同标准差的正态分布示意 医学统计学完全版第85页共654页二、正态曲线下面积的分布规律二、正态曲线下面积的分布规律 医学统计学完全版第86页共654页标准正态分布表(标准正态分布表(u值表)值表)v 标准正态分布曲线下的面积,由此表可查出曲标准正态分布曲线下的面积,由此表可查出曲线下某区间的面积。查表时应注意:线下某区间的面积。查表时应注意:表中曲线下面积为表中曲线下面积为-到到u u 的下侧累计面积;的下侧累计面积;当已知当已知、和、和X X时,先按公式(时,先按公式(2.192.19)求得)求得u u值,再查

53、表;当和未知时,并且样本例数在值,再查表;当和未知时,并且样本例数在100100例以上,常用样本均数和标准差例以上,常用样本均数和标准差S S分别代替分别代替和和 ,按公式(,按公式(2.192.19)求得)求得u u值;值;曲线下横轴上的总面积为曲线下横轴上的总面积为100%100%或或1 1 医学统计学完全版第87页共654页 例例2.162.16 前例前例2.12.1中,某年某市中,某年某市120120名名1212岁健康男孩身岁健康男孩身高,已知均数高,已知均数=143.07cm=143.07cm,标准差,标准差S S=5.70cm,=5.70cm, 估计该地估计该地1212岁健康男孩身

54、高在岁健康男孩身高在135cm135cm以下者占该地以下者占该地1212岁男孩总数的百分数;岁男孩总数的百分数; 估计身高界于估计身高界于135cm135cm150cm150cm范围内范围内1212岁男孩的比例;岁男孩的比例; 分别求出均数分别求出均数1 1S S、均数、均数1.961.96S S、均数、均数2.582.58S S范围范围内内1212岁男孩人数占该岁男孩人数占该120120名男孩总数的实际百分数,说名男孩总数的实际百分数,说明与理论百分数是否接近。明与理论百分数是否接近。医学统计学完全版第88页共654页根据题意,按公式(根据题意,按公式(2.192.19)作)作u u变换变换

55、 421705701431351.u221705071431502.u医学统计学完全版第89页共654页身高范围所占面积身高范围所占面积v 故估计该地故估计该地12男孩身高在男孩身高在135cm以以下者约占下者约占7.78;v 身高界于身高界于135cm150cm范围内者范围内者约占约占81.10。 医学统计学完全版第90页共654页三、正态分布的应用三、正态分布的应用 制定医学参考值范围制定医学参考值范围 参考值范围也称为正常值范围。医学上常把绝大数正参考值范围也称为正常值范围。医学上常把绝大数正常人的某指标范围称为该指标的正常值范围。这里的常人的某指标范围称为该指标的正常值范围。这里的“绝

56、大绝大多数多数”可以是可以是90、95、99,最常用的是,最常用的是95。质量控制质量控制 常以均数常以均数2S作为上、下警戒值,以均数作为上、下警戒值,以均数3S作为上、作为上、下控制值。下控制值。 正态分布是很多统计方法的理论基础正态分布是很多统计方法的理论基础 XX医学统计学完全版第91页共654页THE END THANK YOU FOR LISTENING医学统计学完全版第92页共654页本科生用本科生用医学统计学教案医学统计学教案主讲主讲 王守英王守英新乡医学院公共卫生学系综合实验室医学统计学完全版第93页共654页第第3 3章总体均数的区间估计和假设检验章总体均数的区间估计和假设

57、检验 目录目录q 第五节第五节 均数的均数的 u 检验检验q 第二节第二节 t 分布分布q 第三节第三节 总体均数的区间估计总体均数的区间估计q 第四节第四节 假设检验的意义和基本步骤假设检验的意义和基本步骤q 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误q 第六节第六节 均数的均数的 t 检验检验q 第七节两个方差的齐性检验和第七节两个方差的齐性检验和t检验检验q 第八节第八节 型错误和型错误和型错误型错误q 第九节第九节 应用假设检验应注意的问题应用假设检验应注意的问题医学统计学完全版第94页共654页图示:总体与样本图示:总体与样本医学统计学完全版第95页共654页 一、标

58、准误的意义及其计算一、标准误的意义及其计算 统计推断统计推断( (statistical inference) ) :根据样本信息:根据样本信息来推论总体特征。来推论总体特征。 均数的抽样误差均数的抽样误差 :由抽样引起的样本均数与总体:由抽样引起的样本均数与总体均数的差异称为均数的抽样误差。均数的差异称为均数的抽样误差。 标准误标准误(standard error)(standard error):反映均数抽样误差大:反映均数抽样误差大小的指标。小的指标。 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误医学统计学完全版第96页共654页已知:已知:nXnSSX标准误计算公式标准误

59、计算公式未知:医学统计学完全版第97页共654页 实例:如某年某市120名12岁健康男孩,已求得 均数为143.07cm,标准差为5.70cm,按公式计算,则标准误为:52. 012070. 5XS医学统计学完全版第98页共654页 1.表示抽样误差的大小 ; 2.进行总体均数的区间估计; 3.进行均数的假设检验等 。二、标准误的应用 医学统计学完全版第99页共654页 正态变量正态变量X采用采用u u( (X)/)/变换,则一般变换,则一般的正态分布的正态分布N N (,)(,)即变换为标准正态分布即变换为标准正态分布N N (0,1)(0,1)。 又因从正态总体抽取的样本均数服从正态分布又

60、因从正态总体抽取的样本均数服从正态分布 N N(, ),(, ),同样可作正态变量的同样可作正态变量的u u变换变换, ,即即第二节第二节 t t 分布分布 一、一、t t 分布的概念分布的概念 XXnXXuX医学统计学完全版第100页共654页v 实际工作中由于理论的标准误往往未知,实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,而用样本的标准误作为的估计值, 此时就不此时就不是是u u变换而是变换而是t t变换了,即下式:变换了,即下式: nSXSXtX医学统计学完全版第101页共654页t t分布于分布于19081908年由英国统计学家年由英国统计学家W.S.Gosse

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论