医学统计学基础知识.ppt_第1页
医学统计学基础知识.ppt_第2页
医学统计学基础知识.ppt_第3页
医学统计学基础知识.ppt_第4页
医学统计学基础知识.ppt_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

汤在祥 博士/副教授 苏州大学医学部公共卫生学院 Email: TEL: 159-6221-5800 QQ/微信: 65-617-464 医学统计学基础知识 卫生统计学卫生统计学一门运用统计学,尤其是数 一门运用统计学,尤其是数 理统计学的原理和方法,研究医学科研及理统计学的原理和方法,研究医学科研及 卫生工作中有关数据的收集、整理、分析卫生工作中有关数据的收集、整理、分析 的科学。的科学。 卫生统计学是一门应用学科,是应用卫生统计学是一门应用学科,是应用 统计学的一个分支。统计学的一个分支。 第一节第一节 医学统计学的概念及其作用医学统计学的概念及其作用 (掌握) 用数量反映质量;用群体归纳个体。用数量反映质量;用群体归纳个体。 vv 特点:特点: vv 研究对象:研究对象: 随机事件(偶然事件)随机事件(偶然事件) 非确定性事件 非确定性事件 不可能事件不可能事件 确定性事件确定性事件 必然事件必然事件 第一节 卫生统计学的定义和内容 卫生统计学的主要内容卫生统计学的主要内容 1.1.按卫生统计工作的基本步按卫生统计工作的基本步 骤划分,包括:骤划分,包括: 研究研究设计设计 收收集资料集资料 整理资料整理资料 分析资料分析资料 (掌握) 包括资料收集、整理和分析全包括资料收集、整理和分析全 过程总的设想和安排过程总的设想和安排 抽样方法或设计方案抽样方法或设计方案 样本含量(大小)的确定样本含量(大小)的确定 设设 计计 1 1、统计报表:国家法定的有关卫生工作报、统计报表:国家法定的有关卫生工作报 表、传染病报表、职业病报表、医院工作报表等表、传染病报表、职业病报表、医院工作报表等 。 2 2、日常工作记录:医院的病例、经常性的、日常工作记录:医院的病例、经常性的 卫生监测记录、健康检查记录等。卫生监测记录、健康检查记录等。 3 3、专题调查或实验:针对某个专题做的调、专题调查或实验:针对某个专题做的调 查或实验研究所收集的资料。查或实验研究所收集的资料。 资料的三个来源:资料的三个来源: 内容:数据录入、核查和汇总内容:数据录入、核查和汇总 目的:使资料系统化和条理化目的:使资料系统化和条理化 整理资料:整理资料: 分析资料分析资料 统计推断又包括两个内容:统计推断又包括两个内容: 参数估计参数估计和和假设检验假设检验。 统计分析包括:统计分析包括: 统计描述统计描述(descriptive statistics)descriptive statistics) 统计推断统计推断(inferential statisticsinferential statistics) 2.2.按统计学方法的层次划分按统计学方法的层次划分 基本统计方法:基本统计方法: 统计图表、定量统计图表、定量 资料的统计描述、定性资料的统计描述,资料的统计描述、定性资料的统计描述, 参数估计,两组定量参数估计,两组定量( (或等级或等级) )资料平均值资料平均值 的比较,多组定量的比较,多组定量( (或等级或等级) )资料平均值的资料平均值的 比较,定性资料统计指标的比较,两变量比较,定性资料统计指标的比较,两变量 间关系的分析。间关系的分析。 高级统计方法:高级统计方法: 多因素对某定多因素对某定 量指标的影响分析,多因素对某定性指量指标的影响分析,多因素对某定性指 标的影响分析,随访时间资料的分析,标的影响分析,随访时间资料的分析, 判别分析,重复测量设计两组或多组定判别分析,重复测量设计两组或多组定 量资料均数的比较。量资料均数的比较。 第二节 第二节 统计学中的几个基本概念统计学中的几个基本概念 研究单位研究单位 所研究对象中的个体。所研究对象中的个体。 研究因素研究因素 所要研究的研究对象的某个所要研究的研究对象的某个 或某些性质。或某些性质。 一、研究单位和研究因素一、研究单位和研究因素 统计的研究对象是由个体构成统计的研究对象是由个体构成 的群体,必需给个体规定一些相同的的群体,必需给个体规定一些相同的 因素(各种特征),这样的群体才有因素(各种特征),这样的群体才有 研究意义,这些规定的相同因素就称研究意义,这些规定的相同因素就称 为为同质(同质(homogeneityhomogeneity)。 二、同质和变异二、同质和变异 同质是相对的,研究对象的因素很多,同质是相对的,研究对象的因素很多, 不可能都相同,一般只要规定对研究指标不可能都相同,一般只要规定对研究指标 有影响的主要因素相同,即为同质。有影响的主要因素相同,即为同质。 同质的基础上观察单位之间的差异称为同质的基础上观察单位之间的差异称为 变异(变异(variationvariation) 。 变异是由不可控制的因素产生的。变异是由不可控制的因素产生的。 二、同质和变异二、同质和变异 总体(总体(populationpopulation)根据研究目的所确定的根据研究目的所确定的 同质观察单位或某项特征观测值的集同质观察单位或某项特征观测值的集 合。总体分有限总体和无限总体。合。总体分有限总体和无限总体。 个体(个体(individualindividual)是构成总体的最基本的是构成总体的最基本的 观察单位。观察单位。 样本(样本(samplesample)从总体的全部观察单位中随从总体的全部观察单位中随 机抽取的部分观察单位或某项特征观机抽取的部分观察单位或某项特征观 测值的集合。测值的集合。 三、总体、样本、个体三、总体、样本、个体 (掌握) 随机抽样 random sampling 为了保证样本的可 靠性和代表性,需 要采用随机的抽样 方法(在总体中每 个个体具有相同的 机会被抽到)。 样本中所包含的个体或个体值的个数样本中所包含的个体或个体值的个数 称为称为样本含量(样本含量(sample sizesample size) 随机抽样是指按随机抽样是指按随机原则随机原则从总体中获从总体中获 取样本(总体中的每个个体都有同等机会取样本(总体中的每个个体都有同等机会 被抽取)。被抽取)。 参数参数 与总体相对应,又称为总体参数,是与总体相对应,又称为总体参数,是 指根据总体个体值统计计算出来的描述指根据总体个体值统计计算出来的描述 总体的特征量。总体的特征量。 统计量统计量 与样本相对应,又称为样本统计量,与样本相对应,又称为样本统计量, 是指根据样本数据按有关统计公式计算是指根据样本数据按有关统计公式计算 出的用来描述样本的统计指标。出的用来描述样本的统计指标。 四、参数和统计量四、参数和统计量 (掌握) 统计中用于推断的统计量统计中用于推断的统计量 如如 t t、u u 和和 2 2 等 等 称为推断统计量或检验统计量。称为推断统计量或检验统计量。 误差:测量值和真实值之间的差(系统误差和随 机测量误差),样本指标与总体指标之间 的差(抽样误差) (掌握) 从所研究的总体中,用随机化的方法,从所研究的总体中,用随机化的方法, 抽取一定数量的个体构成实际加以研究的抽取一定数量的个体构成实际加以研究的 样本,根据实际观察到的样本所提供的信样本,根据实际观察到的样本所提供的信 息应用统计方法对相应的总体做科学的统息应用统计方法对相应的总体做科学的统 计推断,这样的研究方式称为计推断,这样的研究方式称为抽样研究抽样研究。 五、抽样研究与抽样误差五、抽样研究与抽样误差 由抽样造成的样本统计量与总体参数由抽样造成的样本统计量与总体参数 ,样本统计量之间的差别称为,样本统计量之间的差别称为抽样误差抽样误差( sampling errorsampling error)。)。 抽样误差是随机误差,是不可避免的。抽样误差是随机误差,是不可避免的。 但可用抽样设计来控制(减小)抽样误差但可用抽样设计来控制(减小)抽样误差 。 六、统计资料的类型六、统计资料的类型 变量变量 每个观察单位被测量和观察的某项特征。每个观察单位被测量和观察的某项特征。 变量值变量值 对变量的测得值,亦称为资料。对变量的测得值,亦称为资料。 对个体的定量特征(定量因素或定量对个体的定量特征(定量因素或定量 指标)的描述,其取值是定量的,表现指标)的描述,其取值是定量的,表现 为数值大小,有单位,又称为为数值大小,有单位,又称为数值变量数值变量 资料资料(numerical (numerical variable)variable)或称为计量或称为计量 资料。资料。 (一)定量因素和定量资料(一)定量因素和定量资料 (掌握) 定性因素和定性资料(分类资料)定性因素和定性资料(分类资料) 对个体的定性特征(定性因素或定对个体的定性特征(定性因素或定 性指标)的描述,其观察值是定性的,性指标)的描述,其观察值是定性的, 表现为互不相容的类别或种属。表现为互不相容的类别或种属。 也称为计数资料。也称为计数资料。 包括二分类变量和多分类变量。包括二分类变量和多分类变量。 (二)定性因素和定性资料(二)定性因素和定性资料 (掌握) (三)等级资料 治愈,好转,有效,无效 -,-/+,+,+,+,+,+ 各类变量之间的转化各类变量之间的转化 定量资料定量资料 分类资料分类资料等级资料 等级资料 分类资料、等级资料赋值分类资料、等级资料赋值0 0、1 1、2 2、3 3 定量资料定量资料 Hb (g/l)Hb (g/l) 分正常、偏低两类分正常、偏低两类 贫血程度:重度、中度、贫血程度:重度、中度、 轻度、正常轻度、正常 频率频率 将随机试验重复将随机试验重复n n次,次,n n次试验次试验 中随机事件中随机事件A A共发生共发生m m次,则次,则n/mn/m表示随表示随 机事件机事件A A发生的频率。发生的频率。 七、频率和概率七、频率和概率 概率概率是描述随机事件可能发生的量。用是描述随机事件可能发生的量。用 P P表示,表示, 概率的统计定义概率的统计定义 当试验次数当试验次数n n趋向趋向 于无穷的大时,频率于无穷的大时,频率m/nm/n的极限值即为概率的极限值即为概率 ,即,即 。 七、频率和概率七、频率和概率 历史上许多科学家都做过投硬币实验:历史上许多科学家都做过投硬币实验: 次数次数n n 正面朝上的次数正面朝上的次数nH nH 频率频率f f 德德. .摩根摩根 2048 1061 0.51812048 1061 0.5181 蒲丰蒲丰 4040 2048 0.50644040 2048 0.5064 K.K.皮尔逊皮尔逊 12000 6019 0.501612000 6019 0.5016 K.K.皮尔逊皮尔逊 24000 12012 0.500524000 12012 0.5005 概率推断概率推断是按一定的概率用样本信息推是按一定的概率用样本信息推 断总体的特征断总体的特征, ,即统计推断含有一定概即统计推断含有一定概 率。率。 小概率事件:小概率事件:P0.05(P0.05(或或0.01)0.01) 小概率事件原理:即小概率事件在一次小概率事件原理:即小概率事件在一次 抽样中一般认为不会发生。抽样中一般认为不会发生。 第二章 计量资料的统计描述 1. 能够了解频数分布表的编制方法及分布图的绘 制,并以此描述资料的频数分布特征。 2. 能够掌握各种集中趋势指标的计算,特点及其 适用条件。 3. 能够掌握各种离散趋势指标的计算,特点及其 适用条件。 4. 能够了解正态分布的概念、特征及应用,掌握 标准正态分布的基本规律。 学习目标: 对于大样本的观察数据, 频数分布表(frequency distribution table) 频数分布图(frequency distribution diagram) 是两种简单明了考察与描述数据的重要方法。 第一节 频数分布表与频数分布图 一、频数分布表一、频数分布表( (frequency distribution table)frequency distribution table) 二、频数分布图二、频数分布图( (frequency frequency distribution diagramdistribution diagram) ) 直方图 Histogram 第二节 集中趋势的描述 集中趋势(central tendency)是指某计量资料的大 多数观察值所在的中心位置。 描述集中趋势的主要统计指标有均数、几何均数和 中位数,这些指标也称为位置度量指标(measures of location)。 (掌握) (掌握) 加权法 (掌握) (掌握) 第三节 离散趋势的描述 一、极差与四分位数间间距 极差,又称为为全距(range,R)是所有观观察值值中的最 大值值(maximum,Max)与最小值值(minim

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论