统计学教程-医学统计方法概述(已)_第1页
统计学教程-医学统计方法概述(已)_第2页
统计学教程-医学统计方法概述(已)_第3页
统计学教程-医学统计方法概述(已)_第4页
统计学教程-医学统计方法概述(已)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学方法概述 一、医学统计学的基本概念 “the science and art of dealing with variation in data through collection, classification and analysis in such a way as to obtain reliable results”。 医学统计学(medical statistics )是应用概率论和数理统计的基本原理和方法,结合医学实际,研究资料和信息的搜集、整理与分析的一门学科。 任务:通过研究事物变异的特征,探索医学领域内未知事物,寻找事物的规律性。二、医学统计学在医学领域中的地位

2、和作用 统计分析是医学科研工作中的重要组成部分。如: 首先, 医学研究离不开统计设计。 医学数据处理离不开统计方法。 统计软件的应用,开拓了医学统计的领域。 统计方法的正确应用要求越来越严。 宏观上,有关卫生正策的制定依赖于统计信息数据。统计学论证是专业结论的基础。三、统计工作的内容 统计设计:观察性研究(observational study),或调查研究。实验研究(intervention study),或干预研究。 描述性研究、分析性研究等。现场人群干预试验、临床试验、动物实验等。 收集资料:医学科研数据。如,实验数据和现场调查数据等。医疗卫生工作记录和卫生业务报表等。其它有关信息数据等

3、。 包括数据的录入、数据核查、数据分组、整理表格、生成统计表、以分析应用。整理资料:数据库文件:如Eipedata、dBASE、FoxBASE等;工作表文件:Excel数据表文件;统计应用软件文件:如SPSS数据文件、SAS数据文件、STATA数据文件等。数据录入逻辑检查,若某变量的最大和最小值,不符合逻辑,说明数据有误。数据核对,常采用双份录入的方式,通过运行程序对比检查,不一致的一定是录错的数据。数据真实性判断,通过变异系数做初步判断。离群数据,当个别数据与群体数据严重偏离时,被称为离群数据(outlier)或极端值。统计软件一般都有判断离群数据的方法。 对该极端值,一般有两种处理办法:若

4、逻辑错误,直接删除;若数据并无明显的逻辑错误,可将该数据剔除前后各做一次分析,若结果不矛盾,则不剔除。若结果矛盾,必须结合专业给以充分合理的解释。数据核查标识变量,主要用于数据管理,包括数据的核对与增删等;分析变量,统计分析的主要变量,又分为: 反应变量(response variable),表示试验效应或观察结果大小的变量或指标。 解释变量(explanatory variable),指示变量(indicator)、分组变量(grouping variable) 、分类变量(categorical variable) 、协变量等。 注意:根据研究目的以及变量间的相互关系,各变量的作用并非一成

5、不变。数据分层或分组,整理表格分析资料: 对整理出的数据,计算有关指标,也就是统计处理,得出结果,做出结论。 总之,统计工作的步骤是相互联系的,任何一个步骤产生错误都会影响最后结论的正确性。三、统计学中的若干个基本概念: 总体(population): 研究总体:根据研究目的所确定的同质的研究对象的全体。 研究对象(观察对象)可以是:人群、实验动物、微生物等。 观察单位可以是:一个家庭、一个人、一只动物、一只眼睛、一个细胞株等。样本(sample): 从研究总体当中随机抽取一部分有代表性的个体,这些个体就组成了一个样本。 参数与统计量: 统计量(statistics):是观察样本的数据计算相应

6、的指标大小。 参数(parameter):是决定总体变量值分布规律的特征指标,是未确定的常数。 性质相同、条件相似的观察对象的个体范围。要求影响观察指标的因素尽可能相同。 广义的来讲,就是大同小异的对象的全体。 同质(homogeneity): 变异(variation): 在同质范围当中,某研究指标个体出现的差异。 误差(error): 真实的数据与收集的数据之间存在的差别,即为误差。统计学上,通常将误差分为: 抽样误差(sampling error): 总体参数与样本统计量之间、或同一总体的样本统计量与样本统计量之间的差异。 变量的类型: 识别资料的类型非常重要,因为不同类型的变量资料需要

7、用不同的统计学方法处理分析。 定性变量资料: 也叫分类变量,其变量的取值,即变量值的大小是定性的。如:职业(工人、农民、教师等),性别(男、女)、疗效(很好、好、不好),血型(A、B、AB、O),病情(轻、中、重)等。1、无序分类变量:是指所分类别或属性之间无程度或顺序的差别。多项分类变量:如:职业、血型等。如:职业、性别、血型等。二项分类变量:如:性别(男、女),结局变量(生、死),某项化验结果(阳性、阴性)等。2、有序分类变量(等级变量):变量的各类别之间有程度的差别。如:疗效、病情等。定性资料的数量化二项分类资料的数量化:多项无序分类资料的数量化:如,血型变量: O型为: X1=0,X2

8、=0,X3=0 A型为: X1=1,X2=0,X3=0 B型为: X1=0,X2=1,X3=0 AB型为:X1=0,X2=0,X3=1等级资料的数量化:如,文化程度变量:文盲 =0 , 小学=l , 初中=2,高中=3, 大学=4,研究生5定量变量资料: 变量值的大小是定量的、测量的,具有度、量、衡单位。又可分为:如:身高、体重、血压等变量。 定量资料的数量化 一般情况下,定量资料不存在数量化问题,因为它本身均为数值变量。 某些情况下,原始数据的观察值不能满足统计分析的应用条件。因此,需要对原始观察值进行数据转换或标准化等。 定量资料与定性资料的关系: 定量资料可转换成定性资料。计数资料定量化为哑变量,不是真正意义上的数值。这样便于识别各个类别,从而像分析计量资料那样分析计数资料,使各种医学资料在统计分析中得到充分合理的利用。 等级资料可合并

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论