二数据管理和spss软件课件_第1页
二数据管理和spss软件课件_第2页
二数据管理和spss软件课件_第3页
二数据管理和spss软件课件_第4页
二数据管理和spss软件课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据管理和SPSS软件 罗艳侠 首都医科大学流行病与卫生统计学系 2014-10-27 1 2 Design Collection of data Sorting data Analysis of data 资料收集与管理 Our Objectives 数据,临床研究的最直接产物,也是进一步分析的基础 ,因此,保证数据的准确性、可靠性、完整性是临床研 究中的一项重要工作。 数据管理:利用计算机硬件和软件技术对数据进行有效 的收集、存储、处理和应用的过程。其目的在于充分有 效地发挥数据的作用。 数据管理是保证试验质量及其重要的环节,是进行现代 统计分析的基础和核心。 3 数据管理 中国国家食品药品监督管理局(State Food and Drug Administration,SFDA)在药品临床试验管理规范 第五十一条中明确规定,数据管理的目的在于把得 自受试者的数据迅速、完整、无误地纳入报告,所 有涉及数据管理的各种步骤均需记录在案,以便对 数据质量及试验实施进行检查。 数据管理 4 数据管理计划 数据库创建与确认 数据录入与核查 数据确认与疑问表 数据质控检查 数据审核与锁定 数据管理的主要内容 5 作为数据管理的开始,制定一份全面而详细的管理 计划,将使整个数据管理过程有章可循、有据可依。所 有数据管理过程均应按照其中定义的时间与方法进行操 作。 数据管理计划 6 1. 研究的一般情况,如研究目的、研究的整体设计等。 2. 数据管理工作的时间表,应与整个研究的大时间表相互 协调。 3. 相关人员与职责(临床监察员、数据管理员、录入员等) 4. 数据库软件的选择与数据库的主要框架等。 5. 确认数据库 6. 定义监查员应提交的数据材料,以及材料的移交与管理 数据管理计划内容 7 7. 如何进行数据录入与核查 8. 如何进行数据确认 9. 疑问表如何产生、解决与管理 10. 如何进行质量检查,包括质量检查的具体质量标准 11. 数据审核 12. 数据锁定及移交 13. 定义需存档的文件 14. 数据的安全保障措施 15. 其它需要特殊说明的问题,如电子数据的传递与管理 、数据管理的阶段报告等。 数据管理计划内容 8 数据库软件 选择用于录入数据的软件及进行最终统计分析的软件 如ORACLE、EPI Info 、EPIData、SAS、SPSS等 记录项目注释(annotation) 定义数据库中将纳入的记录项目及相应的变量名称与变量类型,如: 定义身高为height,类型为数值型,宽度为3,不含小数位。这一工 作应由研究者与数据管理部门共同完成。如还有其它内容需要进入数 据管理环节,则同样应对其进行注释。 数据库的确认(validation) 为数据录入设计适当的录入界面,并确认录入设计是否与注释相一致 、录入界面与规则是否方便录入、软件的输出结果是否与录入内容相 同等。 数据库创建与确认 9 数据编码 试验过程中,一些重要的 项目是以文本形式记录的,如不良事 件、伴随疾病、合并用药等,为了分 析时归纳与总结的方便,常需要对这 些部分进行分类与编码。 数据录入员应进行相应的培训 独立双份录入原则 双份数据库的核对 数据录入与核查 10 在基本消除了录入错误后,便可进行数据检查及确认 需建立有关细节的确认计划,然后编写相应的程序,得 到需确认问题的清单,产生关于数据的疑问表。 疑问表将由临床监查员交研究者进行核查、确认或更正 数据确认的结果由临床监查员返回给数据管理员,对数 据库进行修改与更新。 此过程循环往复,直至所有疑问均得到明确的答复。 以上过程可借助数据库软件平台得到简化, 如:将可预见的问题设计到录入程序中,这样在录入的 同时即可产生疑问表,这种情况在网络背景下由研究者 直接录入数据时具有更加明显的优势。 数据确认与疑问表 11 当数据确认与数据库修正工作完成后,即基本排除了数据录 入错误及逻辑错误。但这些工作并不能完全保证数据的准确 性,进行进一步的质控检查仍然很有必要。 质控检查通常以书面形式,在预先设定的质量标准指导下进 行。 对关键变量经常需要进行100%的核查,即:将数据库中 的关键变量与原始记录(病例报告表及疑问表)进行核对, 通常情况下要求关键变量100%正确。 对非关键变量,通常采用按一定比例抽样的方法进行抽查 ,通常允许一定的错误率,如0.5%或0.1%等。 数据质控检查 12 数据审核的任务是对数据进行最后的检查,一方面确认数据管理的可靠性 ,另一方面对数据中存在的一些可能影响统计分析结果的数据做出决定。 数据审核通常需召开一次会议,由所有参与研究人员(如研究者、监察员 、管理员、统计分析人员等)共同参加,所形成的结论共同负责。 数据审核过程中,如果发现一些事先未考虑到的问题,需要针对这些问题 给出处理意见,如再次发出疑问表、进行约定或根据已有信息做出判断等 。 在数据审核会议上,还有另外一项重要的工作,就是讨论并最终确定统计 分析计划。之前制定的统计分析计划中可能不能被很好地实现的内容需进 行调整。 当所有疑问均已解决、对数据的判断全部完成、统计分析计划也已签署后 ,数据即可锁定,锁定后的数据交统计分析者进行编程分析。原则上,锁 定后的数据将不再更改,除非一些非常明确的证据表明数据中存在错误而 且将明显影响分析结果。 数据审核与锁定 13 Data capture tools CRF Protocol Review Data base Set up Data entry tools Data Validation Data lock Data analysis Report FIRST QC SECOND QC THIRD QC FOURTH QC 没有记录的事情没有发生 研究文件的存档 数据数据管理的所有工作均应有书面材料为据 数据管理计划、数据库确认、病例报告表交接、 数据确认细节描述、疑问表交接、质控检查、数据 审核与锁定等均应有文书为据。 15 注意问题 Epidata 数据录入和数据管理 EpiData基本情况 选择合适的数据管理软件是保证数据质 量的重要方面 参照EpiInfo软件,丹麦学者1999年发起, 全球咨询小组2000年决定开发 可以直接在www.epidata.dk网站上免费下 载使用,目前的版本为v3.1版 可在Windows 95/98/NT/2000/XP环境下 使用 能快速建立数据录入程序,可满足数 据的校验录入、双份比较等 建立的数据库可转变成dBase、Excel 文件以及SAS、SPSS和Stata统计分析软 件的数据格式 为数据管理软件,暂不具有统计分析 功能,适于单表,也适于含子表的情形 EpiData基本情况 EpiData秉承EpiInfo DOS版本的简便 性 简便性体现:以文本形式编写文件, 通过程序将此文本文件转换成数据输入 表格 安装时不受计算机设置的影响。无需 安装或替换任何的DLL文件或系统文件 EpiData基本情况 EpiData程序可用于 定义数据结构; 简化数据输入; 应用校验原理进行数据录入; 编辑/纠正已经录入的数据; 确认变量间的一致性、逻辑性; 显示或打印数据核查错误结果留存; 双份录入数据的比较; 导出数据供统计分析使用。 EpiData使用流程图 定义数据库结构,设计用户录入界面 建立数据库文件 建立数据核查程序 数据录入 输入完成后数据再核查 数据归档备份。 22 QES文件( 调查表文 件):定义 调查表( 问卷)的 结构 REC文件( 数据文件) :存放数 据以及已 经定义好 的编码 CHK文件 (核查文件 ):定义了 数据输入 时字段的 有效性规 则 23 24 数据导出 EpiData软件产生的数据文件以“REC” 作为扩展名,一般不能被其它软件程序 所调用 数据备份 转出为文本文件 数据转成dBase III格式 数据转成Excel格式 转出成Stata、SPSS、SAS所用的数据 SPSS统计分析软件 数据录入和数据管理 SPSS简介 SPSS(Statistical Package for Social Science, 社会科学 统计软件包)和SAS一样也是国际上流行的权威性统计分 析软件之一。 和SAS相比, 它更突出的特色是友好的窗口菜单式用户界 面。在非统计专业科研人员中流行。 在Windows操作系统下它的版本不断升级,但基本统计 分析窗口操作无太大变化。 SPSS的主要窗口 主要有三类:数据编辑窗口(Data Editor)、结果输出 窗口(Viewer)和语法窗口(Syntax Editor)。 数据编辑窗口-SPSS Data Editor 数据视窗(Data View)和变量视窗(Variable View) Data View主要用于显示和编辑数据 Variable View则用来定义编辑变量的有关属性: 包括变量名(Name)、类型(Type)、宽度(Width)、 小数位数(Decimal)、标签(Label)、值标签(Values)、 缺失值(Missing)、列宽(Columns)、对齐方式(Align)和 测量类型(Measure)等。 结果输出窗口-SPSS Viewer 显示分析结果和系统信息。 系统启动时并不打开输出窗口, 当完成首次统计分析过程后会自动 打开。如果处理成功,就显示处理 结果;如果处理过程中发生错误或 失败,则提示出错信息。 在窗口标题栏自动显示其对应的 输出文件名;若是新开的窗口,按 顺序自动标记为“Output1”、 “Output2”、等。 窗口菜单和工具栏 1.File:文件管理菜单,有关文件的调入、存储、显示和打印 等; 2.Edit:编辑菜单,有关文本的编辑,及系统选项设置等; 3.View:视图菜单,可定义窗口视图; 4.Data:数据管理菜单,可定义及修改变量属性,对记录选择 、排序、加权以及对数据文件进行转置、连接、汇总等; 5.Transform:数据转换处理菜单,有关数值的计算、重新赋 值、缺失值替代等; 6.Analyze:统计分析菜单,包含SPSS提供的所有统计分析过 程; 7.Graphs:图形菜单,包含各种统计图的绘制; 8.Utilities:用户选项菜单,可显示变量列表、文件信息, 定义及使用集合,运行脚本文件和编辑菜单项等; 9.Windows:窗口管理菜单,有关窗口的排列、选择、显示等 ; 10.Help:求助菜单,调用各种帮助文件。 保存数据 选择菜单FileSave,由于该数据从来没有被 保存过,所以弹出Save as对话框,用户确定盘 符、路径、文件名以及文件格式后点击OK钮, 即可保存数据文件。 SPSS的主要文件类型: 数据文件:data.sav 结果输出文件:output.spo 数据的类型 SPSS中的变量属性有四个:变量名(Name)、变量类型 (Type)、变量标签(Lable)和变量长度(Width)。 定义SPSS的变量类型至少应该定义变量名、变量类型,其 他的可采用默认。 为变量命名应该采用以下原则: 一般有不多于8个字符组成。 首字母为字母,其后可以为字母或数字或除 “?!*” 以外的字符,但应该注意不能以下划线“-”或圆点“.” 作为变量名的最后一个字符。 变量名不能用“ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT,OR, TO, WITH ”SPSS的保留字。 系统不区分变量名中的大小写字符。例如ABC和abc被 认为是同个变量。 变量类型与数据长度 常用的SPSS数据类型(Type)有数值型,字符型和日期型 。 数值型变量又按不同的类型分为5种 (1) Numeric:标准数值型,同时定义数值的宽度( Width),即整数部分+小数点+小数部分的位数,默认 为8位;定义小数位数(Decimal Places),默认为2位 。 (2) Comma:加逗号的数值型 (3) Dot:加点的数值型 (4) Scientific notation:科学记数型 (5) Date:日期型 (6) Dollar:货币型 (7) Custom currency:自定义型 (8) String:字符型,字符型变量不能参与运算。 变量标签和变量值标签 变量标签是对变量名的进一步说明。可以是中文或英文 。在统计分析输出时,在相应的位置显示改变量标签。 如变量名H,对应的变量标签可以Hight,或身高。 变量值标签是对变量的可能取值所附加的一种说明。对 分类变量往往要定义其取值标签。 例. 某克山病区测得11例克山病患者与13名健康人的 血磷值(mmol/L)如下, 问该地急性克山病患者与健康 人的血磷值是否不同? 患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 变量的定义 该资料是定量资料,因此我们需要建立两个 变量,一个变量代表血磷值,取名为X,另 一个变量代表观察对象是健康人还是克山病 人,取名为GROUP。 Missing,用于定义变量缺失值; Columns,定义显示列宽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论