医学研究的数据管理与分析——第七章_第1页
医学研究的数据管理与分析——第七章_第2页
医学研究的数据管理与分析——第七章_第3页
医学研究的数据管理与分析——第七章_第4页
医学研究的数据管理与分析——第七章_第5页
已阅读5页,还剩142页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 EpiData软件应用Dbase, FoxBase,Visual FoxPro,Lotus23? ?456EpiData软件概述 EpiData是一个关于数据录入和管理的程序 目的:是教会普通用户如何将一张调查表“计算机化”,使得数据输入和管理工作变得容易。 基本设计思想:帮助用户根据调查表信息建立数据库供以后统计分析使用。 EpiData的基本功能:包括调查表文件的建立、数据的录入、核对和数据的转入、转出等。使用该软件可使数据录入和管理变得形象、直观、容易。一、EpiData的设计 设计者:丹麦的Jens M、Michael Bruus和英国的Mark Myatt 编程者:丹麦的Mi

2、chael Bruus 开发思路和原理:Epi Info 6.0二、软件下载和登记注册 下载地址:http:/www.epidata.dk/ download.htm三、版本信息 EpiData 1.5(2001年2月22日);EpiData 2.1a(2002年) EpiData 3.02(2004); EpiData 3.10(NOW)四、安装和系统要求 可在Windows 95/98/NT/2000/XP版本操作系统下运行 3.02和3.10版直接安装中文程序即可。7EpiData软件概述uEpiData软件安装如同拷贝程序文档一样简单。例如,它可以从U盘运行,并且占用内存很小(2.5M

3、)。u由于捐助和志愿者的工作,软件免费免费发布。8EpiData软件概述EpiData程序下载与安装 http:/www.epidata.dk/9EpiDataEpiData程序下载与安装程序下载与安装10数据分析EpiData程序下载与安装11数据录入EpiData 软件 EpiData 软件是在吸收 DOS版的Epi Info 6.0 软件优点基础上开发研制的 Windows版软件。12EpiData 软件 它一方面吸收了Epi Info软件的长处,同时又极具自身特色。 与 视窗版Epi Info软件相比,占用空间小,更加简单易学,且界面友好,可以很方便的对数据进行储存、核对和管理等,13

4、Epidata软件分为两个模块 EpiData Entry用于数据录入与数据管理 EpiData Analysis用于基本的统计描述/分析与制图。14用EpiData软件进行数据录入和管理,将产生三种基本的文件; 每种文件具有固定的后缀,在数据录入和管理中发挥不同作用。(1)调查表文件:后缀为.QES。通过建立调查表文件,系统根据特定规则自动定义数据文件的结构,包括变量名、变量类型和长度等,用于数据录入。(2)数据文件:后缀为.REC。数据文件包含录入的数据信息以及已经定义好的编码,用于数据的统计分析。(3)核对文件:后缀为.CHK。通过建立核对文件,系统将定义数据录入的有效性规则。EpiDa

5、ta Entry 的文件组成15 EpiData数据管理和输入流程数据管理和输入流程 建立调查表文件创建数据库建立核查文件录入数据数据库管理输出数据2007年8月0、设计“问卷”1.建立调查表文件*.QES2、创建数据库*.QES*.REC3、建立核查文件*.QES*.REC*.CHKquestionnairerecordcheck4、录入数据*.QES*.REC*.CHK2007年8月2007年8月EpiData 要求要求 理论上,EpiData程序对录入的记录数没有限制。而实际应用中,记录数最好不要超过200,000300,000。 在设计录入界面时整个录入界面不能超过999行。 对数值或

6、字符串编码进行解释的文字长度最多80 个字符。 编码长度最多为30 个字符。25EpiDataEpiData Entry Entry 的特点的特点 调查表设计便捷调查表设计便捷 数据核查功能强大且实现简便数据核查功能强大且实现简便 与调查表形式一致的可视数据录入界面与调查表形式一致的可视数据录入界面 数据转换功能强大数据转换功能强大 26EpiData Analysis的特点的特点EpiData Analysis 用于对EpiData Entry生成的数据文件进行初步整理和分析,如,描述性统计(Describe)、频数分析(Freq)、平均数分析(Means)、列联表分析(TablesEpiT

7、ables)、相关分析(Correlate)、回归分析(Regress)、秩和检验(kwallis)等。可以绘制统计图形,如,散点图(Scatter diagram)、 线图 (Line graph)、 直方图 (Histogram)、直条图(Bar graph)、 箱式图(Box plot)、饼图 (Pie graph)等。27EpiData主界面简介主界面简介 菜单栏工具栏按钮栏工作区状态栏29编辑过程工具条工具栏数据表预览粘贴字段编辑器编码编辑器30Epidata使用前的准备Epidata语言设置解决编码器调查表中乱码问题“生成变量名”选项设置相关文件默认打开程序Epidata正式开始使

8、用调查表文件的建立数据文件: 原始数据 文件结构(库结构) 字段名 字段类型 字段长度 调查表信息 数据文件371.建立调查表文件(1)新建调查表文件NEWNew. QES file建立调查表文件有以下三种方法:建立调查表文件有以下三种方法:第一种:在菜单中,点击 “文件”(File)“生成调查表文件QES文件”第二种:在工作栏的工作流程中,点击“1. 打开文件”(1.Define Data)“建立新QES文件”第三种:在按钮栏中,点击 ,这时窗口中会在工作区显示一个空白的文档,你可以在此文档中键入调查表内容和框架,编辑完成后,将调查表文件保存,文件的扩展名统一为.QES。391.建立调查表文

9、件(2)保存调查表文件Save1.建立调查表文件(2)保存调查表文件1.建立调查表文件(3)调查表中文件结构调查表中文件结构43 文件结构文件结构: 字段名字段名 字段类型字段类型 字段长度字段长度 文件名文件名假定现有一调查表如下,如何建立.QES文件?调查表调查表姓名:姓名:_性别:(性别:(1)男)男 (2)女)女身高:身高:_._ CM出生日期:出生日期:_年年_月月_日日44如果按原调查表格式直接建立数据如果按原调查表格式直接建立数据库,结果会怎样?库,结果会怎样?45必须定义字段名和字段类型必须定义字段名和字段类型字段类型字段类型字段编码字段编码自动ID号数字# # .#文本_加密

10、字段大写文本逻辑(是/否)日期自动插入日期声音提示46调用字段编辑器:第一种方法:直接按CTRL-Q键。第二种方法:在编辑器工具条上点击字段编辑器图标。手工输入或使用字段编辑器471.建立调查表文件(4)定义字段名定义字段名变量名第一个字符一定为字母(变量名第一个字符一定为字母(A-Z)之后可含字母(之后可含字母(A-Z)和数字(和数字(09)变量名最多变量名最多10个字符个字符变量名不能是中文变量名不能是中文姓名姓名_性别性别#变量标签变量标签字段名字段名变量编码变量编码定义字段名(定义字段名(Field NamesField Names) 以调查表中字段的第一个词命名(First word

11、 in question is field names) 使用 内的内容自动添加字段名(Automatic field names)49定义字段名(定义字段名(Field NamesField Names) “文件”(File)“选项”(Option)“生成REC文件”(Create data file) 在“如何生成字段名”(How to generate field names)中选择字段的命名方式。50用输入字段左面的文本的第一个单词作为输入字段名。如果这个单词超过8个字符就使用前8个字符作为字段名。 例如:v1 Enter age of patient # “v1”。 又如:Enter

12、 age of patient # “Enter” 如果一个字段名已被使用,再出现时会增加一个数字作为字段名。 例如:在一个调查表中有下列行: v1 Enter age of patient # “v1” v1 Height of patient # “v2”以调查表的第一个词作为字段名以调查表的第一个词作为字段名51“更新问题为实际文件名更新问题为实际文件名”如果未勾选如果未勾选52预览显示的并非预览显示的并非真实的字段名真实的字段名如如“姓名姓名”, 真实的字真实的字段名是段名是FIELD15354EpiData将根据字段的“问题”(即输入字段左面的文本)自动产生一个字段名,字段名是以英文

13、字母(A-Z)开始,最长8个英文字符。其它国际字符将被跳过。字段名的产生从字段“问题”字母开始。使用使用 的内容自动添加字段名的内容自动添加字段名What did you doWhat did you do?_55在普通文本中优先选择“ ”括进的文本。如果问题是my firstfield?那末字段名将为MYFIELD;如果问题是“姓名name?”,产生的字段名为name。通用常见单词不予考虑(即What? Who?If?etc.)。What did you do?产生的字段名为YOUDO。如果字段前没有“问题”文本,字段名就取前一个字段名再加上一个数字。如果前一个字段名是dMY字段,那末下一个

14、字段(如果没有“问题”文本)就是dMY1。如果前一个字段是dV31,则下一个字段名就是dV32。如果不存在前一个字段名则使用隐含字段名FIELD1。如果第一个字符是数字则在第一个字符前插入一个字母N。例如 3 little mice?产生的字段名为N3LITTLE。自动添加字段名基本规则自动添加字段名基本规则56按 命名规则修改调查表,然后预览生成REC文件57别忘了修改别忘了修改“选项选项”,否则否则会是这样的581.建立调查表文件(5)字段)字段类型变量编码类型变量编码Field Pick List变量标签变量标签字段名字段名变量编码变量编码字段类型介绍字段类型介绍数值型字段:#,#.#

15、;仅接受数字和空格,不输按空格处理,分析时作缺失值处理,以“.”显示。数字位数由“#”个数决定,小数位数由小数点右边的“#”个数确定。最长可达14位,小数点按1个字符计算。60文本型字段:包括三种。一种是常用的文本(或下划线、或底线)型字段:_;该型字段由连续下划线来定义,长度由下划线字符个数决定,最大值为80,空白字段(字段内容空缺)时,数据管理时将按缺失值处理。另一种为大写文本型字段:。61日期型字段:包括两种。一种为常用日期字段:、,分美式、英式两种,输入时即进行合法性检验;只需输入日期,系统自动插入斜杠。另一种为自动日期型字段:、 ;储存或修改数据时该字段自动输入系统日期,如系统日期正

16、确,也即当天日期。62自动ID号型字段:;这是一种专用字段,用作记录识别号,文件的第一个记录为1,以后记录自动赋值顺次较前增加1,并自动保证编号的唯一性。输入数据时光标跳过此字段。如需使第一个记录号大于1,则可在“文件”菜单“选择项”中的“高级设置”中设置。逻辑型字段(即布尔函数型字段):;只接受Y、N、空格或回车键。后两者作缺失值处理。Y、N字符输入后即转为大写字母。63制作调查表文件可用EpiData编辑器进行。也可用Word或其它文本编辑器编写。注意,必须以纯文本格式存盘,文件后缀名必须是“.qes”。也可在其它文本编辑器编写,再粘贴到EpiData编辑器窗口。如何编写调查表文件64编写

17、调查表文件注意事项(一)编写过程中及时保存文件,文件类型为编写过程中及时保存文件,文件类型为.qes.qes文件文件。系统只会根据系统只会根据“特殊符号特殊符号”来定义一个输入字段(包括类型和来定义一个输入字段(包括类型和长度),并根据符号前的字符给字段命名。建议在编写过程中利长度),并根据符号前的字符给字段命名。建议在编写过程中利用用“字段快速清单字段快速清单”插入插入“特殊符号特殊符号”,即:选择字段类型,定,即:选择字段类型,定义好长度后,按义好长度后,按“插入插入”图标,可避免由于图标,可避免由于“特殊符号特殊符号”输入错输入错误而不能产生有效的输入字段。误而不能产生有效的输入字段。调

18、查表用中文编写时,可用调查表用中文编写时,可用定界符(定界符(“”)将字段名定义为英将字段名定义为英文字符(英文字母或英文字母阿拉伯数字),有利于数据库的文字符(英文字母或英文字母阿拉伯数字),有利于数据库的管理和其他软件的统计分析。注意:管理和其他软件的统计分析。注意:“”必须为半角型,而不能必须为半角型,而不能是全角型是全角型(“ (“”) )。65尽可能把字段定义尽可能把字段定义数值型数值型,有利于统计分析。如糖尿病史,有利于统计分析。如糖尿病史“dmhis”dmhis”可定义为数值型字段,可定义为数值型字段,“1”1”表示表示“有有”,“0”0”表示表示“无无”。调查表文件调查表文件格

19、式尽可能和原调查表一致格式尽可能和原调查表一致,有利于直观录入数据。,有利于直观录入数据。如果用其他文本编辑器编写如果用其他文本编辑器编写.qes.qes文件,在运行文件,在运行EpiDataEpiData后,打开后,打开该该.qes.qes文件即可编辑。文件即可编辑。调查表文件的编写是否符合要求,可通过调查表文件的编写是否符合要求,可通过“数据表预览数据表预览”来查看。来查看。编写调查表文件注意事项(二)662.创建数据文件Make Data FileMake Data File数据文件的产生和修改 主菜单主菜单选择数据导入选择数据导入/ /导出菜单导出菜单“根据根据QESQES文件生成文件

20、生成RECREC文件文件”在工作过程工具条按第二个按钮在工作过程工具条按第二个按钮“生成生成RECREC文文件件”在编辑器菜单在编辑器菜单RECREC文件菜单文件菜单选择选择“生成生成RECREC文件文件”68生成生成RECREC文件文件6970 请大家根据EPIDATA建立调查表库data.qes,生成数据库,保存为data.rec71调查表调查表姓名:姓名:_性别:(性别:(1)男)男 (2)女)女身高:身高:_._ CM出生日期:出生日期:_年年_月月_日日数据文件结构的修改72调查表结构重新修改后怎么办?调查表结构重新修改后怎么办? 数据库建立后,录入了一部分数据,发现漏掉数据库建立后

21、,录入了一部分数据,发现漏掉了一个字段,于是重新修改调查表,这里可以了一个字段,于是重新修改调查表,这里可以根据修改后的根据修改后的QES文件更新文件更新REC文件。文件。732007年8月3.建立核查文件Add/Revise核对文件的建立 核对文件核对文件:CHECKCHECK文件或文件或 .CHK.CHK文件文件 n 范围范围/ /合法值(合法值(Range/LegalRange/Legal)n 跳转(跳转(JumpsJumps)n 必须输入(必须输入(MustEnterMustEnter)n 重复输入(重复输入(RepeatRepeat)7677光标悬停,会提示你命令格式78录入错误时,

22、软件会弹出警告793.建立核查文件必须录入必须录入3.建立核查文件必须录入必须录入只允许录入只允许录入1,2,9或或1 2 9,9表示缺失值表示缺失值1,2,9或或1 2 93.建立核查文件只允许录入只允许录入1,2,9或或1 2 9,9表示缺失值表示缺失值正确:正确: 12,9 错误:错误: 9 ,12如选择如选择2(否(否)(不吸(不吸烟),烟),则跳转到则跳转到A11(饮(饮酒)酒)必须录入必须录入3.建立核查文件必须录入必须录入只允许录入只允许录入1,2,9或或1 2 9,9表示缺失值表示缺失值如选择如选择2(否(否)(不吸烟),(不吸烟),则跳转到则跳转到A11(饮酒),选(饮酒),

23、选择择9,则跳转到,则跳转到A19(调查员(调查员姓名)姓名)2A11,9A193.建立核查文件不管选择什么,录入完毕后,直接跳转到A19(调查员姓名)3.建立核查文件3.建立核查文件3.建立核查文件3.建立核查文件3.建立核查文件2007年8月3.建立核查文件4.录入数据OpenEnter Data选择要录入的数据库(选择要录入的数据库(.REC)4.录入数据变量间转换变量间转换uEnteru、uTab、Shift+TabuCtrl+Home、uCtrl+Endu鼠标鼠标4.录入数据4.录入数据查找记录查找记录Go to record已知记录号已知记录号4.录入数据查找记录查找记录Find

24、Record 不知道记录号不知道记录号 按某种条件查找按某种条件查找4.录入数据查找记录查找记录最多可在最多可在10个不同的变个不同的变量上设置搜量上设置搜寻条件寻条件4.录入数据查找记录查找记录允许设置的条件允许设置的条件等于等于小于小于大于大于 不等于不等于 以此结束以此结束*abcd以此开始以此开始abcd*包含包含*abcd*4.录入数据查找记录查找记录4.录入数据查找记录查找记录Find Again以相同的搜以相同的搜索条件继续索条件继续查找满足条查找满足条件的下一条件的下一条记录记录4.录入数据查找变量查找变量Find Field4.录入数据关闭录入表格关闭录入表格Close Fo

25、rm记录删除 此处仅是在记录加上删除标记, 彻底删除需至“工具”清理REC文件”点击点击103双录入核对 double entry 为了确保录入质量,可以采用双人录入法进行核对。 首先利用工具-复制REC文件结构,复制已建立好的数据库(包括CHK文件),另存为一新库,但已录入的数据不会被复制。104双录入核对 double entry 如需要,可不复制字符型变量 因为家庭住址、工作单位等很少有人愿意录入两次。105两次录入的一致性检验 双轨录入完成后可进行一致检验 比较两次录入不同的地方 注意选择两数据库中的匹配字段用于比较106107108双录入实时校验 先点击工具-准备双录入实时校验109

26、双录入实时校验u指定第1 次已录入的REC文件u创建1新的REC文件,用于双录入110双录入实时校验111应注意录入调查表的顺序显示数据112浏览数据库其它一些常用功能 打印调查表(在数据录入窗体下)文件-打印数据表113将数据库存档 工具-创建压缩文件 可以将指定目录下所有文件、仅EPIDATA文件或单个文件压缩、打包和保存。(ZIP) 需要的时候再利用“工具-解压缩文件”解压缩114描述数据115简单描述和分析数据数据文件的导出和导入 116117数据转出数据转出118转为dbase文件119方法 1 *.REC *.SPSS120121122123数据库的纵向追加与横向合并 124数据库的纵向追加(头-尾)一般用于追加记录,如同学甲录了50份,同学乙录入了60份,现将两数据库合并成个库,共110份记录。注意选项125数据库的横向合并 (肩-肩)如一份调查表包括两部分,同学甲录了Part 1,同学乙录入Part 2,现将两数据库合并成个库,包含Part 1和Part 2。选择关键字段用于匹配,一般用记录号NO作为关键字段,注意需保证

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论