第二十四章 数据管理及EPIDATA-liu_第1页
第二十四章 数据管理及EPIDATA-liu_第2页
第二十四章 数据管理及EPIDATA-liu_第3页
第二十四章 数据管理及EPIDATA-liu_第4页
第二十四章 数据管理及EPIDATA-liu_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据管理及EpiData软件简介刘巧兰研究设计实施调查/干预分析资料结果解释设计问卷收集数据分析数据撰写报告数据录入数据管理数据管理指统计信息用数据表示,并按数据类别组织保存并提供的过程。包括:

数据的组织和保存数据维护数据提供数据备份、数据归档等数据录入指将统计信息转换为数据形式,输入到计算机进行保存、管理的过程。它是计算机数据管理的起点和基础数据录入的步骤1.资料审核:资料真实性和完整性?2.编码表制定:问题的类别或观察指标给定一个特定代码,建立一一对应关系。3.数据编码:如变量性别(男0女1)4.数据库建立:数据库结构、数据库文件、数据输入界面、其他数据功能5.数据输入:编码数据录入计算机6.数据检查:有效性、逻辑性检查数据录入和管理软件EpiInfoEpiDataMicrosoftExcelMicrosoftAccessVisualFoxProOther:SPSS,SAS,STATA…..EpiData免费的数据录入和数据管理软件由丹麦EpiData协会开发,可直接从www.epidata.dk

下载,版本不断更新EpiData3.03.1……具有多国语言版本;应用于公共卫生领域和临床医学;EpiData的安装、运行不会依赖系统文件夹中的任何文件,可以通过setup.exe在计算机中安装这个程序;也可以直接拷贝EpiData.exe文件到计算机中,同样可以运行。EpiData特点直观方便简单易学实用性强对计算机硬件要求不高数据录入功能强EpiData数据库文件调查表文件(*.qes):建立数据录入表格的框架数据文件(*.rec):即数据录入表格核查文件(*.check):设置数据录入过程中某些选项的跳答、必须录入、重复录入等EpiData基本步骤建立编码表例24.1为监测某地区四个学校一、二年级7岁儿童的生长发育情况,拟定了如图24.1的体检监测表,体检时间是2007年1月1日。已知学生的学号范围是011001—042047。拟用EpiData建立数据库,请编写编码表。图24.1某地区学校一、二年级7岁儿童体检监测表表24.1例24.1儿童体检监测表的编码表EpiData的进入选择菜单“开始——程序——EpiData——EpiData数据录入和管理流程建立调查表文件创建数据库建立核查文件录入数据数据库管理输出数据建立调查表选择菜单“文件——建立新QES文件”,得到问卷编辑窗口如下:输入问卷内容前,选择菜单“文件——选择项”,弹出如下对话框:

上面对话框主要用于一些基本的设置,例如:字体、背景等。单击上图中的“生成数据文件”,则出现下面的对话框:

选定“如何自动添加文件名,由输入决定”这两个选项变量类型变量编码

数值型######.##字符型______________或者<E>大写字母字符型<A>,<A>布尔逻辑变量<Y>(只接受Y,N,0,1)日期<dd/mm/yyyy>或者<mm/dd/yyyy><yyyy/mm/dd>输入问卷内容问卷编辑窗口:输入问卷内容的同时,必须插入“_______、##、<yyyy/mm/dd>”这些符号,生成数据文件后,它们就转变为“填答案的空缺”分别表示此处可输“汉字、数字、日期”如姓名(x4)

“输入x4姓名——选择编辑菜单——字段清单”弹出字段选取对话框,“选择文本——输入需要的字段长度(例如10)——单击插入”,就可以在光标处地方插入“________”如身高y3②y3:“输入y3:厘米——选择编辑菜单——字段清单,“选择数字——输入需要的数字长度——单击插入”,就可以在光标处地方插入“###.##”,图中的3就表示可输3个数字,2表示小数位数为2位如出生日期y2y2:出生日期:年/月/日——选择编辑菜单——字段清单”,“选择日期—<yyyy/mm/dd>——单击插入”,就可以在光标处地方插入“<yyyy/mm/dd>”生成数据文件产生数据文件选择“是”——命名文件——保存,得到如下数据库的打开进入EpiData界面后,选择“文件——打开文件”,选择要打开的数据库(*.rec)建立数据核查文件(.chk)数据输入核查的方法字段强制输入限制字段输入值限制字段输入条件限制逻辑检查使用核查命令对话框编写核查文件选择“数据录入质控”——“添加/修改录入质控程序”——选择“相应数据库文件”——打开——选择“需要进行输入限制的字段”——选择“限制方法”——填写限制内容——存盘——关闭数值允许范围及允许值(Range,Legal)

在“Range,Legal”的定义框中键入允许录入的最小值和最大值,并用连字符“-”连接。例如,键入“2-5”,表示当前变量只允许录入2、3、4、5四个数值。如果只对最大值有限制,则用“-INF”(负无穷大)表示最大值。如果只对最小值有限制,则可以用“INF”(无穷大)表示最小值。例如,键入“-INF-5”表示当前变量录入的数值必须≤5。键入“0-INF”表示录入的数值必须≥0。数值允许范围及允许值(Range,Legal)允许值(legal)是在Range,Legal的定义框中键入所有允许输入的数值,数值之间以逗号或空格间隔。如果使用空格作间隔,程序也会自动将其转换为逗号间隔。例如,键入“4,6,8,10”表示当前变量只允许录入4、6、8、10四个数值。如果你的设置中既有允许的范围,又有允许值,那么范围值必须放在前面,允许值放在后面。例如,键入“2-6,8”表示允许录入的数值包括2、3、4、5、6和8。键入“8,2-6”,程序会提示错误。设置跳转功能时,请依次键入跳转值、大于号(>)、跳转的目标变量名。跳转语句间用逗号分隔。例如,1>V23,2>V40表示输入1时,跳转到变量V23;输入2时,跳转到变量V40。除了可以指定跳转的目标变量外,还可以使用另外两种跳转方式,即END和WRITE。END表示“跳转到数据录入表格的最后一个变量”,WRITE表示“将当前记录存盘”。例如,设置跳转为“1>V30,2>END,3>WRITE”表示:当输入1时,跳转到变量V30;如果输入2,直接跳转到最后一个变量;如果输入3,将当前记录存盘。直接编写核查文件(1)核查文件结构和内容关键字1

核查命令……END…….关键字n

核查命令…….END以某个字段名作为命令块的开始是最常见的情况,基本形式如下:字段名1

核查命令…END…字段名m核查命令…END(2)常用核查命令1)合法值列LEGAL/COMMENTLEGALCOMMENTLEGAL

值1编码值1含义1 ……

值n编码值n含义nENDENDCommentLegal:不仅能指定单个合法值列表,而且能指定其值的含义,它实际上就是列出本字段编码表。2)数据范围RANGE指定本字段输入数据范围,格式如下:

RANGE下限上限3)跳转JUMPS当本字段输入完成后,按本字段指定值跳转到指定字段继续录入,格式如下:JUMPS

值1字段名1 …

值n字段名nEND4)自动跳转AUTOJUMPS/GOTO当本字段输入完成后,直接跳转到指定字段继续录入,格式如下:AUTOJUMPS字段名GOTO字段名5)赋值计算LET使某个字段的值等于右侧公式的计算结果,格式如下:

LET字段名=计算公式6)条件语句块IF…THEN…ELSE…ENDIF根据指定条件执行相应的命令,格式如下:IF(条件表达式)THEN

条件满足时执行的命令表ELSE

条件不满足时执行的命令表ENDIF7)关键字段KEY指定某字段是数据库关键字段,并作为识别数据记录的标志,要求EpiData建立对应的索引文件以帮助数据查询,格式如下:KEYUNIQUE或者KEY当使用KEYUNIQUE命令时,关键字段的输入值在数据库内是唯一的,从而保证该记录是数据库内唯一记录,防止数据重复输入。8)确定输入CONFIRM,格式如下:BEFOREFILE光标不会自动移到下一个录入字段,必须按回车键.CONFIRMEND(五)数据输入文件——打开EpiData文件——选择(*.REC)文件类型

——选择相应的数据库文件名——打开

图24.9数据库数据输入窗口为保证数据录入的质量,常采用双人双录入的方法进行数据录入。在准备双录入时,你可以选择菜单“工具——拷贝数据文件结构”,此操作就可将一个已经建好的数据结构,另存为一个新的数据库

数据核查数据录入完成后,必须进行数据录入后核查,以发现和纠正录入错误。核查过程与数据清理相同,具体内容见第二节数据核查与清理。数据归档备份数据库归档:纸质归档和电子归档数据库归档:包含数据库本身外,还应包含数据库结构、文件大小、最后修改日期、编码表和相关文件如问卷文件、检查文件名称和内容等。EpiData数据库相关的文件形式和类型多样,不便于归档管理,将所有文件压缩成一个文件保存会极大地方便归档保存和数据传递,所以可以对数据进行压缩归档。数据归档压缩操作顺序如下:工具——创建文档——选择需压缩的数据库文件——输入将要保存的压缩文件名及储存地址——确定

图24.10数据压缩备份对话框数据双录实时双录:第二次输入数据时立即与第一次输入的数据比对,即时检查、更正。独立双录分别两次独立完成所有数据的录入,然后进行数据库比对,最后根据比对结果,纠正不一致的输入错误。数据库一致性检查选择“数据处理”——选择“一致性检验”,得到如下:分别选择两次录入的数据库——确定选择匹配字段——选中“选项中”所需选项——确定第二节数据核查与清理数据核查:数据录入完成后,对已录入的数据进行合理性检查,以发现和纠正填写和录入错误的过程。数据清理:在进行统计分析前对数据进行检查以发现和剔除不合理数据的过程从本质上看,无论是数据核查还是数据清理其基本原理和处理过程是相似的。(一)重复记录检查检查重复记录必须有关键字段,并以关键字段值是否重复作为衡量记录是否重复的标准,即如果出现两个及以上记录的关键字段值相同,则相应的记录为重复记录。重复记录检查的操作顺序选择“其他功能”——“计算记录数”,则:

选择REC文件——选择关键字段——确定(二)数据合理性检查数据合理性检查即对输入数据信息的有效性检查,也称幅度检查。数据合理性检查的操作顺序选择“其他功能”——“变量基本描述”——选择数据库REC文件——确定,得:

选择检查字段——确定结果输出窗口:包含各个计算字段的数据值限制命令和实际数据值结果

浏览上面各个字段的分析结果可发现错误数据和异常数据第三节数据预处理数据预处理:完成数据录入并清理后的数据在进行统计分析前,按规范对数据进行集中和整理、统一汇总、统一指标计算的过程。

包括:数据规范、合并和汇总计算新字段数据类型转换数据变换重新分类、汇总(一)数据合并纵向合并进行纵向合并的两个数据库的数据结构应该相同或基本相同横向合并横向合并的两个数据库应该具有相同的关键变量,其结果将同一观测对象的所有字段和记录集中存放在同一数据库中。纵向合并的操作顺序选择“数据输入/输出”——纵向追加记录/横向合并字段,选择需要合并的两个数据库名,如下:选择“确定”由以上步骤可得:填写新的合并数据库名——在“追加/Append”中选择“在A的末记录后追加两者共用字段的记录”——追加/Append填写文件标记(可省略)——确定——确定横向合并的操作步骤选择“数据导入/导出”——纵向追加记录/横向合并字段——选择需要合并的两个数据库名,得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论