医学数据管理_Epidata【稻香书屋】_第1页
医学数据管理_Epidata【稻香书屋】_第2页
医学数据管理_Epidata【稻香书屋】_第3页
医学数据管理_Epidata【稻香书屋】_第4页
医学数据管理_Epidata【稻香书屋】_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学研究数据管理与统计分析Data management & analysis,1,高等课堂,搜集资料,整理与分析资料,调查(研究)项目,分析表(指标,研究目的,回答,统计分析步骤,调查研究步骤,研究设计思路与数据管理分析步骤,解释、呈现结果,2,高等课堂,确定调查和研究的目的是选定研究指标的依据 研究指标又是研究目的的具体体现,一、明确调查和研究的目的,了解参数,用以说明总体。 研究变量间的关系,通过确立统计学联系来 探索病因或验证疗效等。,3,高等课堂,二、确定研究对象和观察单位,研究对象:对象来源总体是什么? 抽样方法:如何抽样?代表性? 观察单位:个体?群体,4,高等课堂,三、研究设计

2、类型的选择,根据研究目的选择合适的设计类型: 描述疾病的或健康状况的三间分布 探讨病因 验证预防和控制措施的效果 评价疫苗的效果 新药上市前临床试验,5,高等课堂,6,高等课堂,四、确定研究项目,拟定调查表(问卷,调查和研究项目的确定:分析项目、备选项目 调查表和原始数据记录表的设计,7,高等课堂,根据研究设计类型确定所需样本量计算公式。 相关参数: 一类错误的概率:即检验水准,越小所需样本含量越多,对于相同的检验水准,双侧检验比单侧检验所需的样本含量更大,通常取0.05。 把握度(power) 1-,一般0.8-0.9 单侧检验还是双侧检验,单侧检验所需样本量小,双侧检验所需样本量大,五、样

3、本含量的估计,8,高等课堂,常用样本含量的估计软件:EpiCalc 2000,9,高等课堂,常用软件:EPI INFO,10,高等课堂,常用软件:OPENEPI,11,高等课堂,直接观察法 采访法 包括面访、调查会及信访、电话访问等,六、原始资料的收集,原始资料的收集方式,12,高等课堂,七、调查和研究的质量控制,真实性(效度) 可靠性(信度,偏倚及其如何控制,如何评价,13,高等课堂,录入前的核对 录入计算机,建立数据库(database) Excel、Access、EpiData、STATA、SPSS、SAS软件等 录入后的核对和整理 逻辑检查、核对 排序(sorting) 建立新变量 数

4、据的编码和转换 缺失值的处理,八、 数据资料的整理,14,高等课堂,Dbase, FoxBase,Visual FoxPro,Lotus,数据录入和管理软件,15,高等课堂,用Epidata构建调查表数据库,16,高等课堂,用Epidata录入调查表,17,高等课堂,统计分析常用软件,18,高等课堂,让我们从一个简单的调查开始,研究目的:了解本班同学年龄、性别、身高等信息。 Step1: 建立调查表 文本编辑软件:Word,19,高等课堂,Step 2:调查表数据录入,20,高等课堂,EpiData软件概述,一、EpiData的设计 设计者:丹麦的Jens M、Michael Bruus和英国

5、的Mark Myatt 编程者:丹麦的Michael Bruus 开发思路和原理:基于Epi Info 6.0 二、软件下载和登记注册 下载地址:http:/www.epidata.dk/ download.htm 三、版本信息 EpiData 1.5(2001年2月22日);EpiData 2.1a(2002年) EpiData 3.02(2004); EpiData 3.10(NOW) 四、安装和系统要求 可在Windows 95/98/NT/2000/XP/7等操作系统下运行,21,高等课堂,EpiData软件概述,EpiData软件安装如同拷贝程序文档一样简单。例如,它可以从U盘运行,

6、并且占用内存很小(2.5M)。 由于捐助和志愿者的工作,软件免费发布,22,高等课堂,EpiData程序下载与安装,http:/www.epidata.dk,23,高等课堂,EpiData程序下载与安装,数据录入,24,高等课堂,EpiData 软件,EpiData 软件是在吸收 DOS版的Epi Info 6.0 软件优点基础上开发研制的 Windows版软件,25,高等课堂,EpiData 软件,它一方面吸收了Epi Info软件的长处,同时又极具自身特色。 与 视窗版Epi Info软件相比,占用空间小,更加简单易学,且界面友好,可以很方便的对数据进行储存、核对和管理等,26,高等课堂,

7、用EpiData软件进行数据录入和管理,将产生三种基本的文件; 每种文件具有固定的后缀,在数据录入和管理中发挥不同作用。 (1)调查表文件:后缀为.QES。通过建立调查表文件,系统根据特定规则自动定义数据文件的结构,包括变量名、变量类型和长度等,用于数据录入。 (2)数据文件:后缀为.REC。数据文件包含录入的数据信息以及已经定义好的编码,用于数据的统计分析。 (3)核对文件:后缀为.CHK。通过建立核对文件,系统将定义数据录入的有效性规则,EpiData Entry 的文件组成,27,高等课堂,EpiData Entry 的特点,调查表设计便捷 数据核查功能强大且实现简便 与调查表形式一致的

8、可视数据录入界面 数据转换功能强大,28,高等课堂,讲了半天, EpiData究竟长什么样,29,高等课堂,请打开电脑上EpiData主程序,为何我的电脑上没有欢迎使用EpiData,30,高等课堂,EpiData软件的窗口介绍,31,高等课堂,编辑过程工具条,工具栏,数据表预览,粘贴,字段编辑器,编码编辑器,32,高等课堂,调查表文件的建立,数据文件: 原始数据 文件结构(库结构) 字段名 字段类型 字段长度,调查表信息 数据文件,33,高等课堂,建立调查表文件,建立调查表文件是建立数据库、实现数据录入和管理的第一步,34,高等课堂,建立调查表文件有以下几种方法,第一种:在菜单中,点击 “文

9、件”(File)“生成调查表文件QES文件” 第二种:在工作栏的工作流程中,点击“1. 打开文件”(1.Define Data)“建立新QES文件” 第三种:在按钮栏中,点击 ,这时窗口中会在工作区显示一个空白的文档,你可以在此文档中键入调查表内容和框架,编辑完成后,将调查表文件保存,文件的扩展名统一为.QES,35,高等课堂,假定现有一调查表如下,如何建立.QES文件,调查表 姓名:_ 性别:(1)男 (2)女 身高:_._ CM 出生日期:_年_月_日,36,高等课堂,如果按原调查表格式直接建立数据库,结果会怎样,37,高等课堂,必须定义字段名和字段类型,38,高等课堂,调用字段编辑器:

10、第一种方法:直接按CTRL-Q键。 第二种方法:在编辑器工具条上点击字段编辑器图标,手工输入或使用字段编辑器,39,高等课堂,字段类型介绍,数值型字段:#,#.# ;仅接受数字和空格,不输按空格处理,分析时作缺失值处理,以“.”显示。数字位数由“#”个数决定,小数位数由小数点右边的“#”个数确定。最长可达14位,小数点按1个字符计算,40,高等课堂,文本型字段:包括三种。一种是常用的文本(或下划线、或底线)型字段:_;该型字段由连续下划线来定义,长度由下划线字符个数决定,最大值为80,空白字段(字段内容空缺)时,数据管理时将按缺失值处理。另一种为大写文本型字段,41,高等课堂,日期型字段:包括

11、两种。一种为常用日期字段:、,分美式、英式两种,输入时即进行合法性检验;只需输入日期,系统自动插入斜杠。另一种为自动日期型字段:、 ;储存或修改数据时该字段自动输入系统日期,如系统日期正确,也即当天日期,42,高等课堂,自动ID号型字段:;这是一种专用字段,用作记录识别号,文件的第一个记录为1,以后记录自动赋值顺次较前增加1,并自动保证编号的唯一性。输入数据时光标跳过此字段。如需使第一个记录号大于1,则可在“文件”菜单“选择项”中的“高级设置”中设置。 逻辑型字段(即布尔函数型字段):;只接受Y、N、空格或回车键。后两者作缺失值处理。Y、N字符输入后即转为大写字母,43,高等课堂,我们按照这些

12、要求重新建立数据库,这次应该成功了吧,先预览一下,44,高等课堂,怎么会这样,45,高等课堂,定义字段名(Field Names,以调查表中字段的第一个词命名 (First word in question is field names) 使用 内的内容自动添加字段名(Automatic field names,46,高等课堂,定义字段名(Field Names,文件”(File)“选项”(Option)“生成REC文件”(Create data file) 在“如何生成字段名”(How to generate field names)中选择字段的命名方式,47,高等课堂,更新问题为实际文件名

13、”如果未勾选,48,高等课堂,预览显示的并非真实的字段名,如“姓名”, 真实的字段名是Field1,49,高等课堂,50,高等课堂,按 命名规则修改调查表,然后预览生成REC文件,51,高等课堂,别忘了修改“选项,否则会是这样的,52,高等课堂,制作调查表文件可用EpiData编辑器进行。 也可用Word或其它文本编辑器编写。注意,必须以纯文本格式存盘,文件后缀名必须是“.qes”。 也可在其它文本编辑器编写,再粘贴到EpiData编辑器窗口,如何编写调查表文件,53,高等课堂,编写调查表文件注意事项(一,编写过程中及时保存文件,文件类型为.qes文件。 系统只会根据“特殊符号”来定义一个输入

14、字段(包括类型和长度),并根据符号前的字符给字段命名。建议在编写过程中利用“字段快速清单”插入“特殊符号”,即:选择字段类型,定义好长度后,按“插入”图标,可避免由于“特殊符号”输入错误而不能产生有效的输入字段。 调查表用中文编写时,可用定界符(“”)将字段名定义为英文字符(英文字母或英文字母阿拉伯数字),有利于数据库的管理和其他软件的统计分析。注意:“”必须为半角型,而不能是全角型(“”,54,高等课堂,尽可能把字段定义数值型,有利于统计分析。如糖尿病史“dmhis”可定义为数值型字段,“1”表示“有”,“0”表示“无”。 调查表文件格式尽可能和原调查表一致,有利于直观录入数据。 如果用其他

15、文本编辑器编写.qes文件,在运行EpiData后,打开该.qes文件即可编辑。 调查表文件的编写是否符合要求,可通过“数据表预览”来查看,编写调查表文件注意事项(二,55,高等课堂,数据文件的产生和修改,主菜单选择数据导入/导出菜单“根据QES文件生成REC文件” 在工作过程工具条按第二个按钮“生成REC文件” 在编辑器菜单REC文件菜单选择“生成REC文件,56,高等课堂,生成REC文件,57,高等课堂,58,高等课堂,请大家根据EPIDATA建立调查表库data.qes,生成数据库,保存为data.rec,调查表 姓名:_ 性别:(1)男 (2)女 身高:_._ CM 出生日期:_年_月

16、_日,59,高等课堂,现在我们已经有了两个文件: *.QES 调查表文件 *.REC 数据文件 *.REC文件是根据QES文件生成的,用于数据录入,万一我的QES文件丢了怎么办,60,高等课堂,数据文件结构的修改,61,高等课堂,调查表结构重新修改后怎么办,数据库建立后,录入了一部分分数据,发现漏掉了一个字段,于是重新修改调查表,这里可以根据修改后的QES文件更新REC文件,62,高等课堂,我一边QQ聊天,一边录入数据,万一录错了,软件会通知我吗,嗨!有第3种人吗,63,高等课堂,核对文件的建立,核对文件:CHECK文件或 .CHK文件,范围/合法值(Range/Legal) 跳转(Jumps

17、) 必须输入(MustEnter) 重复输入(Repeat,64,高等课堂,65,高等课堂,光标悬停,会提示你命令格式,66,高等课堂,录入错误时,软件会弹出警告,67,高等课堂,试试,如果将1改为20会怎样?改为15会怎样,关键字段的定义,以编号code2为例,这个编号具有唯一性,为避免重复输入,可在CHK文件中定义: code2 KEY UNIQUE 1 MUSTENTER END,68,高等课堂,练习,请大家根据下列调查表内容,利用EPIDATA建立调查表数据库,保存为data1.qes,并生成data1.rec用于录入资料,69,高等课堂,调查表 1.地区号: N J 2.调查表编号:

18、 3. 录入ID号: 4.姓名:_ 5.性别:(1)男 (2)女 6.你吸烟吗? (1)否跳问7 (2)是 续问6.1 6.1 你多在年龄开始吸烟的? _ 岁 6.2 平均每天吸烟支数? _ 支 7.身高:_._ CM 8.血压值(收缩压/舒张压): _ /_mmHg 9.出生日期:_月_日_年 10. 你是否具有下列症状?如有请在相应症状前打勾。 咳嗽 咳痰 发热 胸痛 呼吸困难 咯血 11.调查表录入日期: _月_日_年,录入时自动编码,70,高等课堂,请大家根据data1.rec数据库,建立CHK文件,保存为data1.chk 要求: (1)地区号自动录入 (2)编号、姓名必须录入 (3

19、)性别只能填1或2 (4)是否吸烟只能填1、2或9 (5)是否吸烟能够实现跳转 (6)平均每天吸烟支数的范围在1-40之间或填99 并请尝试录入35份调查表,存盘,71,高等课堂,记录删除,此处仅是在记录加上删除标记, 彻底删除需至“工具”清理REC文件,点击,72,高等课堂,如果研究对象是(1)男性,而我却录成了(2)女性,软件好象不会弹出警告嘛,73,高等课堂,双录入核对 double entry,为了确保录入质量,可以采用双人录入法进行核对。 首先利用工具-复制REC文件结构,复制已建立好的数据库(包括CHK文件),另存为一新库,但已录入的数据不会被复制,74,高等课堂,双录入核对 do

20、uble entry,如需要,可不复制字符型变量 因为家庭住址、工作单位等很少有人愿意录入两次,75,高等课堂,两次录入的一致性检验,双轨录入完成后可进行一致检验 比较两次录入不同的地方 注意选择两数据库中的匹配字段用于比较,76,高等课堂,77,高等课堂,78,高等课堂,调查表录入两次,比较后发现错误再修改,好象太麻烦! 有没有边录入边比较的方法,79,高等课堂,双录入实时校验,先点击工具-准备双录入实时校验,80,高等课堂,双录入实时校验,指定第1 次已录入的REC文件 创建1新的REC文件,用于双录入,81,高等课堂,双录入实时校验,应注意录入调查表的顺序,82,高等课堂,显示数据,浏览数据库,83,高等课堂,其它一些常用功能,打印调查表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论