数据库在医疗领域的研究分析及测试对比_第1页
数据库在医疗领域的研究分析及测试对比_第2页
数据库在医疗领域的研究分析及测试对比_第3页
数据库在医疗领域的研究分析及测试对比_第4页
数据库在医疗领域的研究分析及测试对比_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Cache在医疗领域的研究分析及测试对比陈航陕西省人民医院信息科高级工程师邮编 :710068西安巿友谊西路 256 号关健词 Cache 对比测试摘 要将数据库Cache与目前在我国医疗行业信息化应用中广泛使用的数据库Microsoft SQLServer 2000、Oracle9i、DB2在同等条件下进行海量测试, 得出Cache在医疗卫生领域应用的优势.Cache 是新一代高性能数据库技术,被誉为创新的“后关系型”数据库(Postrelational Database )。它以ANSI和ISO标准M语言的独特多维数据 模型为基石, 提供了三种整合的、 能并发访问同一数据的数据库技术: 成

2、熟的对 象访问方式,高性能的SQL访问方式以及丰富的多维访问。在 Cache中的对象模 型具备了符合ODMGS准的完整的对象特性,而且融合了为 OLTP专门优化过的 SQL技术,并无缝集成了为实现快速开发 Web应用的最新技术。Cache创新地摆 脱了传统关系数据库的局限性, 在对象数据、 关系型数据以及多维数据视图之间 不需要映射,节省了开发和运行时间。面向对象建模技术是目前编程中的主流技术。 Cache完全面向对象,在构建 数据关系复杂的应用中有独特的吸引力, 尤其是在医疗行业中的应用。 在国际上 医疗行业信息化相对发达的国家,如美国等, Cache数据库的使用非常广泛。美 国十大医院和三

3、大实验室都在使用 Cache数据库,而且在美国国防部的VA系统 中也使用着Cache数据库,Cache数据库医疗行业的应用有以下特点:5.1 Cach e在医疗领域的多维数据存取疾病是一个多变而复杂的对象, 随时都有可能有新的疾病出现, 或者是疾病 的变种,甚至一个病人的疾病也会有变异或者转移的可能。 新疾病有着不同的疾 病类型,那么它可以从几种不同的类型里继承出来。同样,一些症状也是对象, 新的症状可以从原来的继承出来,如图 5-1。图 5-1 疾病的演变在疾病、药物、病人、检查等维系复杂的元素之间,可能存在不同的元素关 系。例如一个元素 A 可能包含着不定数目的元素 B、C、D、E 等,而

4、 B、C、D、E 也可能有着自己的不定包含。 如果非要用一个固定的二维表格的话, 可能就需要 限制包含的数目, 以及包含的深度。 如果说是对象, 只需要图 5-2 的简单的定义 就可以了。图 5-2需要成为被包含元素的 A、B、C、D、E 都从一个类里面继承出来,这个基类 可以是一个空的类。然后 A 里面的一个属性 S 作为一个基类的集合:Property S As 基类 Collection=list 这样,复杂的关系,就可以简单地表示出来。如上所示,Cache使用高效的多维形式来存储数据。Cache运用各种技术存取 数据,如基于对象的访问模式、表格或多维数组模式标准SQL访问模式和 Web

5、访问模式等等, 所有这些数据访问模式也可以并发地访问同一个数据。 有了这个 多维数据引擎, 就可以用任何方式来建模, 可以减少多表连接等处理过程来提高 执行效率, 这有别于关系型数据库。 但现在毕竟是关系型数据库的全盛时期 , 许 多医疗行业的应用软件,尤其是那些用于数据报表和分析的程序,都使用SQL作为它们的查询语言。Cache通过支持SQL数据存取,能很好的兼容这些应用程 序,也使得把它们从关系型数据库上移植到 Cache上非常容易,大大提高Cache 的推广性开放性和应用程序开发的能力。5.2 Cache与关系型数据库在医疗领域的对比研究5.2.1 研究与测试的背景目前在我国医疗行业信息

6、化应用中广泛使用的数据库 Microsoft SQLServer 2000、Oracle9i、DB2等,经过多年的实际应用检验,目前面临的主要问题有以 下几点:1)应用系统软件开发周期长,后期需求变更成本高昂。我国大部分三甲医 院已经建设完成的HIS系统(包含挂号系统、门诊收费系统、药房管理系统、药 库管理系统、入出院管理系统、 住院病人费用管理系统、 医嘱管理系统等基础模 块),设计、开发、实施所需周期相对其他行业较长,据调查目前西安市三甲医 院的HIS系统开发实施周期需要两年至三年的时间,其中前期投入的需求分析、 系统设计、 编码测试时间需要两年左右。 其主要原因是因为医院中部门繁多、 各

7、 种对象关系复杂, 而且受政策变化影响很大, 导致业务流程的具有不确定性, 需 求容易变更;目前西安市三甲医院的 HIS系统在设计应用完成后,数据库中的用 户表达 300张以上,由于表间关系的复杂性,导致需求变更所需要的代价高昂, 使用户业务拓展困难。2)系统运行速度慢,运行故障率高。根据对西安市应用关系型数据库的各 个医院的调研结果显示,目前在医院业务高峰期(上午 9:30-10:30),各个医 院均存在不同程度的系统相应速度慢、 用户等待时间长问题, 终端用户戏称为电 脑不如人脑。由于His系统死锁和数据库问题导致的故障平均每年在 2-5次,有 些系统实施运行时间较长的用户平均故障率居然每

8、月 1次。众所周知,医疗行业 信息化属于生命相关行业, 系统运行关系到患者的生命安全, 目前这种应用状况, 不能够满足实际应用中对于系统稳定性和系统性能的要求。3)系统后期维护繁琐,软件升级困难。HIS系统中应用的关系型数据库由于 涉及的用户表众多, 又要兼顾用户的业务运行速度, 不能使用太多的表间关联和 外键,导致了数据库的数据冗余度差,数据增长速度快。据不完全统计,西安市 三甲医院中的关系型数据库增加速度平均在每天 10M左右,2003-2006年增长率分 别是100%、150%、200%左右,平均数据库容量在15G以上。随着近年来在医院 中逐渐推广的医院影像系统、 检验系统等系统的多媒体

9、数据的存储更加剧了这一 现象,使得医院数据库成为了名副其实的海量数据库。 根据调研结果显示, 这种 数据库的增长速度呈逐年增长的趋势, 这样的海量数据给医院数据库的后期的数 据安全、备份、索引优化、软件版本升级、数据库迁移都带来了巨大的压力。在 调查中同时发现,各个医院的数据库管理人员有80%不是专业IT技术人员,而且 各个医院的人员配置相对较少,平均 3个人左右,有些医院竟然没有专职的数据 库管理人员,数据库管理工作是由其他部门的人员兼职进行的,这一事实表明, 我国目前医疗行业信息化应用的发展过程中, 既懂计算机信息技术、 又懂医学以 及医院管理的复合型人才十分缺乏。 这样的矛盾存在使得当前

10、各级医院的信息系统后期维护问题更加突出,也导致了系统运行故障增加的机率。4) 系统实施成本偏高,系统运行性价比不高。我国医疗行业信息化应用中的主要矛盾之一就是资金问题,因为目前国家的拨款只占卫生事业支出的10%左右,所以信息化建设基本上是各级医疗卫生机构自力更生, 大多数医院采取了边 积累边建设的方式,由于受到市场经济条件下的行业竞争的压力, 大部分医院更 愿意将有限的发展资金投资购买一些可以马上产生效益的医疗设备,如CT机、麻醉机等,而不愿意在不能直接产生经济效益的信息系统上投入巨资。 这个现状表 明我国发展中国家的国情决定了,现阶段各级医院在信息化投入的力度不会太大。 据卫生部统计2004

11、-2005年国内建设HIS的医院,平均投入资金仅占年医院总收入 的0.5%左右。目前市场上的信息化产品和数据库产品价格颇高, 这也是限制医疗 行业信息化应用的发展因素之一。因此,市场需要一种产品价格低,对硬件性能 要求不高,但是性能稳定、高效的,能充分保护医院投资的数据库产品。由于后关系型数据库采用了多维数据模型, 所以从理论上分析,后关系数据 库系统应该具有比采用二维模型的关系数据库更加高效的性能, 但是并没有进行 量化分析。所以本章对后关系数据库以及关系数据库的性能进行测试对比研究, 以验证后关系型数据库在医疗卫生领域的优势。 测试数据资料主要来源于西安交 通大学口腔医院(Cache50)

12、 陕西省人民医院(Microsoft Sql Server 2000)、 西安交通大学第一附属医院(Oracle9i )等医院20032006年历史数据库中医疗 信息数据。5.2.2 研究与测试的平台环境1)测试的硬件环境。采用 IBM ? p510 ;1路 1.5G Hz Power5CPU IGchipkill内存;73G硬盘2)测试的软件环境。 Windows2000;.NET Framework;Cache5.0 ;MicrosoftSql Server 20005.3 Cache与关系型数据库在医疗领域的测试对比531数据库操作上的性能比较为了对后关系型数据库及关系型数据库进行性能比

13、较,本人首先抽取护理信 息管理系统Cache 5.0数据库中的护理记录类,同时又在 SQLServer 2000中建 立了与护理记录类相对应的表。比较方式是在程序中采用相同的 SQL 语言来访问 这两种数据库,针对这两种数据库进行实际的数据库操作,每项操作执行100次取平均值,每次操作的记录数为 20000行,最后获得下表5-1中的数值。表5-1 Cache 5.0与SQL SERVER 2000 执行速度对比数据库操作平均执行速度相对速度Cache 5.0SQL SERVER 2000Cache 5.0:SQL SERVER2000INSERT1.994m4.621m1:2.32SELECT

14、0.016m0.031m1:1.94UPDATE0.127m0.189m1:1.49DELETE0.049m0.086m1:1.76上表显示的数据是在模拟环境中通过作者自己编写的测试程序获得的,没有考虑实际的网络情况。从上表可以的看出,对后关系型数据库Cache 5.0执行SQL访问的速度比关系型数据库 SQL Server 2000平均要快1.88倍。实际上采 用对象方式访问后关系型数据库比采用 SQL的方法还要快。5.3.2并发用户的平均响应时间对比在并发用户的平均响应时间的比较中,分别模拟了 30、60、90、120、150 个并发用户对后关系型数据库 Cache 5.0与关系型数据库S

15、QLServer 2000进行 了测试。测试结果如下表所示:图5-3并发用户的平均响应时间 SQL SERVER 2000+ Cache 5.0从以上的图表可以分析得出,在并发用户数不断增加的情况下,后关系型数据库Cache5.0的平均响应时间的变化率小于关系型数据库 SQL Server 20005.3.3结果分析通过在相同条件下对后关系型数据库Cache 5.0以及关系型数据库SQLServer 2000进行实际的实验数据分析,能够得出这样的一个结论:采用后关系 型数据库开发护理部信息管理系统能获得比采用传统关系型数据库所开发的护 理部信息管理系统具备更高效的性能。5.4 Cache与关系

16、型数据库在医疗领域的综合对比选取关系型数据库SQL Server 2000与Cache进行综合对比,综合对比包括 产品定位(表5-2 )、医疗卫生行业的经验(表5-3 )、线性可扩展能力(表5-4 )、 性能(表5-5)、总体拥有成本(表 5-6)表5-2 产品定位Cach eSQL Server 2000Cache做为第二代的面向对象的数据库,能够解 决关系型数据库(包括 SQL Server、难于解决的 需要高性能或者对复杂数据进行处理的问题。特别关系型数据库,应用于不冋的行业,针 对医疗卫生领域略显逊色,随着数据量 和用户数的增长,其性能瓶颈会出现。在医疗卫生领域:由于医疗卫生行业数据的

17、特殊 性,使得Cache非常适合处理医学数据,所以, 世界上大多数大型的医疗信息系统都使用Cache数据库。在欧美的医疗卫生行业,Cache占据了70%的市场份额。表5-3医疗卫生行业的经验Cach eSQL Server 2000在医疗卫生领域具有 28年的专业服务经验,是世界 医疗卫生行业第一位的数据库。在医疗卫生领域有说服力的大型应用 案例不多。在欧美的医疗卫生行业占有70%的市场份额。美国VA , Partners医疗集团,十佳医院,英国NHS都使用Cache数据库多维的数据结构非常适合医疗卫生行业复杂的数据 处理。表5-4线性可扩展能力Cach eSQL Server 2000Cac

18、he具有非常咼的延展性,对硬件性能的 要求随着数据量的增长线性增加。做为关系型数据库,对硬件性能的要求随着 数据量的增长呈接近指数增加。有大量的案例可以证明更换Cache后,系统性能提高并且节省了大量的硬件设备。没有实际的案例表明系统更换成SQL Server之后性能提高并节省大量的硬件投资。表5-5 性能Cach eSQL Server 2000Cache是一个面向对象数据库,在对缓存处 理的技术上远优于其他的关系型数据库,在 速度方面可以和内存数据库媲美。做为定位于中低端应用的关系型数据库,不 能满足大型,高性能,高可靠系统的需要。在数据挖掘方面:Cache独特的多维的数据 结构使得在挖掘

19、和分析的同时省去了复杂的 Cube构建,大大提高了系统的使用效率,冋 时挖掘的深度远远超过了关系型数据库。在挖掘之前,需要建立cube把一维的表转换成多维的结构,在挖掘的深度方面有着先天的缺陷。Cache动态的位图索引技术大大提高了 Cach e的查询速度,同时打破了OLTP和OLAP的界限,可以在查询的同时做数据的 更新。OLTP和OLAP需要各自独立的数据库。表5-6 总体拥有成本Cach eSQL Server 2000总体拥有成本包括前期建设投资成本,所需要的硬件成本和后期使用维护成本Cach e的综合拥有成本最低SQL Server的综合拥有成本很高Cache对硬件的性能要求远远低于

20、 SQLServer,,有大量的案例表明,在更换成Cache之后,用户节省了大量的服务器的投 资成本。在存储方面,存储冋样的数据,Cache 只需要关系型数据库 5.0%-70%的存储空间。Cache的设计理念之一是 零DBA,Cache 是最易于管理维护的数据库之一。由于关系数据库固有的缺陷,在许多没有数 据的地方也需要存储空白的单元,所以浪费 了大量的存储空间,同时也影响了处理性能。 在使用和维护方面需要有经验的DBA来维护,大大增加了用户的人力成本。5.5研究与测试的结论经过以上的测试对比,可以得出以下结论:1) 在医疗行业的应用环境下,Cach0tSQLServer2OOO响应速度更快,并发处理能力更强,大数据量吞吐能力更强;2) Cache的多维数据结构可以有效的避免数据冗余,提高数据利用率,减 少数据库的容量,降低维护成本。参考文献:1 Baroudi Bloor国际咨询公司,关系型数据库的失败,后关系数据库的崛起以及市场对混

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论