数据库新技术及其发展趋势_第1页
数据库新技术及其发展趋势_第2页
数据库新技术及其发展趋势_第3页
数据库新技术及其发展趋势_第4页
数据库新技术及其发展趋势_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库新技术及其发展趋势内容摘要:由于数据库技术在特殊领域的应用和其他相关学科技术的发展,促使数据库技术不断创新、发展。本文阐述了一些新的数据库技术及新一代数据库技术的发展方向。关键词:数据库信息集成网格数据管理移动数据库数据加密技术发展趋势一、引言[1]数据库技术是计算机科学的重要分支,主要研究如何安全高效地管理大量、持久、共享的数据。数据库的研究始于20世纪60年代中期,从诞生到现在,在不到半个世纪的时间里,形成了坚实的理论基础、成熟的商业产品和广泛的应用领域,目前数据库成为一个研究者众多且被广泛关注的研究领域。随着信息管理内容的不断扩展和新技术的层出不穷,数据库技术面临着前所未有的挑战。面对新的数据形式,人们提出了丰富多样的数据模型(层次模型、网状模型、关系模型、面向对象模型、半结构化模型等),同时也提出了众多新的数据库技术(XML数据管理、数据流管理、Web数据集成、数据挖掘等)。在Web大背景下的各种数据管理问题成为人们关注的热点。本文讨论目前数据库研究领域中最热门的几个研究方向的发展现状、面临的问题和未来趋势。二、数据库发展动力[2]目前Internet是主要的驱动力。现在,大部分企业感兴趣的是如何与供应商和客户进行更密切的交流,以便提供更好的客户支持。在这方面的应用从根本上说是跨企业的,需要安全和信息集成的有力工具。另一个重要应的用领域是自然科学,特别是物理科学、生物科学、保健科学和工程领域,这些领域产生了大量复杂的数据集,需要信息集成机制的支持。除此之外,它们也需要对数据分析器产生的数据管道进行管理,需要对有序数据进行存储和查询(如时间序列、图像分析、网格计算和地理信息),需要世界范围内数据网格的集成。此外,还有一个推动数据库研究发展的动力是相关技术的成熟。三、主流技术发展趋势[3]1.信息集成随着Internet的飞速发展,网络迅速成为一种重要的信息传播和交换的手段,尤其是在Web上,有着极其丰富的数据来源。信息集成系统的方法可以分为:数据仓库方法和Wrapper/Mediator方法。在数据仓库方法中,各数据源的数据按照需要的全局模式从各数据源抽取并转换,存储在数据仓库中。用户的查询就是对数据仓库中的数据进行查询。对于数据源数目不是很多的单个企业来说,该方法十分有效。另一种方法是Wrapper/Mediator方法。该方法并不将各数据源的数据集中存放,而是通过Wrapper/Mediator结构满足上层集成应用的需求。这种方法的核心是中介模式(mediatedschema)。信息集成系统通过中介模式将各数据源的数据集成起来,而数据仍存储在局部数据源中,通过各数据源的包装器(wrapper)对数据进行转换使之符合中介模式。用户的查询基于中介模式,不必知道每个数据源的特点,中介器(mediator)将基于中介模式的查询转换为基于各局部数据源的模式查询,它的查询执行引擎再通过各数据源的包装器将结果抽取出来,最后由中介器将结果集成并返回给用户。Wrapper/Mediator方法解决了数据的更新问题,从而弥补了数据仓库方法的不足。不过,这种框架结构正受到来自3个方面的挑战。第1个挑战是如何支持异构数据源之间的互操作性(interoperability)。另一个挑战是如何模型化源数据内容和用户查询。第三个挑战是当数据源的查询能力受限时,如何处理查询和进行优化。2.传感器数据库技术随着微电子技术的发展,传感器的应用越来越广泛。根据传感器在一定的范围内发回的数据,在一定的范围内收集有用的信息,并且将其发回到指挥中心。当有多个传感器在一定的范围内工作时,就组成了传感器网络。传感器网络由携带者所捆绑的传感器及接收和处理传感器发回数据的服务器所组成。传感器网络中的通信方式可以是无线通信,也可以是有线通信。在传感器网络中,传感器数据就是由传感器中的信号处理函数产生的数据。信号处理函数要对传感器探测到的数据进行度量和分类,并且将分类后的数据标记时间戳,然后发送到服务器,再由服务器对其进行处理。传感器数据可以通过无线或者光纤网存取。无线通信网络采用的是多级拓扑结构,最前端的传感器节点收集数据,然后通过多级传感器节点到达与服务器相连接的网关节点,最后通过网关节点,将数据发送到服务器。传感器节点上数据的存储和处理方法有两种:第1种类型的处理方法是将传感器数据存储在一个节点的传感器堆栈中,这样的节点必须具有很强的处理能力和较大的缓冲空间;第2种方法适用于一个芯片上的传感器网络,传感器节点的处理能力和缓冲空间是受限制的:在产生数据项的同时就对其进行处理以节省空间,在传感器节点上没有复杂的处理过程,传感器节点上不存储历史数据;对于处理能力介于第1种和第2种传感器网络的网络来说,则采用折衷的方案,将传感器数据分层地放在各层的传感器堆栈中进行处理。传感器网络越来越多地应用于对很多新应用的监测和监控。新的传感器数据库系统需要考虑大量的传感器设备的存在,以及它们的移动和分散性。因此,新的传感器数据库系统需要解决一些新的问题。主要包括:传感器数据的表示和传感器查询的表示、在传感器节点上处理查询分片、分布查询分片、适应网络条件的改变、传感器数据库系统等。3.网格数据管理网格是把整个网络整合成一个虚拟的巨大的超级计算环境,实现计算资源、存储资源、数据资源、信息资源、知识资源和专家资源的全面共享。目的是解决多机构虚拟组织中的资源共享和协同工作问题。按照应用层次的不同可以把网格分为3种:计算网格,提供高性能计算机系统的共享存取;数据网格,提供数据库和文件系统的共享存取;信息服务网格则支持应用软件和信息资源的共享存取。高性能计算的应用需求使计算能力不可能在单一计算机上获得,因此,必须通过构建“网络虚拟超级计算机”或“元计算机”获得超强的计算能力,这种计算方式称为网格计算。它通过网络连接地理上分布的各类计算机(包括机群)、数据库、各类设备和存储设备等,形成对用户相对透明的虚拟的高性能计算环境,应用包括了分布式计算、高吞吐量计算、协同工程和数据查询等诸多功能数据网格保证用户在存取数据时无须知道数据的存储类型(数据库,文档,XML)和位置。涉及的问题包括:如何联合不同的物理数据源,抽取源数据构成逻辑数据源集合;如何制定统一的异构数据访问的接口标准;如何虚拟化分布的数据源等。信息网格是利用现有的网络基础设施、协议规范、Web和数据库技术,为用户提供一体化的智能信息平台,其目标是创建一种架构在OS和Web之上的基于Internet的新一代信息平台和软件基础设施。4.移动数据管理越来越多的人拥有掌上型或笔记本电脑,或者个人数字助理(PDA)甚至智能手机,这些移动计算机都将装配无线联网设备,用户不再需要固定地联接在某一个网络中不变,而是可以携带移动计算机自由地移动,这样的计算环境,我们称之为移动计算(mobilecomputing)。研究移动计算环境中的数据管理技术,已成为目前分布式数据库研究的一个新的方向,即移动数据库技术。与基于固定网络的传统分布计算环境相比,移动计算环境具有以下特点:移动性、频繁断接性、带宽多样性、网络通信的非对称性、移动计算机的电源能力、可靠性要求较低和可伸缩性等。移动计算以及它所具有的独特特点,对分布式数据库技术和客户/服务器数据库技术,提出了新的要求和挑战。移动数据库系统要求支持移动用户在多种网络条件下都能够有效地访问所需数据,完成数据查询和事务处理。通过移动数据库的复制/缓存技术或者数据广播技术,移动用户即使在断接的情况下也可以继续访问所需的数据,从而继续自己的工作,这使得移动数据库系统具有高度的可用性。此外,移动数据库系统能够尽可能地提高无线网络中数据访问的效率和性能。而且,它还可以充分利用无线通信网络固有的广播能力,以较低的代价同时支持大规模的移动用户对热点数据的访问,从而实现高度的可伸缩性,这是传统的客户/服务器或分布式数据库系统所难以比拟的。目前,移动数据管理的研究主要集中在以下几个方面:首先是数据同步与发布的管理。其次是移动对象管理技术。5.微小型数据库技术随着移动计算时代的到来,嵌入式操作系统对微小型数据库系统的需求为数据库技术开辟了新的发展空间。微小型数据库技术目前已经从研究领域逐步走向应用领域。一般说来,微小型数据库系统(asmall-footprintDBMS)可以定义为:一个只需很小的内存来支持的数据库系统内核。微小型数据库系统针对便携式设备其占用的内存空间大约为2MB,而对于掌上设备和其他手持设备,它占用的内存空间只有50KB左右。内存限制是决定微小型数据库系统特征的重要因素。微小型数据库系统根据占用内存的大小又可以进一步分为:超微DBMS(pico-DBMS)、微小DBMS(micro-DBMS)和嵌入式DBMS3种。微小型数据库系统与操作系统和具体应用集成在一起,运行在各种智能型嵌入设备或移动设备上。微小型数据库技术目前已经从研究领域向广泛的应用领域发展,各种微小型数据库产品纷纷涌现。尤其是对移动数据处理和管理需求的不断提高,紧密结合各种智能设备的嵌入式移动数据库技术已经得到了学术界、工业界、军事领域和民用部门等各方面的重视并不断实用化。6.数据加密技术[4]我们经常需要一种措施来保护我们的数据,防止被一些怀有不良用心的人所看到或者破坏。在信息时代,信息可以帮助团体或个人,使他们受益,同样,信息也可以用来对他们构成威胁,造成破坏。在竞争激烈的大公司中,工业间谍经常会获取对方的情报。因此,在客观上就需要一种强有力的安全措施来保护机密数据不被窃取或篡改。数据加密与解密从宏观上讲是非常简单的,很容易理解。加密与解密的一些方法是非常直接的,很容易掌握,可以很方便的对机密数据进行加密和解密。一:数据加密方法在传统上,我们有几种方法来加密数据流。所有这些方法都可以用软件很容易的实现,但是当我们只知道密文的时候,是不容易破译这些加密算法的(当同时有原文和密文时,破译加密算法虽然也不是很容易,但已经是可能的了)。最好的加密算法对系统性能几乎没有影响,并且还可以带来其他内在的优点。例如,大家都知道的pkzip,它既压缩数据又加密数据。又如,dbms的一些软件包总是包含一些加密方法以使复制文件这一功能对一些敏感数据是无效的,或者需要用户的密码。所有这些加密算法都要有高效的加密和解密能力。幸运的是,在所有的加密算法中最简单的一种就是“置换表”算法,这种算法也能很好达到加密的需要。每一个数据段(总是一个字节)对应着“置换表”中的一个偏移量,偏移量所对应的值就输出成为加密后的文件。加密程序和解密程序都需要一个这样的“置换表”。事实上,80x86cpu系列就有一个指令‘xlat’在硬件级来完成这样的工作。二.基于公钥的加密算法一个好的加密算法的重要特点之一是具有这种能力:可以指定一个密码或密钥,并用它来加密明文,不同的密码或密钥产生不同的密文。这又分为两种方式:对称密钥算法和非对称密钥算法。所谓对称密钥算法就是加密解密都使用相同的密钥,非对称密钥算法就是加密解密使用不同的密钥。非常著名的pgp公钥加密以及rsa加密方法都是非对称加密算法。加密密钥,即公钥,与解密密钥,即私钥,是非常的不同的。从数学理论上讲,几乎没有真正不可逆的算法存在。例如,对于一个输入‘a’执行一个操作得到结果‘b’,那么我们可以基于‘b’,做一个相对应的操作,导出输入‘a’。在一些情况下,对于每一种操作,我们可以得到一个确定的值,或者该操作没有定义(比如,除数为0)。对于一个没有定义的操作来讲,基于加密算法,可以成功地防止把一个公钥变换成为私钥。因此,要想破译非对称加密算法,找到那个唯一的密钥,唯一的方法只能是反复的试验,而这需要大量的处理时间。rsa加密算法使用了两个非常大的素数来产生公钥和私钥。即使从一个公钥中通过因数分解可以得到私钥,但这个运算所包含的计算量是非常巨大的,以至于在现实上是不可行的。加密算法本身也是很慢的,这使得使用rsa算法加密大量的数据变的有些不可行。这就使得一些现实中加密算法都基于rsa加密算法。pgp算法(以及大多数基于rsa算法的加密方法)使用公钥来加密一个对称加密算法的密钥,然后再利用一个快速的对称加密算法来加密数据。这个对称算法的密钥是随机产生的,是保密的,因此,得到这个密钥的唯一方法就是使用私钥来解密。四、结束语本文从目前数据库研究的热点问题出发,探讨了数据库未来发展方向的问题。在众多新技术应用中,对数据库研究最具影响力,推动数据库研究进入新纪元的无疑将是Internet的发展。Internet中的数据管理问题从深度和广度两方面对数据库技术都提出了挑战。数据库技术已经成为计算机科学的一个重要分支,数据库系统也在不断地更替、发展和完善。数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等相互渗透,相互结合,成为当前数据库技术发展的主要特征。[5](一)、性能与易用性仍然是数据库发展方向

关系型数据库所以升级缓慢,其中一个主要原因就是没有关键的技术革新,各大厂商所做的主要工作都是在对自己的产品进行锦上添花式的不断完善。这一发展方向就是使数据库向着需求更少的方向增强。所谓需求更少是指数据库以更少的相对资源消耗、更高的性能运行,并且随着技术的不断进步,数据库变得更加智能,维护和使用将更加简单。这是数据库技术在完善过程中的必经之路。

在这一方面,Oracle数据库一直走在前列,从Oracle9i开始,Oracle一直致力于是数据库软件更加自动化,在这一原则的支撑下,Oracle不断实现了诸如自动PGA管理、自动SGA管理、自动段空间管理(ASSM)、自动存储管理(ASM)等等新特性,这些新特性切实降低了DBA的工作量,使得数据库的管理更加简单;而IBMDB2也一直在加强这方面的功能,IBM的SMART技术(Self-ManagingAndResourceTuning-自我管理和资源调优)正是在这些方面的增强。在DB2V9中IBM同样推出了一系列的自动化特性,包括自动数据库管理功能、自动统计数据收集等功能,但是这些特性相较Oracle而言是来之甚晚的,所以在2006年IBM主推的是XML这一重大改进。

然而一项新的技术能否得到用户的认可还需要时间去检验。根据Oracle公司在2006年10月举行的OpenWorld大会上公布的统计数据,自Oracle10g发布以来,仅有约一半的用户升级到Oracle10g,其他用户仍然维持在原来的版本运行;所以IBM的Viper能否最终得到用户的认可取得成功,还有待检验。

(二)、搜索是数据库的未来之路

随着数据库技术的不断完善,用户数据的不断积累,用户的需求也不断提高,在此之上,更高级的应用应运而生,这包括已经成熟的数据仓库应用、广为接受的商业智能(BI)应用、以及方兴未艾的SOA等。当数据库能够容纳几乎所有数据之后,我们必然面临的一个问题是如何快速获得我们需要的数据。

当用户访问数据库时,怎样减少用户的等待,快速返回用户需要的数据是所有数据库都需要解决的问题。这也就需要另外一项高级增强--面向搜索的增强,从某种意义上说面向需求的增强-数据分析和挖掘也正是这个方向上的高级应用之一。目前各数据库在这一方面都不够完善,我们相信在未来,数据库能够容纳和存储各种数据之后,必然向快速搜索和查询方面进行增强。

微软公司在2006年12月发布的Vista操作系统中,已经将搜索框加入到开始菜单的最初始位置,让用户最先接触到搜索,最快的找到用户的数据;2006年,Google获得了飞速发展,Google带给我们的最大便利就是快速的获取数据。无论在Vista或者Google之后,都存在着关系型或非关系型数据库的支持,微软或Google的搜索技术代表了一种潮流,如何快速找到需要的数据已经越来越为用户所关心。

(三)、开源数据库有望走向应用主流

和Linux操作系统渐入佳境一样,开放源代码的数据库系统正走向应用的主流。目前主要的开源数据库产品包括MySQL、MaxDB和PostgreSQL。在MySQL5.0版本升级之后,MySQL数据库越来越象SQLServer等大型数据库,并逐渐从开源圈子向企业级市场拓展。凭借廉价优势,MySQL的市场正在扩大。除了开源数据库厂商成为市场焦点外,甲骨文、Sun和微软老牌厂商也纷纷拥抱开源。开源数据库软件正在以其低成本得到越来越多用户的认可,并迫使主流厂商推出免费版应对。费用低且性能佳的开源数据库使得中小型企业使用数据库成为可能,使中小型企业能以较低的成本来构建强大的各种数据库应用。在引入数据库后,又会在使用过程中不断地发展新应用,从而推动企业的信息化,形成一个良性的发展过程。在这个过程中,开源数据库恰好扮演了一个引入者和助力者的角色。未来,在中小企业用户市场的拉动下,开源数据库有望走向应用主流。

综合2005至2007年数据库市场的运行情况及多家分析机构的评估,在2008年后,数据库及数据仓库的发展将会偏重于以应用为导向,服务则倾向于业务敏捷,并且还会为新型应用提供多种结构数据的支持。

(四)、未来数据库发展主要趋势

2008年后,数据库的发展将会偏重于应用,还会为新型应用提供多种结构数据的支持。数据库技术发展的主要趋势:

1.XM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论