信息技术 第一册(五年制高职)教案 1.2数据库存储技术_第1页
信息技术 第一册(五年制高职)教案 1.2数据库存储技术_第2页
信息技术 第一册(五年制高职)教案 1.2数据库存储技术_第3页
信息技术 第一册(五年制高职)教案 1.2数据库存储技术_第4页
信息技术 第一册(五年制高职)教案 1.2数据库存储技术_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库存储技术数据库技术主要研究如何存储、使用和管理数据,是计算机技术中发展最快、应用最广的技术之一。在信息技术高速发展的今天,数据库技术的应用已经深入到了各个领域。数据库的定义

数据库(Database,DB)是存储在计算机内、有组织、可共享的数据和数据对象(如表、视图、存储过程和触发器等)的集合。这种集合按一定的数据模型(或结构)组织、描述并长期存储,同时能够以安全可靠的方法进行数据的检索和存储。数据库有以下几个主要的特点:(1)数据结构化

数据的结构化是数据库区别于文件系统的根本特征。在数据库系统中的数据和文件系统中的数据不同。在文件系统中,文件数据之间不存在联系,而且只能从属于特定的应用,数据库中的数据是面向全组织的、复杂的数据结构,数据具有完整的数据结构,同时同一个数据库中的多个数据文件之间可以相互联系。(2)数据共享

数据共享是数据库技术的基本特征。数据库中的数据可以供多个用户或多个应用程序共享,数据共享大大减少了数据的冗余度和不一致性,大大提高了数据的利用率和工作效率。

(3)数据独立性

数据独立性主要包括数据的物理独立性和逻辑独立性。数据的物理独立性是指用户的应用程序与数据库的数据是相互独立的,不存储在同一个地方,数据的逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。不会因一方的变化而发生改变,大大地降低了应用程序开发和数据库维护的工作量。数据库技术的发展历史

时至今日,数据库技术已经形成了比较完善的理论体系和实用技术,它研究和解决了计算机信息处理过程中大量数据有效地组织和存储的问题,在数据库系统中减少数据存储冗余、实现数据共享、保障数据安全以及高效地检索数据和处理数据。随着使用计算机进行数据管理的技术的不断发展,数据库技术经历了人工管理、文件系统、数据库系统三个阶段。(1)人工管理阶段(20世纪50年代中期以前)

在人工管理阶段,计算机主要应用与科学计算,对于数据保存的需求尚不迫切,数据的管理是靠人工进行的,计算机外部设备只有磁带机、卡片机和纸带穿孔机,没有直接存取的磁盘设备,也没有操作系统,只有汇编语言,数据处理采取批处理的方式,数据存在大量重复存储的现象。

人工管理数据的特点是数据不保存,没有专门的软件系统对数据进行管理,数据不共享也不独立。(2)文件系统阶段(20世纪50年代后期到60年代中期)

在文件系统阶段,计算机不仅用于科学计算,同时也开始用以信息处理,硬件方面有了很大改进,出现了磁盘、磁鼓等直接存储设备。软件方面出现了高级语言和操作系统,且操作系统中出现了专门的数据管理软件。这个阶段的特点是数据以文件形式可长期保存下来,由专门的文件系统管理数据,文件形式多样化,程序与数据间有一定独立性。但是,文件系统的主要缺陷是数据文件之前缺乏有机的联系,数据与程序之间缺乏独立性,不能有效地共享相同的数据,从而造成数据的冗余度大和不一致性,给数据的修改和维护带来了困难。(3)数据库系统阶段(20世纪60年代后期至今)随着计算机技术的迅速发展和广泛应用,磁盘技术取得重要进展,数据管理中数据量急剧增长,对数据共享和数据管理提出了更高的需求,文件系统已经不能满足应用的需求,导致了数据库技术的产生。数据库技术是计算机科学技术中发展最快的领域之一,也是应用最广的技术之一,先后经历了三个演变:

①第一代数据库系统——层次和网状数据库系统层次数据库是数据库系统的先驱,而网状数据库则是数据库概念、方法、技术的奠基。它们是数据库技术中研究得最早的两种数据库系统。层次模型对应于有根定向有序树,而网状模型对应的是有向图。所以,这两种数据模型可以统称为格式化数据模型。这两种数据库系统具有下列共同特点:支持三级模式的体系结构;用存取路径来表示数据之间的联系;独立的数据定义语言;

导航的数据操纵语言。②第二代数据库系统——关系数据库系统1970年美国IBM公司San

Jose研究室的研究员E.F.Codd首次提出了数据库系统的关系模型。经过大量的高层次的研究和开发取得了一系列的成果,主要是:奠定了关系模型的理论基础,研究了关系数据库语言,有关系代数、关系演算、SQL语言及QBE等,同时研制了大量的RDBMS的原型,攻克了系统实现中查询优化、并发控制、故障恢复等一系列关键技术。关系数据库是以关系模型为基础。关系模型有数据结构、关系操作以及数据完整性三部分组成,主要特点有关系模型的概念单一;以关系代数为基础;数据独立性强,数据的物理存储和存取路径对用户隐蔽;关系数据库语言是非过程化的,大大降低了用户编程的难度。

③新一代数据库技术——数据库大家族从20世纪80年代以来,数据库技术在商业领域的取大成功,刺激了其他领域对数据库技术需求的迅速增长。随着用户应用需求的提高、硬件技术的发展和网络提供的丰富多彩的多媒体交流方式,促进了数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计算技术等相互渗透,互相结合,成为当前数据库技术发展的主要特征,形成了数据库新技术。新一代数据库系统以更丰富的数据模型和更强大的数据管理功能为特征,满足了更加广泛复杂的新应用的要求。其基本特征为:第三代数据库系统应支持数据管理、对象管理和知识管理;必须保持或继承第二代数据库系统的技术;必须对其他系统开放。数据库技术发展的现状在当今的互联网中,最常见的数据库模型主要是两种,即关系型数据库和非关系型数据库。随着应用领域的不断扩展,关系数据库的限制和不足日益显现出来,不能有效地处理多维数据和互联网应用中半结构化和非结构化的海量数据,如Web页面、电子邮件、音频、视频等;当达到一定规模时,高并发读写性能低;所支持的容量也有限。而非关系型的数据库在特定的场景下可以发挥出难以想象的高效率和高性能,它作为对传统关系型数据库的一个有效的补充,得到了非常迅速的发展。(1)结构化数据、非结构化数据和半结构化数据那为什么会有关系型数据库和非关系型数据库呢?主要是由于不同数据库所处理的数据类型有所不同。在实际应用中,我们会遇到各式各样的数据库,主要有:①结构化数据结构化数据能够用数据或统一的结构加以表示,如数字、符号。结构化数据又称为作行数据,它是用二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,结构化数据主要通过关系型数据库进行存储和管理。②非结构化数据非结构化数据主要包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等。非结构化数据不能用数据库的二维表来呈现的,它的字段长度是可变的,并且每个字段的记录又可能由可重复或不可重复的子字段构成的数据库。非结构化数据库不仅可以处理结构化数据,更适合处理非结构化数据,它采用多值字段、了字段和变长字段机制进行数据项的创建和管理,广泛应用于全文检索和各种多媒体信息处理领域。③半结构化数据半结构化数据介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间,一般是自描述的,数据的结构和内容混在一起,没有明显的区分。比如XML、HTML文档就是半结构化数据。(2)主流的关系型数据库和非关系型数据库目前,主要的数据库有关系型数据库RDBMS和非关系型数据库NoSQL。在这些数据库中,处理的数据有的是结构化数据,有的是非结构化数据和半结构化数据。关系型数据库已经拥有非常庞大的客户群,其产品也以各自独特的功能在数据库市场上占有重要地位,现在比较常见的数据库有Oracle、MySQL、Sybase、Access、DB2等,这些数据库都为Java、C++、Python、PHP等常见编程语言提供了API,供它们连接和访问。非关系型数据库,即NoSQL数据库,即NotOnlySQL,意为不仅仅是SQL。大多数人认为NoSQL数据库与关系型数据库完全对立,其实不然。非关系型数据库基于数据存储模型,可分为列存储数据库、键值(Key-Value)存储数据库,文档型数据库,对象型数据库,图形数据库,各个类型的数据库也都有许多自己的相关产品并被采纳使用。键值(Key-Value)数据库不关心具体的数据内容,直接把“键”映射到“值”上,值是非结构化的数据存储模式。常见的有Redis、TokyoCabinet/Tyrant、OracleBDB、Voldemort。列存储数据库系统中,列簇形式存储,将业务逻辑相关的数据放在同一列存储,相同列的数据存储在一起。列存储数据库支持列的动态扩展,更适合海量数据的处理,主要产品有HBase、Casssndra、Rias,常用于Hadoop分布式文件系统中。文档存储数据库与键值(Key-Value)数据库类似,但是值是结构化存储的模式。文档型数据库中的文档有的是JSON格式,有的类似JSON格式。常见的数据库有MongoDB、CouchDB。对象型数据库与文档型数据库相似,但数据以对象的形式进行存储,这些对象只能由其所属的类中定义的方法来操作。常见的数据库有db4o、Versant。图形结构数据库使用图形模型作为数据存储结构,能扩展到不同服务器上,常用于社交网络、推荐系统等。常见的有Neo4J、InfoGrid、InfiniteGraph。表1常用数据对照表类型名称特点应用场景关系型数据库Oracle支持多用户、大事务量的高性能事务处理数据安全性和完整性控制支持分布式数据库和分布处理基于客户端/服务器技术大部分企事业单位都用ORACLE,在电信行业占用最大的份额。MySQL开源,体积小,速度快应用于中小型WEB网站Sybase基于客户/服务器体系结构是一种高性能、可编程数据库电信行业使用较多DB2并发性好,适合海量数据的存储和处理,跨平台,即能在所有主流平台上运行,同时可伸缩性好,可支持从大型机到单用户环境,应用于OS/2、Windows等平台下。适用于数据仓库和在线事物处理。适用于于大型应用系统,在企业级的应用最为广泛。全球500家大型企业中,85%以上使用DB2的数据库服务器。非关系型数据库HBase属于列存储数据库是Google的BigTable的开源实现,建立在HDFS上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统通常用来应对分布式存储海量数据;适用于偏好BigTable,并且需要对大数据进行随机、实时访问的场合。MongoDB属于文档型数据库可存储比较复杂的数据类型高性能、易部署、易使用支持动态查询支持完全索引,包含内部对象使用高效的二进制数据存储,包括大型对象(如视频等)广泛应用于各种大型门户网站和专业网站,大大降低了企业运营成本。Redis属于键值存储数据库性能高,扩展性强易部署、高并发适用于数据变化快且数据库大小可遇见(适合内存容量)的应用程序。数据库技术发展的趋势经过几十年的发展,数据库技术已经得到了很好的完善,尤其是关系型数据库管理系统。目前,随着新技术的不断涌现,数据库技术不断向新的应用领域的渗透,数据库技术在下面几个方面得到了更好的发展:(1)面向对象数据库(OODBMS)数据库领域中引入面向对象的方法,数据库技术和面向对象技术相结合,就形成了面向对象数据库管理系统。面向对象数据库本质上也是一个数据库系统,因此系统也具备数据库系统的处理能力,其次它又是一个面向对象的系统,包含了对象的概念、方法和技术。与传统的数据库相比,面向对象数据库在复杂系统的模拟、表达和处理能力等方面具有明显的优势,不足之处是面向对象数据库的理论和技术还不成熟、不够完善。但随着数据库技术和面向对象技术的不断发展和完善,面向对象的数据库必将会得到广泛应用。(2)网络技术与数据库技术的融合数据库技术和网络技术相结合产生了分布式数据库系统。分布式数据库利用高速网络将分散的多个数据存储单元连接起来,组成一个逻辑上统一的数据库,分布式数据库有局部数据库和全局数据库的概念。分布式数据库具有以下的优点:能对数据进行全局管理,也能让各节点自主管理本节点的数据;分布式数据库中的数据都是相互独立的,且分布透明;分布式数据库极大地增加了数据的容量;分布式数据库的数据可靠性和可用度高;分布式数据库改善了系统的性能和并行处理能力。分布式数据库也存在一定的问题。比如花在通信上的系统开销较大;分布式数据库的存取结构比较复杂;分布式数据库的数据安全性和保密性处理都相对较难。但随着相关技术的发展,分布式数据库的问题也会逐步得到解决。(3)多媒体技术进入数据库领域随着多媒体技术的发展,无论是电脑还是在网络,到处都有各种多媒体信息,如声音、图像、视频、超文本信息等,当多媒体信息太多时,需要使用多媒体数据库来组织和管理它们。多媒体数据库是计算机技术、影像技术和通信技术相结合的产物,多媒体数据类型复杂、信息量庞大,信息具有实时性、分布性和交互性等特点。(4)人工智能与数据库技术的结合人工智能主要研究如何运用计算机模拟人的思维和活动,逻辑推理和判断是人工智能最主要的特征,但信息检索的效率较低。数据库技术主要用来处理数据,适合进行数据的存储、管理、检索等操作,但不具备逻辑推理能力。人工智能对逻辑推理要求较高,但它不会注意空间和时间的限制,因此人工智能中语言和专家系统的效率较低。而数据库关注实际存放的数据,同时也会考虑时间和空间效率,但不关心通过推理得出的数据。人工智能和数据库技术相结合产生了智能数据库系统,它发挥了两种技术各自的优点,是一种新型的数据库系统。(5)对象—关系数据库有机结合当前数据库大部分都是关系数据库,关系语言与其他常规程序语言一起,可完成任意的数据库操作。关系数据库建模简单,但数据类型有限,数据结构是有限制的。面向对象方法起源于程序设计语言,它用现实世界的实体对象为基本元素来描述复杂的客观世界,建模能力强且易理解,但面向对象方法提供的功能不如数据库灵活。将面向对象的建模能力

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论