




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章数据管理第一页,共七十二页,2022年,8月28日1第一节数据管理概述信息与数据数据组织的层次数据管理技术的发展第二页,共七十二页,2022年,8月28日信息与数据数据:在信息处理中,信息载体上反映信息内容且可被接受者(人或机器)识别的物理符号称为数据。多媒体:是指数据的多种形式的组合。第三页,共七十二页,2022年,8月28日数据组织的层次分层:分为数据项、记录、文件和数据库四层。数据项:是具有确定逻辑意义(即可描述信息内容)的数据的最小单位。是不可分的数据单位。记录:是具有一定关系的数据项的一个有序集合。关键字:能唯一标识一条记录的数据项的最小集合。文件:同类记录的有序集合。数据库:存储起来的相关数据的集合。数据库管理系统(DataBaseManagementSystem)第四页,共七十二页,2022年,8月28日
数据库中数据与应用程序及用户的关系用户或应用程序1数据库管理系统数据库第五页,共七十二页,2022年,8月28日数据管理技术的发展数据管理:在信息系统中,数据(信息)的收集、加工、检索、存储、传输、利用和维护等工作称为数据管理。第六页,共七十二页,2022年,8月28日数据管理技术发展的三个阶段人工管理阶段20世纪50年代以前计算机软硬件的背景没有操作系统软件,没有专门的管理软件外存为最简单的存取设备数据管理的特点数据不在计算机中长期保存没有软件系统对数据进行管理一组数据对应于一个应用程序(数据面向应用,不共享)第七页,共七十二页,2022年,8月28日文件管理阶段20世纪50年代后期计算机软硬件的背景出现了对计算机资源进行有效管理的操作系统和专门管理数据的文件系统出现了可进行大量存储的外存储器数据管理的特点数据可被长期存储和反复处理程序与数据分开,数据在物理存储上实现了独立数据管理方式上还存在不足,有待进一步提高第八页,共七十二页,2022年,8月28日数据库系统阶段20世纪60年代开始,实际应用对数据管理的要求程度越来越高。计算机软硬件的背景数据管理的特点可以实现对数据元素间复杂关系的描述。数据存储方式改善,存储空间利用率高,数据可以进行反复应用。数据有较好的共享性。数据具有较好的独立性。可实现对数据的统一管理和控制。第九页,共七十二页,2022年,8月28日第二节数据库及其管理系统概述信息模型数据模型数据库的结构数据库系统的构成第十页,共七十二页,2022年,8月28日概述对客观世界的认识、描述分为三个层次现实世界:客观存在的事物及其相互联系。信息世界:客观存在的现实世界在人们头脑中的反映。数据世界:对信息世界中的有关信息经过加工、编码、格式化等具体处理,便进入了数据世界。三者之间的关系(P62)第十一页,共七十二页,2022年,8月28日信息模型的要素实体(Entity)属性(Attribute)联系(Relationship)两个实体集之间相互联系的方式一对一联系:A中任一个体至多与B中一个个体有联系,简示1:1。信息模型个体实体集第十二页,共七十二页,2022年,8月28日一对多联系:A中至少有一个体与B中一个以上个体有联系,且B中任一个体至多与A中一个体有联系,简示1:N。多对多联系:A中至少有一个体与B中两个或两个以上的个体有联系,B中也至少有一个个体与A中两个或两个以上的个体有联系,简示N:M。建立信息模型的一种方法:实体-联系方法,简称E-R方法。第十三页,共七十二页,2022年,8月28日实体-联系模型(E-R模型)于1976年提出的实体-联系方法(Entity-RelationshipApproach)。该方法用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。现实世界是由一组称作实体的基本对象以及这些对象间的联系构成的第十四页,共七十二页,2022年,8月28日信息世界中的基本概念
实体(Entity)现实世界中可区别于其他对象的一个事件或物体属性(Attribute)描述实体
码(Key)唯一识别实体和联系的属性集域(Domain)每个属性所允许的值集实体集(EntitySet)同一类型所有实体的集合联系(Relationship)实体间的相互关联
一对一联系(1:1)
一对多联系(1:n)
多对多联系(m:n)
实际上,一对一联系是一对多联系的特例,而一对多联系又是多对多联系的特例。
第十五页,共七十二页,2022年,8月28日E-R图的特点一个联系可以定义在两个以上的实体集上。一个联系也可以定义在一个集合自身上。对给定的实体集,还可以有两个以上的联系。联系的类型必须标注清楚。第十六页,共七十二页,2022年,8月28日区分实体与属性的一般性的原则尽量减少实体集,能作为属性时不要作为实体集。作为属性的事物,不能再有需要描述的性质(属性),也不能与其他事物有联系。作为属性的事物与所描述的实体之间只能是1:N(含1:1)的关系。第十七页,共七十二页,2022年,8月28日数据模型组成:由三部分组成。一组规定的用以构造数据库的基本数据结构类型一组数据操作或推导规则完整性约束数据模型与信息模型的关系数据模型必须以相应的信息模型为基础。信息模型和数据模型要素的对应关系第十八页,共七十二页,2022年,8月28日常见数据模型的概述层次模型数据结构:树型结构缺点:处理效率较低,无法直接描述层次间的N:M。第十九页,共七十二页,2022年,8月28日网状模型满足条件可以有一个以上的节点(记录型)无父节点至少有一个节点的父节点多于一个与层次模型之间的不同层次模型中,从子女节点道双亲节点的联系是唯一的,而网状模型可以不唯一。网状模型中,还允许两个记录间有两个以上的联系。第二十页,共七十二页,2022年,8月28日关系模型概念:关系模型将数据的逻辑结构归纳为满足一定条件的二维表,称为一个关系。关系由关系框架和若干元组组成。组成元组的元素是分量。元组由n个分量组成称关系为n元关系。关系模型由关系(数据结构)、关系上定义的操作和关系完整性约束规则组成。关系模型的最大特点:描述的一致性,即无论对实体集还是实体之间的联系,均可以用关系(二维表)来表述。第二十一页,共七十二页,2022年,8月28日关系模型(RelationalModel)1969年美国IBM公司SanJose研究室的研究员首次提出了数据库系统的关系模型。开创了数据库关系方法和关系数据理论的研究,为数据库技术奠定了理论基础。20世纪80年代以来,计算机厂商新推出的数据库管理系统几乎都支持关系模型。第二十二页,共七十二页,2022年,8月28日关系模型(RelationalModel)关系数据模型的数据结构
在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
关系数据模型的优缺点
关系模型与非关系模型不同,
关系模型的概念单一。
关系模型的存取路径对用户透明
当然,关系数据模型也有缺点,其中最主要的缺点是,由于存取路径对用户透明,查询效率往往不如非关系数据模型。因此为了提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度。
第二十三页,共七十二页,2022年,8月28日完整性约束:对每个属性的定义域的限制,各属性间数据关系(联系)的描述以及其他一些关于该关系的强制性约束条件,统称为完整性约束。关系的规范化一般要求实现第三范式。第二十四页,共七十二页,2022年,8月28日什么是
数据库?(1)数据库(DATABASE,简称DB)
所谓数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度,较高的数据独立性和易扩展性,并可为各种用户共享。
第二十五页,共七十二页,2022年,8月28日什么是数据库?(2)通常,数据库中的数据,至少在在大型系统中,既是集成的,又是共享的:集成指的是数据库可以被当作几个不同的文件的合并,数据库至少可以部分消除文件之间的冗余。共享指的是数据库中的每项数据可以被不同的用户共享。每个用户可以因不同的目的而访问相同的数据,甚至可以同时访问同一数据(并发访问)。第二十六页,共七十二页,2022年,8月28日什么是数据库?(3)数据库集成和共享带来的一个结果,是任一用户都只需关心整个数据库中的一小部分,而且不同用户所使用的数据库会以各种方式重叠。换句话说,对于一个指定的数据库,不同用户会以许多不同的方式来观察第二十七页,共七十二页,2022年,8月28日什么是数据库?(4)数据库的结构划分成四个级次:局部逻辑级全局逻辑级存储级物理级。第二十八页,共七十二页,2022年,8月28日模式:又叫概念模式。数据库管理员(DBA)看到的数据库,也叫DBA视图。外模式:也称为子模式。用户可以看到并获准使用的那部分数据的逻辑结构,又叫用户视图。内模式:是数据库的存储结构。物理数据库:数据库在物理存储设备上的组织。第二十九页,共七十二页,2022年,8月28日什么是
数据库管理系统?(1)数据库管理系统(DATABASEMANAGEMENTSYSTEM,简称DBMS)。数据库管理系统是位于用户与操作系统之间的一层数据管理软件。它的主要功能包括以下几个方面:1.数据定义功能2.数据操纵功能3.数据库的运行管理4.数据库的建立和维护功能第三十页,共七十二页,2022年,8月28日什么是
数据库管理系统?(2)SQL>CREATETABLEstudent(nameCHAR(10),……)SQL>SELECTnameFROMstudentWHEREage>20SQL>INSERTINTOStudent(name,zip,age)VALUES(“WANGWU”,100872,22,)SQL>UPDATE….SQL>DELETE……
第三十一页,共七十二页,2022年,8月28日什么是数据库系统?(1)数据库系统(DATABASESYSTEM简称DBS)数据库系统是指一个计算机存储记录的系统,即,它是一个计算机系统,该系统的目标是存储信息并且支持用户检索和更新所需要的信息一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。第三十二页,共七十二页,2022年,8月28日什么是数据库系统?(1)应用程序数据库管理系统数据库用户第三十三页,共七十二页,2022年,8月28日什么是数据库系统?(2)一、硬件平台及数据库由于数据库系统数据量都很大,加之DBMS丰富的功能使得自身的规模也很大,因此整个数据库系统对硬件资源提出了较高的要求,这些要求是:(1)要有足够大的内存,存放操作系统,DBMS的核心模块,数据缓冲区和应用程序。(2)有足够的大的磁盘等直接存取设备存放数据库,有足够的磁带(或微机软盘)作数据备份。(3)要求系统有较高的通道能力,以提高数据传送率。
第三十四页,共七十二页,2022年,8月28日什么是数据库系统?(3)二、软件:数据库系统的软件主要包括:
(1)DBMS:DBMS是为数据库的建立、使用和维护配置的软件。(2)支持DBMS运行的操作系统。(3)具有与数据库接口的高级语言及其编译系统,便于开发应用程序。(4)以DBMS为核心的应用开发工具。(5)为特定应用环境开发的数据库应用系统。第三十五页,共七十二页,2022年,8月28日什么是数据库系统?(4)三、人员或用户
开发、管理和使用数据库系统的人员主要是:数据库管理员、系统分析员和数据库设计人员、应用程序员和最终用户。
不同的人员涉及不同的数据抽象级别,具有不同的数据视图-视图是表达数据库系统中相关元素关系的有效工具。第三十六页,共七十二页,2022年,8月28日什么是数据库系统?(5)1.数据库管理员(DataBaseAdministrator简称DBA),具体的职责包括:(1)决定数据库中的信息内容和结构(2)决定数据库的存储结构和存取策略(3)定义数据的安全性要求和完整性约束条件(4)监控数据库的使用和运行(5)数据库的改进和重组重构第三十七页,共七十二页,2022年,8月28日什么是数据库系统?(6)2.系统分析员和数据库设计人员
系统分析员负责应用系统的需求分析和规范说明,他们要和用户及DBA相结合,确定系统的硬软件配置并参与数据库系统的概要设计。
数据库设计人员负责数据库中数据的确定、数据库各级模式的设计。数据库设计人员必须参加用户需求调查和系统分析,然后进行数据库设计。在很多情况下,数据库设计人员就由数据库管理员担任。
第三十八页,共七十二页,2022年,8月28日什么是数据库系统?(7)3.应用程序员
应用程序员负责编写数据库应用程序。他们使用某些程序设计语言如COBOL,C++,Java或某种高级的第四代语言(见第二章)来编写应用程序。这些程序通过向DBMS发出SQL语句请求来访问数据库。这些程序通常可以是批处理应用程序,或联机应用程序,目的是允许最终用户通过联机工作站或终端访问数据库。
第三十九页,共七十二页,2022年,8月28日什么是数据库系统?(8)4.最终用户(EndUser)最终用户可以通过在前面提到的联机应用程序访问数据库,或者使用数据库系统软件提供的界面。常用的界面方式有浏览器、菜单驱动、表格操作、图形显示、报表书写等。
第四十页,共七十二页,2022年,8月28日第三节关系数据库系统及其应用关系数据库的特点关系数据语言介绍SQL的特点、作用及应用常见关系数据库系统及厂商介绍如何选购DBMS第四十一页,共七十二页,2022年,8月28日关系数据库的特点与其他数据模型数据库相比,关系数据库的优点简单、灵活。关系数据语言具有较好的非过程化特性,更适应非专业用户对应用系统的开发需求。有更高的数据独立性。更适应数据库的重组和控制。易于实现随机查询。第四十二页,共七十二页,2022年,8月28日良好的理论基础,成熟的技术体系。易于知识库系统的综合。第四十三页,共七十二页,2022年,8月28日关系数据语言简介关系代数集合运算关系运算SQL语句关系数据语言的特点一体化-DDL、SDDL、DML数据操纵单一非过程化程度高对数据进行集合处理第四十四页,共七十二页,2022年,8月28日SQL语言简介特点标准化程度极高应用广泛易学易用增加了对高级语言开发程序的嵌入式使用方式支持网络应用第四十五页,共七十二页,2022年,8月28日SQL语句的语法结构与应用实例自修完成要求:掌握SQL的基本结构并能够完成简单的数据查询。第四十六页,共七十二页,2022年,8月28日主流的关系数据库Foxpro-FoxMicrosoftOracle-OracleCorporationSybase-SybaseInformix/基于Unix系统的关系数据库SQLServer-Microsoft……第四十七页,共七十二页,2022年,8月28日第四节多媒体数据管理多媒体数据处理的概述多媒体数据处理系统的软、硬件构成多媒体数据模型多媒体数据库第四十八页,共七十二页,2022年,8月28日多媒体数据处理的概述多媒体数据的特点媒体的种类与性质多媒体技术是计算机交互式综合处理多种媒体信息-文本、图形、图像和声音,式多种信息建立逻辑联系,集成一个系统并具有交互性。多媒体的关键特性:信息载体的多样性、交互性和集成性。第四十九页,共七十二页,2022年,8月28日从信息表单的角度看,媒体具有以下属性:对媒体可识别和理解。不同媒体所表达信息的程序不同媒体之间相互联系也存在信息媒体可以进行相互转换第五十页,共七十二页,2022年,8月28日多媒体的特点数据量巨大数据类型繁多各数据类型间的差别较大处理方法不同空间占用差别大时间特性的差别(组织方法包括时间概念)多媒体数据的输入输出复杂普遍采用多通道异步输入方式,以保证在空间和时间都不同的情况下输入各种媒体数据并保存起来,有利于多种媒体信息的合成。第五十一页,共七十二页,2022年,8月28日多媒体信息系统与传统信息系统相比多媒体系统集成的范围更加广泛提供和处理的信息真正实现多媒体化从应用范围上看,多媒体信息系统的应用范围将更加广泛从应用水平和效果上看,多媒体信息系统具有更好的信息表现效果,更好的交互性能,具有更高的应用水平。第五十二页,共七十二页,2022年,8月28日多媒体信息系统中的主要研究内容数据压缩与解压缩压缩算法多媒体信息的组织与管理突破传统的数据管理模式,开拓适合多媒体信息管理的方法和技术。多媒体信息表现和可视化用户与多媒体系统之间的多种交互形式。多媒体通信与分布处理-基于网络的技术第五十三页,共七十二页,2022年,8月28日多媒体的软、硬件平台体现软件硬件平台以及系统结构的标准化研究。虚拟现实技术(VirtualReality)感觉世界中虚拟的实体逼真-三维视觉、听觉、触感等真实感人通过自然技能来实现交互-肢体动作采集三维传感设备的应用第五十四页,共七十二页,2022年,8月28日多媒体数据处理系统的硬件构成多媒体的特定处理技术对于主板上集成的芯片提出了更高的要求。多媒体硬件光盘存储器及光盘驱动器多媒体I/O设备音响设备以及录音设备视频卡音频卡第五十五页,共七十二页,2022年,8月28日多媒体计算机系统的配置重点总线宽度-满足多路动态数字音频视频数据传输的要求;接口-各种接口以联接各种音频、视频I/O端口和其他交互设备等各种多媒体设备的端口;内、外存的容量-以满足多媒体数据处理的要求。多媒体PC中硬件的最低要求-表3-16第五十六页,共七十二页,2022年,8月28日多媒体数据处理系统的软件构成软件种类驱动软件-一般常驻于内存,直接管理和控制多媒体硬件。操作系统-核心,目前使用最多的是带有多媒体处理功能的Windows操作系统。多媒体工具软件-如视频与音频采集软件。多媒体数据管理软件-多媒体数据库。其他多媒体应用软件-应用于特定领域的多媒体软件。第五十七页,共七十二页,2022年,8月28日多媒体数据模型
多媒体数据模型的分类超文本模型文献模型信息元模型表现与同步模型在多媒体数据模型的研究中,利用面向对象的方法来研究和分析多媒体数据是较为理想的思路。第五十八页,共七十二页,2022年,8月28日多媒体数据库多媒体对数据库的影响数据量大且媒体之间的数据量大小差别极大,影响数据库中数据的组织和存取方式。媒体种类繁多,特定各异,处理方法也各不相同,较难实现统一的处理方式。多媒体信息系统中,数据常具有分布性,需要通过网络的方式来实现,给数据管理和通讯方面带来难题。多媒体数据库中,接口一般是多媒体化的,对于数据的操作难以实现统一的格式。多媒体数据管理中“版本”问题突出,同一对象会出现不同表现形式,对DBMS提出更高要求。第五十九页,共七十二页,2022年,8月28日多媒体数据库方法扩展关系数据库方法增加数据类型新技术的应用-windows中OLE(对象联接与嵌入)技术NF方法对关系模型进行扩充,允许关系表中再有表,增加层次结构使关系表达更加灵活有效。面向对象方法面向对象的方法支持多媒体应用方面的优点-P107第六十页,共七十二页,2022年,8月28日多媒体数据的查询和检索的特殊性多媒体查询的两大类基于表现的查询-“找出具有声音注释的图像”基于内容的查询-“找出所有带有‘Good’的句子”“根据实例”的查询“找出与某照片相貌相似的全部罪犯”第六十一页,共七十二页,2022年,8月28日第五节数据仓库数据仓库的产生数据仓库的概念和特点数据仓库的体系结构第六十二页,共七十二页,2022年,8月28日数据仓库的产生主要由两个方面的需求促成了数据仓库的建立和使用:全局应用-面向全局模式的复杂分析-对于频繁操作性的数据处理数据仓库的建立使企业的信息环境划分为两大部分:操作环境-日常操作性应用信息提供环境(分析环境)-对信息的分析应用第六十三页,共七十二页,2022年,8月28日数据仓库的概念和特点概念:使支持管理决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合。精确:数据仓库使企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。注意与其他数据库应用不同,数据仓库是一种观点,不是可以直接购买的商品。它包括电子邮件文档、语音邮件文档、CD-Rom、多媒体信息以及还未考虑到的数据。第六十四页,共七十
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国宝石和珠宝行业市场发展趋势与前景展望战略研究报告
- 普通中式正餐企业制定与实施新质生产力战略研究报告
- 2025-2030中国安全云分析行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国孕妇奶粉行业发展分析及发展前景与投资研究报告
- 龙头花洒行业跨境出海战略研究报告
- 2025-2030中国婴儿头定型枕行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030中国女性游戏行业市场发展分析及发展趋势与投资研究报告
- 2025-2030中国天然气制油市场运行形势及未来竞争格局展望研究报告
- 2025-2030中国复合维生素咀嚼片市场动态调研与供需销售前景分析研究报告
- 住宿线上推广企业制定与实施新质生产力战略研究报告
- 七年级生物上册 3.2.1 种子的萌发说课稿1 (新版)新人教版
- 2025年临床医师定期考核必考复习题库及答案(1000题)
- 2024年中国男式印花T-恤衫市场调查研究报告
- 保安指挥车辆标准手势培训
- 【MOOC】医学心理学-北京大学 中国大学慕课MOOC答案
- 中建塔式起重机安装、拆除专项施工方案
- 《光明乳业公司企业应收账款管理现状及优化建议(10000字论文)》
- 邀请招标文件模板
- 金融投资项目立项管理制度
- 大学生职业规划学习通超星期末考试答案章节答案2024年
- 教育目的-(第五章)
评论
0/150
提交评论