




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章数据库和数据库管理系统本章内容4.1传统的数据组织方式4.2数据库系统4.3数据库管理系统4.4专用和通用数据库系统4.5数据仓库数据管理技术的发展人工管理阶段数据不在计算机中长期保存没有软件系统对数据进行管理一组数据对应于一个应用程序文件系统数据按一定的规则组成文件,能在计算机中长期保存、反复处理有软件系统对数据进行管理,程序与数据之间有了一定的独立性数据库系统传统的数据组织方式传统上,业务数据按照域、记录和文件的层次组织起来。数据域是数据的最小单位,例如职工编号。记录是相关的数据域的集合,如职工记录。文件是相关的记录的集合,如职工文件。文件和文件夹文件是电子表格、文档、数据集合,或事实的集合。文件夹是相关文件的集合。文件的结构文件结构指在磁介质上存储记录的方式在顺序文件结构中,存储记录的方式是按主键顺序存储。直接文件存储是将记录随机存储,即存放时不按主键顺序。索引顺序文件结构是在直接存取介质上进行连续存储根据索引跟踪记录的物理地址和访问记录。索引文件索引区前部分:数据项,通常是关键字后部分;记录的存储地址,指针数据区逻辑顺序与记录的物理顺序无关目的:提高查询的效率传统文件系统的局限性整体无结构数据的冗余度大浪费存储空间数据的不一致性应用程序对为其专门设计的文件存在依赖本章内容4.1传统的数据组织方式4.2数据库系统
4.3数据库管理系统4.4专用和通用数据库系统4.5数据仓库数据库系统数据库是组织中基于计算机制数据资源的集合数据库的两个主要目标减少数据冗余数据冗余指的是数据的重复数据冗余的代价:数据的不一致性获得数据独立性数据独立性指对数据结构进行修改时,不必修改处理该数据的应用程序通过数据字典实现应用数据库的数据层次为:数据库文件记录域现实世界转换数据世界数据模型认识抽象信息世界概念模型现实世界中客观对象的抽象过程客观事物的关系与性质实体联系属性数据库文件记录数据项三个世界术语对应表现实世界信息世界数据世界例子全体实体集文件某校全体学生的数据个体实体记录学生张三的数据特征属性数据项(字段)(张三,男,23)信息模型要素:实体(entity):客观世界的万事万物属性(attribute):实体的特征(外在表现)实体集(entityset):同类个体的集合。联系(relationship)相互联系的方式一对一联系(1:1)一对多联系(1:n)多对多联系(m:n)E-R模型实体-联系(Entity-Relationship)实体集属性联系数据库结构的发展数据库结构(数据库模型)数据库用于组织记录及确定记录间关系的方法商业数据库产品中,已经提供了四种数据库结构层次数据库结构第一个数据库管理系统是IDS2(IntegratedDataStore)开始采用层次数据库结构数据分成组,每组分成更小的组,更小的组再进一步分组。数据库的层次结构适合于处理定单录入、应收事务处理系统(1)有且仅有一个节点无双亲(这个节点称为根节点);
(2)其他节点有且仅有一个双亲节点。
注:树的节点代表实体集图某大学行政机构层次模型网状数据库结构CODASYL1997发布了网状数据库结构说明网状数据库模型特点所有记录用系表示每一系都包含一个主记录和若干属记录允许一个记录同时属于几个系层次模型和网状模型如今很少使用缺乏灵活性图网状模型的例子
学生
班级
社团
(1)一个节点可以有多个双亲节点;(2)多个节点无双亲节点。关系数据库结构E.F.Codd;C.J.Date描述了基于关系代数的数据库结构数据库结构可以看成表的集合,表之间的关系不是通过显式的索引或地址存储,表之间的关系是隐含的表中的公共列是建立隐含关系的工具更为灵活关系模型理论表:具有结构的某个相同主题的数据集合。表由行(记录)、列(字段)组成每列有一个字段名,每个字段只有一个值行的上下顺序、列的左右顺序任意任意两行记录的内容不应相同字段的取值范围称为域。同一字段的域相同,不同字段的域也有可能相同。关系数据库中的维修商表冗余的弊端冗余:
数据在同一表或不同表中重复出现弊端:浪费空间删除异常修改复杂数据异常数据不一致插入异常
导师编号姓名性别职称系名电话101陈平林男教授社科系34358750102李向明男副教授计算机系76853212103马大可女研究院生物系86238931104李小严女副教授社科系34358750模式的规范化1第一范式2第二范式3第三范式1第一范式表中任意字段的值必须是不可分的,即每个记录的每个字段只能包含一个数据。2第二范式表中所有非主键字段完全依赖于主键字段表中的“名称”字段不依赖于主键“职工号+工地编号”
2第二范式解决方法:非主键字段依赖主键“职工号+工地编号”非主键字段依赖主键“工地编号”3第三范式第三范式:满足第二范式的前提下,一个表的所有非主键字段均不传递依赖于主键传递依赖:设表中有A(主键)、B、C三个字段,若B依赖于A,而C依赖于B,称字段C传递依赖于主键字段A
3第三范式解决方法规范化过程先对二维表消去组合项与重复组化为第一范式再消去非主属性对主关键字的不完全依赖性而变为第二范式再消去非主属性对主关键字的传递依赖性就化为第三范式。规范化职工号姓名级别工资学历毕业时间001张三技1083中专1957001张三技1083大学1968001张三技1083研究生1981002李四技1262大学1970003王五技1083大学1970004赵二技1262中专1968E-R图转换为关系模型一个实体型转换为一个关系模式。实体名作为关系名实体的属性就是关系的属性。一个联系转化为一个关系模式。联系名作为关系名与该联系相连的各实体的关键字以及联系的属性转化为关系的属性(m:n)一的主键放在多表中(1:n)面向对象数据库结构面向对象数据库技术看起来最适于管理在类型、长度、内容和形式上有实质差异的复杂数据类型。每个对象的数据、描述对象的行为、属性的说明三者是封装在一起的。对象之间通过消息互相作用,且每个对象都由一组属性来描述。具备相同属性及方法的对象被成为一个类,某对象的行为及属性可以由同一个类中的其他对象所继承与其他数据库技术有本质的区别,开发人员在学习使用时有一定的难度数据库软件的发展GE的IDS是第一个数据库管理系统,其贡献在于将把数据结构的描述与程序分开。数据库管理系统(DatabaseManagementSystem,DBMS)易于使用、易于访问结构查询语言(StructuredQueryLanguage,SQL语言)本章内容4.1传统的数据组织方式4.2数据库系统4.3数据库管理系统
4.4专用和通用数据库系统4.5数据仓库数据库管理系统(DBMS)DBMS的功能以规范、一致的方式存储数据;以规范、一致的方式将数据组织成记录;允许用规范、一致的方式存取记录应用程序、数据库、数据库管理系统三者之间的关系数据库管理系统的组成远程监督程序应用开发程序开发工具安全软件包归档程序报表生成器数据字典/目录数据字典指的是在数据库中存储数据的定义数据字典/目录应包含数据库中每一数据项的名称及对各数据项的描述、对各个数据项之间关系的描述。数据字典可以是纸面上的,也可以是计算机文件。通过使用数据字典,DBMS可以将数据以规范、一致的方式进行存储,从而减少了数据冗余。数据语言数据描述语言(DDL)用来描述数据项的定义数据操纵语言(DML)用来检索和存储数据库中的数据,以确保数据库中存取数据的规范性。元数据和数据视图元数据:关于数据的数据每一数据项的定义信息数据项与其他数据项的关系数据库中的两种视图逻辑视图是用户观察数据库中记录结构和记录之间关系的一种形式物理视图是记录在存储介质上的实际组织与存储的方式模式模式是对数据的描述,是数据库逻辑视图的描述。模式通常需要说明数据的特征,包括:数据域名别名(相同数据域采用的另一个名字)数据类型(字符、字母等)位数小数的位数不同的完整性规则子模式
子模式用来表示所有数据描述的一个子集,一个数据库逻辑视图的一部分就是子模式。一个子模式只包含一个完整数据库中的数据项子集。这些数据项反映某个用户特定数据需要。子模式提供了一种保证数据库安全的手段。将模式、子模式和数据字典结合起来,对所有数据库用户呈现一个中心数据库的视图,这就保证了数据独立性,减少了冗余。数据库系统的三级模式图
三种查询语言结构化查询语言(SQL)包含大约30个已成为行业标准的类英语命令
示例:SELECTNAME,ADDRESSFROMCUSTOMERWHERESTATE=‘MI’自然语言查询
LISTTHENAMEANDADDRESSESOFALLCUSTOMERWHOLIVEINMICHIGANQBE查询不必直接书写查询语言的优缺点优点:用户不必深入了解记录结构信息和DBMS检索数据的处理过程管理者不必学习COBOL或C语言等标准编程语言就可以访问数据库缺点:用户需要经过培训才能高效使用查询语言多平台数据和Web服务软件多平台数据库在不同的硬件及操作系统平台上都可以使用的DBMS软件Web服务软件Web服务软件集成到DBMS存放数据库的计算机系统转换到Web服务器上网的用户无论处于何地都可以对数据进行操作用户不但可查看本地数据库数据,而且对于万维网本身数据也可进行查询数据库管理员数据库管理员(DBA):负责数据库的信息系统专家。DBA的职责数据库规划数据库实施数据库运行数据库安全维护数据库管理系统的优点减少数据冗余提高了数据的一致性保证数据独立性从多个文件中集成数据快速检索数据和信息改进安全控制本章内容4.1传统的数据组织方式4.2数据库系统4.3数据库管理系统4.4专用和通用数据库系统
4.5数据仓库专用数据库系统-超媒体数据库超媒体数据库超媒体数据库是以超文本作为记录的系统超媒体系统可由一个组织的内、外部文件构成超媒体文件包括文本、图片、声音、视频等多种数据类型读取超媒体文件需一种软件——浏览器以超媒体文件存储的信息可以用非连续方式存取其它专用数据库系统在线数据库图像数据库文档数据库通用数据库系统通用数据管理系统能处理各种类型的数据——传统文本数据以及图像声音、超媒体文件、标准文本。通用数据库系统可满足各种平台的要求。例房地产银行本章内容4.1传统的数据组织方式4.2数据库系统4.3数据库管理系统4.4专用和通用数据库系统4.5数据仓库数据仓库的概念数据仓库是指能存储、检索、管理或操纵大量数据的系统。数据仓库包括组织中数据库的数据和外部的数据。特点:非常大质量非常高而且可检索面向某一主体而不是面向事务处理在整个组织应用的范围内进行设计数据仓库的主要组成部件数据本身;可供数据存储、访问的硬件及网络基础结构;可从原始数据源析取数据,将这些数据转化成规范格式,并存入数据仓库中的软件;图表查询工具;在数据仓库中进行数据挖掘的用户使用的图形查询工具;使信息系统人员维护、升级数据仓库的管理软件。数据仓库的作用将组织中随时间推移而出现的数据孤岛集中起来市场分析数据库中知识发现(KDD)数据集市建立数据仓库看起来是一项大的挑战折衷的策略-实施数据集市(DataMarket)数据集市是一个数据库,由组织中某一个部门所需要的数据组成,它所包含的数据仅描述一部分公司运营情况内容总结第四章。直接文件存储是将记录随机存储,即存放时不按主键顺序。索引顺序文件结构是在直接存取介质上进行连续存储根据索引跟踪记录的物理地址和访问记录。逻辑顺序与记录的物理顺序无关。属性(attribute):实体的特征(外在表现)。一对一联系(1:1)。多对多联系(m:n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新版试用期劳动合同模板合同
- 土地承包合同法律文本示例
- 厂家设备租赁合同样本集锦
- 项目合作人才服务合同
- 茶叶购销合同模板
- 新产品开发项目合同协议书范本
- 保密合同-工作手机保管细则
- 度设备采购借款合同模板
- 仓储用房租赁合同参考样本
- 度医疗服务采购合同
- 勃利县大四站镇侵蚀沟治理工程施工组织设计
- 汽车电子技术专业人才培养方案样本
- 血栓风险评估及个体化干预(遗传性易栓症风险基因检测)
- 血透患者的健康宣教课件
- 医院舆情应对处置预案
- 普通高中历史课程标准(2022年版2023年修订)解读
- 《统计学原理贾俊平》课件
- 2024电力储能电站钠离子电池技术条件
- 方法验证报告方案
- 关于企业高层管理人员职责的通知
- 消防员班长培训课件
评论
0/150
提交评论