版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章数据库与数据库管理系统用户应用软件系统软件硬件MIS软件层次操作系统数据库管理系统第4章数据库与数据库管理系统本讲内容:一数据组织1.实体和属性2.数据项,记录,文件3.纪录的关键字二文件组织1.顺序文件2.散列文件3.索引文件第4章数据库与数据库管理系统三数据库系统数据库管理技术的发展数据库系统的组成数据库的三级体系结构关系数据库模型数据库设计初步四数据库语言数据处理的概念数据处理是指把来自科学研究、生产实践和社会经济活动等领域中的原始数据,用一定的设备和手段,按一定的使用要求,加工成另一种形式的数据。数据处理的基本内容:
数据收集;
数据转换;
数据筛选、分组、排序;
数据的组织;
数据的运算;
数据存储;
数据检索;
数据输出。
管理信息系统是用来进行数据处理的,它关注的是数据以何种结构进行存储和采用何种方法从组织好的数据中检索数据。一数据组织DataOrganization数据模型是对数据的某种抽象表示形式,是描述数据的一组概念和定义。数据模型决定了对数据项的组织方式。描述包括:静态(结构,联系,约束)动态:定义在数据上的操作逻辑数据模型和物理数据模型数据组织-2逻辑结构数据间的逻辑关系,逻辑结构包括两大类:线性结构和非线性结构,线性表、栈、队列及串为线性结构,而树和图则为非线性结构。物理结构又称存贮结构,指数据元素在计算机存贮器中的存储方式,存储方式一般有四种:顺序存储、链接存储、索引存储及散列存储。映象对于给定的逻辑结构需要寻找一种对应的存储结构,以便在计算机中存储。通常把这种对应关系称为映象。一数据组织DataOrganization数据层次课程号课程名学分学时J101数学10100W201物理880Y301化学880层次示例数据库文件记录数据项字节位学生数据库课程文件,简历文件,财务文件。。。课程号课程名学分学时J101数学10100J101(课程号字段)10101010(字母J的ASCII码)0一数据组织DataOrganization1.实体和属性实体:数据所代表的事件或事物。如:职工甲属性:实体的特征属性域:属性值的变化范围实体集:实体的集合。如:全厂职工一数据组织DataOrganization2.数据项,记录,文件数据项:描述的实体的一个属性记录:与数据处理的某一对象有关的一切数据项排列构成一个纪录文件:相关纪录的集合构成文件一数据组织DataOrganization三个世界模型现实世界存在于人们头脑之外的客观世界信息世界现实世界在人们头脑中的反映,人们把它用文字和符号记录下来数据世界信息世界的信息在机器世界中以数据形式存储现实世界信息世界或概念模型认识抽象数据世界转换一数据组织DataOrganization现实世界信息世界数据世界例子全体实体集文件某厂全体职工的个人数据资料个体实体记录职工张三的数据特征属性数据项(字段)(张三,男,25,工程师)一数据组织DataOrganization3.关键字在一个文件内,通常我们以相同的方式存放着若干记录,记录中的关键字是指:该记录中具有以下特征的一个或一组数据项,特征为:对于该文件中的所有记录来讲,该数据项或者该组数据项它的值是唯一的。意味着根据一个关键字可以确定一个特定的记录。设立关键字在检索,更新,排序中有很大的作用。二文件组织FileOrganization文件结构(组织)问题不是DB出现后才有的,在文件系统中已经充分研究过。目前,文件管理仍是操作系统的主要功能之一。有些DBMS就以操作系统的文件管理作为其物理层的基础。更多的DBMS独立设计存储结构。DB中的文件既继承了传统文件系统的某些技术,又有与之相区别的特点。文件组织关系到数据处理的效率和对记录的操作方式。二文件组织FileOrganization1.顺序文件记录按其在文件中的逻辑顺序依次进入存储介质而建立的文件,一个记录紧接着前一个记录顺序排列。如:磁带文件连续存取的速度快,适用于批处理和定期处理任务。如:数据备份和定期的财务报表顺序文件文件中数据记录的物理顺序与逻辑顺序一致,文件记录按主键的值递增(或递减)次序排序,形成其逻辑顺序。870001张三456870002李四645870003王五587870004孙六676870005钱七565………………12345……文件记录物理设备主键的值相对磁道二文件组织FileOrganization2.散列文件将记录的某一属性用散列函数直接映射成记录地址数据库中应用不多二文件组织FileOrganization3.索引文件索引表1101G1102C1103E1104A数据文件学号姓名专业1104张三MIS1102李四MIS1103王五MS1101丁六MS记录地址ABCDEFG索引文件两部分索引文件的一般结构索引区数据区前部分,数据项通常就是关键字后部分,记录的存储地址—指针例如:
(a)数据文件
物理记录号编号姓名职称10135梁勇副教授10203李民副教授10402王红副教授10542陈立高工10812周一教授11217方波工程师(b)输入过程中建立的索引表(c)输入完成后排序的索引表索引项物理记录号021040310212108171123510142105索引项物理记录号351010310202104421051210817112二文件组织FileOrganization先根据关键字从索引表中查出记录所在的位置,然后再到该位置取出数据。逻辑顺序与记录的物理顺序无关。提高查询效率索引本身要占一定空间二文件组织FileOrganization满足下列条件之一的属性或表不宜建立索引:不出现或很少出现在查询条件中的属性属性值很少的属性,如:性别,用索引还不如顺序扫描。属性值分布严重不均匀的属性。如:职工年龄经常更新的属性或表,因为更新时索引需要维护过长的属性,如:超过30个字节,索引的存储空间比较大。太小的表二文件组织FileOrganization主关键字一般可建立索引。以读为主或只读的表,只要需要,且存储空间允许,可建索引。有些查询可以从索引直接得到结果,不必访问数据块,宜建索引。如,查询某属性的MIN或MAX。对于等值查询(即查询条件中以等号为比较符),如果满足条件的元组是少量的,可考虑在有关的属性上建索引。
数据块系统运行以后还可以进行调整,有些索引一时难以决定是否建立,可留待运行时通过实验来确定三数据库系统1.数据管理技术的发展1)程序管理阶段应用程序1应用程序2...应用程序N数据组N数据组1数据组2...也称手工管理阶段或简单应用阶段,计算机主要用于科学计算,所需的数据不多,数据不能长期保存在计算机内。数据是面向应用的。每一组数据对应一个应用程序。三数据库系统2)文件管理阶段应用程序1应用程序2...应用程序N数据组N数据组1数据组2...操作系统文件系统随着操作系统技术的发展和外存的出现,计算机开始用于管理,借助文件管理系统,数据以文件的形式长期保存在外存储器上,查询、修改等操作由文件统一管理。三数据库系统(1)程序管理阶段数据和程序结合为一个不可分的整体一组数据对应一个应用程序(2)文件系统管理阶段数据文件按应用程序的要求而建立程序和数据有一定的独立性,仍相互依赖各文件相互独立,分散保管。数据的一致性不易控制。文件系统是用户和用户应用程序与数据文件间的接口。三数据库系统3)数据库方法阶段使用数据库管理系统DBMS不仅描述数据本身,还描述数据之间的联系。数据在统一控制下,为尽可能多的用户服务。用户或用户程序数据库管理系统如:ACCESSFOXPROORACLEDB2等数据库用户或用户程序用户或用户程序用数据库专门管理数据,实现了数据与程序的真正独立;降低数据的冗余度;数据为多个用户共享;实现了整个组织数据的结构化;DBMS提供了数据的安全、完整、并发控制功能。三数据库系统数据独立性强物理独立性。数据库的物理组织发生变化不影响数据的逻辑结构。逻辑独立性。数据库的逻辑结构改变时,无须改变应用程序。数据冗余度小数据的共享性高数据的一致性好有数据安全和完整性保障。三数据库系统3.数据库的三级体系结构用户用户子模式用户用户级用户视图子模式\映式模式子模式DBA视图系统管理员视图概念级模式物理级模式\存储模式映射存储模式三数据库系统ANSI提出的数据库结构的标准化建议:用户级:亦称外模式。是数据库用户看到的数据视图。概念级,称为概念模式,模式1.对数据库整体逻辑结构的描述。2.统一考虑所有用户现在和将来的需求,并把这些需求所涉及的记录及记录间的联系有机地结合成一个逻辑整体。物理级:又称内模式或存储模式。1.对数据物理结构和存储方式的描述,对用户是透明的。2.物理组织修改后,不必修改模式。三个层次之间的两种映射模式与子模式之间的映射,这种映射把概念级数据库和用户数据库联系起来。模式与内模式之间的映射,这种映射把概念级数据库与物理数据库联系起来。正是通过这两种映射关系,换来了用户使用数据库的方便,最终把用户对数据库的逻辑操作转换成对数据的物理操作三数据库系统4.数据库模型DB概念模型:层次模型,网络模型,关系模型。RDB在80年代推出,新推出的DBMS几乎都支持关系模型。关系模型以表(TABLE)这一统一形式来表示数据的逻辑结构。关系数据库有一套完善的关系代数理论和方法支持。三数据库系统1)层次模型的数据结构(HierarchicalModel)用树形结构来表示实体之间联系的模型叫层次模型层次数据库系统的典型代表是IBM公司的IMS系统特点:每个记录只有一个父节点,当表示M:N关系时必然存在冗余。只有一个结点无父结点总是从父记录指向子记录一个单位的层次模型可有多棵树构成联系一般用指针实现(或物理邻接)每个记录只有一条查找路径三数据库系统系系号系名称负责人专业专业代号专业名教师教师编号姓名职务学生学号姓名年龄性别课程课号课程名类别学时查询时采取广度遍历策略,操作人员必须非常熟悉数据的层次结构层次模型使用指针来避免大量的数据冗余,但这样做会导致数据模式的不清晰三数据库系统2)网状模型的数据结构:用有向图结构表示实体类型及实体间的联系网状数据模型的典型代表是DBTG系统特点可以有一个以上的结点无父结点至少有一个结点多于一个父节点联系由指针实现每个记录可由多条查找路径学校领导领导教师班级教学管理
学生三数据库系统通过LINK联系记录表达M:N关系用户在使用网状DB时,不但要说明做什么,还要说明怎么做,即给出存储路径三数据库系统3)关系模型的数据结构:关系模型采用二维表来表示,二维表由表框架(FRAME)及表的元组(TUPLE)组成。表框架由N个命名的属性(Attribute)组成,N称为属性元素(arity)。每个属性有一个取值范围称为值域(domain)。表框架对应了关系的模式,即类型的概念。姓名工作时小时工资总和张三1020200李四2040800王五3010300记录元组字段属性三数据库系统代号生产厂家城市S2机床配件厂北京S4工业设备厂上海编号名称材质规格P1螺丝帽钢12P2螺栓铁17P4螺丝钉钢14P5法兰盘铝12代号编号数量S2P1300S2P2400S4P2300S4P4500S4P5600从北京机床配件厂采购了哪些零件?在RDB中,用户需要用多个相关联的表中的信息来生成管理所需的报表。通过关系运算,可以将任何两个有共同数据项的表关联起来,这是RDB的威力所在。三数据库系统关系数据库的基本操作选择:在表中找出符合指定条件的记录。连接:把相关的表合并起来,向用户提供比单个表更多的信息投影:在已有表的基础上,选定所需的列建立一个新表。三数据库系统代号生产厂家城市S2机床配件厂北京S4工业设备厂上海编号名称材质规格P1螺丝帽钢12P2螺栓铁17P4螺丝钉钢14P5法兰盘铝12代号编号数量S2P1300S2P2400S4P2300S4P4500S4P5600代号生产厂家城市编号数量名称材质规格S2机床配件厂北京P1300螺丝帽钢12S2机床配机厂北京P2400螺栓铁17S4工业设备厂上海P2300螺栓铁17S4工业设备厂上海P4500螺丝钉钢14S4工业设备厂上海P5600法兰盘铝12为什么不在设计数据库的时候就用上述这张大表?三数据库系统代号生产厂家城市编号数量名称材质规格S2机床配件厂北京P1300螺丝帽钢12S2机床配机厂北京P2400螺栓铁17S4工业设备厂上海P2300螺栓铁17S4工业设备厂上海P4500螺丝钉钢14S4工业设备厂上海P5600法兰盘铝12优点:便于查询缺点:数据冗余度大:如,设备厂出现的次数插入异常:如,要添加“铜帽”,因没进货,则无法插入删除异常:如,没进北京配件厂的螺丝帽,则把螺丝帽材质为钢的信息去掉。更新异常:如,要更换螺栓规格,则要逐一更换。三数据库系统关系模型的规范理论关系模型的好坏对数据的存储,操作有很大影响。因此,一般要对得到的关系模式进行优化(规范化)规范化理论是E.F.Codd在1971年提出的,研究关系模型中各属性之间的关系,探讨关系模型应具备的性质和设计方法。三数据库系统初步得到的关系模型优化后的关系模型(数据库设计结果)规范化理论三数据库系统范式的定义:1NF:如果一个关系模式R的所有属性都是基本的不可分隔的,则称为R为第一范式。2NF:设关系模式R(U,F),如果R
1NF且所有的非主属性完全依赖于R的每个主码,不存在非关键字段对任何主码的部分依赖,则R
2NF。若数据库模式R中的每个关系模式R都属于2NF,则数据库模式R
2NF。
3NF:如果关系模式R是2NF,而且每个非关键字的属性不是传递依赖于关键字,那么关系模式R是第三范式BCNF:若关键模式R中的每个觉得因素,都是R的一个候选关键字,则称R是BCNF。三数据库系统例1:下面的关系-物资税价表不满足第一范式的条件,不是第一范式。物资编码物资名称物资价税物资金额增值税额0101003生铁600.00102.00去掉分割的数据项后,可得到下面的关系,它已经是第一范式物资编码物资名称物资金额增值税额0101003生铁600.00102.00三数据库系统例2:下面的关系模式是否为第三范式?(关系模式中主码为“教师代码”)教师代码教师姓名院系名称院系负责人Y0001江涛应用学院李丽华Y0002张伟应用学院李丽华Y0003何丽丽应用学院李丽华非主属性“院系名称”依赖于主码“教师代码”,而院系负责人又依赖与院系名称。因此,院系负责人传递依赖于主码教师代码。因此不是第三范式三数据库系统上例中消除传递依赖关系的办法是将关系教师分解为如下两个满足第三范式的关系(教师代码,教师姓名,院系名称,院系负责人)教师(教师代码,教师姓名,院系名称)院系(院系名称,负责人)三数据库系统在关系数据库中,对关系模型的基本要求是满足第一范式,这样的关系模式就是合法的,允许的。但有些关系模式存在数据冗余,存储操作异常等不足,因此,要进一步改善关系模式,这就是规范化的目的关系模式的规范化是采用投影分解的方法来实现的,分解时应注意保证分解前和分解后的等价性规范化等级的选择要综合考虑多种因素,要在减少数据冗余,消除存储操作异常和响应时间之间做出合理的折中。一般而言,规范化等级越高,检索时需要的数据连接操作就越多,DBMS的开销就越大,响应时间变长。实际研制和开发数据库系统时,多采用3NF三数据库系统5.数据库的初步设计要建立数据库需要做两方面的设计1)逻辑设计:得出好的关系模式(表的各个属性构成)2)物理设计:数据库在物理存储设备上如何组织(设计内模式)三数据库系统实体关系图(E-R图)是P.S.Chen于1976年提出用于直接从现实世界中抽象出实体类型及实体间联系,然后用E-R图表示。E-R图中的四个基本成分矩形框,表示实体类型菱形框,表示联系类型椭圆形框,表示实体类型和联系类型的属性直线,联系类型与其涉及的实体类型之间以直线连接在直线端部标上联系的种类(1:1,1:n,m:n)三数据库系统关系模型可以由E-R模型转换而来,转换规则有:E-R模型中的每一个实体集对应一个关系,实体集名作为关系名,实体集的属性作为这个关系的属性E-R模型中的联系也对应一个关系,该联系的属性及与该联系相连的各实体集的主码作为该关系的属性。三数据库系统联系(Relation):是指实体间的相互关系一对一联系一对多联系多对多联系三数据库系统一对一联系如果实体集合A中的每一个实体,实体集合B中只有一个实体与其发生联系;B中的每一个实体,A中也只有一个实体与其发生联系,称A和B是一对一联系。如:总统与国家之间的关系(管理)三数据库系统一对多联系如果对于A中的一个实体,B中有一个以上实体与其发生联系;而B中的每一个实体只与A中的一个实体发生联系,那么称A和B是一对多联系。如:国家与省之间的联系(管辖)三数据库系统多对多联系如果对A中一个实体,B中至少有一个实体与之存在联系;B中一个实体,A中至少也有一个实体与之存在联系,称A和B是多对多联系。如:医生与病人之间的联系(诊疗)三数据库系统E-R模型设计举例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 南京医科大学康达学院《专业方向综合课程设计》2023-2024学年第一学期期末试卷
- 湖南省长沙市2024年中考数学模拟考试试卷含答案
- 九江学院《服装CAD制版》2023-2024学年第一学期期末试卷
- 江苏海洋大学《生化分离工程》2023-2024学年第一学期期末试卷
- 湖南九嶷职业技术学院《越南语阅读》2023-2024学年第一学期期末试卷
- 【物理】第十二章 简单机械 单元练习+2024-2025学年人教版物理八年级下册
- 黑龙江工商学院《文化与社会发展》2023-2024学年第一学期期末试卷
- 重庆第二师范学院《机器学习与人工智能》2023-2024学年第一学期期末试卷
- 浙江海洋大学《光电信息材料与技术》2023-2024学年第一学期期末试卷
- 中国科学技术大学《公关与营销策划》2023-2024学年第一学期期末试卷
- GB/T 16895.3-2024低压电气装置第5-54部分:电气设备的选择和安装接地配置和保护导体
- 2025湖北襄阳市12345政府热线话务员招聘5人高频重点提升(共500题)附带答案详解
- 2025年河北省职业院校技能大赛智能节水系统设计与安装(高职组)考试题库(含答案)
- 2024年下半年鄂州市城市发展投资控股集团限公司社会招聘【27人】易考易错模拟试题(共500题)试卷后附参考答案
- GB/T 29498-2024木门窗通用技术要求
- 《职业院校与本科高校对口贯通分段培养协议书》
- GB 4053.2-2009固定式钢梯及平台安全要求第2部分:钢斜梯
- 通力电梯培训教材:《LCE控制系统课程》
- 品管圈PDCA持续质量改进提高静脉血栓栓塞症规范预防率
- 一次函数单元测试卷(含答案)
- 陕西省榆林市各县区乡镇行政村村庄村名居民村民委员会明细
评论
0/150
提交评论