版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
管理信息系统的技术基础教学基本内容与要求:
理解理解数据处理的概念、基本内容,熟悉数据组织、数据库系统的构成、数据库设计的主要内容;理解计算机网络的基本概念,了解计算机网络技术。
7/20/20231第一节数据处理一、数据处理的概念1.数据处理:指把来自科学研究、生产实践和社会经济活动等领域中的原始数据,用一定的设备和手段,按一定的使用要求,加工成另一种形式的数据的过程。
数据处理是管理活动的最基本内容,也是管理信息系统的基本功能!2.数据处理的主要目的(1)数据转换:便于分析、传送或处理的形式(代码)(2)抽取有价值的数据(3)便于保存和管理7/20/20232第一节数据处理一、数据处理的概念3.数据处理的基本内容(1)数据收集(2)数据转换(3)数据筛选、分组和排序(4)数据组织(5)数据运算(6)数据存储(7)数据检索(8)数据输出4.数据处理注意事项:(1)以何种方式存储(2)以何种数据结构便于存储和取用(3)以何种方法检索7/20/20233第一节数据处理二、数据组织数据组织是数据的组织方式及内在的联系方式。决定数据处理的效率,是数据处理的主要内容之一。包括:数据结构、数据文件和数据库1.数据结构(1)构成逻辑结构物理结构指数据间的逻辑关系线性结构非线性结构如:线性表、栈、队列、串如:树、图存储结构指存储方式顺序存储链式存储索引存储散列存储
同一种逻辑结构采用不同的物理结构得到不同的数据结构。对于给定的逻辑结构需要寻找一种恰当的物理结构以便于存储。7/20/20234第一节数据处理(2)数据结构相关概念①结点:表征某一数据结构特点及其连接方式的基本单位称为数据结构的结点(Node)。
结点可以是:一个字符、数字、记录、集合构成:结点=数据域+指针域(链域)数据域:存放结点本身信息的域指针域(链域):存放结点与其他结点关系信息的域②指针:存放与结点有关的结点的地址③链:若干带指针的结点组成的集合④结点的结构:LLINK指针INFO信息RLINK指针注意:数据域和指针域都可存放多个7/20/20235第一节数据处理(2)数据结构相关概念⑤结点的种类⑤单项链:每个结点只有一个指针,指向其下一个结点。⑥线性表:指数据的结构形式本质上是一维的线性关系,其中的每个结点都是同一类型的数据结构。后继结点前趋结点(直接后继)指针指向的下一个结点(直接前趋)与本结点邻接的前一结点顺序存储链式存储:线性表按顺序方式存储到计算机:线性表按链式方式存储到计算机查询方便,插入、删除难插入、删除容易7/20/20236第一节数据处理(2)数据结构相关概念⑦树:是结点之间有分支和层次关系的结构。
是数据处理中应用最广泛,最重要的非线性结构。优点:表示自然、处理方便、高效2.数据文件(1)数据文件:把数据按某种数据结构组织起来存放存放在外部设备上,就构成数据文件。数据文件是记录的集合,记录是数据项的集合。数据项是数据处理的最小单位。数据项描述个体的属性。记录中能唯一的标识该记录的数据项称为主键。把其他能够鉴别记录的数据项可定义为副键。主键和副键统称为鉴别键。其功能:鉴别和搜索记录7/20/20237第一节数据处理(3)数据文件的组织方式①定义:数据文件的组织方式是指文件内部构造数据的方式。②种类:分两类顺序文件索引文件文件中的记录是按照某些关键字排序的文件。特点存取第i个记录,必须先存取前面的第i-1个记录插入记录只能加在末尾优点:连续存取、速度快。用途:顺序存取、批量修改除文件文身外,另外建一张指示逻辑记录和物理记录之间对应关系的索引表,这类包括文件数据区和索引表的文件称为索引文件。优点:检索方便7/20/20238第一节数据处理3.数据库比文件系统更高级的一种数据组织方式。文件系统只限于记录内部,适用于单项应用。数据库考虑全局数据结构,适用于整体。7/20/20239第二节数据库技术一、数据库系统的构成1.数据库系统:是由计算机系统、数据库、数据库管理系统和有关人员组成的具有高度组织的总体。2.构成(1)计算机系统(2)数据库:是以一定的组织方式存储在一起的相关数据的集合。包括:物理数据库(存放实际数据)和描述数据库(存放数据逻辑结构)(3)数据库管理系统:是一组对数据库进行管理的软件,包括数据定义语言、数据操纵语言、数据管理例行程序和编译程序。7/20/202310第二节数据库技术一、数据库系统的构成(4)人员数据库管理员系统程序员用户应用程序用户专门用户参数用户7/20/202311第二节数据库技术二、数据模型1.数据模型:是数据库系统设计中用于提供信息表示和操作手段的形式构架。
就是对现实世界中数据的抽象、描述以及处理等。2.种类:按应用的目的不同分:概念模型和数据模型3.概念模型(信息模型):按用户的观点和信息建模。
7/20/202312第二节数据库技术二、数据模型(1)相关概念:①实体:指现实世界中存在的对象和事物。实体有个体和总体之分。总体有同质总体和异质总体之分。数据文件描述的是同质总体,数据库描述的是异质总体。②属性:指实体具有的某种特性。③联系:分实体内部联系和实体外部联系(2)联系的种类:①一对一(1:1)②一对多(1:N)③多对多(M:N)7/20/202313第二节数据库技术二、数据模型4.实体-联系方法(Entity-relationApproach)简称:E-R方法(1976年P.P.S.chen提出的)最常用的概念模型的表示方法。(1)实体:用矩形表示,矩形框内写明实体名。(2)属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。(3)联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1,1:n或m:n)。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来。7/20/202314练习一:书55练习二:企业物资管理实体有:仓库属性有仓库号、面积、电话号码。零件属性有零件号、名称、规格、单价、描述。供应商属性有供应商号、姓名、地址、电话号码、账号。项目属性有项目号、予算、开工日期。职工属性有职工号、姓名、年龄、职称。7/20/2023157/20/202316第二节数据库技术二、数据模型5.数据模型:对客观事物及联系的数据化描述。(1)种类:包括网状、层次和关系模型最常用是关系模型。(2)关系模型:应用关系代数和关系演算等数学理论来处理数据库系统中的数据关系。特点概念单一关系规范化易于理解,操作简单、方便7/20/202317第二节数据库技术(3)关系模型中的主要术语①关系:一个关系对应于一张二维表。②元组:表中一行称为一个元组。③属性:表中一列称为一个属性,列名即为属性名。④主码(主关键字):表中的某个属性组,它的值唯一的标识一个元组。⑤域:属性的取值范围。⑥分量:元组中的一个属性值。⑦关系模式:对关系的描述。用关系名(属性1,属性2,…,属性n)来表示例:学生(学号,姓名,性别,专业)7/20/202318第二节数据库技术三、关系的规范化目的是优化数据模型,优化通常用规范化理论为指导。规范化理论是E.F.Codd在1971年提出的,主要包括五种规范化模式(NormalForm,简称范式)。在五种范式中通常只用前三种。1.第一范式(1NF):在关系模式R中的每一个具体关系r中,如果每个属性值都是不可再分的最小数据单位,则称R是第一范式的关系。记为R∈1NF。7/20/202319第二节数据库技术三、关系的规范化教师代码姓名工资基本工资附加工资1001张兴500.0060.001002李明799.0070.001003王进400.0050.00表3.4表3.5符合第一范式教师代码姓名基本工资附加工资1001张兴500.0060.001002李明799.0070.001003王进400.0050.007/20/202320第二节数据库技术三、关系的规范化教师代码姓名职称研究课题号研究课题名2.第二范式(2NF):如果关系模式R∈1NF,且R中的所有非主属性都完全依赖于其主码,则称关系R是第二范式的,记为R∈2NF。教师代码姓名职称教师代码研究课题号研究课题名7/20/202321第二节数据库技术三、关系的规范化3.第三范式(3NF):如果关系模式R∈2NF,且R中的所有非主属性对主码都不存在传递依赖,则称关系R是第三范式,记为R∈3NF。若R∈3NF,则每一个非主属性既不部分依赖于主码也不传递依赖于主码。传递依赖:假设A、B、C分别是同一个数据结构R中的三个数据元素,或分别是R中若干个数的集合,如果C函数依于B,即B→C,而B函数依赖于A,即A→B,那么显然,C也依赖于A,我们称这种依赖关系为“传递依赖”,即“C传递依赖A”。如:表3.77/20/202322第二节数据库技术三、关系的规范化产品代码产品名生产厂名生产厂地址产品代码产品名生产厂名生产厂名生产厂地址7/20/202323厂名生产情况(每月)产品名称数量F1P1P2P3P4P5P6300200400200100100F2P1P2300400F3P2200F4P2P3P4200300400厂名产品名称数量F1F1F1F1F1F1F2F2F3F4F4F4P1P2P3P4P5P6P1P2P2P2P3P43002004002001001003004002002003004007/20/202324职工号姓名级别工资学历毕业时间001001001002张三张三张三李四技10技10技10技0983838362中专大学研究生大学1957196819811970表的内容是实际问题的简化,姓名这一项代表了职工的姓名、年龄、性别、住址等一系列基本情况信息,毕业时间代表与该职工学历有关的毕业学校、专业、成绩等信息,假定职工号是每个职工的唯一标识,而工资完全由级别所确定。那么,在这个表中各个数据项(即属性)之间有以下的相互依赖关系。7/20/202325(职工号)→姓名、级别、工资(职工号、学历)→毕业时间这表明姓名、级别、工资等的取值依赖于职工号,而毕业时间要由职工号与学历两个属性才能唯一确定:因而,在这个关系中就无法找到一个或几个属性可以共同作为唯一标识的主码(也叫主关键字)以使其它非主属性完全依赖于它而确定。
7/20/202326按此关系所建的数据库就有以下几个缺点:1)冗余度高。如张三这个职工的姓名等基本情况信息,由于他有三个学历而要存储三次,浪费了存储空间。2)维护困难。这种关系对于数据的修改、删除、插入等操作都十分不便,例如:张三的级别等基本信息修改时必须同时修改多处,张三记录的删除要三个同时删去;而对李四增加一个学历就要把他的基本情况再写入一遍等。3)容易造成数据的矛盾。由于许多数据的多次存储,维护操作不便,稍有疏忽就会使同一数据在数据库中的结果不同,同一个张三可能具有不同的工资,这就造成了数据库数据的不一致。7/20/202327所以,第一范式的关系必须进一步规范化为第二范式(2NF)。其方法是:从第一范式中分解出新的关系,使每个关系里都可确定一个或几个属性作为关系的主关键字,使该关系中的其他属性都完全依赖于他而定,从而消去非主属性对主关键字的不完全依赖性。由此所得关系叫做第二范式关系。对于上表,只要拆开为表1、表2两个关系就可以使之满足第二范式。
职工号姓名级别工资001002张三李四技10技98362职工号学历毕业时间001001001002中专大学研究生大学1957196819811970表1的关系中主关键字是职工号这一主属性,表2的关系里主关键字由(职工号、学历)两个主属性共同构成,这两个关系中所有的非主属都完全依赖于主关键字,因而均是第二范式的关系。7/20/202328符不符合第三范式?
第二范式仍然会造成一些麻烦。请看上表这个关系,实际上可能很多人的级别都是技10级的,那么他们的工资应当也都是83元,如果现在要把技10级的工资改为87元,那么,技10级的职工工资都要修改,有一个人改错了,就会造成同一级工资不一样的错误,因而,这种关系也有数据冗余(同级工资存储多次)和易造成数据的不一致等问题,其原因就在于这些属性间存在着如下所示的一种传递依赖关系:
职工号→级别,级别→工资从而使:职工号→级别→工资也就是说:上表中虽然级别与工资两个属性完全依赖于主属性职工号,但实际上是工资直接依赖于级别,由于级别依赖于职工号而使工资通过级别的传递作用间接依赖于职工号这个属性。7/20/202329进一步的规范化就是要消去非主属性对主关键字的传递依赖性,变为第三范式(3NF)。现在只要把第二范式的关系拆开为几个关系即可达到目的。如上表的关系,拆开为以下两表,它们就都能满足第三范式了。职工号姓名级别级别工资7/20/202330
概括一下以上的规范化过程:先对二维表消去组合项与重复项化为第一范式,再消去非主属性对主关键字的非完全函数依赖性而变为第二范式,再消去非主属性对主关键字的传递依赖就化为第三范式了。
应注意:并非规范化程度越高越好,一般说,规范化程度高了,使用起来就不方便,同时又影响系统的运行效率。因为,规范化要将数据分解,形成多个关系,而当需要一个较全面的数据时,还得同时在这些分解了的关系中检索记录,这比起在一个关系中检索这些数据要用许多时间。因此,一般软件开发要求规范到3NF就可满足需要。7/20/202331二维表的四个性质:在规范化理论中,把关系看做是二维表,它有以下四个性质:1)在任一列上,数据项应该具有同一个属性;2)在一个表中所有的行都是不相同的,即不允许有重复的组项出现;3)在一个个表中,行的顺序是无关紧要的。4)在一个表中,每一个列(属性)有不同的名称,列的顺序也无关紧要。也就是说,任何一个关系都必须是规范化的。7/20/202332第三节计算机网络一、计算机网络的概念与分类1.相关概念(1)计算机网络:是用通信介质把分布在不同地理位置的计算机和其他网络设备连接起来,实现信息互通和资源共享的系统。(2)网络介质:是数据传输的物理通道。包括:同轴电缆、双绞线、光纤、微波、卫星等。(3)协议:是网络设备间进行通信的一组约定。指设备间通信的电气性能、数据组织方式等。(4)节点:是网络中某分支的端点或网络中若干条分子的公共汇交点。(5)链路:是指两个相邻节点之间的通信线路。7/20/202333第三节计算机网络一、计算机网络的概念与分类2.网络拓扑结构(1)网络拓扑结构:是指网络的链路和节点在地理上所形成的几何图形。。对通信线路,不管它具体是哪种通信介质,而统一把它们抽象成“线”,从而用对“点”、“线”的研究取代对具体通信网络的研究。(2)计算机网络结构种类(按通信信道的类型)①点-点信道网络:网络中的每一条信道都连接到一对节点上。有:星形、环形、树形、网兴等。如3.11②共享信道网络:所有节点共享一条通信信道,每个节点发送的信息可由所有节点检测,但只有目的地址指定的节点能够收到。有:总线型、树形、环形等。7/20/202334第三节计算机网络一、计算机网络的概念与分类3.计算机网络的分类(1)按功能分:①资源子网②通信子网(2)按应用范围和应用方式分①局域网(LocalAreaNetework,LAN)②广域网(WideAreaNetwork,WAN)③互联网(因特网,Internet)④综合业务数字网(ISDN)能传送多种业务信息,包括数据、图像、语音、文字等。7/20/202335第三节计算机网络二、局域网技术1.网络体系结构的发展(1)集中式(主机-终端模式):数据处理和数据库应用在主机,终端显示。(2)文件服务器/工作站:DBMS安装在文件服务器上,数据处理和应用程序分布在工作站上。(3)客户/服务器:DBMS安装在数据库服务器上,进行数据处理和存储管理等后台任务;客户机运行应用程序,完成输入和输出等前台任务。(4)分布式处理环境:以计算机网络为依托,把各个同时工作的分散计算单元、不同的数据库、不同的操作系统连接成一个整体的分布式系统,为多
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专题01 热爱生活 热爱写作+作文选材技巧-【同步作文课】六年级语文上册单元写作深度指导(统编版2024·五四学制)
- 幼儿园小班音乐《红眼睛》课件
- 西京学院《影像设备创新设计》2023-2024学年第一学期期末试卷
- 西京学院《数控技术与编程》2021-2022学年期末试卷
- 冰淇淋素描课件
- 核心制度课件
- 管理会计实务 课件情境3、4 谋而后定:企业战略执行的有效工具、做好企业的战略参谋官
- 西华师范大学《体育科学研究方法》2023-2024学年第一学期期末试卷
- 西华师范大学《科学教育学》2022-2023学年第一学期期末试卷
- 移动机器人原理与技术 课件 第7、8章 移动机器人语音识别与控制、移动机器人的通信系统
- 二十四节气立春课件
- 感染性物质的运输管理与操作规范课件
- 职工转移申请表
- 《 东北三省》课件 (公开课获奖)2022年商务星球版地理
- 网络安全检查表模板
- 贵州省火力发电企业名录2017年125家
- 胸腔穿刺术液体脚本
- 二年级上册科学二单元《材料》教材解读
- 10-源代码编译指南
- 新教材湘教湘科版四年级上册科学 1.1 各种各样的声音 教案(教学设计)
- 《招标投标法》学习培训
评论
0/150
提交评论