管理信息系统课件 第3章-管理信息系统的技术基础_第1页
管理信息系统课件 第3章-管理信息系统的技术基础_第2页
管理信息系统课件 第3章-管理信息系统的技术基础_第3页
管理信息系统课件 第3章-管理信息系统的技术基础_第4页
管理信息系统课件 第3章-管理信息系统的技术基础_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章管理信息系统的技术基础第三章管理信息系统的技术基础本章所讲内容如下:数据管理技术1

数据仓库与数据挖掘2数据通信与计算机网络33.1数据管理技术本节所讲的内容如下:1.

计算机数据管理的发展2.

数据库系统3.

数据库系统的结构4.

数据库设计5.

企业对信息的应用计算机进行数据处理的效率,主要取决于数据在机器中的存储结构和处理方式。根据数据存储结构和处理方式,把计算机数据管理分为三个阶段,即(一)人工管理阶段(20世纪50年代中期以前)(二)文件管理阶段(20世纪50年代后期—20世纪60年代中期)(三)数据库管理阶段(20世纪60年代后期开始)3.1.1计算机数据管理的发展(1)(一)人工管理阶段

★背景

■计算机主要用于科学计算数据量小、结构简单,如高阶方程等数值计算

■外存为顺序存取设备磁带、卡片、纸带,没有磁盘等直接存取设备

■没有操作系统,没有数据管理软件用户用机器指令编码,通过纸带机输入程序和数据,程序运行完毕后,由用户取走纸带和运算结果,再让下一用户上机操作,数据并不长期保存在计算机内3.1.1计算机数据管理的发展(2)(一)人工管理阶段

★特点

■用户完全负责数据管理工作

数据的组织、存储结构、存取方法、输入输出等

■数据完全面向特定的应用程序每个程序使用自己的数据,数据不保存,用完就撤走

■数据与程序没有独立性程序中存取数据的子程序随着存储结构的改变而改变

3.1.1计算机数据管理的发展(3)(二)文件管理阶段

★背景

■计算机不但用于科学计算,还用于管理■外存有了磁盘、磁鼓等直接存取设备无须顺序存取由地址直接访问所需记录■有了专门管理数据的软件,一般称为文件系统文件存储空间的管理、目录管理、文件读写管理文件保护向用户提供操作接口3.1.1

计算机数据管理的发展(4)(二)文件管理阶段

★特点

■系统提供一定的数据管理功能

支持对文件的基本操作(增、删、改、查等),用户程序不必考虑物理细节数据的存取基本上以记录为单位

■数据仍是面向应用的

一个数据文件对应一个或几个用户程序

■数据与程序有一定的独立性文件的逻辑结构与存储结构由系统进行转换,数据在存储上的改变不一定反映在程序上3.1.1计算机数据管理的发展(5)(三)数据库管理阶段

★背景

计算机管理的数据量大,关系复杂,共享性要求强(多种应用、不同语言共享数据)

■外存有了大容量磁盘,光盘

■软件价格上升,硬件价格下降,编制和维护软件及应用程序成本相对增加,其中维护的成本更高,力求降低3.1.1计算机数据管理的发展(6)(三)数据库管理阶段

★特点

■有了数据库管理系统

■采用复杂的数据模型表示数据结构■数据冗余度小,能够实现数据共享,易于扩充

■具有较高的数据独立性■为用户提供了方便的用户接口■提供统一的数据控制功能

并发控制、数据恢复、数据完整性、数据安全性

3.1.1计算机数据管理的发展(7)(一)人工管理阶段(二)文件管理阶段(三)数据库管理阶段

表3-1三个阶段数据管理技术的特点

手工管理文件管理数据库管理

数据的管理者用户(程序员)文件系统数据库系统数据的针对者特定应用程序面向某一应用面向整体应用数据的共享性无共享共享差,冗余大共享好,冗余小数据的独立性无独立性独立性差独立性好数据的结构化无结构记录有结构,整体无结构整体结构好3.1.1计算机数据管理的发展(8)应用程序1应用程序2应用程序n数据集1数据集2数据集n。。。。。。应用程序1应用程序2应用程序n文件1文件2文件n。。。。。。文件系统应用程序1应用程序2应用程序n。。。DBMS数据库数据库管理系统,DatabaseManagementSystem应用程序与数据之间不可分割,当数据有所变动时程序则必须随之改变,独立性差;另外,数据不能长期保存,各应用程序之间的数据不能直接调用,缺少共享性,因而这种管理方式不够灵活,而且一个系统中存在程序间大量的重复数据,即数据冗余。即把有关的数据组织成数据文件,这种数据文件可以脱离程序而独立存在,由一个专门的文件管理系统实施统一管理数据文件不能被多个应用程序(用户)所共享,造成数据冗余。另外,由于数据文件之间不能建立任何联系,因而文件系统仍是一个无结构的数据集合。即对所有的数据实行统一规划管理,形成一个数据中心,构成一个数据“仓库”。在这一管理阶段,数据与应用程序之间完全独立,数据子集之间可以建立关联关系。由于能够合理地组织数据,系统中数据的冗余大大减少,有利于数据的转换和更大范围内的共享。Stop!IjustwanttoknowwhatisDatabase?回去看看数据库系统是指组织、存取和维护大量数据的人—机管理系统,是由计算机、数据库、数据库管理系统和有关人员组成的有机整体。一个组织的数据库系统一般有四个组成部分:①计算机系统②数据库③数据库管理系统④知识工作者

3.1.2数据库系统(1)①计算机系统指用于数据库管理的计算机软硬件系统。数据库需要大容量的主存以存放和运行操作系统、数据库管理系统程序和应用程序以及数据库、目录和系统缓冲区等,外存则需要大容量的直接存取设备。此外系统还应具有网络功能以实现数据资源的共享。

3.1.2数据库系统(2)②数据库数据库是以一定的组织方式存储在一起的相关数据的集合,它用综合的方法组织数据,使数据独立性高、冗余小,可供多个用户共享,能够保证数据的安全性和可靠性,允许并发地使用数据库,并能保证数据的一致性和完整性。数据库的三个主要目标:使数据冗余最小,达到数据独立性和共享性。数据冗余:数据的重复,即同一数据存储在多个文件中。数据独立性:数据结构与处理该数据的应用程序相互独立。数据共享性:允许多用户并发地使用数据库中的数据。3.1.2数据库系统(3)③数据库管理系统

数据库管理系统(databasemanagementsystem,DBMS)是一个负责数据库管理和维护的软件系统,通常包括数据定义语言及其编译程序、数据操纵语言及其编译程序以及数据管理例行程序等一组软件。具体来说,一个数据库管理系统应具备以下功能:数据库定义数据库操纵数据库查询数据库控制数据库通信3.1.2数据库系统(4)④知识工作者数据库用户:包括最终用户和程序设计人员。最终用户是组织中的业务和管理人员。数据库设计人员:指从事数据库开发的信息专家(包括系统分析员)。数据库管理员

(DBA):是负责数据库全面管理的信息专家。

3.1.2数据库系统(5)(一)数据描述在人们对现实世界的认识和对其进行数字化描述的过程中经历了三个不同的世界(或称领域):①现实世界②信息世界③数据世界3.1.3数据库系统的结构(1)现实世界、信息世界和数据世界三个世界的关系如下图所示:现实世界信息世界(实体-联系方法)数据世界(DBMS支持的数据模型)对信息进行收集、分类和抽象对信息进行加工转换图3-4数据描述的三个阶段3.1.3数据库系统的结构(2)(一)数据描述

1.现实世界

现实世界是指客观存在的世界中的事实及其联系,它是人类社会存在和发展的环境。如:学生、课程、教师等

2.信息世界

信息世界是现实世界中客观事物在人们头脑中的反映,是一种抽象化、概念化了的世界。3.1.3数据库系统的结构(3)信息世界相关术语:实体:是指客观存在并相互区别的事物。

如:一名教师、一名学生、学生的一次选课、一次借书

属性:实体具有许多特性,每一个特性都称为属性。

如:学生实体可由学号、姓名、性别、年龄、系别等属性构成主键:惟一标识实体的属性集称为主键。

如:学生实体的学号可作为学生实体的主键实体集:是具有相同特性的同类实体的集合。

如:所有教师、所有学生3.1.3数据库系统的结构(4)实体之间的联系:

a.一对一联系(1:1)

如:学校里一个班级中有一个正班长,而一个正班长只在一个班级中任职,则班级与班长之间具有一对一联系。

b.一对多联系(1:n)

如:一个班级中有若干名学生,而每个学生只在一个班级中学习,则班级与学生之间具有一对多联系。

c.多对多联系(m:n)

如:一门课程同时有若干名学生选修,而一名学生可以同时选修多门课程,则课程与学生之间具有多对多联系。3.1.3数据库系统的结构(5)3.数据世界

数据世界也称计算机世界,它是现实世界中的事物及其联系经过信息世界的抽象后,转换到计算机中的表示形式。字段(fields):标记实体属性的命名单位称为字段(或数据项)如:学生有学号、姓名、性别、出生年月等字段记录(record):字段的有序集合称为记录文件(file):同一类记录的汇集称为文件如:所有学生记录组成一个学生文件主键(file):能唯一标识文件中每个记录的字段或字段集如:学号可以作为学生记录的主键3.1.3数据库系统的结构(6)三个不同世界术语对照表:客观世界信息世界数据世界事物及其联系实体及其联系数据库事物类(全体)实体集文件事物(对象,个体)实体记录特征(性质)属性字段3.1.3数据库系统的结构(7)(二)数据模型简介

数据模型是是用来表示和处理数据之间联系的,它是对客观事物及其联系的数据化描述,是关于全局数据的组织方式的抽象表达。数据模型的设计方法决定着数据库的设计方法。目前,在实际数据库系统中支持的数据模型主要有三种:①层次模型②网状模型③关系模型3.1.3数据库系统的结构(8)(二)数据模型简介

1、层次模型

数据库系统最早使用的一种数据模型,以层次或树状结构来表示实体之间的联系。

学校(根)班级1班级2班级3学生1学生2图3-5层次模型

只能描述数据之间一对一或一对多的关系3.1.3数据库系统的结构(9)层次模型——树型结构ABCDEF根结点(唯一)叶结点(一个先驱)实例

学校系处办公室教研室科2.网状模型教师课程学生图3-6网状模型

描述数据之间多对多的关系3.1.3数据库系统的结构(10)网状模型⑴允许有一个以上结点无父结点;⑵允许有一个结点有多于一个的父结点。DCBA根结点根结点两个先驱两个先驱3.关系模型

用二维表的形式表示实体及其之间的联系。通俗地讲,关系就是二维表格,表格中的每一行称作一个元组,它相当于一个记录值,每一列是一个属性值集,列可以命名,称为属性名。

表3-3

关系模型的一种关系

学号姓名性别0411001张建平男0411002赵晓丽女0411003陈玉东男…….…………3.1.3数据库系统的结构(11)关系模型中的主要术语有:关系:一个关系对应于一张二维表。元组:二维表中的一行称为一个元组。属性:二维表中的一列称为一个属性。关键字:二维表中的属性或属性的组合,它的值能惟一地标识一个元组。域:属性的取值范围。3.1.3数据库系统的结构(12)A1A2A3

…Ana1a2a3

…anb1b2b3

…bn

…x1x2x3

…xn表头元组行属性列二维表(三)数据库的三级模式结构图3-7数据库的三级体系结构3.1.3数据库系统的结构(13)应用程序A应用程序B应用程序C外模式外模式模式外模式/模式映射模式/内模式映射外模式/模式映射DBMS用户用户用户DB内模式OS为了有效地组织、管理数据,提高数据库的逻辑独立性和物理独立性,人们为数据库设计了一个严谨的体系结构,数据库领域公认的标准结构是三级模式结构,它包括外模式、模式和内模式。

1.外模式

外模式也叫子模式或用户模式,是用户和数据库系统的接口,是不同数据库用户的数据视图,是对数据库的局部数据的逻辑结构和特征的描述,是模式的子集。

2.模式

模式又称逻辑模式或概念模式,是数据库中全体数据的全局逻辑结构和特征的描述,是所有用户的公共数据视图。

3.内模式

内模式也称存储模式,是对数据物理结构和存储结构的描述,它依赖于数据库的全局逻辑结构,但独立于用户模式,也独立于具体的存储设备。3.1.3数据库系统的结构(14)所谓视图,就是指观察、认识和理解数据的范围、角度和方法,是数据库在用户“眼中"的反映,很显然,不同层次(级别)用户所“看到’’的数据库是不相同的。用户级对应外模式,概念级对应模式,物理级对应内模式,使不同级别的用户对数据库形成不同的视图.数据库三级模式的对比理解

数据库结构对应关系

特点

外模式用户级(面向用户级应用程序员)①一个数据库可以有多个外模式;②外模式就是用户视图;③外模式是保证数据安全性的一个有力措施

模式概念级(面向建立和维护数据库人员)①一个数据库只有一个模式;②是数据库数据在逻辑级上的视图;③数据库模式以某一种数据模型为基础;④定义模式时不仅要定义数据的逻辑结构(如数据记录由哪些数据项构成,数据项的名字、类型、取值范围等),而且要定义与数据有关的安全性、完整性要求,定义这些数据之间的联系。

内模式物理级(面向系统程序员)①一个数据库只有一个内模式;②一个表可能由多个文件组成,如:数据文件、索引文件。它是数据库管理系统(DBMS)对数据库中数据进行有效组织和管理的方法其目的有:①为了减少数据冗余,实现数据共享;②为了提高存取效率,改善性能。3.1.3数据库系统的结构(15)

给定一组数据,如何能够构造出一个好的关系模式呢?这要研究关系数据库的规范化理论!规范化理论研究关系模式中各属性之间的依赖关系及其对关系模式性能的影响,探讨关系模式应该具备的性质和设计方法。规范化可以使关系的结构简化,存储尽量减少数据冗余,使数据库的设计更加合理!(四)关系的规范化①数据依赖:关系中数据项之间存在两种依赖关系函数依赖:设R(U)是属性集U上的关系模式,X和Y是属性集U的子集。若对于R(U)的中的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称X函数确定Y或Y函数依赖于X,记为X→Y。

例如对一个学生的描述,其属性有学号、姓名等,给定学号唯一的确定姓名,学号姓名3.1.3数据库系统的结构(16)多值依赖:若给定X,Y有一组属性值与之对应,则称X多值决定Y或Y多值依赖于X,记为X→→Y。例如:学生选课,一个学生可以选多门课程,同给定一个学号(X),就可以找出多门课程与之对应,则称“课程号(Y)”多值依赖于“学号”,即学号→→课程号

3.1.3数据库系统的结构(17)完全函数依赖:在关系模式R(U)中,若X→Y,且X的任何一个真子集X’,都有X’→Y,则称Y完全函数依赖于X,记为X→Y。部分函数依赖:若X→Y,如果X存在真子集X,且X’Y成立,则称Y对X是部分函数依赖,用符号X→Y表示。例:{学号,课号}→成绩,{学号}→成绩,{课号}→成绩则:{学号,课号}→成绩;例:{学号,课号}→姓名,{学号}→姓名,则:{学号,课号}→姓名;3.1.3数据库系统的结构(18)fPfP传递依赖:在关系模式R(U)中,若X→Y,Y→Z且Y→X,则称Z传递依赖于X,记为X→Z。例:{学号→系名,系名→系址},且系名→学号,则学号→系址3.1.3数据库系统的结构(19)tt(四)关系的规范化②规范化所谓规范化是把关系模式从低一级向高一级转换的过程。满足不同条件的关系模式称为不同的范式。在规范化理论中通常将关系模式分为五种规范模式,简称范式,它表示的是关系模式的规范化程度,也即满足某种约束条件的关系模式。

回去看看3.1.3数据库系统的结构(20)第一范式(1NF):如果一个关系模式中的所有属性都是不可再分的数据项,则称该模式为第一范式。第二范式(2NF):如果一个关系模式R满足1NF,并且所有的非主属性都完全依赖于关键字,则称该模式为第二范式。第三范式(3NF):如果一个关系模式R满足2NF,并且所有的非主属性都不传递依赖于关键字,则称该模式为第三范式。

实际应用中分解到第3NF就足够了。3.1.3数据库系统的结构(21)数据库设计是指对于一个给定的应用环境,提供一个良好的数据模型与处理模式的逻辑设计,以及确定一个良好的数据库存储结构与存取方法的物理设计,从而建立起既能反映现实世界信息和信息联系,满足用户数据要求和处理要求,又能被某个数据库管理系统(DBMS)所接受,同时能实现系统目标并能有效地存取数据的数据库。3.1.4数据库设计(1)数据库设计分为需求分析、概念结构设计、逻辑结构设计和物理结构设计四个阶段。用户需求概念结构设计逻辑结构设计物理结构设计数据库实施需求说明数据说明概念结构逻辑结构物理结构图3-9数据库设计的四个阶段3.1.4数据库设计(2)(一)用户信息需求分析目标是获得用户对计划建立的数据库的信息需求的全面描述,通常使用数据流程图(DFD)和数据字典(DD)方法。(二)概念结构的设计将需求转化为信息世界中的实体及其联系,用概念模型描述。概念模型的设计是不依赖于任何数据库管理系统的,它是对用户需求的归纳,能够方便、准确地表示出信息世界的常用概念,与具体的硬件环境和软件环境均无关。3.1.4数据库设计(3)(二)概念结构的设计

概念模型的表示方法很多,其中最为常用的是实体-联系方法,该方法用E-R(Entity-Relationship)图来描述现实世界的概念模型。第1步,抽象出实体,并一一命名第2步,根据实体的属性描述其间的各种关系E-R图的符号表示:

实体实体的属性实体间的关系3.1.4数据库设计(4)(二)概念结构的设计

例如在学校课程管理中,涉及的实体包括:①学生:属性有学号、姓名、性别、出生年月;②系:属性有系号、系名、系主任;③教师:属性有职工号、姓名、性别、出生年月、职称;④课程:属性有课程号、课程名、学分;课程课程号课程名学分学生学号姓名性别出生年月”学生“实体及其属性”课程“实体及其属性3.1.4数据库设计(5)在上个例子中学校课程管理中,实体之间的联系包括:①组成:一个系由多名学生组成,而一名学生只属于一个系,为1:n联系;②选修:一个学生可选修多门课程,而一门课程也可以被多名学生选修,所以是m:n联系,其属性为成绩;③讲授:一门课可由多名教师讲授,而一名教师可讲授多门课程,所以是m:n联系;学生系组成n1学生课程选修nm成绩课程教师讲授mn3.1.4数据库设计(6)仓库产品仓库号地点面积存放编码名称价格数量1n学生课程学号姓名班级学习编号名称学时成绩mn厂长工厂厂长号姓名年龄管理厂号厂名地点11(a)厂长与工厂一对一联系(b)仓库与产品一对多联系(c)学生与课程多对多联系实体间的联系举例E-R图设计举例-学校课程管理系统

①学生:属性有学号、姓名、性别、出生年月;②系:属性有系号、系名、系主任;③教师:属性有职工号、姓名、性别、出生年月、职称;④课程:属性有课程号、课程名、学分;一个系由多名学生组成,而一名学生只属于一个系;一个学生可选修多门课程,而一门课程也可以被多名学生选修,学生选修课程会给定成绩;一门课可由多名教师讲授,而一名教师可讲授多门课程。课程课程号课程名学分教师选修nm成绩系组成讲授学生学号姓名性别出生年月职工号姓名性别出生年月职称系号系名系主任nmn1图3-10学校课程管理E-R图E-R图设计举例—学校课程管理系统E-R图设计举例用E-R图表示单位供货的概念模型,涉及的实体有:仓库:仓库号、仓库面积、电话号码零件:零件号、名称、规格、单价、描述供应商:编号、名称、地址、电话号码、帐号

这些实体之间的联系如下:一个仓库可存放多种零件,一种零件只能存放在一个仓库中。一个供应商可以供应多种零件,一个零件可以由多个供应商供应。仓库零件仓库号电话面积存放零件号名称规格数量1n单价描述供应商供应商号电话帐号名称地址供应nm数量E-R图设计举例E-R图设计分为三步:1.分E-R图,单用户的概念结构;2.初步E-R图,总体概念结构;3.消除冗余的数据和实体间的联系。E-R图设计步骤

SAN公司从帆船主那里向客户出租闲置的帆船,船出租时设备齐全,大多是船主提供的。包括固定在船上的无线电、电冰箱、指南针,还有一些如帆、救生艇、烹饪器皿没有安装在船上。SAN提供导航书籍,水流表等补给品。SAN的一个重要责任就是跟踪船上的设备以防丢失。另外,SAN要精确记录客户出租情况,不仅用于开拓市场,还可记录客户有过哪些航海经验(如有无危险路线和恶劣天气航海经验)。SAN大部分业务是裸船出租,但在客户要求时也会提供兼职船长和水手。帆船经常需要维修,包括定期换件和不定期维修。船主要求SAN精确记录所有维护活动和费用。如果船的重要部件发生故障,SAN调度员需要维修质量和历史信息作决策。SAN准备开发一个信息系统管理以上业务。请根据以上描述建立E-R模型。案例:SAN帆船出租帆船客户船员船主维修厂设备租航出租SAN附带维修租借雇佣111nnnnmmmA同学的设计方案实体的属性:帆船:帆船代码、船主代码、名称型号船主:船主代码、姓名、联系方式船员:船员代码、姓名、兼职岗位、客户:客户代码、姓名等基本信息维修公司:公司代码、地点、联系方式设备:设备代码、设备名称、所有者(船主/SAN)、状态(固定/不固定)联系的属性:租航:开始日期、终止日期、租用费附带:数量维修:性质(定期/不定期)、维修部件、费用、效果租借:开始日期、终止日期、费用雇佣:开始日期、终止日期、兼职时间、薪水帆船客户船员船主维修厂设备租航出租SAN附带维修租借雇佣111nnnnmmm?San作为个体(实体实例)不应出现在E-R图中

将San从图中去除,船主、船员与其它实体怎样建立联系?Key实体类(总体)与实体实例(个体)的区分个体与属性的区分即可用联系,又可用实体实现(如某类业务)帆船船员设备维修厂船主出租归属参加111nnm租赁业务客户1n附带n维修nnm雇用SAN帆船出租E-R图帆船客户船员船主维修厂设备租航出租SAN附带维修租借雇佣111nnnnmmmPossibleentitiesforSan

租赁业务船船主客户设备船主提供的设备船主提供的移动设备船主提供的固定设备

San提供的设备船员定期维修不定期维修维修维修厂

EntitiesSelectedfortheE-RDesign

租赁业务船船主客户设备船员维修厂帆船船员设备维修厂船主出租归属参加使用111nnm租赁业务客户1n归属nmmn雇用n维修n(三)逻辑结构设计

逻辑结构设计是将概念模型从E-R图转换成某种数据库管理系统支持的数据模型,一般是转换为关系数据模型。

E-R图中每个实体相应地转换为一个关系,即一个二维表,该关系应包括对应实体的全部属性,并确定出主键。对E-R图中的联系要根据联系的不同采取不同的手段将其转换为不同的关系,具体规则如下:3.1.4数据库设计(7)(三)逻辑结构设计

①每一个实体都转换为一个关系模式,实体的名称作为关系的名称,实体的属性就是关系的属性。前例:系(系号,系名,系主任)学生(学号,姓名,性别,出生年月)课程(课程号,课程名,学分)教师(职工号,姓名,性别,出生年月,职称)3.1.4数据库设计(8)(三)逻辑结构设计

②将每一个多对多联系都转换为一个关系模式。联系的名称为关系的名称,联系的属性由相关联系的各实体中的关键属性(能唯一地标识出一个实体的属性)和该联系自己所具有的属性组成。

前例:选修(学号,课程号,成绩)讲授(课程号,职工号)3.1.4数据库设计(9)(三)逻辑结构设计③将每一个一对多联系都转换成一个关系模式,也可以不单独转换为一个关系模式,只需在联系的“n”端实体所对应的关系模式中加“1”端实体的关键属性即可。

前例:组成(学号,系号)或学生(学号,姓名,性别,出生年月,系号)④两个实体集的一对一联系的转换,可按②或③进行,视具体情况而定。3.1.4数据库设计(10)(三)逻辑结构设计

根据上述规则,上例学校课程管理的概念模型可转换为如下关系模型:系(系号,系名,系主任)学生(学号,姓名,性别,出生年月)课程(课程号,课程名,学分)教师(职工号,姓名,性别,出生年月,职称)选修(学号,课程号,成绩)讲授(课程号,职工号)组成(学号,系号)3.1.4数据库设计(11)仓库产品仓库号地点面积存放编码名称价格数量1n(四)物理结构设计

物理结构设计是为数据模型在可用的硬件设备上确定合适的存储结构和存取方法,并建立索引等。

物理结构设计以逻辑结构设计结果为输入,结合具体的DBMS功能、DBMS所提供的物理环境和工具、应用环境和数据存储设备,进行数据存储组织和方法的设计,主要包括确定数据的存储结构、存取路径的选择和调整、确定数据存放位置和存储分配等。回去看看3.1.4数据库设计(12)(一)联机事务处理(OnlineTransactionProcessing,OLTP)

联机事务处理是以数据库为基础,面对的是操作人员和基层管理人员,对基本数据进行查询和增加、删除、修改等处理。它涉及到对要输入的信息进行收集和处理;反过来,再对收集到的和经过处理的信息加以利用,去更新已有的信息。3.1.5企业对信息的应用(1)例:书店的售书系统。将客户的购书信息不断录入到系统中,然后再利用这些信息去更新书店藏书的库存数据,另外客户还可以利用该系统对图书进行查询操作。在信息处理的过程中,书店的售书管理系统将支持联机事务处理的概念。目前大多数企业运用DB和DBMS对联机事务处理提供技术支持。支持联机事务处理功能的DB,最常见的就是业务DB。3.1.5企业对信息的应用(2)(二)联机分析处理(OnlineAnalyticalProcessing,OLAP)

联机分析处理是一种为支持决策而进行的信息处理方式,它是针对特定问题的联机数据访问和分析,通过对信息进行快速、稳定、一致和交互式的存取,对数据进行多层次、多阶段的分析处理,以获得高度归纳的分析结果。

例:在书店售书系统中,管理人员可能希望知道类似这样的问题,如“在最近三个月中哪些类型的书籍比较畅销,相应的库存情况如何,今后的进书策略是什么?’’等,这就是联机分析处理的(OLAP)一种形式。3.1.5企业对信息的应用(3)

与联机事务处理相比OLAP的特征:⑴快速性⑵可分析性⑶多维性⑷信息性3.1.5企业对信息的应用(4)⑴快速性OLAP能快速响应用户的分析请求。OLAP系统应能在几秒内对用户的大部分分析要求做出回应。如果终端用户在30秒内没有得到OLAP系统的响应会变得不耐烦,从而使用户的思路受到干扰,影响分析质量。对于大量的数据分析要达到这个速度并不容易,因此就更需要一些技术上的支持,如专门的数据存储格式、对频繁查询的数据预先进行计算、特别的硬件设计等。3.1.5企业对信息的应用(5)⑵可分析性指OLAP系统可以提供给用户强大的统计、分析(包括时间序列分析、成本分配、货币兑换、非过程化建模、多维结构的随机变化等)和报表处理功能。

3.1.5企业对信息的应用(6)⑶多维性多维性是OLAP的关键属性。系统必须提供对数据分析的多维视图和分析,包括对层次维和多重层次维的完全支持。事实上,多维分析是分析企业数据最有效的方法,是OLAP的灵魂。直观的多维数据模型使用户很容易就能选择、浏览和研究数据。3.1.5企业对信息的应用(7)⑷信息性不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得所需信息,并导出有用信息。需要考虑许多因素,如数据的可复制性、可利用的磁盘空间、OLAP产品的性能及与数据仓库的结合度等。

3.1.5企业对信息的应用(8)3.2数据仓库与数据挖掘本节所讲的内容如下:数据仓库(DataWarehouse,DW)1数据挖掘(DataMining,DM)2(一)数据仓库的定义数据仓库之父WilliamH.Inmon在1991年出版的“BuildingtheDataWarehouse”一书中所提出数据仓库的概念。数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、随时间变化的(TimeVariant)的数据集合,用于支持管理决策(DecisionMakingSupport)。

DW的最终目标是把企业范围内的所有数据集成在一个大仓库中,让用户能运行查询、产生报告、执行分析。

3.2.1数据仓库(1)“主题”是指用户使用DW辅助决策时所关心的重点问题,每个主题对应一个客观分析领域,如销售、成本、利润的情况等。所谓面向主题就是指DW中的信息是按主题组织的,按主题来提供信息的。“集成的”是指DW中的数据不是事物处理系统数据的简单拼凑,而是经过系统地加工整理,是相互一致的、具有代表性的全局数据。3.2.1数据仓库(2)“随时间变化的”指DW中存储的是一个时间段的数据,而不仅仅是某一个时间点的数据,所以主要用于进行时间趋势分析。一般DW的数据时限为5~10年,数据量也比较大,一般为10GB左右。

“信息本身相对稳定”指数据一旦进入DW后,一般情况下将被长期保留,极少有更新或删除操作。

3.2.1数据仓库(3)(二)数据仓库的特征

1、数据仓库将来自不同数据库的信息结合在一起

2、数据仓库是多维的

3、数据仓库支持决策而不是事务处理

3.2.1数据仓库(4)①数据仓库将来自不同DB的信息结合在一起

数据仓库将企业中各个业务DB中的信息结合起来(通过汇总与合计)。当人们从各类业务DB中提取信息来创建数据仓库时,收集的只是那些进行决策所需的信息。这种“所需的信息”是用户按照他们对逻辑化的决策信息需求而确定的。故数据仓库只包含与用户进行决策有关的信息。3.2.1数据仓库(5)②数据仓库是多维的RDB模型中,信息是用一系列二维表表示的。数据仓库是多维度的,即它们包含若干层的行和列,称为多维数据库。数据仓库中的层次根据不同的维度来表示信息,这种多维度的信息图表被称为超立体结构。

3.2.1数据仓库(6)比如一个销售统计,4个deminsion分别为product(电器,白色家电,电视机,液晶电视),location(亚洲,中国,上海,浦东),organization(亚太区,东亚,大中国区)customers(苏宁中国,苏宁上海,苏宁长宁区....),

如果你需要看液晶电视在浦东由大中国区销售卖给苏宁长宁店的情况,这时你用到了四个维。如果你只要看所有白色电器的销售情况,你只需要joinproduct这个维表的第二个hierarchy就可以得到结果。取决于客户自己的决定.③数据仓库支持决策而不是事务处理在企业中,多数DB是面向事务对象的。即它们都支持联机事务处理(OLTP),可以说这类DB是一种事务性DB。数据仓库不是面向事务对象的,它们是用来支持企业中各类决策任务的。故:数据仓库支持联机分析处理(0LAP)。3.2.1数据仓库(7)如:在证券业中,它可处理客户分析、账户分析、证券交易数据分析、非资金交易分析等多个业界关心的主题,这是证券业扩大经营、防范风险的预警行动。在税务领域中,通过对大量数据资料的分析来掌握各行各业、各种产品和各类市场的从业人员以及企业的纳税能力,并与其实际纳税金额进行对比,从而查出可能的偷漏税者。此外,数据仓库技术还在保险业、银行业、营销业、保健业以及客户关系管理中都有广泛应用。3.2.1数据仓库(8)数据库与数据仓库的联系数据仓库的出现,并不是要取代数据库,而是数据库的一个分支。目前,大部分数据仓库还是用关系数据库管理系统来管理的。出发点不同:数据库是面向事务的设计;数据仓库是面向主题设计的。存储的数据不同:数据库一般存储在线交易数据;数据仓库存储的一般是历史数据。设计规则不同:数据库设计是尽量避免冗余,一般采用符合范式的规则来设计;数据仓库在设计是有意引入冗余,采用反范式的方式来设计。提供的功能不同:数据库是为捕获数据而设计,数据仓库是为分析数据而设计,基本元素不同:数据库的基本元素是事实表,数据仓库的基本元素是维度表。数据库与数据仓库的区别(一)数据挖掘的定义

数据挖掘是从大量的、不完全的、模糊的、随机的数据中抽取出有效的、新颖的和潜在有用的知识的过程。

DM的过程一般由三个主要的阶段组成:数据准备、挖掘操作、结果表达和解释。

数据源数据目标数据预处理后数据模式知识数据集成数据选择预处理数据挖掘解释评价数据准备数据挖掘结果表达和解释3.2.2数据挖掘(1)3.2.2数据挖掘(2)(二)数据挖掘技术关联分析分类分析聚类分析预测文本数据挖掘Web数据挖掘(三)数据挖掘的方法神经网络方法遗传算法决策树算法粗糙集方法模糊集方法统计分析方法…3.2.2数据挖掘(3)

(四)数据挖掘的应用

1.数据库营销(databasemarketing)

数据库营销的任务是通过交互式查询、数据分割和模型预测等方法来选择潜在的顾客以便向他们推销产品。

2.货篮分析(basketanalysis)货篮分析是分析市场销售数据(如POS数据库)以识别顾客的购买行为模式

3.2.2数据挖掘(4)其他应用电信:客户流失原因分析;银行:客户聚类(细分),理财产品交叉销售;百货公司/超市:购物篮分析(关联规则);保险:客户细分,产品交叉销售,客户流失原因分析;信用卡:欺诈行为探测,客户细分;电子商务:网站日志分析;税务部门:偷漏税行为探测;警察机关:犯罪行为分析;3.2.2数据挖掘(5)3.3数据通信与计算机网络本节所讲内容:1.计算机体系结构2.数据通信概述3.计算机网络概述4.网络体系结构与协议5.Internet6.计算机网络应用一、计算机体系结构

(管理信息系统的物理机构)

经历了从单机结构到主从结构、客户机/服务器结构到浏览器/服务器体系结构的发展过程。

(一)单机结构

如果在一个系统内的多台计算机是各自独立使用的,这样的系统就是单机结构的系统。

(二)主从结构

主从结构又称主机—终端结构,它有一台大型主机,可以同时在本地或远程挂接多个终端,主机对各终端用户传来的数据进行分时处理,使每个终端用户感觉像拥有一台自己的大型计算机一样。当终端用户增多时,主机负担过重,处理性能显著下降,造成"主机瓶颈"。

3.3.1计算机体系结构(1)(二)主从结构应用:如订票系统、银行储蓄系统、出纳系统、登记查询系统等等。主机I/O设备I/O设备I/O设备

DB

业务处理3.3.1计算机体系结构(2)

(三)文件服务器/工作站结构

在文件服务器/工作站系统中,一个组织的多个工作站与一台服务器互相连接起来。使用微机作为工作站,以高性能微机或小型机作为服务器。数据库管理系统安装在文件服务器上,而数据处理和应用程序分布在工作站上,文件服务器仅提供对数据的共享访问和文件管理,没有协同处理能力。这种方式可充分发挥工作站的处理能力,但网络负担较重,严重时会造成"传输瓶颈"。

文件服务器工作站工作站工作站工作站3.3.1计算机体系结构(3)(四)客户机(Client)/服务器(Server)(C/S)结构

网络系统上的计算机系统分成客户机与服务器两类,其中服务器可能包括文件服务器、数据库服务器、打印服务器、专用服务器等,网络系统结点上的其他计算机系统称为客户机。如:把DBMS安装在数据库服务器上;数据处理可以从应用程序中分离出来,形成前后台任务:客户机运行应用程序,完成屏幕交互和输入、输出等前台任务,服务器则运行DBMS,完成大量的数据处理及存储管理等后台任务。客户机与服务器间只传送SQL语句及结果,因此传送的数据量较小。由于共享能力和前台的自治能力,后台处理的数据不需要在前后台间频繁传输,从而有效解决了文件服务器/工作站模式下的"传输瓶颈"问题。服务器客户机客户机客户机3.3.1计算机体系结构(4)(四)客户机(Client)/服务器(Server)(C/S)结构

常用的C/S模式有两层结构、三层结构两种。数据库服务器客户机数据库服务器客户机应用服务器(a)两层结构(b)三层结构3.3.1计算机体系结构(5)(五)浏览器(Browser)/服务器(Server)(B/S)结构

在浏览器/服务器结构中,大量的应用程序都在客户端进行,每个客户都必须安装应用程序和工具。用户工作界面是通过WWW浏览器(IE,NetScape)来实现,在Internet环境中C/S结构自然延伸为三层或多层结构。数据库数据库服务器(服务器层)Web服务器(中间层)浏览器(客户层)3.3.1计算机体系结构(6)

(五)浏览器(Browser)/服务器(Server)(B/S)结构

(一)数据通信系统

数据通信就是通过适当的传输线路将数据信息从一台机器传送到另一台机器。数据通信实质上包含了数据处理和数据传输两方面内容。

通信系统的基本构成要素为:计算机、通信处理机、数据信号转换器、通信信道(即传输介质)及通信协议。

主要由计算机系统完成依靠通信系统实现计算机A数据信号转换器通信处理机计算机B数据信号转换器通信处理机通信信道图3-22数据通信系统简化模型3.3.2数据通信概述(1)(二)数据通信中的基本概念

1、模拟数据通信与数字数据通信模拟数据是连续变化的数值,模拟数据通信是指在传输介质上用模拟信号进行传输数字数据是离散的数值,数字数据通信是指直接在传输介质上传送脉冲数字信号。两者差异:①模拟通信比数字通信误码率高得多②数字通信可将多种多媒体信息合成起来传输,而模拟通信不行③

数字通信设备可用性越来越强趋势:无论是模拟数据还是数字数据,都将用数字通信传输。3.3.2数据通信概述(2)

2.信号传输方向

单工通信方式半双工方式全双工方式

3.通信传输介质

双绞线同轴电缆光纤无线传输介质ABABAB3.3.2数据通信概述(3)③通信传输介质双绞线由两根相互绝缘并绞扭在一起的铜导线对组成。绞扭的目的:是为减少线对间的电磁干扰。双绞线很早就用于传统的电话系统中,即用于传输模拟信号,也可用于传输数字信号,传输的距离可达几公里到十几公里。在局域网中,常选用双绞线进行点对点的高速连接,每段长度不超过100米,数据速率可达100Mbit/s。3.3.2数据通信概述(4)双绞线各线对之间以色标相区别,不同颜色的线对用于实现不同功能,安装使用非常方便。常用的八芯UTP(无屏蔽)四对线的颜色及实现模拟的功能分别为:蓝:模拟话音橙:数据绿:数据棕:电源

3.3.2数据通信概述(5)同轴电缆由一对导体组成,其内导体为铜质导线,外包一层绝缘材料,再外边为网状编织细铜丝组成的外导体,最外层是保护性塑料外套。“同轴”:指内导体的铜芯线与外导体铜丝编织网是同轴的,这种结构中的铜丝编织网可以有效地屏蔽外界电磁干扰,故而同轴电缆可用于较高速的数据传输。

3.3.2数据通信概述(6)基带同轴电缆:用于传输数字信号,通常用于局域网,使用曼彻斯特编码,数据速率可达10Mbps。优点:安装简单,价格便宜,但信号易衰减和畸变,故传输距离较短,通常不超过一公里。(近年因为100Mbps以上的高速网已成为主流,局域网中已很少选用同轴电缆作传输媒体)。宽带同轴电缆:传输模拟信号,带宽可达300-500MHz。典型的应用为CATV(有线电视)中用来作为标准传输电缆。因其频带特宽,故常使用频分多路复用技术将其划分为多个子频带,这些子频带可同时传输声音信号、视频图像和数字信号等综合信息,传送的距离可达几十公里。不足:电缆中的模拟信号只能进行单向传输,传输技术较复杂,设备相对昂贵。3.3.2数据通信概述(7)光导纤维(光纤)光纤是光导纤维的简写,是一种利用光在玻璃或塑料制成的纤维中的全反射原理而达成的光传导工具。前香港中文大学校长高锟和GeorgeA.Hockham首先提出光纤可以用于通讯传输的设想,高锟因此获得2009年诺贝尔物理学奖。它的内层是能传导光波的玻璃纤维,外层加比玻璃折射率低的材料作保护层。以一定角度进入光纤的光波可在两种材料的介面上形成全反射,从而可以不断地向前传输。3.3.2数据通信概述(8)相对金属导线,光纤中传输的是光信号,故而用于传送电信号时在发送端和接收端要进行光电信号的转换,两端的转换设备一般比较昂贵。光纤的优点:可提供高速的数据速率(100Mbit/s以上)、更低的误码率(10-9)、较低的损耗和更宽的频带;光纤不受电磁干扰或噪声影响,可进行长距离传输,而且不能被偷听,安全保密性好;光纤重量轻、体积小,易于铺设。以前制约光纤大量应用的因素主要是价格昂贵,安装和配置技术复杂。随着技术的进步,这两个障碍已经不再重要,光纤正在逐步取代金属类介质成为有线类介质的第一选择。3.3.2数据通信概述(9)

微波通信无线通信介质指的是不须通过线缆,通过空间传输信号。包括微波、激光、红外线和短波等几种。微波通信的载波频率为2GHz~40GHz,因为频率高,故而可以同时高速传递大量信息。微波通信系统分:地面微波系统和卫星微波系统。3.3.2数据通信概述(10)微波通信示意地面微波系统中,因为微波以直线传播,地球表面是曲面,因而要架设较高的天线并在超过一定距离后用中继站来接力。通信卫星可以看成设在空中的微波中继站,一般利用的是地球同步卫星,三个地球同步卫星就可以覆盖地球上的全部通信区域。卫星通信的优点:容量大,距离远,但因为地球同步卫星位于距地36000公里的高空,从发送站经卫星到接收站有约270ms的延迟,组建卫星网络时必须对这一因素加以考虑。3.3.2数据通信概述(11)卫星通信示意4.数据传输形式

基带信号传输:按数据波的原样传输,不包含任何调制频带信号传输:把二进制信号调制成音频模拟信号再传输宽带信号传输:将多路视频信号调制复用为一个宽带信号传输数字数据传输:数据信号在数据信道上传输数据通信的主要性能指标传输速率:每秒能传输数据代码的位数,单位为比特/秒带宽:信道能够传送信号的频率宽度误码率:二进制码在传输过程中被传错的概率3.3.2数据通信概述(12)计算机网络是用传输介质把分布在不同地理位置的计算机和其他通信设备连接起来,实现数据通信和资源共享的分布式系统。计算机网络的构成包括:计算机系统、通信设备、传输介质和网络软件。

(一)计算机网络的功能

计算机网络从功能上分成通信子网和资源子网两部分。

通信子网:计算机网络中实现网络通信功能的设备及其软件的集合。主要负责整个网络的通信管理与控制。资源子网:计算机网络中实现资源共享的设备和软件的集合。由主机和终端设备构成,负责数据处理,向网络提供可供选用的硬件资源、软件资源和数据资源。3.3.3计算机网络概述(1)(一)计算机网络的功能

1、数据通信

2、资源共享

3、提高计算机的可靠性和可用性

4、易于进行分布式信息处理(二)网络拓扑结构

网络拓扑是网络布局的方法,常见的拓扑结构有星型、环型、总线型、树型等,如下图所示:3.3.3计算机网络概述(3)星型结构星型环型结构环型总线结构树型结构星型图3-27网络拓扑结构3.3.3计算机网络概述(4)⑵网络拓扑结构星型网络有一个中央节点,任何两个节点的通信都要经过中央节点。该拓扑结构简单、建网容易、便于管理,但它属于集中控制,对中央节点的依赖性大。3.3.3计算机网络概述(5)

环型各节点连成环状,信息沿着一个方向传递,通过各个中间节点的存储转发,最后到达目的节点。该拓扑结构管理简单,总路径长度较短,但一旦一个节点出故障,则可造成全网不能工作,并且当环中节点过多时,传输效率降低,响应时间长。

3.3.3计算机网络概述(6)

总线型各节点都连接在一条公共的总线上。由于节省了电缆和其它连接设备,使用的电缆较少,安装容易,网络连接成本较低,但网络线路对整个系统影响较大。3.3.3计算机网络概述(7)树型各个节点按层次进行连接。该拓扑结构比较复杂,成本较高,但易于扩展。3.3.3计算机网络概述(8)

网型3.3.3计算机网络概述(9)各节点都有几条路径与网络相联,一条线路出故障,通过迂回线路,网络仍能正常工作,但是必须进行路由选择.特点:结构可靠性高,但网络控制和路由选择比较复杂,一般用在广域网上。

(三)网络的类型

1、按网络的覆盖的地理范围分局域网(localareanetwork,LAN)几公里~几十公里城域网(metropolitanareanetwork,MAN)10~100公里广域网(wideareanetwork,WAN)几百公里~几千公里

2、按网络的所有权分类公共网络专用网增值网虚拟专用网3.3.3计算机网络概述(10)

(四)网络的接口部件

调制解调器:完成调制与解调任务的设备。网络适配器:简称网卡,发送和接受数据的计算机接口设备多路复用器:够集成数据、话音、传真及局域网的接入复用设备,能够高效地在一条线路上混传话音/传真、数据,从而降低了网络通信成本,可以为企业节省系统运行费用。中继器:局域网下,在传输介质上用于放大和整形传输信号集线器:Hub,也成多端口中继器。网桥:桥连器,连接两个局域网的一种存储/转发设备。路由器:连接类型不大相同的网络。网关:互联网中的协议转换器,能在高层协议不同的情况下提供协议转换服务。3.3.3计算机网络概述(11)

(一)网络协议与体系结构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论