信息传输与存储信息管理与管理信息系统详解演示文稿_第1页
信息传输与存储信息管理与管理信息系统详解演示文稿_第2页
信息传输与存储信息管理与管理信息系统详解演示文稿_第3页
信息传输与存储信息管理与管理信息系统详解演示文稿_第4页
信息传输与存储信息管理与管理信息系统详解演示文稿_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息传输与存储信息管理与管理信息系统详解演示文稿当前1页,总共84页。优选信息传输与存储信息管理与管理信息系统当前2页,总共84页。学习任务信息传输

信息存储

Clicktoaddtitleinhere12本章主要涉及:当前3页,总共84页。5.1信息传输当前4页,总共84页。5.1.1古代信息传输在古代,我国是世界上最早建立有组织的传递信息系统的国家之一。早在三千多年前的商代,信息传递就已见诸记载。乘马传递曰驿,驿传是早期有组织的通信方式。秦汉时期,形成了一整套驿传制度。特别是汉代,将所传递文书分出等级,不同等级的文书要由专人、专马按规定次序、时间传递。当前5页,总共84页。5.1.1古代信息传输唐代的官邮交通线以京城长安为中心,向四方辐射,直达边境地区,大致30里设一驿站。据《大唐六典》记载,最盛时全国有1639个驿站,专门从事驿务的人员共二万多人,其中驿兵一万七千人。邮驿分为陆驿、水驿、水路兼并三种,各驿站设有驿舍,配有驿马、驿驴、驿船和驿田。当前6页,总共84页。5.1.2信息传输的概念

信息传输是从一端将命令或状态信息经信道传送到另一端,并被对方所接收。包括传送和接收。传输介质分有线和无线两种,有线为电话线或专用电缆;无线是利用电台、微波及卫星技术等。信息传输过程中不能改变信息,信息本身也并不能被传送或接收。必须有载体,如数据、语言、信号等方式,且传送方面和接收方面对载体有共同解释。当前7页,总共84页。5.1.2信息传输的概念

信息传输的特性包括:①有效性有效性用频谱复用程度或频谱利用率来衡量。提高有效性的措施是,采用性能好的信源编码以压缩码率,采用频谱利用率高的调制减小传输带宽。②可靠性可靠性用信噪比和传输错误率来衡量。提高数字传输可靠性的措施是,采用高性能的信道编码以降低错误率。③安全性安全性用信息加密强度来衡量。提高安全性的措施是,采用高强度的密码与信息隐藏或伪装的方法。当前8页,总共84页。5.1.3数据信息传输模型1.数据通信网络的结构在数据通信网络中信息的发出者称其为信源;信息的接收者称为信宿;发送器对发送信号编码或转换,产生能够传输的光、电信号;接收器将收到的信号转换成信宿设备可以处理的信号;传输系统是连接信源与信宿之间的复杂线路网络。连接信源与信宿的物理和逻辑设备称为信道。当前9页,总共84页。5.1.3数据信息传输模型2.数据通信方式①并行通信和串行通信并行通信方式是将一组数据按数位宽度同时进行传输,每一个数位都要有自己的数据传输线和发送、接收设备。并行通信的传输速率高,但传输设备多,并行通信方式一般用在距离近、传输速率要求高的通信中。串行通信方式是在一根数据传输线上,每次传送一位二进制数据,即数据一位接一位地传送。在传输距离远,传输数字数据的场合,都采用串行传输方式,如计算机网络。当前10页,总共84页。5.1.3数据信息传输模型②单工通信与双工通信按照数据传输方向及其时间关系可将通信方式分为单工、半双工和全双工三种。在单工通信中,发送设备和接收设备之间只有一个传输通道,数据单方向的从发送端到接收端,传输通道的方向不能改变。在半双工通信中,两个设备之间有两个传输通道,可以轮流双方向地传送,但不能同时进行。在全双工通信中,两个设备之间有两个传输通道,并且可同时双向传送数据,相当于两个相反方向的单工通信的组合。当前11页,总共84页。5.1.3数据信息传输模型③基带传输与频带传输基带传输是指在数字信道直接传输数字信号。当进行远距离通信时,往往将数字数据转换成模拟信号(调制)后传输,在接收端再进行信号的恢复(解调),当调制成频率信号的频率范围在音频范围(200Hz—3.4kHz)内时,这种传输方式称为频带传输。其频率范围比音频范围宽时,则称之为宽带传输。当前12页,总共84页。5.1.3数据信息传输模型④同步传输与异步传输在串行通信通讯中,发送与接收方必须以同样的速率在相同的时段内发送和接收数据,否则收发会产生微小误差,微小误差的积累,会导致传输错误,为此要用到同步技术。所谓同步是指接收端要按照发送端所发送的每个数据的起止时间和重复频率来接收数据,即收发双方在时间上必须一致(同步)。当前13页,总共84页。5.1.3数据信息传输模型数据传输的同步方式有异步传输与同步传输两种。异步传输是以字符为单位的数据传输。每个字符都要附加1位起始位“0”、1位寄偶校验位和l位停止位“1”,以标记一个字符的开始和结束。起始位和停止位结合起来,便可实现字符的同步。同步传输是以数据块为单位的数据传输。每个数据块的头部和尾部都要附加一个特殊的字符或比特序列,标记一个数据块的开始和结束,一般还要附加一个校验序列,以便对数据块进行差错控制。当前14页,总共84页。5.1.3数据信息传输模型3.数据通信传输介质传输介质分为有线介质和无线介质。有线介质常用的有双绞线、同轴电缆和光纤三种。双绞线是以螺旋状扭在一起的两根绝缘导线组成的。两根线扭在一起是为了减少相互间的辐射电磁干扰。

光纤是光导纤维的简称,它由能传导光波的石英玻璃纤维,外加保护层构成。用光纤来传输电信号时,在发送端先要将其转换成光信号,而在接收端又要由光检波器还原成电信号。当前15页,总共84页。5.1.3数据信息传输模型同轴电缆也像双绞线那样由一对导体组成,但它们是按“同轴”形式构成线对。基带同轴电缆用来直接传输数字信号。宽带同轴电缆多用于频分多路复用的模拟信号发送。闭路电视所使用的CATV电缆就是宽带同轴电缆。当前16页,总共84页。5.1.3数据信息传输模型无线传输介质是通过大气传输,目前有三种技术:微波、红外线和激光。微波通信是在对流层视线距离范围内利用无线电波进行传输的一种通信方式,频率范围为2GHz-40GHz。卫星通信是微波通信的特殊形式,卫星接收来自地面发送站发出的电磁波信号后,再以广播方式用不同的频率发回地面,为地面工作站接收。当前17页,总共84页。5.1.3数据信息传输模型红外通信和激光通信也像微波通信一样,有很强的方向性,都是沿直线传播的。所不同的是红外通信和激光通信把要传输的信号分别转换为红外光信号和激光信号,直接在空间传播。当前18页,总共84页。5.1.3数据信息传输模型4.调制和解调调制即把数字数据对应的原始电脉冲信号变换成适合于远距离模拟传输线路传输的模拟信号,反之模拟信号还原为数字信号称为解调。调制方法有以下几种:振幅、频率、相位。调幅方式也称为幅移键控法ASK,它是用固定频率的正弦信号的两种不同幅度来表示二进制数的“1”和“0”。通常对“1”信号,调制器送出一幅度恒定的固定频率的模拟信号;而对于“0”,输出幅度为0的信号。当前19页,总共84页。5.1.3数据信息传输模型调频方式也称移频键控法FSK,它是用载波信号的两种不同的频率来表示二进制数的“1”和“0”。一般用载波频率附近的两个不同频率表示两个二进制的值。调相方式即移相键控法PSK,它是用载波信号的不同相位来表示二进制数。根据确定相位参考点的不同,调相方式可分为绝对调相和相对调相(或差分调相)。当前20页,总共84页。5.1.3数据信息传输模型5.多路复用技术在一条介质上同时传送多路信号的传输方式,叫做介质的多路复用。有频分、时分和波分三种。信道所能传输的信号频率有一定的范围,这一范围称作该信道频带的宽度,即带宽。频分多路复用(FDM)技术应用的基本条件是传输介质的可用带宽必须超过各路给定信号所需带宽的总和。传输介质的带宽划分为若干个窄频带,每一路信号占用一个窄频带的方法称为频分多路复用。当前21页,总共84页。5.1.3数据信息传输模型时分多路复用(TDM)应用的基本条件是传输介质能达到的数据传输率应超过各路传输数字信号所需的数据传输率的总和。即将每一条物理信道按时间分成若干时间片,使其每个信号按时间片轮流交替地使用单一信道,这种使多个数字信号在宏观上同时进行传输的方法称为时分多路复用(TDM)。波分多路复用(WDM)用于光纤,允许在一条光纤中同时传送多束互不干扰的不同波长的激光光束。当前22页,总共84页。5.1.3数据信息传输模型6.数据交换技术通常采用的数据传送技术有3种:电路交换、报文交换和分组交换。①电路交换在数据传输期间,源节点与目的节点之间有一条利用中间节点构成的专用的物理连接线路,在数据传输结束之前,一直保持这条线路。用电路交换技术完成的数据传输要经历如下三个过程:电路建立、数据传输和电路拆除。当前23页,总共84页。5.1.3数据信息传输模型②报文交换不需在两个站点之间建立一条专用通路,其数据传输的单位是报文(站点一次发送的数据块),长度不限且可变。在某一时间内,报文的传输只占用两个节点之间的一段线路。而在两个通信用户间的其它线路段,可传输其它用户的报文,不像电路交换那样必须端到端信道全部占用。当前24页,总共84页。5.1.3数据信息传输模型传送过程采用存储—转发方式,即发送站在发送一个报文时,把目的地址附加在报文上,途经的网络节点在收下整个报文后,暂存这个报文并检查有无错误,然后利用目的地址和路由信息找出下一个节点的地址,再把整个报文传送给下一个节点,通过逐个节点转送直到目的站点。当前25页,总共84页。5.1.3数据信息传输模型③分组交换为了更好地利用信道容量,并降低节点中数据量的突发性,可以使用分组交换。在分组交换网络中,每个分组的长度有一个上限,因此,一个较长的报文必须分成若干个分组,每个分组中包括数据和目的地址。其传输过程与报文交换类似,但由于限制了每个分组的长度,因此大大地改善了网络传输的性能。分组交换可分为虚电路分组交换和数据报分组交换两种。

当前26页,总共84页。5.1.3数据信息传输模型在虚电路方式中,仍然要经历建立虚电路、交换数据和拆除虚电路三个过程。逻辑通路所以是“虚”的,是因为这条电路不是专用的。在数据报方式中,每个分组的传送是被单独处理的,每个分组被称为一个数据报,每个数据报自身带有分组序号和地址信息,传送过程亦采用存储—转发方式。当某一个站点要发送报文时,先把报文拆成若干个数据报,依次发送到网络节点。但以后,各个数据报所走的路径就可能不再相同,从而各个数据报的到达也不保证是按顺序的,目的站必须对到达的数据报排序重组。当前27页,总共84页。5.2信息存储当前28页,总共84页。5.2.1数据库技术与数据库管理系统1.数据库概述(1)数据库技术的产生在20世纪50年代中期以前没有专门用于数据管理的软件,操作系统出现以后可以通过操作系统管理数据。但是操作系统是以文件为单位进行管理的,文件之间没有联系,很难解决数据在多个文件中重复存储和数据不一致的问题。为此,20世纪60年代后期出现了数据库系统。数据库的产生使得信息系统的研制围绕共享的数据库为中心来进行,实现了数据的集中管理,提高了数据的利用率和一致性,从而能更好地为决策服务。当前29页,总共84页。5.2.1数据库技术与数据库管理系统数据库系统数据与程序的关系

当前30页,总共84页。5.2.1数据库技术与数据库管理系统(2)数据库系统基本概念主要有数据、数据库、数据库管理系统、数据库系统四个概念。数据(data)是描述事物的符号记录,是数据库中存贮的基本对象。数据库(database,DB)是长期存储在计算机内、有组织的、统一管理的相关数据的集合。DB能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等。当前31页,总共84页。5.2.1数据库技术与数据库管理系统数据库管理系统(databasemanagementsystem,DBMS)是位于用户与操作系统之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制,并能够保证数据的安全性、完整性。数据库系统(databasesystem,DBS)是实现有组织地、动态地存储大量关联数据,方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。一般由数据库、数据库管理系统、应用系统、数据库管理员和用户构成。当前32页,总共84页。5.2.1数据库技术与数据库管理系统2.数据库的三级模式在数据模型中有型(type)和值(value)的概念。型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。例如:学生记录的型为(学号,姓名,性别,系别,年龄,籍贯),该记录型的一个记录值为(900201,李明,男,计算机,22,江苏)。当前33页,总共84页。5.2.1数据库技术与数据库管理系统(1)三级模式数据库系统采用外模式、模式和内模式三级模式结构

当前34页,总共84页。5.2.1数据库技术与数据库管理系统模式(schema)又叫逻辑模式、概念模式。模式是数据库中全体数据的逻辑结构和特性的描述,是所有用户的公共数据视图。DBMS提供数据定义语言DDL来描述逻辑模式,严格定义数据的逻辑结构(数据项的名字、类型、取值范围等)以及数据间的相互关系和数据的约束等。当前35页,总共84页。5.2.1数据库技术与数据库管理系统模式仅仅涉及到型的描述,不涉及到具体的值。模式的一个具体值称为模式的一个实例。同一个模式可以有很多实例。模式是相对稳定的,而实例是相对变动的。模式反映的是数据的结构及其关系,而实例反映的是数据库某一时刻的状态。数据库中的数据经常变化,而数据库的结构在一定时间范围内不会改变。当前36页,总共84页。5.2.1数据库技术与数据库管理系统内模式(internalschema)又叫物理模式、存储模式。内模式是数据在数据库系统的内部表示,即对数据的物理结构/存储方式的描述。外模式(externalschema)又叫用户模式、子模式。外模式是模式的子集,是与某一应用有关的数据的逻辑表示。当前37页,总共84页。5.2.1数据库技术与数据库管理系统(2)两级映象在三级模式中提供了两级映象,这不仅在三级数据库模式之间建立了联系,也保证了数据库系统的数据独立性,如图所示。外模式/模式映象定义并保证了外模式和模式之间的对应关系。当前38页,总共84页。5.2.1数据库技术与数据库管理系统数据库系统投入使用后,可能有必要修改模式(如增加新关系、属性、改变类型),这时可以重新定义外模式/模式映象,而使现存外模式和应用程序保持不变,保证了数据的逻辑独立性。这些映象定义通常包含在各自外模式的描述中。当前39页,总共84页。5.2.1数据库技术与数据库管理系统模式/内模式映象定义并保证了模式和内模式之间的对应关系。当内模式发生变化时,重新定义模式/内模式映象,从而使模式和外模式保持不变,建立在外模式上的应用程序也保持不变,保证了数据的物理独立性。该映象定义通常包含在模式描述中。当前40页,总共84页。5.2.1数据库技术与数据库管理系统3.数据模型(datamodel)(1)概述模型是现实世界事物特征的模拟和抽象。如航模飞机是对实际飞机的模拟和抽象,它不是真正的飞机,但又真实的反映了实际飞机的属性和特征。为便于人和计算机都能理解,信息抽象采用逐步抽象的方法,把数据模型分成两个不同的层次:按用户的观点来对现实世界的抽象称为概念模型(也称信息模型);以计算机系统的观点模拟现实世界的模型叫做数据模型。

当前41页,总共84页。5.2.1数据库技术与数据库管理系统也就是说,首先按人们的认识观点将现实世界抽象为信息世界的概念模型,然后再通过数据模型将信息世界转换为机器(计算机)世界。数据模型又可进一步细分为逻辑(数据)模型和物理(数据)模型两个分层次。如下图所示。模型的转换

当前42页,总共84页。5.2.1数据库技术与数据库管理系统①概念模型(conceptualdatamodel,CDM)概念模型就是概念层次的数据模型,简称为概念模型。是现实世界的事物经过人脑的抽象加工,提取出对用户有用的信息,经过组织整理加工形成的。概念模型按用户的观点来对现实世界进行建模,这种建模方法是缺乏计算机知识的用户最容易理解的,并便于和数据库设计人员进行交流,是系统分析员、程序设计员、维护人员、用户之间相互理解的共同语言;概念模型必须转换成逻辑模型,才能在DBMS中实现。当前43页,总共84页。5.2.1数据库技术与数据库管理系统②逻辑模型(logicaldatamodel,LDM)逻辑数据模型是用户通过数据库管理系统看到的现实世界,它描述了数据库数据的整体结构。是具体的DBMS所支持的数据模型,不同的DBMS提供了不同的逻辑数据模型,如层次模型、网状模型、关系模型、面向对象模型等。当前44页,总共84页。5.2.1数据库技术与数据库管理系统③物理模型(physicaldatamodel,PDM)物理数据模型用来描述数据的物理存储结构和存储方法,面向具体的DBMS,面向操作系统和机器。PDM不仅与具体的DBMS有关,还与操作系统和硬件有关。每一种逻辑模型在实现时都有其对应的物理模型。DBMS为保证其独立性和可以执行,大部分PDM的实现工作由系统自动完成,而设计者只设计某些特殊结构。也就是说,一般用户看不到物理数据结构,所以无须过多了解。当前45页,总共84页。5.2.1数据库技术与数据库管理系统(2)概念模型实体-联系模型(简称E-R模型)是由于1976年首先提出的。它提供不受任何DBMS约束的面向用户的表达方法,在数据库设计中被广泛用作数据建模的工具。E-R数据模型问世后,经历了许多修改和扩充。分类E-R模型的构成成分是实体集、属性和联系集.当前46页,总共84页。5.2.1数据库技术与数据库管理系统E-R图为实体-联系图,提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。构成E-R图的基本要素是实体型、属性和联系,其表示方法为:·实体型:用矩形表示,矩形框内写明实体名;·属性:用椭圆形表示,并用无向边将其与相应的实体连接起来;·联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1,1:n或m:n)。当前47页,总共84页。5.2.1数据库技术与数据库管理系统联系示意图当前48页,总共84页。5.2.1数据库技术与数据库管理系统(3)概念模型的表示方法最常用的概念模型表示方法是实体—联系方法,该方法用E-R图来描述某一组织的概念模型。E-R图用矩形方框表示实体集合,方框内标明实体集合名称;用椭圆框表示属性,通过无向边连接到实体集。只有一个属性的实体集可用属性代替,附加到它参加的联系上;当前49页,总共84页。5.2.1数据库技术与数据库管理系统如某属性为实体的关键字,用下划线在属性名上标明;用菱形框表示联系,框内标明联系的名称,通过无向边连接到参加联系的每个实体集合;在用无向边连接联系到实体集时,在边上注明1或n(多)来标明联系的类型。若实体之间联系也具有属性,则把属性和菱形代表的实体联系也用无向边连接上。

当前50页,总共84页。5.2.1数据库技术与数据库管理系统例如,一个学生可选多门课程,而一门课程又有多个学生选修,一个教师至多可讲三门课程,一门课程至多只有一个教师教授,该教学组织的E-R图如图所示。

教学E-R模型

当前51页,总共84页。5.2.1数据库技术与数据库管理系统(3)(逻辑)数据模型①数据模型三要素逻辑数据模型是数据库系统的核心和基础,常简称为数据模型。逻辑数据模型包含数据结构、数据操作和数据完整性约束三个部分,称为数据模型三要素。当前52页,总共84页。5.2.1数据库技术与数据库管理系统数据结构描述数据的静态特征,是指对实体类型和实体间联系的描述。数据操作描述数据的动态特征,是指对数据库中各种数据对象允许执行的操作的集合。数据约束条件是一组数据完整性规则的集合,给出数据及其联系应具有的制约和依赖规则,数据库中的数据必须满足这组规则。当前53页,总共84页。5.2.1数据库技术与数据库管理系统②常见数据模型数据模型主要有层次模型、网状模型、关系模型、面向对象模型等四种。层次模型(hierarchicalmodel)用树形结构来表示各类实体以及实体间的联系。记录类型描述的是实体,对应一个节点,字段描述实体的属性。上层节点叫父节点,下层节点叫子节点,同一双亲的节点叫兄弟节点。只有一个节点没有双亲节点,称之为根节点。根以外的其它节点有且只有一个双亲节点。当前54页,总共84页。5.2.1数据库技术与数据库管理系统网状模型(networkmodel):用有向图结构表示实体类型及实体间联系的数据模型。与层次模型一样每个节点表示一个记录类型,每个记录类型可包含若干个字段,节点之间的连线表示记录类型间的联系。关系模型(relationalmodel):用二维表表示实体和实体之间的联系。当前55页,总共84页。5.2.1数据库技术与数据库管理系统面向对象模型(object-orientedmodel):面向对象程序设计方法和面向对象数据库技术相结合就产生了面向对象数据库系统。面向对象模型将实体视为对象,对象是现实世界中实体的模型化。当前56页,总共84页。5.2.1数据库技术与数据库管理系统(4)关系模型和关系数据库关系模型中数据的逻辑结构是一张二维表。关系数据库系统是支持关系模型的数据库系统。例如,下表的学生数据表表示了一个学生关系模型。当前57页,总共84页。5.2.1数据库技术与数据库管理系统①关系常用术语通常由行和列组成的二维表就是关系(relation);表中的一行即为一个元组(tuple);表中的一列即为一个属性(attribute),属性有名与值的区别;由属性名组成的表头为框架(framework)(关系的型);元组中的一个属性值(字段值)称分量(component);属性的取值范围是域(domain);当前58页,总共84页。5.2.1数据库技术与数据库管理系统可以唯一确定一个元组的一个属性或属性组为候选码(candidatekey,可简称为码);一个关系中常有多个候选码,可指定一个为主码;对关系的描述是关系模式(relationmodel),一般表示为:关系名(属性1,属性2,…,属性n)。其中关系的主码用下划线指明,如:学生(学号,姓名,性别,系别,年龄,政治面貌)。当前59页,总共84页。5.2.1数据库技术与数据库管理系统②关系操作关系数据模型的理论基础是集合论,关系操作采用集合操作方式,即操作的对象和结果都是集合。关系操作主要包含传统集合运算(并、交、差等)和专门的关系运算(选择、投影、连接等)。投影操作是对一个关系进行垂直分割,从二维表中选出所需要的列,消去其他列,并重新安排列的顺序。当前60页,总共84页。5.2.1数据库技术与数据库管理系统选择操作是根据某些条件对关系做水平分割,即选取符合条件的元组。联接是对两个关系的运算,它是将两个关系在给定的属性上满足给定条件的元组连接起来而得到的一个新的关系。当前61页,总共84页。5.2.1数据库技术与数据库管理系统4.数据库技术发展的趋势

(1)下一代数据库技术的发展主流面向对象的数据库技术将成为下一代数据库技术发展的主流。部分学者认为现有的关系型数据库无法描述现实世界的实体,而面向对象的数据模型由于吸收了已经成熟的面向对象程序设计方法学的核心概念和基本思想,使得它符合人类认识世界的一般方法,更适合描述现实世界。甚至有人预言,数据库的未来将是面向对象的时代。

当前62页,总共84页。5.2.1数据库技术与数据库管理系统(2)数据库技术发展的新方向非结构化数据库是部分研究者针对关系数据库模型过于简单,不便表达复杂的嵌套需要以及支持数据类型有限等局限,从数据模型入手而提出的全面基于因特网应用的新型数据库理论。当前63页,总共84页。5.2.1数据库技术与数据库管理系统他们认为这种数据库的最大区别就在于它突破了关系数据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理,在处理连续信息(包括全文信息)和非结构信息(重复数据和变长数据)中有着传统关系型数据库所无法比拟的优势。当前64页,总共84页。5.2.1数据库技术与数据库管理系统(3)数据库技术发展的又一趋势有学者指出

:数据库与学科技术的结合将会建立一系列新数据库,如分布式数据库、并行数据库、知识库、多媒体数据库等,这将是数据库技术重要的发展方向。其中,许多研究者都对多媒体数据库作为研究的重点,并认为多媒体技术和可视化技术引入多媒体数据库将是未来数据库技术发展的热点和难点。①未来数据库技术及市场发展的两大方向分别为数据仓库和电子商务.②面向专门应用领域的数据库技术

当前65页,总共84页。5.2.1数据库技术与数据库管理系统5.数据库管理系统的代表(1)Oracle

(2)PostgreSQL(3)MicrosoftSQLServer(4)MicrosoftAccess当前66页,总共84页。5.2.2数据仓库1.什么是数据仓库(DataWarehouse,DW)数据仓库之父比尔·恩门(BillInmon)在1991年出版的“BuildingtheDataWarehouse”(《建立数据仓库》)一书中所提出的定义被广泛接受,数据仓库是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。当前67页,总共84页。5.2.2数据仓库数据仓库是一个过程而不是一个项目;数据仓库是一个环境,而不是一件产品。数据仓库提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据仓库技术是为了有效的把操作形数据集成到统一的环境中以提供决策型数据访问,的各种技术和模块的总称。所做的一切都是为了让用户更快更方便查询所需要的信息,提供决策支持。

当前68页,总共84页。5.2.2数据仓库2.数据仓库的特点(1)面向主题

(2)集成的(3)相对稳定的(4)反映历史变化

从工程的角度来看,数据仓库是一个集成的解决方案,由多种产品和专业技术服务组成,提供了一种对数据进行存储与分析的技术手段。

当前69页,总共84页。5.2.2数据仓库3.数据仓库系统体系结构整个数据仓库系统是一个包含四个层次的体系结构,如下图所示。数据仓库系统体系结构

当前70页,总共84页。5.2.2数据仓库①数据源数据源是数据仓库系统的基础,通常包括内部信息和外部信息。内部信息包括存放于关系型DBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等。当前71页,总共84页。5.2.2数据仓库②数据存储与管理数据仓库的核心是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库,则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据,进行抽取、清理、并有效集成,按照主题进行组织。当前72页,总共84页。5.2.2数据仓库③OLAP服务器对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。数据挖掘应建立在联机分析处理OLAP的数据环境基础之上。④前端工具主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。当前73页,总共84页。5.2.2数据仓库4.数据仓库的组成

(1)数据仓库数据库

(2)数据抽取工具(3)元数据(4)访问工具(5)数据集市(DataMarts)

当前74页,总共84页。5.2.2数据仓库5.数据仓库的建立步骤

数据仓库的建立步骤如下:

1)收集和分析业务需求。

2)建立数据模型和数据仓库的物理设计。

3)定义数据源。

4)选择数据仓库技术和平台。

5)从操作型数据库中抽取、净化、和转换数据到数据仓库。

6)选择访问和报表工具。

7)选择数据库连接软件。

8)选择数据分析和数据展示软件。

9)更新数据仓库。

当前75页,总共84页。5.2.2数据仓库6.数据仓库和数据集市

有关决策支持型数据库的数据集市是面向企业中的某个部门或是项目小组的。一些专家顾问将数据集市的建造描述为建立数据仓库全过程中的一步。首先,一个储存企业全部信息的数据仓库被创建,其中,数据均具备有组织的、一致的、不变的格式。数据集市随后被创立,其目的是为不同部门提供他们所需要的那部分信息。数据仓库聚集了所有详细的信息,而数据集市中的数据则是针对用户们的特定需求总结而出的。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论