第5章 信息传输及存储-《信息管理及管理信息系统》_第1页
第5章 信息传输及存储-《信息管理及管理信息系统》_第2页
第5章 信息传输及存储-《信息管理及管理信息系统》_第3页
第5章 信息传输及存储-《信息管理及管理信息系统》_第4页
第5章 信息传输及存储-《信息管理及管理信息系统》_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息管理与管理信息系统信息管理与管理信息系统李联宁李联宁 编著编著第第 5 章章 信息传输与存储信息传输与存储 学习任务学习任务信息传输 信息存储 Click to add title in here 12本章主要涉及:本章主要涉及:5.1 信息传输5.1.1 古代信息传输在古代,我国是世界上最早建立有组织的传递信在古代,我国是世界上最早建立有组织的传递信息系统的国家之一。早在三千多年前的商代,信息系统的国家之一。早在三千多年前的商代,信息传递就已见诸记载。息传递就已见诸记载。 乘马传递曰驿,驿传是早乘马传递曰驿,驿传是早期有组织的通信方式。期有组织的通信方式。 秦汉时期,形成了一整套驿传制度

2、。特别是汉代,秦汉时期,形成了一整套驿传制度。特别是汉代,将所传递文书分出等级,不同等级的文书要由专将所传递文书分出等级,不同等级的文书要由专人、专马按规定次序、时间传递。人、专马按规定次序、时间传递。 5.1.1 古代信息传输唐代的官邮交通线以京城长安为中心,向四方辐唐代的官邮交通线以京城长安为中心,向四方辐射,直达边境地区,大致射,直达边境地区,大致30里设一驿站。据里设一驿站。据大大唐六典唐六典记载,最盛时全国有记载,最盛时全国有1639个驿站,专门个驿站,专门从事驿务的人员共二万多人,其中驿兵一万七千从事驿务的人员共二万多人,其中驿兵一万七千人。邮驿分为陆驿、水驿、水路兼并三种,各驿人

3、。邮驿分为陆驿、水驿、水路兼并三种,各驿站设有驿舍,配有驿马、驿驴、驿船和驿田。站设有驿舍,配有驿马、驿驴、驿船和驿田。5.1.2 信息传输的概念 信息传输是从一端将命令或状态信息经信道传送信息传输是从一端将命令或状态信息经信道传送到另一端,并被对方所接收。包括传送和接收。到另一端,并被对方所接收。包括传送和接收。传输介质分有线和无线两种,有线为电话线或专传输介质分有线和无线两种,有线为电话线或专用电缆;无线是利用电台、微波及卫星技术等。用电缆;无线是利用电台、微波及卫星技术等。信息传输过程中不能改变信息,信息本身也并不信息传输过程中不能改变信息,信息本身也并不能被传送或接收。必须有载体,如数

4、据、语言、能被传送或接收。必须有载体,如数据、语言、信号等方式,且传送方面和接收方面对载体有共信号等方式,且传送方面和接收方面对载体有共同解释。同解释。5.1.2 信息传输的概念 信息传输的特性包括:信息传输的特性包括: 有效性有效性 有效性用频谱复用程度或频谱利用率来衡量。提高有效性用频谱复用程度或频谱利用率来衡量。提高有效性的措施是,采用性能好的信源编码以压缩码有效性的措施是,采用性能好的信源编码以压缩码率,采用频谱利用率高的调制减小传输带宽。率,采用频谱利用率高的调制减小传输带宽。 可靠性可靠性 可靠性用信噪比和传输错误率来衡量。提高数字传可靠性用信噪比和传输错误率来衡量。提高数字传输可

5、靠性的措施是,采用高性能的信道编码以降低输可靠性的措施是,采用高性能的信道编码以降低错误率。错误率。 安全性安全性 安全性用信息加密强度来衡量。提高安全性的措施安全性用信息加密强度来衡量。提高安全性的措施是,采用高强度的密码与信息隐藏或伪装的方法。是,采用高强度的密码与信息隐藏或伪装的方法。5.1.3 数据信息传输模型1. 数据通信网络的结构数据通信网络的结构 在数据通信网络中信息的发出者称其为信源;信息的接在数据通信网络中信息的发出者称其为信源;信息的接收者称为信宿;收者称为信宿; 发送器对发送信号编码或转换,产生能够传输的光、电发送器对发送信号编码或转换,产生能够传输的光、电信号;信号;

6、接收器将收到的信号转换成信宿设备可以处理的信号;接收器将收到的信号转换成信宿设备可以处理的信号; 传输系统是连接信源与信宿之间的复杂线路网络。传输系统是连接信源与信宿之间的复杂线路网络。 连接信源与信宿的物理和逻辑设备称为信道。连接信源与信宿的物理和逻辑设备称为信道。5.1.3 数据信息传输模型2. 数据通信方式数据通信方式 并行通信和串行通信并行通信和串行通信 并行通信方式是将一组数据按数位宽度同时进行传并行通信方式是将一组数据按数位宽度同时进行传输,每一个数位都要有自己的数据传输线和发送、输,每一个数位都要有自己的数据传输线和发送、接收设备。并行通信的传输速率高,但传输设备多,接收设备。并

7、行通信的传输速率高,但传输设备多,并行通信方式一般用在距离近、传输速率要求高的并行通信方式一般用在距离近、传输速率要求高的通信中。通信中。 串行通信方式是在一根数据传输线上,每次传送一串行通信方式是在一根数据传输线上,每次传送一位二进制数据,即数据一位接一位地传送。在传输位二进制数据,即数据一位接一位地传送。在传输距离远,传输数字数据的场合,都采用串行传输方距离远,传输数字数据的场合,都采用串行传输方式,如计算机网络。式,如计算机网络。5.1.3 数据信息传输模型 单工通信与双工通信单工通信与双工通信 按照数据传输方向及其时间关系可将通信方式分为按照数据传输方向及其时间关系可将通信方式分为单工

8、、半双工和全双工三种。单工、半双工和全双工三种。 在单工通信中,发送设备和接收设备之间只有一个在单工通信中,发送设备和接收设备之间只有一个传输通道,数据单方向的从发送端到接收端,传输传输通道,数据单方向的从发送端到接收端,传输通道的方向不能改变。通道的方向不能改变。 在半双工通信中,两个设备之间有两个传输通道,在半双工通信中,两个设备之间有两个传输通道,可以轮流双方向地传送,但不能同时进行。可以轮流双方向地传送,但不能同时进行。 在全双工通信中,两个设备之间有两个传输通道,在全双工通信中,两个设备之间有两个传输通道,并且可同时双向传送数据,相当于两个相反方向的并且可同时双向传送数据,相当于两个

9、相反方向的单工通信的组合。单工通信的组合。5.1.3 数据信息传输模型 基带传输与频带传输基带传输与频带传输 基带传输是指在数字信道直接传输数字信号。基带传输是指在数字信道直接传输数字信号。 当进行远距离通信时,往往将数字数据转换成模拟当进行远距离通信时,往往将数字数据转换成模拟信号(调制)后传输,在接收端再进行信号的恢复信号(调制)后传输,在接收端再进行信号的恢复(解调),当调制成频率信号的频率范围在音频范(解调),当调制成频率信号的频率范围在音频范围(围(200Hz3.4kHz)内时,这种传输方式称为频)内时,这种传输方式称为频带传输。带传输。 其频率范围比音频范围宽时,则称之为宽带传输。

10、其频率范围比音频范围宽时,则称之为宽带传输。5.1.3 数据信息传输模型 同步传输与异步传输同步传输与异步传输 在串行通信通讯中,发送与接收方必须以同样的在串行通信通讯中,发送与接收方必须以同样的速率在相同的时段内发送和接收数据,否则收发速率在相同的时段内发送和接收数据,否则收发会产生微小误差,微小误差的积累,会导致传输会产生微小误差,微小误差的积累,会导致传输错误,为此要用到同步技术。错误,为此要用到同步技术。 所谓同步是指接收端要按照发送端所发送的每个所谓同步是指接收端要按照发送端所发送的每个数据的起止时间和重复频率来接收数据,即收发数据的起止时间和重复频率来接收数据,即收发双方在时间上必

11、须一致(同步)。双方在时间上必须一致(同步)。5.1.3 数据信息传输模型数据传输的同步方式有异步传输与同步传输两种。数据传输的同步方式有异步传输与同步传输两种。异步传输是以字符为单位的数据传输。每个字符都异步传输是以字符为单位的数据传输。每个字符都要附加要附加1位起始位位起始位“0”、1位寄偶校验位和位寄偶校验位和l位停止位停止位位“1”,以标记一个字符的开始和结束。,以标记一个字符的开始和结束。起始位和停止位结合起来,便可实现字符的同步。起始位和停止位结合起来,便可实现字符的同步。同步传输是以数据块为单位的数据传输。每个数据同步传输是以数据块为单位的数据传输。每个数据块的头部和尾部都要附加

12、一个特殊的字符或比特序块的头部和尾部都要附加一个特殊的字符或比特序列,标记一个数据块的开始和结束,一般还要附加列,标记一个数据块的开始和结束,一般还要附加一个校验序列,以便对数据块进行差错控制。一个校验序列,以便对数据块进行差错控制。5.1.3 数据信息传输模型3. 数据通信传输介质数据通信传输介质 传输介质分为有线介质和无线介质。传输介质分为有线介质和无线介质。 有线介质常用的有双绞线、同轴电缆和光纤三种。有线介质常用的有双绞线、同轴电缆和光纤三种。 双绞线是以螺旋状扭在一起的两根绝缘导线组成的。双绞线是以螺旋状扭在一起的两根绝缘导线组成的。两根线扭在一起是为了减少相互间的辐射电磁干扰。两根

13、线扭在一起是为了减少相互间的辐射电磁干扰。 光纤是光导纤维的简称,它由能传导光波的石英玻光纤是光导纤维的简称,它由能传导光波的石英玻璃纤维,外加保护层构成。用光纤来传输电信号时,璃纤维,外加保护层构成。用光纤来传输电信号时,在发送端先要将其转换成光信号,而在接收端又要在发送端先要将其转换成光信号,而在接收端又要由光检波器还原成电信号。由光检波器还原成电信号。5.1.3 数据信息传输模型同轴电缆也像双绞线那样由一对导体组成,但它们同轴电缆也像双绞线那样由一对导体组成,但它们是按是按“同轴同轴”形式构成线对。形式构成线对。基带同轴电缆用来直接传输数字信号。基带同轴电缆用来直接传输数字信号。宽带同轴

14、电缆多用于频分多路复用的模拟信号发送。宽带同轴电缆多用于频分多路复用的模拟信号发送。闭路电视所使用的闭路电视所使用的CATV电缆就是宽带同轴电缆。电缆就是宽带同轴电缆。5.1.3 数据信息传输模型无线传输介质是通过大气传输,目前有三种技术:无线传输介质是通过大气传输,目前有三种技术:微波、红外线和激光。微波、红外线和激光。微波通信是在对流层视线距离范围内利用无线电波微波通信是在对流层视线距离范围内利用无线电波进行传输的一种通信方式,频率范围为进行传输的一种通信方式,频率范围为2GHz-40GHz。卫星通信是微波通信的特殊形式,卫星接收来自地卫星通信是微波通信的特殊形式,卫星接收来自地面发送站发

15、出的电磁波信号后,再以广播方式用不面发送站发出的电磁波信号后,再以广播方式用不同的频率发回地面,为地面工作站接收。同的频率发回地面,为地面工作站接收。5.1.3 数据信息传输模型红外通信和激光通信也像微波通信一样,有很强的红外通信和激光通信也像微波通信一样,有很强的方向性,都是沿直线传播的。方向性,都是沿直线传播的。所不同的是红外通信和激光通信把要传输的信号分所不同的是红外通信和激光通信把要传输的信号分别转换为红外光信号和激光信号,直接在空间传播。别转换为红外光信号和激光信号,直接在空间传播。5.1.3 数据信息传输模型4. 调制和解调调制和解调 调制即把数字数据对应的原始电脉冲信号变换成适调

16、制即把数字数据对应的原始电脉冲信号变换成适合于远距离模拟传输线路传输的模拟信号,反之模合于远距离模拟传输线路传输的模拟信号,反之模拟信号还原为数字信号称为解调。拟信号还原为数字信号称为解调。 调制方法有以下几种:振幅、频率、相位。调制方法有以下几种:振幅、频率、相位。 调幅方式也称为幅移键控法调幅方式也称为幅移键控法ASK ,它是用固定频,它是用固定频率的正弦信号的两种不同幅度来表示二进制数的率的正弦信号的两种不同幅度来表示二进制数的“1”和和“0”。通常对。通常对“1”信号,调制器送出一幅信号,调制器送出一幅度恒定的固定频率的模拟信号;而对于度恒定的固定频率的模拟信号;而对于“0”,输出,输

17、出幅度为幅度为0的信号。的信号。5.1.3 数据信息传输模型 调频方式也称移频键控法调频方式也称移频键控法FSK,它是用载波信,它是用载波信号的两种不同的频率来表示二进制数的号的两种不同的频率来表示二进制数的“1”和和“0”。一般用载波频率附近的两个不同频率表。一般用载波频率附近的两个不同频率表示两个二进制的值。示两个二进制的值。 调相方式即移相键控法调相方式即移相键控法PSK,它是用载波信号,它是用载波信号的不同相位来表示二进制数。根据确定相位参的不同相位来表示二进制数。根据确定相位参考点的不同,调相方式可分为绝对调相和相对考点的不同,调相方式可分为绝对调相和相对调相(或差分调相)。调相(或

18、差分调相)。5.1.3 数据信息传输模型5. 多路复用技术多路复用技术 在一条介质上同时传送多路信号的传输方式,叫在一条介质上同时传送多路信号的传输方式,叫做介质的多路复用。有频分、时分和波分三种。做介质的多路复用。有频分、时分和波分三种。 信道所能传输的信号频率有一定的范围,这一范信道所能传输的信号频率有一定的范围,这一范围称作该信道频带的宽度,即带宽。围称作该信道频带的宽度,即带宽。 频分多路复用频分多路复用(FDM)技术应用的基本条件是传)技术应用的基本条件是传输介质的可用带宽必须超过各路给定信号所需带输介质的可用带宽必须超过各路给定信号所需带宽的总和。传输介质的带宽划分为若干个窄频带,

19、宽的总和。传输介质的带宽划分为若干个窄频带,每一路信号占用一个窄频带的方法称为频分多路每一路信号占用一个窄频带的方法称为频分多路复用。复用。5.1.3 数据信息传输模型 时分多路复用时分多路复用(TDM)应用的基本条件是传输)应用的基本条件是传输介质能达到的数据传输率应超过各路传输数字信介质能达到的数据传输率应超过各路传输数字信号所需的数据传输率的总和。即将每一条物理信号所需的数据传输率的总和。即将每一条物理信道按时间分成若干时间片,使其每个信号按时间道按时间分成若干时间片,使其每个信号按时间片轮流交替地使用单一信道,这种使多个数字信片轮流交替地使用单一信道,这种使多个数字信号在宏观上同时进行

20、传输的方法称为时分多路复号在宏观上同时进行传输的方法称为时分多路复用(用(TDM)。)。 波分多路复用波分多路复用(WDM)用于光纤,允许在一条)用于光纤,允许在一条光纤中同时传送多束互不干扰的不同波长的激光光纤中同时传送多束互不干扰的不同波长的激光光束。光束。5.1.3 数据信息传输模型6. 数据交换技术数据交换技术 通常采用的数据传送技术有通常采用的数据传送技术有3种:电路交换、种:电路交换、报文交换和分组交换。报文交换和分组交换。 电路交换电路交换 在数据传输期间,源节点与目的节点之间有一条在数据传输期间,源节点与目的节点之间有一条利用中间节点构成的专用的物理连接线路,在数利用中间节点构

21、成的专用的物理连接线路,在数据传输结束之前,一直保持这条线路。用电路交据传输结束之前,一直保持这条线路。用电路交换技术完成的数据传输要经历如下三个过程:电换技术完成的数据传输要经历如下三个过程:电路建立、数据传输和电路拆除。路建立、数据传输和电路拆除。5.1.3 数据信息传输模型 报文交换报文交换 不需在两个站点之间建立一条专用通路,其数据传不需在两个站点之间建立一条专用通路,其数据传输的单位是报文(站点一次发送的数据块),长度输的单位是报文(站点一次发送的数据块),长度不限且可变。不限且可变。 在某一时间内,报文的传输只占用两个节点之间的在某一时间内,报文的传输只占用两个节点之间的一段线路。

22、而在两个通信用户间的其它线路段,可一段线路。而在两个通信用户间的其它线路段,可传输其它用户的报文,不像电路交换那样必须端到传输其它用户的报文,不像电路交换那样必须端到端信道全部占用。端信道全部占用。5.1.3 数据信息传输模型 传送过程采用存储传送过程采用存储转发方式,即发送站在发送一转发方式,即发送站在发送一个报文时,把目的地址附加在报文上,途经的网络个报文时,把目的地址附加在报文上,途经的网络节点在收下整个报文后,暂存这个报文并检查有无节点在收下整个报文后,暂存这个报文并检查有无错误,然后利用目的地址和路由信息找出下一个节错误,然后利用目的地址和路由信息找出下一个节点的地址,再把整个报文传

23、送给下一个节点,通过点的地址,再把整个报文传送给下一个节点,通过逐个节点转送直到目的站点。逐个节点转送直到目的站点。5.1.3 数据信息传输模型 分组交换分组交换 为了更好地利用信道容量,并降低节点中数据量为了更好地利用信道容量,并降低节点中数据量的突发性,可以使用分组交换。在分组交换网络的突发性,可以使用分组交换。在分组交换网络中,每个分组的长度有一个上限,因此,一个较中,每个分组的长度有一个上限,因此,一个较长的报文必须分成若干个分组,每个分组中包括长的报文必须分成若干个分组,每个分组中包括数据和目的地址。数据和目的地址。 其传输过程与报文交换类似,但由于限制了每个其传输过程与报文交换类似

24、,但由于限制了每个分组的长度,因此大大地改善了网络传输的性能。分组的长度,因此大大地改善了网络传输的性能。 分组交换可分为虚电路分组交换和数据报分组交分组交换可分为虚电路分组交换和数据报分组交换两种。换两种。 5.1.3 数据信息传输模型在虚电路方式中,仍然要经历建立虚电路、交换数在虚电路方式中,仍然要经历建立虚电路、交换数据和拆除虚电路三个过程。逻辑通路所以是据和拆除虚电路三个过程。逻辑通路所以是“虚虚”的,是因为这条电路不是专用的。的,是因为这条电路不是专用的。在数据报方式中,每个分组的传送是被单独处理的,在数据报方式中,每个分组的传送是被单独处理的,每个分组被称为一个数据报,每个数据报自

25、身带有每个分组被称为一个数据报,每个数据报自身带有分组序号和地址信息,传送过程亦采用存储分组序号和地址信息,传送过程亦采用存储转发转发方式。当某一个站点要发送报文时,先把报文拆成方式。当某一个站点要发送报文时,先把报文拆成若干个数据报,依次发送到网络节点。但以后,各若干个数据报,依次发送到网络节点。但以后,各个数据报所走的路径就可能不再相同,从而各个数个数据报所走的路径就可能不再相同,从而各个数据报的到达也不保证是按顺序的,目的站必须对到据报的到达也不保证是按顺序的,目的站必须对到达的数据报排序重组。达的数据报排序重组。5.2 信息存储5.2.1 数据库技术与数据库管理系统1. 数据库概述数据

26、库概述(1)数据库技术的产生)数据库技术的产生 在在20世纪世纪50年代中期以前没有专门用于数据管理的年代中期以前没有专门用于数据管理的软件,操作系统出现以后可以通过操作系统管理数软件,操作系统出现以后可以通过操作系统管理数据。但是操作系统是以文件为单位进行管理的,文据。但是操作系统是以文件为单位进行管理的,文件之间没有联系,很难解决数据在多个文件中重复件之间没有联系,很难解决数据在多个文件中重复存储和数据不一致的问题。存储和数据不一致的问题。 为此,为此,20世纪世纪60年代后期出现了数据库系统。数据年代后期出现了数据库系统。数据库的产生使得信息系统的研制围绕共享的数据库为库的产生使得信息系

27、统的研制围绕共享的数据库为中心来进行,实现了数据的集中管理,提高了数据中心来进行,实现了数据的集中管理,提高了数据的利用率和一致性,从而能更好地为决策服务。的利用率和一致性,从而能更好地为决策服务。5.2.1 数据库技术与数据库管理系统数据库系统数据与程序的关系数据库系统数据与程序的关系 5.2.1 数据库技术与数据库管理系统(2)数据库系统基本概念)数据库系统基本概念 主要有数据、数据库、数据库管理系统、数据库主要有数据、数据库、数据库管理系统、数据库系统四个概念。系统四个概念。 数据(数据(data)是描述事物的符号记录,是数据库)是描述事物的符号记录,是数据库中存贮的基本对象。中存贮的基

28、本对象。 数据库(数据库(database,DB)是长期存储在计算机)是长期存储在计算机内、有组织的、统一管理的相关数据的集合。内、有组织的、统一管理的相关数据的集合。DB能为各种用户共享,具有较小冗余度、数据能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等。间联系紧密而又有较高的数据独立性等。5.2.1 数据库技术与数据库管理系统 数据库管理系统(数据库管理系统(database management system,DBMS)是位于用户与操作系统之间的)是位于用户与操作系统之间的一层数据管理软件,它为用户或应用程序提供访问一层数据管理软件,它为用户或应用程序提供访问D

29、B的方法,包括的方法,包括DB的建立、查询、更新及各种数的建立、查询、更新及各种数据控制,并能够保证数据的安全性、完整性。据控制,并能够保证数据的安全性、完整性。 数据库系统(数据库系统(database system,DBS)是实现)是实现有组织地、动态地存储大量关联数据,方便多用户有组织地、动态地存储大量关联数据,方便多用户访问的计算机硬件、软件和数据资源组成的系统,访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。一般由数据即它是采用数据库技术的计算机系统。一般由数据库、数据库管理系统、应用系统、数据库管理员和库、数据库管理系统、应用系统、数据库管理员和用户构

30、成。用户构成。5.2.1 数据库技术与数据库管理系统2. 数据库的三级模式数据库的三级模式 在数据模型中有型(在数据模型中有型(type)和值()和值(value)的概)的概念。念。 型是指对某一类数据的结构和属性的说明,值是型是指对某一类数据的结构和属性的说明,值是型的一个具体赋值。型的一个具体赋值。 例如:学生记录的型为(学号,姓名,性别,系例如:学生记录的型为(学号,姓名,性别,系别,年龄,籍贯),该记录型的一个记录值为别,年龄,籍贯),该记录型的一个记录值为(900201,李明,男,计算机,李明,男,计算机,22,江苏)。,江苏)。5.2.1 数据库技术与数据库管理系统(1)三级模式)

31、三级模式 数据库系统采用外模式、模式和内模式三级模式数据库系统采用外模式、模式和内模式三级模式结构结构 5.2.1 数据库技术与数据库管理系统模式(模式(schema)又叫逻辑模式、概念模式。)又叫逻辑模式、概念模式。模式是数据库中全体数据的逻辑结构和特性的描模式是数据库中全体数据的逻辑结构和特性的描述,是所有用户的公共数据视图。述,是所有用户的公共数据视图。DBMS提供数据定义语言提供数据定义语言DDL来描述逻辑模式,来描述逻辑模式,严格定义数据的逻辑结构(数据项的名字、类型、严格定义数据的逻辑结构(数据项的名字、类型、取值范围等)以及数据间的相互关系和数据的约取值范围等)以及数据间的相互关

32、系和数据的约束等。束等。5.2.1 数据库技术与数据库管理系统模式仅仅涉及到型的描述,不涉及到具体的值。模式仅仅涉及到型的描述,不涉及到具体的值。模式的一个具体值称为模式的一个实例。同一个模式的一个具体值称为模式的一个实例。同一个模式可以有很多实例。模式是相对稳定的,而实模式可以有很多实例。模式是相对稳定的,而实例是相对变动的。例是相对变动的。模式反映的是数据的结构及其关系,而实例反映模式反映的是数据的结构及其关系,而实例反映的是数据库某一时刻的状态。数据库中的数据经的是数据库某一时刻的状态。数据库中的数据经常变化,而数据库的结构在一定时间范围内不会常变化,而数据库的结构在一定时间范围内不会改

33、变。改变。5.2.1 数据库技术与数据库管理系统内模式(内模式(internal schema)又叫物理模式、)又叫物理模式、存储模式。内模式是数据在数据库系统的内部存储模式。内模式是数据在数据库系统的内部表示,即对数据的物理结构表示,即对数据的物理结构/存储方式的描述。存储方式的描述。 外模式(外模式(external schema)又叫用户模式、)又叫用户模式、子模式。外模式是模式的子集,是与某一应用子模式。外模式是模式的子集,是与某一应用有关的数据的逻辑表示。有关的数据的逻辑表示。5.2.1 数据库技术与数据库管理系统(2)两级映象)两级映象 在三级模式中提供了两级映象,这不仅在三级数在

34、三级模式中提供了两级映象,这不仅在三级数据库模式之间建立了联系,也保证了数据库系统据库模式之间建立了联系,也保证了数据库系统的数据独立性的数据独立性,如图所示。如图所示。 外模式外模式/模式映象定义并保证了外模式和模式之间模式映象定义并保证了外模式和模式之间的对应关系。的对应关系。5.2.1 数据库技术与数据库管理系统 数据库系统投入使用后,可能有必要修改模式数据库系统投入使用后,可能有必要修改模式(如增加新关系、属性、改变类型),这时可以(如增加新关系、属性、改变类型),这时可以重新定义外模式重新定义外模式/模式映象,而使现存外模式和应模式映象,而使现存外模式和应用程序保持不变,保证了数据的

35、逻辑独立性。用程序保持不变,保证了数据的逻辑独立性。 这些映象定义通常包含在各自外模式的描述中。这些映象定义通常包含在各自外模式的描述中。5.2.1 数据库技术与数据库管理系统 模式模式/内模式映象定义并保证了模式和内模式之间内模式映象定义并保证了模式和内模式之间的对应关系。的对应关系。 当内模式发生变化时,重新定义模式当内模式发生变化时,重新定义模式/内模式映象,内模式映象,从而使模式和外模式保持不变,建立在外模式上从而使模式和外模式保持不变,建立在外模式上的应用程序也保持不变,保证了数据的物理独立的应用程序也保持不变,保证了数据的物理独立性。该映象定义通常包含在模式描述中。性。该映象定义通

36、常包含在模式描述中。5.2.1 数据库技术与数据库管理系统3. 数据模型(数据模型(data model)(1) 概述概述 模型是现实世界事物特征的模拟和抽象。如航模飞模型是现实世界事物特征的模拟和抽象。如航模飞机是对实际飞机的模拟和抽象,它不是真正的飞机,机是对实际飞机的模拟和抽象,它不是真正的飞机,但又真实的反映了实际飞机的属性和特征。但又真实的反映了实际飞机的属性和特征。 为便于人和计算机都能理解,信息抽象采用逐步为便于人和计算机都能理解,信息抽象采用逐步抽象的方法,把数据模型分成两个不同的层次:抽象的方法,把数据模型分成两个不同的层次: 按用户的观点来对现实世界的抽象称为概念模型按用户

37、的观点来对现实世界的抽象称为概念模型(也称信息模型);(也称信息模型); 以计算机系统的观点模拟现实世界的模型叫做数据以计算机系统的观点模拟现实世界的模型叫做数据模型。模型。 5.2.1 数据库技术与数据库管理系统也就是说,首先按人们的认识观点将现实世界抽象也就是说,首先按人们的认识观点将现实世界抽象为信息世界的概念模型,然后再通过数据模型将信为信息世界的概念模型,然后再通过数据模型将信息世界转换为机器(计算机)世界。数据模型又可息世界转换为机器(计算机)世界。数据模型又可进一步细分为逻辑(数据)模型和物理(数据)模进一步细分为逻辑(数据)模型和物理(数据)模型两个分层次。如型两个分层次。如下

38、下图图所示。所示。模型的转换模型的转换 5.2.1 数据库技术与数据库管理系统 概念模型(概念模型(conceptual data model,CDM) 概念模型就是概念层次的数据模型,简称为概念概念模型就是概念层次的数据模型,简称为概念模型。是现实世界的事物经过人脑的抽象加工,模型。是现实世界的事物经过人脑的抽象加工,提取出对用户有用的信息,经过组织整理加工形提取出对用户有用的信息,经过组织整理加工形成的。成的。 概念模型按用户的观点来对现实世界进行建模,概念模型按用户的观点来对现实世界进行建模,这种建模方法是缺乏计算机知识的用户最容易理这种建模方法是缺乏计算机知识的用户最容易理解的,并便于

39、和数据库设计人员进行交流,是系解的,并便于和数据库设计人员进行交流,是系统分析员、程序设计员、维护人员、用户之间相统分析员、程序设计员、维护人员、用户之间相互理解的共同语言;互理解的共同语言; 概念模型必须转换成逻辑模型,才能在概念模型必须转换成逻辑模型,才能在DBMS中中实现实现。5.2.1 数据库技术与数据库管理系统 逻辑模型(逻辑模型(logical data model,LDM) 逻辑数据模型是用户通过数据库管理系统看到的逻辑数据模型是用户通过数据库管理系统看到的现实世界,它描述了数据库数据的整体结构。是现实世界,它描述了数据库数据的整体结构。是具体的具体的DBMS所支持的数据模型,不

40、同的所支持的数据模型,不同的DBMS提供了不同的逻辑数据模型,如层次模型、网状提供了不同的逻辑数据模型,如层次模型、网状模型、关系模型、面向对象模型等。模型、关系模型、面向对象模型等。5.2.1 数据库技术与数据库管理系统 物理模型(物理模型(physical data model,PDM) 物理数据模型用来描述数据的物理存储结构和存物理数据模型用来描述数据的物理存储结构和存储方法,面向具体的储方法,面向具体的DBMS,面向操作系统和机,面向操作系统和机器。器。PDM不仅与具体的不仅与具体的DBMS有关,还与操作系有关,还与操作系统和硬件有关。统和硬件有关。 每一种逻辑模型在实现时都有其对应的

41、物理模型。每一种逻辑模型在实现时都有其对应的物理模型。DBMS为保证其独立性和可以执行,大部分为保证其独立性和可以执行,大部分PDM的实现工作由系统自动完成,而设计者只设计某的实现工作由系统自动完成,而设计者只设计某些特殊结构。也就是说,一般用户看不到物理数些特殊结构。也就是说,一般用户看不到物理数据结构,所以无须过多了解。据结构,所以无须过多了解。5.2.1 数据库技术与数据库管理系统(2)概念模型)概念模型 实体实体-联系模型(简称联系模型(简称E-R模型)是由模型)是由P.P.Chen于于1976年首先提出的。它提供不受任何年首先提出的。它提供不受任何DBMS约束约束的面向用户的表达方法

42、,在数据库设计中被广泛的面向用户的表达方法,在数据库设计中被广泛用作数据建模的工具。用作数据建模的工具。 E-R数据模型问世后,经历了许多修改和扩充。数据模型问世后,经历了许多修改和扩充。分类分类E-R模型的构成成分是实体集、属性和联系模型的构成成分是实体集、属性和联系集集.5.2.1 数据库技术与数据库管理系统 E-R图为实体图为实体-联系图,提供了表示实体型、属性联系图,提供了表示实体型、属性和联系的方法,用来描述现实世界的概念模型。和联系的方法,用来描述现实世界的概念模型。 构成构成E-R图的基本要素是实体型、属性和联系,图的基本要素是实体型、属性和联系,其表示方法为:其表示方法为: 实

43、体型:用矩形表示,矩形框内写明实体名;实体型:用矩形表示,矩形框内写明实体名; 属性:用椭圆形表示,并用无向边将其与相应属性:用椭圆形表示,并用无向边将其与相应的实体连接起来;的实体连接起来; 联系:用菱形表示,菱形框内写明联系名,并联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(边旁标上联系的类型(1 : 1,1 : n或或m : n)。)。5.2.1 数据库技术与数据库管理系统联系示意图联系示意图 5.2.1 数据库技术与数据库管理系统(3) 概念模型的表示方法概念模型的表示方法 最常用的概念模

44、型表示方法是实体最常用的概念模型表示方法是实体联系方法,联系方法,该方法用该方法用E-R图来描述某一组织的概念模型。图来描述某一组织的概念模型。 E-R图用矩形方框表示实体集合,方框内标明图用矩形方框表示实体集合,方框内标明实体集合名称;实体集合名称; 用椭圆框表示属性,通过无向边连接到实体集。用椭圆框表示属性,通过无向边连接到实体集。只有一个属性的实体集可用属性代替,附加到只有一个属性的实体集可用属性代替,附加到它参加的联系上;它参加的联系上;5.2.1 数据库技术与数据库管理系统 如某属性为实体的关键字,用下划线在属性名如某属性为实体的关键字,用下划线在属性名上标明;上标明; 用菱形框表示

45、联系,框内标明联系的名称,通用菱形框表示联系,框内标明联系的名称,通过无向边连接到参加联系的每个实体集合;过无向边连接到参加联系的每个实体集合; 在用无向边连接联系到实体集时,在边上注明在用无向边连接联系到实体集时,在边上注明1或或n(多)来标明联系的类型。(多)来标明联系的类型。 若实体之间联系也具有属性,则把属性和菱形若实体之间联系也具有属性,则把属性和菱形代表的实体联系也用无向边连接上。代表的实体联系也用无向边连接上。 5.2.1 数据库技术与数据库管理系统例如,一个学生可选多门课程,而一门课程又有例如,一个学生可选多门课程,而一门课程又有多个学生选修,一个教师至多可讲三门课程,一多个学

46、生选修,一个教师至多可讲三门课程,一门课程至多只有一个教师教授,该教学组织的门课程至多只有一个教师教授,该教学组织的E-R图如图所示。图如图所示。 教学教学E-R模型模型 5.2.1 数据库技术与数据库管理系统(3) (逻辑)数据模型(逻辑)数据模型 数据模型三要素数据模型三要素 逻辑数据模型是数据库系统的核心和基础,常逻辑数据模型是数据库系统的核心和基础,常简称为数据模型。逻辑数据模型包含数据结构、简称为数据模型。逻辑数据模型包含数据结构、数据操作和数据完整性约束三个部分,称为数数据操作和数据完整性约束三个部分,称为数据模型三要素。据模型三要素。5.2.1 数据库技术与数据库管理系统 数据结

47、构描述数据的静态特征,是指对实体类数据结构描述数据的静态特征,是指对实体类型和实体间联系的描述。型和实体间联系的描述。 数据操作描述数据的动态特征,是指对数据库数据操作描述数据的动态特征,是指对数据库中各种数据对象允许执行的操作的集合。中各种数据对象允许执行的操作的集合。 数据约束条件是一组数据完整性规则的集合,数据约束条件是一组数据完整性规则的集合,给出数据及其联系应具有的制约和依赖规则,给出数据及其联系应具有的制约和依赖规则,数据库中的数据必须满足这组规则。数据库中的数据必须满足这组规则。5.2.1 数据库技术与数据库管理系统 常见数据模型常见数据模型 数据模型主要有层次模型、网状模型、关

48、系模型、数据模型主要有层次模型、网状模型、关系模型、面向对象模型等四种。面向对象模型等四种。 层次模型(层次模型(hierarchical model)用树形结构来)用树形结构来表示各类实体以及实体间的联系。记录类型描述表示各类实体以及实体间的联系。记录类型描述的是实体,对应一个节点,字段描述实体的属性。的是实体,对应一个节点,字段描述实体的属性。上层节点叫父节点,下层节点叫子节点,同一双上层节点叫父节点,下层节点叫子节点,同一双亲的节点叫兄弟节点。只有一个节点没有双亲节亲的节点叫兄弟节点。只有一个节点没有双亲节点,称之为根节点。根以外的其它节点有且只有点,称之为根节点。根以外的其它节点有且只

49、有一个双亲节点。一个双亲节点。5.2.1 数据库技术与数据库管理系统 网状模型(网状模型(network model):用有向图结构表):用有向图结构表示实体类型及实体间联系的数据模型。与层次模示实体类型及实体间联系的数据模型。与层次模型一样每个节点表示一个记录类型,每个记录类型一样每个节点表示一个记录类型,每个记录类型可包含若干个字段,节点之间的连线表示记录型可包含若干个字段,节点之间的连线表示记录类型间的联系。类型间的联系。 关系模型(关系模型(relational model):用二维表表示实):用二维表表示实体和实体之间的联系。体和实体之间的联系。5.2.1 数据库技术与数据库管理系统

50、 面向对象模型(面向对象模型(object-oriented model):面向):面向对象程序设计方法和面向对象数据库技术相结合对象程序设计方法和面向对象数据库技术相结合就产生了面向对象数据库系统。就产生了面向对象数据库系统。 面向对象模型将实体视为对象,对象是现实世界面向对象模型将实体视为对象,对象是现实世界中实体的模型化。中实体的模型化。5.2.1 数据库技术与数据库管理系统(4)关系模型和关系数据库)关系模型和关系数据库 关系模型中数据的逻辑结构是一张二维表。关系数关系模型中数据的逻辑结构是一张二维表。关系数据库系统是支持关系模型的数据库系统。例如,下据库系统是支持关系模型的数据库系统

51、。例如,下表的学生数据表表示了一个学生关系模型。表的学生数据表表示了一个学生关系模型。5.2.1 数据库技术与数据库管理系统 关系常用术语关系常用术语 通常由行和列组成的二维表就是关系(通常由行和列组成的二维表就是关系(relation);); 表中的一行即为一个元组(表中的一行即为一个元组(tuple);); 表中的一列即为一个属性(表中的一列即为一个属性(attribute),属性有名),属性有名与值的区别;由属性名组成的表头为框架与值的区别;由属性名组成的表头为框架(framework)(关系的型);)(关系的型); 元组中的一个属性值(字段值)称分量元组中的一个属性值(字段值)称分量(

52、component);); 属性的取值范围是域(属性的取值范围是域(domain););5.2.1 数据库技术与数据库管理系统 可以唯一确定一个元组的一个属性或属性组为可以唯一确定一个元组的一个属性或属性组为候选码(候选码(candidate key,可简称为码);,可简称为码); 一个关系中常有多个候选码,可指定一个为主一个关系中常有多个候选码,可指定一个为主码;码; 对关系的描述是关系模式(对关系的描述是关系模式(relation model),),一般表示为:关系名(属性一般表示为:关系名(属性1,属性,属性2,属,属性性n)。)。 其中关系的主码用下划线指明,如:学生(学其中关系的主码

53、用下划线指明,如:学生(学号,姓名,性别,系别,年龄,政治面貌)。号,姓名,性别,系别,年龄,政治面貌)。5.2.1 数据库技术与数据库管理系统 关系操作关系操作 关系数据模型的理论基础是集合论,关系操作采用关系数据模型的理论基础是集合论,关系操作采用集合操作方式,即操作的对象和结果都是集合。集合操作方式,即操作的对象和结果都是集合。 关系操作主要包含传统集合运算(并、交、差等)关系操作主要包含传统集合运算(并、交、差等)和专门的关系运算(选择、投影、连接等)。和专门的关系运算(选择、投影、连接等)。 投影操作是对一个关系进行垂直分割,从二维表中投影操作是对一个关系进行垂直分割,从二维表中选出

54、所需要的列,消去其他列,并重新安排列的顺选出所需要的列,消去其他列,并重新安排列的顺序。序。5.2.1 数据库技术与数据库管理系统 选择操作是根据某些条件对关系做水平分割,即选择操作是根据某些条件对关系做水平分割,即选取符合条件的元组。选取符合条件的元组。 联接是对两个关系的运算,它是将两个关系在给联接是对两个关系的运算,它是将两个关系在给定的属性上满足给定条件的元组连接起来而得到定的属性上满足给定条件的元组连接起来而得到的一个新的关系。的一个新的关系。5.2.1 数据库技术与数据库管理系统4. 数据库技术发展的趋势数据库技术发展的趋势 (1)下一代数据库技术的发展主流)下一代数据库技术的发展

55、主流 面向对象的数据库技术将成为下一代数据库技面向对象的数据库技术将成为下一代数据库技术发展的主流术发展的主流 。 部分学者认为现有的关系型数据库无法描述现实世部分学者认为现有的关系型数据库无法描述现实世界的实体界的实体 ,而面向对象的数据模型由于吸收了已经成而面向对象的数据模型由于吸收了已经成熟的面向对象程序设计方法学的核心概念和基本思熟的面向对象程序设计方法学的核心概念和基本思想想 ,使得它符合人类认识世界的一般方法使得它符合人类认识世界的一般方法 ,更适合描更适合描述现实世界。述现实世界。 甚至有人预言甚至有人预言 ,数据库的未来将是面向对象的时代。数据库的未来将是面向对象的时代。 5.

56、2.1 数据库技术与数据库管理系统(2)数据库技术发展的新方向)数据库技术发展的新方向 非结构化数据库是部分研究者针对关系数据非结构化数据库是部分研究者针对关系数据库模型过于简单库模型过于简单 ,不便表达复杂的嵌套需要以及支不便表达复杂的嵌套需要以及支持数据类型有限等局限持数据类型有限等局限 ,从数据模型入手而提出的从数据模型入手而提出的全面基于因特网应用的新型数据库理论。全面基于因特网应用的新型数据库理论。5.2.1 数据库技术与数据库管理系统 他们认为这种数据库的最大区别就在于它突破了他们认为这种数据库的最大区别就在于它突破了关系数据库结构定义不易改变和数据定长的限制关系数据库结构定义不易

57、改变和数据定长的限制 ,支持重复字段、子字段以及变长字段并实现了对支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存变长数据和重复字段进行处理和数据项的变长存储管理储管理 ,在处理连续信息在处理连续信息 (包括全文信息包括全文信息 )和非结构和非结构信息信息 (重复数据和变长数据重复数据和变长数据 )中有着传统关系型数中有着传统关系型数据库所无法比拟的优势。据库所无法比拟的优势。5.2.1 数据库技术与数据库管理系统(3)数据库技术发展的又一趋势)数据库技术发展的又一趋势 有学者指出有学者指出 :数据库与学科技术的结合将会建立一数据库与学科技术的结合将会建立一

58、系列新数据库系列新数据库 ,如分布式数据库、并行数据库、知如分布式数据库、并行数据库、知识库、多媒体数据库等识库、多媒体数据库等 ,这将是数据库技术重要的这将是数据库技术重要的发展方向。发展方向。 其中其中 ,许多研究者都对多媒体数据库作为研究的重许多研究者都对多媒体数据库作为研究的重点点 ,并认为多媒体技术和可视化技术引入多媒体数并认为多媒体技术和可视化技术引入多媒体数据库将是未来数据库技术发展的热点和难点。据库将是未来数据库技术发展的热点和难点。 未来数据库技术及市场发展的两大方向分别为数未来数据库技术及市场发展的两大方向分别为数据仓库和电子商务据仓库和电子商务. 面向专门应用领域的数据库

59、技术面向专门应用领域的数据库技术 5.2.1 数据库技术与数据库管理系统5. 数据库管理系统的代表数据库管理系统的代表 (1) Oracle (2) Postgre SQL (3)Microsoft SQL Server (4) Microsoft Access 5.2.2 数据仓库1.什么是数据仓库什么是数据仓库(Data Warehouse,DW) 数据仓库之父比尔数据仓库之父比尔恩门(恩门(Bill Inmon)在)在1991年出版的年出版的“Building the Data Warehouse”(建立数据仓库建立数据仓库)一书中所提出的定义被广)一书中所提出的定义被广泛接受,数据仓库

60、是一个面向主题的(泛接受,数据仓库是一个面向主题的(Subject Oriented)、集成的()、集成的(Integrate)、相对稳定)、相对稳定的(的(Non-Volatile)、反映历史变化()、反映历史变化(Time Variant)的数据集合,用于支持管理决策。)的数据集合,用于支持管理决策。 5.2.2 数据仓库 数据仓库是一个过程而不是一个项目;数据仓库数据仓库是一个过程而不是一个项目;数据仓库是一个环境,而不是一件产品。是一个环境,而不是一件产品。 数据仓库提供用户用于决策支持的当前和历史数数据仓库提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论