全国计算机等级考试三级数据库备战资料_第1页
全国计算机等级考试三级数据库备战资料_第2页
全国计算机等级考试三级数据库备战资料_第3页
全国计算机等级考试三级数据库备战资料_第4页
全国计算机等级考试三级数据库备战资料_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.第一章 计算机基础知识1、冯.诺依曼计算机以“存储程序”原理为基础,由运算器(对数据进行加工的部件)、存储器、控制器(对指令的解释和执行)、输入设备和输出设备等五大部件组成。2、计算机指令系统:系列计算机:指令系统向下兼容。 计算机所能执行的操作称为指令复杂指令系统计算机:CISC精简指令系统计算机:RISC 指令系统的类型:数据传送类指令(mov)、算术逻辑类指令(add)和判定控制类指令(cmp)。指令系统的寻址方式:立即寻址(立即数寻址),指令中直接给出操作数。寄存器寻址:操作数在寄存器中。直接寻址:指令中直接给出操作数地址。 寄存器间接寻址:寄存器给出操作数地址。寄存器相对寻址:指令

2、中给出操作数的地址偏移量3、微型处理器分类:通用微处理器、嵌入式微处理器和数字信号处理器等4、总线: 可分为数据总线,地址总线,控制总线PCI:不依附具体处理器的局部总线。 USB:通用串行总线。1394总线:FireWire,为家用电器研制的一种高速串行总线。1394总线在数字视频设备(数字摄像机)中广泛应用。5,语言处理程序的任务就是将高级语言编写的源程序编译成机器语言。5、计算机的技术指标:运算速度MIPS(每秒百万条指令)影响计算机运算速度的因素很多,主要是CPU的主频和存储器的存取周期。存储器容量:基本单位B(Byte) 1KB=1024Byte 1MB=1024KB 1GB=102

3、4MB 1TB=1024GB数据传输率:基本单位bps(每秒传输多少位) 1Kbps=103bps 1Mbps=103Kbps 1Gbps=103Mbps6、计算机中的信息表示非数字信息的表示:ASCII码汉字的表示:三类代码体系:输入码,如:拼音码、五笔字形码等;机内码;交换码,如GB2312-80;6.计算机辅助系统:计算机辅助设计(CAD),制造(CAM),测试(CAT),教学(CAI)7,八进制转换为二进制:把每位八进制数分别转换为二进制。8,对于正整数:原码,反码,补码都是正数本身;对于负整数,原码符号位为1,数值部分取其绝对值;反码符号位为1,其他位是原码取反;补码符号位为1,其他

4、位是原码取反,末位加1.7、计算机网络基础计算机网络的基本特征:资源共享。广域网与广域网的互联是通过路由器实现的。传输技术分为: 广播式网络(通过一条公共信道实现)点-点式网络(通过存储转发实现)。采用分组存储转发与路由选择是点-点式网络与广播网络的重要区别之一按规模分类:局域网(LAN)FDDI(以太网采用最通用的通信协议标准传输快)、城域网(MAN)、广域网(WAN)广域网(远程网)以下特点:1 适应大容量与突发性通信的要求。2 适应综合业务服务的要求。3 开放的设备接口与规范化的协议。4 完善的通信服务与网络管理。几种常见的广域网的特点:X.25:第一个数据公共网络,建立在速率低、误码率

5、高的电缆介质上,X.25协议包括差错控制、流量控制和拥塞控制等,由通信子网完成,有时间延迟。FR(帧中继):建立在速率高、误码率低的光纤上,对X.25协议进行简化,差错控制由用户终端完成。B-ISDN(宽带综合业务数字网)、N-ISDN(窄带综合业务数字网)提供标准用户接口,使对终端用户透明。ATM(异步传输模式,一种数据传输与分组交换技术,能满足多媒体应用的高速率与低延迟的要求,具有线路交换实时性好和分组交换灵活性好的双重优点。各种城域网建设方案有几个相同点:传输介质采用光纤,交换接点采用基于IP交换的高速路由交换机或ATM交换机,在体系结构上采用核心交换层,业务汇聚层与接入层三层模式。城域

6、网MAN介于广域网与局域网之间的一种高速网络。8、网络协议为三部分:(1)语法,即用户数据与控制信息的结构和格式;(2)语义,即需要发出何种控制信息,以及完成的动作与做出的响应;(3)时序,即对事件实现顺序的详细说明.9、Internet的结构和组成 协议:TCP/IP协议组TCP/IP参考模型可以分为:应用层,传输层(TCP、UDP协议),网络层(IP协议),主机-网络层应用层协议分为:a、依赖于面向连接的TCP协议: 文件传送协议FTP、电子邮件协议SMTP,超文本传输协议HTTP。b、依赖于面向连接的UDP协议:主要有简单网络管理协议SNMP;简单文件传输协议TFTP。c、既依赖于TCP

7、协议,也可以依赖于UDP协议:域名服务DNS等。d、网络终端协议:Telnet;网络文件系统 NFS;路由信息协议RIP。10、域名与IP地址:IP地址由网络地址和机器地址组成:IP地址长度为32位,X.X.X.X表示,X为8为,表示0-255,(点分十进制地址)。主要分为A类(网络地址7位,机器地址24位)、B类(网络地址14位,机器地址16位)、C类(网络地址21位,机器地址8位);域名 格式 主机名.组名.网点名 主机名和IP地址一一对应,访问主机可使用主机名,也可以使用它的IP地址。11、Internet 提供的服务(1)WWW服务:采用客户机/服务器模式a、超文本(采用非线性的网状结

8、构组织信息形式)和超媒体是WWW的信息组织形式b、HTML(超文本标记语言,网页语言)和HTTP(超文本传输协议)是WWW工作的基础c、URL(统一资源定位器):查找主页。由三部分组成:协议类型,主机名和文件名及路径比如:http://index.htm,其中http为协议类型,为主机名,index.htm为文件名及路径(2)电子邮件服务: 电子邮件发送接收协议:发送协议,简单邮件传送协议(SMTP),接收协议,可以使用邮局协议(POP3)和交互式邮件存取协议(Interactive Mail Access Protocol,IMAP)电子邮件内容协议 MIME(Mul

9、tipurpose Internet Mail Extensions),可以传送图像、声音等多媒体信息12、Internet的接入:ISP(Internet Service Provider,ISP)Internet服务提供商接入Internet的方式:局部网接入、电话线接入ADSL非对称数字用户环路,基于电话线,上、下行传输速率不同,上行可达1Mbps;下行可达8Mbps。13信息安全基础信息安全包括四方面内容: 保密性、 完整性、 可用性、 可控性(1)密码体制:加密或密码体制由5部分组成:明文空间(明文的集合)、密文空间(密文集合)、加密密钥空间、解密密钥空间、加密和解密算法集 通常加密

10、和解密算法的操作都是在一组密钥控制下完成(加密密钥,解密密钥)。单钥加密体制分为两类:流密码(明文逐位加密)和分组密码(明文分组,逐组加密)。密钥的分配和存储是最关键和困难的问题。(2)信息认证:主要的有数字签名技术、身份识别技术和信息的完整性校验技术(消息认证)(3)恶意软件:特洛依木马(较为原始的攻击方式,在普通程序中隐含非法功能代码程序)、登录陷阱(网络钓鱼,虚假页面窃取用户密码账户)、逻辑炸弹(在程序中设置的破环代码)僵尸网络:一对多进行控制后门陷阱(内部人员造成的安全漏洞,在程序中设置的绕开登录进入系统)、缓冲区溢出、网络防病毒软件:允许用户设置3中扫描方式: 实时扫描、预置扫描、人

11、工扫描(4)网络安全 网络安全服务的主要内容:安全攻击、安全机制、安全服务网络服务攻击分类: 服务攻击和非服务攻击服务攻击:对服务器发起攻击,丧失服务能力,比如对WWW服务器攻击,主页被篡改。拒绝服务DoS或DdoS分布式拒绝服务。 非服务攻击:对通信设备攻击,使设备瘫痪网络信息攻击类型:截获、窃听、篡改和伪造等14、操作系统安全操作系统的安全措施一般可以从隔离、分层和内控3个方面来进行考虑。隔离可分为:(注意后面的解释)物理隔离:使不同安全要求的进程使用不同物理实体。时间隔离:使不同进程在不同时间运行。逻辑隔离:限制程序存取。密码隔离:进程以其他进程不知的方式隐蔽数据和计算。操作系统安全措施

12、:访问控制、存储保护及文件保护与保密。访问控制:认证、访问权限、文件保护、审计。存储保护:防止地址越界、防止操作越权。第二章 数据结构算法1、数据:数据的基本单位是数据元素。数据元素可由一个或多个数据项组成。数据项是数据的不可分割的最小单位,其值能唯一确定一个数据元素的数据项称作关键码。有时也把数据项称作域,字段等。2、数据结构:数据的逻辑结构(线性和非线性结构)、数据的存储结构、数据的运算(检索,插入,删除,更新排序)3、主要的数据存储方式:顺序存储结构(逻辑和物理相邻,存储密度大)和链式存储结构顺序存储结构:顺序存储计算公式 LiL0(i1)×K 顺序结构可以进行随机存取;插人、

13、删除运算会引起相应节点的大量移动 链式存储结构:a、指针域可以有多个,可以指向空,比顺序存储结构的存储密度小 b、逻辑上相邻的节点物理上不一定相邻。 c、插人、删除等不需要大量移动节点4、顺序表:一般情况下,若长度为n的顺序表,在任何位置插入或删除的概率相等,元素移动的平均次数为n/25、链表:线性链表(单链表和双向链表等)和非线性链表线性链表也称为单链表,其每个一节点中只包含一个指针域,双链表中,每个节点中设置有两个指针域。单链中插入: q . link:Plink: 删除:q:p . link; p . link:q; p. link:qlink;双链插入:q . llink:P:qrli

14、nk:Prlink; Prlink . link:q; prlink:q; 删除:p . llink. rlink:p. rlink; Prlink. llink:Pllink;6、栈:“后进先出”(LIFO)表。栈的应用:表达式求解、二叉树对称序周游、快速排序算法、递归过程的实现等 Top(s,x)把栈S的栈顶元素读到变量x中。7、队列:“先进先出”线性表。应用:树的层次遍历 enq:插入 deq:删除 8、串:由零个或多个字符组成的有限序列。串中字符的数目就是串的长度。9、多维数组的顺序存储:10、稀疏矩阵的存储:下三角矩阵顺序存储其他常见的存储方法还有三元组法和十字链表法(链式存储法)1

15、1、广义表:由零个或多个单元素或子表所组成的有限序列。广义表的元素可以是子表,而子表的元素还可以是子表12、树型结构:非线性结构。常用的树型结构有树和二叉树。二叉树与树的区别:二叉树不是树的特殊情况,树和二叉树之间最主要的区别是:二叉树的节点的子树要区分左子树和右子树,即使在节点只有一棵子树的情况下也要明确指出该子树是左子树还是右子树。13、树转换成二叉树:(1)在兄弟结点之间加条连线 (2)对每一个节点,只保留它与第一个子节点的连线,与其他子节点连线全部抹掉 (3)以树根为轴心,顺时针旋转45。 一棵树转换为二叉树后,根节点没有右子树14、二叉树和树的周游(遍历) 二叉树的周游主要有以下3种

16、方式:前序法(NLR根,左,右)、对称序法(LNR)、后序法(LRN左右根) 周游树和树林:深度优先和按广度优先两种方式进行。深度优先方式又可分为按先根次序和按后根次序周游 树与二叉树周游之间的对应关系:按先根次序周游树正好与按前序法周游树对应的二叉树等同,后根次序周游树正好与按对称序法周游对应的二叉树等同 按广度优先方式就是层次次序周游若一个树叶(度为0的结点)是某二叉树的对称序最后一个结点,则它必是该二叉树前序最后一个结点。15、二叉树的存储和线索 二叉树的存储结构:二叉树的llink一rlink法存储表示 线索二叉树:在有n个节点的二叉树的且llink - rlink法存储表示中,必定有

17、n+1个空指针域完全二叉树的顺序存储(按层次次序):当i<=n/2 结点i的左子女结点是2i 当i<=(n-1)/2 右子女结点2i+1完全二叉树:如果一棵树最多只有最下两层结点度小于2,并且结点都集中在该层的最左边若干位置上。16、哈夫曼树:一类带权路径长度最短的树。树的带权路径长度为树中所有叶子节点的带权路径长度之和WPL。WPL最小的不是完全二叉树,而是权大的叶子离根最近的二叉树。 用于数据通信的二进制编码。17、查找:(1)顺序查找:平均查找长度为(n +1 )/2次,时间复杂度为O(n)(2)二分法查找:线性表节点必须按关键码值排序,且线性表是以顺序存储方式存储的。查找成

18、功比较次数log2n,查找失败比较次数log2n+1(3)分块查找(既希望较快查找,又要动态变化):先是块间查找,然后块内查找。(4)散列表(哈希表Hash)的存储和查找:关键码值决定结点存储地址。平均检索长度不直接依赖于元素个数。处理冲突的方法:开地址法(线性探测法)、拉链法等负载因子(装填因子)=表实际存储的结点个数/表的最大能存储结点个数(即表长)二叉排序树(每个结点只包含一个关键码值):每个结点左子树的所有关键码值都小于该结点关键码值,右子树所有结点关键码值都大于该结点关键码值。对称周游二叉排序树,得到一个有序序列,时间复杂度O(log2n)平衡的二叉树排序(AVL树):任意结点的平衡

19、因子(其右子树减去左子树高度)均取值0,1 ,1B树和B+树(都是平衡多路查找树,都是动态索引结构):M阶树,每个结点至多有M-1个关键码,至少有M/2(取上界)-1个关键码。B树适合随机查找,不适合顺序查找。B+树适合顺序查找,也能随机查找一棵M阶B树或者为空。满足(1)每个结点至多有m棵子树。(2)根节点或为叶结点,或至少有两棵子树。(3)中间结点至少有m/2棵子树。M阶B+树(1)每个结点至多有m个子女(2)每个结点(除根外)至少有m/2个子女(3)根节点至少有2个子女对外存储器中的索引通常采用多路查找树结构。18、排序 直接插人排序(与初始状态无关)、希尔排序(缩小增量法)、直接选择排

20、序、堆排序、起泡排序、快速排序等排序算法要了解。直接选择排序、希尔排序、快速排序和堆排序是不稳定排序,其他排序为稳定排序堆分为大小根堆两种。对于小根堆1,若树根结点存在左(右)孩子,则根节点的值<=左(右)孩子结点值 2,以左右孩子为根子树又各是一堆。交换排序:两两比较2.快速排序 快速排序是口前内部排序中速度最快的一种排序算法,记录的比较和交换是从两端向中间进行的,排序码较大的记录一次就能够从前面交换到后面单元,排序码较小的记录一次就能够从后面交换到前面单元,记录每次移动的距离较远,总比较和移动次数较少。快速排序除了需要一个记录的辅助空间来存放每次选取的基准记录外,还需要一个栈空间来实

21、现递归。归并排序 归并是将两个或者多个有序表合并成一个有序表归井排序要求待排序文件已经部分排序。归并排序的基本思想是将这些已排过序的文件进行合并,得到完全排序的文件。 假设初始序列含有n个记录,则可看成是n个有序的子序列,每个子序列的长度为1,然后两两归并,得到n/2个长度为2或I的有序子序列,再两两归并,如此重复,直到得到一个长度为n的有序序列为止。这种排序方法称为二路归并排序。第三章 操作系统1、操作系统概念:一是管理系统中的各种资源;二是给用户提供一个友好的界面。2、操作系统包括以下3个基本特征:并发性、共享性、随机性。3、功能:进程管理(对处理器管理)、存储管理、作业管理、文件管理、设

22、备管理4、操作系统类型(1)批处理操作系统:成批、多道,交互性不强。系统目标:提高资源利用率、作业吞吐量和作业流程自动化。(2)分时操作系统:多路性、交互性、独立性、及时性 采用时间片轮转的方式 及时响应高可靠性(3)实时系统(实时控制、实时信息处理):及时响应、高可靠性 实时系统:能够及时响应各种外部事件并在规定时间内完成对事件处理。(4)嵌入式操作系统:高可靠性、实时性、占资源少、智能化、易连接、低成本等。5、操作系统与用户的接口:程序级接口:系统调用命令组成。操作级接口:提供操作命令系统调用:操作系统向用户提供的程序级服务,用户程序借助它可以向操作系统提出各种请求。6、操作系统的硬件环境

23、(CPU、存储体系、中断系统、I/O控制和时钟)(1)CPU状态:管态R0(CPU执行操作系统程序)和目态R3(CPU执行用户程序)较大的数字表示较低的特权 目态到管态的转变的唯一途径是中断,通过修改程序状态字实现管态和目态的转换(2)中断机制:中断的实现需要硬件和软件结合完成。中断类型:强迫性中断和自愿性中断。强迫性中断:不期望或不可预料的中断.如:输入输出中断(数据传输结束,设备出错)、硬件故障中断(掉电,内存校验错误)、时钟中断、程序性中断(缺页,缺段,溢出,除零等)。自愿性中断:程序有意安排的访管指令或系统调用。中断向量:中断处理程序的入口地址及运行环境(程序状态字PSW)中断优先级由

24、硬件规定,中断屏蔽由程序状态字的中断屏蔽位决定。通过中断屏蔽可以调整中断事件的响应次序中断屏蔽是提出中断请求后CPU不予响应的状态。中断响应是解决中断的发现和接受问题,是由中断装置完成的。 (3)定时装置:定时装置硬件时钟通常分为两类:即绝对时钟和相对时钟。 CPU对外部设备的控制方式:1、循环测试I/O 2、中断 3、DMA(直接内存存取):高速外设与内存批量处理数据 4、通道处理(I/O处理机)7、进程管理创建一个进程的主要任务是为它分配一个内存空间和一个进程控制块。(1)进程与程序的区别与联系:a.进程是程序的执行,是动态的;而程序是指令的集合,是静态的。 b.进程有生命周期,即进程的存

25、在是有限的,从运行到结束,是暂时的;而程序则是永久存在的。 c.进程包括程序、数据和进程控制块(PCB)。 d.一个程序可以有多个进程,一个进程也可以包含多个程序。进程控制块PCB是一个数据结构,进程在内存中存在的唯一标志(2)进程状态: 运行态, 就绪态,等待状态(阻塞状态)(3)线程:CPU调度和分派的基本单位。共享进程资源。(4)进程的通信 临界资源是指一次只允许一个进程使用的资源:一个进程中访问临界资源的那段程序代码称为临界区。它们不允许两个及以上的进程同时访问或修改。 进程同步:多个进程协同完成任务。进程互斥:多个进程使用同一资源(临界资源)。 低级通信:少量信息的交换(P操作和V操

26、作)解决进程的同步与互斥问题,既可用硬件实现,也可用软件实现。 信号量S的大小表示某类资源的数量。当S>0表还有资源可分配 S<0 其绝对值表示等待队列中进程数目。每执行一次P意味着要求分配一个资源;每执行一次V操作意味释放一个资源就有可能有另一个进程从等待进入就绪队列。 高级通信:大信息交换(消息机制(消息缓冲、信箱通信)、共享内存,管道) 进程(线程)调度:先来先服务、时间片轮转、最高优先级(紧迫度高的进程)、 多级队列反馈算法:综合了FCFS、时间片轮转和可抢占最高优先数算法。 线程属性:每个线程有唯一的标识符和一张线程描述表。 2,不同线程可以执行相同的程序 3,同一进程中

27、的各个线程共享进程的内存地址空间 4,线程是处理器的独立调度单位,多个线程可并发执行。(5)死锁:进程个数至少为两个产生死锁的必要条件:互斥条件、不可剥夺条件、部分分配、循环等待 死锁的预防:静态的, 破环必要条件之一:静态预分配(破坏部分分配)、资源有序分配(破坏环路等待)、 可剥夺资源(破坏不可剥夺性)死锁的避免:银行家算法,安全状态 死锁的检测:进程等待时检测、定时检测、系统利用率降低时检测死锁的解除:资源剥夺和撤销进程8、存储管理(1)功能:内存的分配和回收、内存共享、存储保护(防止地址越界和操作越权)、地址映射(地址重定位)地址映射。地址有物理地址和逻辑地址(又称相对地址)两个概念。

28、程序被调入主存时,首先要将程序的逻辑地址变换为物理地址,包括相应地调整程序中有关地址的指令,这个过程称为地址重定位。重定位的方法有两种:静态地址重定位和动态地址重定位 内存扩充:让外存当作内存来使用(2)碎片管理:解决碎片的方法是移动技术或紧凑(拼接)技术(3)静态地址重定位:程序装入内存时,进行逻辑地址转换物理地址转换动态地址重地位:程序运行过程中,要访问指令和数据才进行地址转换,需要硬件地址映射机制(基址寄存器和限长寄存器)(4)空闲分区的分配策略:最先适应算法(地址从小到大找第一个满足进程空间大小的分区) 最佳适应算法(最节约空间):分区表按容量从小到排序;最坏适应算法:分区按容量从大到

29、小排序。(5)虚拟存储管理:虚拟存储得以实现是由程序的局部性原理来决定的。程序的局部性原理包括时间局部性和空间局部 (6)页面淘汰算法包括以下几种:最佳淘汰算法(OPT)不可能达到、先进先出淘汰算法(FIFO)、最近最久末使用淘汰算法(LRU)最近使用最少淘汰算法(LFU)(访问次数少) (7)影响缺页中断次数因素:a、分配给进程的物理页面数 b.页面大小 c.程序本身的编制方法c、页面淘汰算法:最佳淘汰算法(OPT)能使缺页中断率最低(8)颠簸(抖动):缺页率高引起。工作集模型解决颠簸(抖动)9、文件管理(1)逻辑结构:流式文件(基本单位字符)(如:源程序文件、目标代码文件,Unix的文件)

30、和记录文件(定长和不定长记录),记录包含一个记录键和其他属性,可以只含记录键。(2)文件的物理结构:连续结钩、链接结构、索引结构及Hash结构等,文件的存取方式与物理结构有关。UNIX三级索引表的计算:如果一个物理块可以存放256个块号,则三级索引表表示文件的大小 2563+2562+256+10(3)文件目录:文件系统的最大特点就是“按名”存取(4)文件控制块FCB是文件在内存中存在的唯一标志,文件目录是文件控制块的有序集合。每个目录项就是一个文件控制块。 文件和文件控制一一对应(5)多级目录结构,有利于避免文件重名;当前目录:可以提高检索速度。目录项分解法,它可以提高文件检索速度(6)记录

31、的成组:若干个逻辑记录合成在一个物理块中,每个块中的逻辑记录个数为块因子。系统打开文件表:专门用于保存已打开文件的文件控制块。用户打开文件表:该表的内容有文件描述符,打开方式,读写指针,系统打开文件等。 在过程的进程控制块PCB中记录了“用户打开文件表”的位置, 在每个进程中,都有一个用户打开文件表 10、设备管理 (1)按设备的工作特性可以分为存储设备和输人输出设备两种 (2)按照资源分配方式可以分为独享设备、共享设备和虚拟设备3种 虚设备技术,一类设备模拟另一类设备的技术。在高速设备(如高速大容量磁盘)上模拟低速设备 :SPOOLING是典型的虚设备技术,被模拟的设备称为虚拟设备。 可以采

32、用虚拟设备技术提高独占设备的利用率,所采用的具体技术称为SPOOLING技术 (3)按设备的数据组织分类:块设备(磁盘、磁带)和字符设备(打印机)。 (4)通道可以分为以下3种类型:字节多路通道、选择通道和成组多路通道。 (5)单缓冲区,双缓冲区,多缓冲区和缓冲池:解决外设与CPU速度不匹配问题 (6)磁盘调度: 访问磁盘时间:寻道时间、旋转延迟时间和数据传输时间。 磁盘调度由移臂调度和旋转调度组成。移臂调度:先来先服务FCFS(大幅度移动)、最短寻道时间优先(饥饿,考虑了寻道优化),扫描算法(考虑方向和距离,考虑了寻道优化) 旋转调度:目的减少旋转延迟时间。第四章 数据库系统技术基础1、信息

33、与数据的关系:数据是信息的符号表示,或称载体;信息是数据的内涵,是数据的语义解释2,数据库(DataBase,简称DB)是长期存储在计算机内的有组织的、可共享的数据集合。其数据是按一定的数据模型组织、描述和存储的,具有较小的冗余度、较高的数据独立性和易扩展性,并可为一定范围内的各种用户共享 数据库中的数据通常可分为用户数据和系统数据。系统数据也称为数据字典或系统目录和元数据。3,数据库管理系统(DBMS)是指负责数据库存取、维护和管理的系统软件。它的基本功能有:数据定义功能、数据操作功能、数据库的运行管理和数据库的建立、维护功能。4,数据库系统(简称DBS )是指在计算机系统中引人数据库后的系

34、统构成。一般由数据库、操作系统、数据库管理系统(及其工具)、应用系统、数据库管理人员和用户构成。3、数据模型: 数据模型是数据库系统的数学形式框架,是数据库系统的核心和基础.4、数据模型的分类:概念模型,也称信息模型;逻辑模型,主要包括 网状模型(DBTG系统和CODASYL系统)、层次模型(IMS数据库管理系统)和关系模型等;物理模型 。5、数据模型的三要素:数据结构、数据操作和完整性约束。数据结构是所研究的对象类型的集合,用于描述系统的静态特征。数据的静态特征是指对数据结构和数据间联系的描述。数据结构是刻画一个数据模型性质最重要的方面。数据操作是指对数据库中各种对象的实例允许执行的操作的集

35、合,包括操作及相关的操作规则。数据完整性约束是一组完整性规则的集合完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态及状态的变化,以保证数据的正确、有效和相容。6、概念模型,信息世界建模,E-R模型是常用的概念模型。EER扩充E-R模型,面向对象模型、谓词模型。E-R图提供了表示实体型、属性和联系的方法。 (1)实体型:用矩形表示,矩形框内写明实体名。 (2)属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。 (3)联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型7、逻辑模型,面向数据库管理

36、系统。传统逻辑模型(层次、网状、关系)基于记录的模型。层次、网状模型用记录和链接表示数据和联系, 面向对象的模型,对象-关系模型都属于逻辑模型,基于对象。层次模型是数据库系统中最早出现的数据模型,用树型结构来表示各类实体及实体间的联系。层次模型的查询效率很高,但它只能表示I:N联系,对数据进行查询和更新操作时则很复杂,所以编写应用程序也很复杂。网状数据模型的特点是记录之间的联系通过指针来实现,M: N联系容易实现,查询效率较高。 关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型作为数据库的组织方式。用二维表格结构表示实体类型及实体间联系的模型称为关系模型。一个关系模型一般由多个二

37、维表组成。每张二维表称为一个关系。面向对象模型既是概念模型又是逻辑模型。每个对象有唯一的对象标志。每个对象的状态和行为被封装在一起。8、数据库系统的三级模式结构:由外模式、模式和内模式三级构成的。9、模式(Schema):一个数据库只有一个模式;外模式也称子模式或用户模式,一个数据库可以有多个外模式。外模式是保证数据库安全性的一个有力措施。内模式也称存储模式或物理模式,一个数据库只有一个内模式。模式也称概念模式或逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。模式实际是数据库数据在逻辑的视图。逻辑模式的基础是数据模型10. 数据库的二层映像与数据独立性:外模式模式

38、映像,包含在各自的外模式描述中。外模式模式映像保证了数据与程序的逻辑独立性(模式变,外模式不变);模式内模式映像,包含在模式描述中,模式内模式映像保证了数据与程序的物理独立性(物理模式变,模式不变,外模式不变)。 数据物理独立性:当数据物理存储结构改变,应用程序可以不变;逻辑独立性:数据逻辑结构改变,用户程序可不变。第五章 关系数据库系统1、关系模型由关系数据结构、关系操作集合和关系完整性约束3部分组成。 实体及实体间的联系都用关系表示,一个关系就是一张二维表(反之错),是关系模型中数据的逻辑结构。 数据库的数据完整性是指数据库中数据的正确性和相容性和一致性,那是一种语义概念,包括两个方面:与

39、现实世界中应用需求的数据的相容性和正确性数据库内数据之间的相容性和正确性。2、关系模型中的关系操作的理论依据为关系代数和关系演算。 关系操作的特点是集合操作方式。 关系语言的特点:高度非过程化。3、关系数据语言可以分为如下3类:关系代数语言、关系演算语言(包括元组关系演算语言和域关系演算语言)及具有关系代数和关系演算双重特点的SQL语言。4、关系模型中有3类完整性约束:实体完整性、参照完整性(引用完整性)和域完整性约束(用户自定义的完整性)关系从数学的观点来定义有以下两种解释。 (1)集合论观点:关系是一个元素个数为K(K,1)的元组集合。 (2)值域的观点:关系是属性值域笛卡儿积的一个子集。

40、 5、关系数据库对关系的限定当关系作为关系数据模型的数据结构时,关系数据库对关系有如下的限制。 (1)每一个关系仅仅有一种关系模式一种记录类型即每一列中的分量是同一类型的数据,来自同一个域。 (2)不同的列可以出自同一个域,称其中的每一列为一个属性,不同的属性要给予不同的属性名。 (3)列的顺序无关紧要,即列的次序可以任意交换。 (4)任意两个元组不能完全相同。 (5)行的顺序无关紧要,即行的次序可以任意交换。(6)每一个属性是不可分解的这是关系数据库对关系的最基本的一条限定。 6、关系模型的完整性约束:实体完整性关系的所有主属性都不能取空值,而不仅是主码整体不能取空值参照完整性规则:外键要么

41、取空值,要么等于被参照关系中某个元组的主码值。7、域完整性约束(用户有定义的完整性):对其他属性值域的约束,也称为域完整性规则,包括数据类型、精度、取值范围、是否允许空值等。8、关系代数(了解操作的执行结果)并、差、笛卡儿积、投影和选择为五种基本运算。9、传统的集合运算包括并RUSttRtS。、交RS=t|tRtSR一(R一s)。、差RS=ttRtS。和广义笛卡儿积4种运算。设关系R和s的分别是r元和s元关系,定义R和s的笛卡儿积是一个(r+s)元元组的集合;若R有m个元组,S有n个元组,则关系R 和S的广义笛卡儿积有m ×n个元组,记做:R×St|t=tr ,tstr t

42、s10、专门的关系运算包括:对单个关系进行垂直分解(投影操作)或水平分解(选择操作)和对多个关系进行结合(连接操作) 连接是从两个关联的笛卡儿积中选取属性间满足一定条件的元组。一种是等值连接(选取的属性值相等),一种是自然连接,自然连接是一种特殊的等值连接。11、广义投影赋值RS、外连接 (左外连接、右外连接)、半连接 ,聚集:G表示, 外部并第六章 关系数据库标准语言SQL1、SQL称为结构化查询语言,SQL已经成为关系数据库主流语言,1987年被国际标准化组织采纳为国际标准1992年公布了SQL92(SQL2),1999年公布了SQL93(SQL3,对象-关系SQL),2003年公布SQL

43、2003(SQL4)2、SQL 特点:SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体综合统一、高度非过程化、面向集合的操作方式、以同一种语法结构提供两种使用方式(自含式和嵌入式SQL)、语言简洁,易学易用。3、SQL数据库体系结构:外模式对应于视图和部分基本表、模式对应于基本表,内模式对应于存储文件 基本表是本身独立存在的表,一个关系就是一个基本表(存放实际数据),行对应元组,列对应属性;一个基本表可以跨一个或多个存储文件存放,一个存储文件可以存放多个基本表;所有基本表的集合构成了模式;基本表是模式和外模式的一部分。 一个SQL表可以是一个基本表,也可以是一个视图。视图是一个或几

44、个基本表导出的表,数据库中存放视图的定义,视图的数据仍然在基本表中。视图是一个虚表,是外模式的一部分。一个SQL表可以有若干索引,索引放在存储文件中。存储文件的逻辑结构组成了SQL数据库的内模式。物理结构由操作系统管理,对用户透明。SQL用户可以是一个应用程序,可以一个SQL用户。4、SQL的数据类型:预定义数据类型、构造数据类型、用户定义数据类型5、基本的SQL定义语句:关系数据库的基本对象是模式、表、视图、索引和域基本对象创建删除修改模式 CREATE SCHEMADROP SCHEMA基本表CREATE TABLEDROP TABLEALTER TABLE视图CREATE VIEWDRO

45、P TABLE索引CREATE INDEX DROP INDEX域CREATE DOMAINDROP DOMAIN6、基本操作语句(1)模式的定义与删除 Create Schema <模式名> AUTHORIZATION <用户名> Drop Schema <模式名>|CASCADE级联|RESTRICT约束(2)基本表的操作:创建:CREATE TABLE模式名.表名(列名数据类型(列级完整性约束 ,列名数据类型列级完整性约束 ,表级完整性约束);<列级完整性约束条件>:涉及相应属性列的完整性约束条件<表级完整性约束条件>:涉及一个

46、或多个属性列的完整性约束条件修改:ALTER TABLE表名 ADD新列名数据类型完整性约束 DROP <列名>完整性约束名 MODIFY列名数据类型;删除:当某个基本表不再需要时,可以用DROP TABLE语句进行删除,其格式为: DROP TABLE表名基本表一旦被删除,表中的数据、此表上建立的索引和视图都将自动被删除。因此执行删除基本表的操作时一定要格外小心。DROP TABLE <表名> RESTRICT 视图等关联对象没有事先删除则不能执行删除操作(3)索引操作 建立索引是加快查询速度的有效手段,提供多种存取路径UNIQUE 唯一索引,建立的索引其值必须唯一C

47、LUSTER聚簇索引,表示索引值的顺序与表中记录的物理顺序一致,适合在经常查询的列上建立,不适合在经常更新的列上建立CREATE UNIQUECLUSTERINDEX索引名 ON表名(列名次序,列名次序);次序指定索引值的排列次序,可选ASC(升序)或DESC(降序),默认值为ASC 删除索引:DROP INDEX索引名;删除索引时,系统会同时从数据字典中删去有关该索引的描述4、SQL的数据操纵语句SQL语言的数据操纵包括INSERT(插人)、DELETE(删除)、UPDATE(更新)和SELETE(检索,又称查询)4个语句SELECT语句是数据操作的核心。(1)数据查询 SELECTALLI

48、 DISTINCT目标列表达式,目标列表达式 FROM基本表或视图,基本表或视图 WHERE条件表达式 GROUP BY列名lHAVING条件表达式 ORDER BY列名2ASC 1 DESC;a.简单查询 简单查询涉及数据库中的一个表,包括以下几种: (1)查询表中的若干列。 (2)查询经过计算的值。 (3)消除取值重复的行。DISTINCT (4)查询满足条件的元组。WHERE (5)利用LIKE的查询。_、% (6)涉及空值NULL的查询。IS NULL 、IS NOT NULL (7)对查询结果排序。ORDER BY ASC/DESC (8)使用集函数。Count 、SUM、AVG、M

49、AX、MIN (9)对查询结果分组。Group by having b. 连接查询 外连接的三种类型:左外连接、右外连接、全外连接左外连接(LEFT OUTER JOIN):结果表中保留连接条件左边关系中的所有元组右外连接(RIGHT OUTER JOIN): 结果表中保留连接条件右边关系中的所有元组全外连接(FULL OUTER JOIN): 结果表中保留连接条件左右两边关系中的所有元组某些系统中用+=表示左外连接、=+表示右外连接、+=+表示全外连接c.嵌套查询 (I)由谓词IN引导的子查询:IN是最常用的谓词。 (2)谓词是比较运算符的子查询。 (3)由NOTEXISITS谓词引导的子查

50、询。d.集合查询。 UNION(并)、INTERSECT(交)、EXCEPT(差)5、SQL的修改语句(1)插入操作(insert)insert into 表名(字段名,) values(常量,) insert into 表名(字段名,) select from(2)删除操作(delete)delete from 表名 where F 删除表中的数据,表的结构还存在数据字典中(3)更新操作(update)update 表名 set 列名=表达式,列名=表达式 where F6、视图 (1)创建视图CREATE VIEW视图名(列名,列名 AS子查询 WITH CHECK OPTION:其中子查

51、询可以是任意复杂的SELECT语句,但通常不允许含有ORDER BY子句和DISTINCT短语。WITH CHECK OPTION表示对视图进行UPDATE、INSERT和DELETE操作时要保证更新、插人或删除的行满足视图定义中的谓词条件(即子查询中的条件表达式)。(2)行列子集视图(去掉某行,列保留主键)、表达式视图、分组视图(聚集函数,GROUP BY子句)、连接视图行列子集视图可以修改,带表达式视图、连接视图和分组视图不能修改。(3)查询视图:将对视图的查询转换为对基本表的查询的过程称为视图的消解(View Resolution)。视图物化(View Materialization):

52、是指在视图第一次被查询的时候物理地建立一个临时的视图表(实表),但必须保证更新基本表时自动更新视图表,保持物化视图的最新性。(4)修改视图 为防止用户通过视图对数据进行增、删、改操作时,无意或有意操作不属于视图范围内的基本表数据可在定义视图时加上WITH CHECK OPTION子句,这样在视图上增、删、改数据时,DBMS会进一步检查视图定义中的条件,若不满足条件,则拒绝执行该操作。 改视图包括插入(INSERT)、删除(DELETE)和更新(UPDATE) 3类操作。(5)视图的作用 (1)能够简化用户的操作。 (2)使用户能以多种角度看待同一数据。 (3)对重构数据库提供了一定程度的逻辑独

53、立性。 (4)能够对机密数据提供安全保护。7、数据控制语句和嵌入式SQL(1)GRANT语句和REVOKE语句实现权限授予和权限回收 安全性! GRANT 权限 ON 对象名 to 用户 with grant option; with grant option 获得权限的用户允许授予其他用户 (2) REVOKE权限,权限 ON对象类型对象名 FROM用户,用户;(3) SQL语言分为独立语言和嵌入式语言 能嵌入SQL的高级语言称为主语言 或 宿主语言SQL语言嵌入主语言解决的3个问题:SQL语言与主语言的区分:EXEC SQL<SQL语句>数据库工作单元与程序工作单元的通信(通过

54、主变量)游标解决集合操作与记录操作的矛盾游标定义(不执行) 打开(执行定义中SELECT) 推进(FETCH) 关闭 语句DBMS可采用两种方法处理嵌入式SQL,一种是预编译,另一种是修改和扩充主语言(4)动态SQL:程序在执行过程中动态生成SQL语句。动态SQL的两种执行方式:1、立即执行;2、先准备后执行第七章 关系数据库的规范化理论与数据库设计1、“不好”的关系模式有以下4个问题: a、数据冗余 b、更新异常 c、插入异常 d、删除异常2、函数依赖数据依赖中重要的是函数依赖和多值依赖(1)函数依赖定义:设R(U)是属性集U上的一个关系模式,X和Y均为U的子集。若对于R(U)的任一个可能的关系r,r中不可能有两个元组在X中的属性值相等,而在Y中的属性值不等,那么称X函数决定Y X->Y,或Y函数依赖于X, X为决定因素(函数中的一一映射关系)(2)函数依赖包括非平凡的函数依赖、平凡的函数依赖、完全函数依赖、部分函数依赖及传递函数依赖平凡函数依赖: 非平凡函数依赖: 如果 XY,但 Y Í X, 则称 XY 是平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论