版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第12章数据备份技术知识点:●数据完整性的概念及提高方法●容错与网络冗余的概念●网络备份系统●数据库的恢复难点:●容错●网络冗余要求熟练掌握以下内容:●数据完整性的概念及提高方法●容错与网络冗余●数据库备份类型了解以下内容:网络备份系统数据库的恢复12.1数据完整性
数据库中的数据是从外界输入的,而数据的输入由于种种原因,会发生输入无效或错误信息。保证输入的数据符合规定,成为了数据库系统,尤其是多用户的关系数据库系统首要关注的问题。数据完整性(dataintegrity)泛指与损坏和丢失相对的数据的状态,它通常表明数据的可靠性与准确性是可以信赖的,同时也意味着数据有可能是无效的或不完整的。数据完整性包括数据的精确性、有效性和一致性。12.1.1数据完整性概述对数据完整性来说,危险常常来自一些简单的计算不周、混淆、人为的错误判断或设备出错等导致的数据丢失、损坏或不当的改变。而数据完整性的目的就是保证计算机系统,或计算机网络系统上的信息处于一种完整和未受损坏的状态。这意味着数据不会由于有意或无意的事件而被改变或丢失。数据完整性的丧失意味着发生了导致数据被丢失或被改变的事情。为此,首先将检查导致数据完整性被破坏的常见的原因,以便采用适当的方法以予解决,从而提高数据完整性的程度。在分布式计算环境中,或在计算机网络环境中,如果通过PC、工作站、服务器、中型机和主机系统来改善数据完整性已变得一天比一天困难。原因何在?许多机构为了给它们的用户提供尽可能好的服务都采用不同的平台来组成系统,这仿佛拥有不同的硬件平台一样,使这些机构一般都拥有使用不同文件系统和系统服务的机器。E-mail交换系统成了对协同工作的网络系统的需求;协议的不同需要网关或协议的转换;系统开发语言和编译器的不同也产生了应用上兼容性的问题,凡此种种,造成了系统之间通信上可能产生的问题。其结果使之处于一种充满了潜在的不稳定性和难于预测的情况之当。一般地来说,影响数据完整性的因素主要的有5种:硬件故障、网络故障、逻辑问题、意外的灾难性事件、人为的因素。1、硬件故障任何一种高性能的机器都不可能长久地运行下不发生任何故障,这也包括了计算机,常见的影响数据完整性的硬件故障有:磁盘故障;I/O控制器故障;电源故障;存储器故障;介质、设备和其它备份的故障、芯片和主板故障。2、网络故障在LAN上,数据在机器之间通过传输介质高速传递,用来连接机器设备的线缆总是处在干扰和物理损伤在内的多种威胁之中,使计算机之间难于通信或根本无法通信的事件,最终导致数据的损毁或丢失。网络上的故障通常发生如下三个方面:网络接口卡和驱动程序实际上是不可分割的。在大多数的情况下,网络接口卡、驱动程序的故障并不损害数据,仅仅使使用者无法访问数据。但是,当网络服务器上的网络接口卡发生故障时,服务器一般会停止运行,这就很难保证被打开的那些文件是否被损坏。网络中被传输的数据对网络所造成的压力往往是很大的。网络设备,例如路由器和网桥中的缓冲区不够大就会发生操作阻塞的现象,从而导致数据包的丢失。相反,如果路由器和网桥的缓冲容量太大,由于调度如此大量的信息流所造成的延时极有可能导致会话超时。此外,网络布线设计上不正确性也可能网络故障,影响到数据的完整性。辐射本身就具有电子移动的能力,所以,辐射会给数据造成损坏是会自然的。控制辐射的办法,采用屏蔽双绞线或光纤系统进行网络的布线。3、逻辑问题软件也是威胁数据完整性的一个重要因素。由于软件问题而影响数据完整性的有下列几种途径:软件错误;文件损坏;数据交换错误;容量错误;不恰当的需求;操作系统错误。其中:软件错误包括形式多样的缺陷,通常与应用程序的逻辑有关。文件损坏是由于一些物理的或网络的问题导致文件被破坏。文件也可能由于系统控制或应用逻辑中一些缺陷而造成损坏。颇为叫人烦恼的是如果被损坏的文件自己又被其它的过程调用而生成新的数据,这些新生成的数据是错的,这是一类很难应付的问题。当文件转换过程中生产的新的文件,如果不具有正确的格式时便产生数据交换错误。当软件在运行时,系统容量,如内存等的不够也是导致出错的原因。所有的操作系统都有自己的错误,这是众所周知的,无需大惊小怪。此外,系统的应用程序接口(API)被第三方开发商用来为最终用户提供服务,这第三方根据公开发布的API功能来编写其软件产品,如果这些API不像所说的那样工作就会发生数据被破坏的事件。在软件开发过程中,需求分析,需求报告没有正确地反映用户要求做的工作,系统只能停在那里,生成一堆无用的数据。这种情况在数字位数已被固定而输入的数字位数已被固定而输入的数字位数超出了这个限制时是很典型的。如果出错检查程序未能发现这一情况,程序就会产生错误的数据。4、灾难性事件常见的灾难性事件有:水灾;火灾;风暴——龙卷风、台风、暴风雪等;工业事故;蓄意破坏/恐怖活动。5、人为因素由于人类的活动数据完整性所造成的影响是多方面的。人类给数据完整性带来的常见的威胁包括:意外事故;缺乏经验;压力/恐慌;通信不畅;蓄意的包袱破坏和窃取。12.1.2提高数据完整性的办法提高数据完整性的可行的解决办法有二个方面的内容:首先,采用预防性的技术防范危及数据完整性事件的发生,其次,一旦数据的完整性受到损坏时采取有效的恢复手段,恢复被损坏的数据。下面所列出的是一些恢复数据完整性和防止数据完整性丧失的技术:备份;镜像技术;归档;转储;分级存储管理;奇偶检验;灾难恢复计划;故障发生前的预前分析;电源调节系统;系统安全程序。备份是用来恢复出错系统或防止数据丢失的一种最常用的办法。通常所说的Backup是一种做备份的操作,它把正确的完整的数据拷贝到磁带等介质上,万一系统的数据完整性受到了不同程度的损坏,可以用备份系统将最近一次的系统备份恢复到机器上去。作为一个网络管理员或系统员没有任何借口可以不做备份。镜像技术是物理上的镜像原理在计算机技术上的具体应用,它所指的是将数据原样从一台计算机(或服务器)上拷贝到另一台计算机(或服务器上)。镜像技术在计算机系统中具体执行时一般有二种方法:逻辑地将计算机系统或网络系统中的文件系统按段拷贝到网络中的另一台计算机或服务器上严格地在物理层上进行,例如建立磁盘驱动器、I/O驱动子系统和整个机器的镜像。在计算机及其网络系统中,归档有二层意思:其一,将文件从网络系统的线存储器上拷贝到磁带或光学介质上以便长期保存;其二,将文件从网络的在线存储器上拷贝的同时删除旧文件,使网络上的剩余存储空间变大一些。通过归档,也可以把在线存储器上删除的文件转入永久介质上的措施加强对文件系统的保护。转储与备份有其相同之处,但也有不同的地方。转储是指那些用来恢复的磁带是如何到别处去的。这是与备份的最大不同之处。分级存储管理(hierarchicalstoragemanagement——HSM)与归档很相似,它是一种能将软件从在线存储器上归档到靠近在线存储器上的自动系统,也可以进行相反的过程。从实际使用的情况来看,它对数据完整性较使用归档方法具有更多的好处,但风险也更大。奇偶校验提供一种监视的机制来保证不可预测的内存错误不致于会引起服务器出错以至造成数据完整性的丧失。灾难给计算机落系统带来的破坏是巨大的,而灾难恢复计划是在废墟上如何重建系统的指导性文件。故障前预兆分析是根据部件的损坏或老化等情况并非一下子完全破坏的,而是有一过程,在这过程中,出错的次数不断增加,设备的动作也开始变得有点不可思议,根据分析,判断问题的结症,以便做好排除的准备。电源调节中电源是指不间断电源,它是一个完整的服务器系统的重要组成部分,当系统失去电力供应时,这种后援的系统开始运做,从而保证系统的正常工作。除了不间断电源以外,电源调节还为网络系统提供恒定平衡的电压。因为,当负载变化时,电网的电压可能会有所波动,这样可能影响到系统的正常运行,因此,这种电源调节的稳压设备是很有价值的。12.2容错与网络冗余12.2.1容错容错既是一种彩票专业术语又是计算机行业的专业术语。容错在计算机中指系统恢复文件的错误,存储在计算机中的文件或者在网络中传输的文件有可能因为故障或者干扰信号等的影响而发生错误或者丢失,此时一般情况下系统能够自动恢复文件,将这些损坏或丢失的文件和数据恢复到发生事故以前的状态,使系统能够连续正常运行的一种技术。但是文件错误严重时候必须认为恢复或者文件彻底丢失。系统的恢复能力就是容错能力简称容错。容错FT(FaultTolerant)技术一般利用冗余硬件交叉检测操作结果。随着处理器速度的加快和价格的下跌而越来越多地转移到软件中。未来容错技术将完全在软件环境下完成,那时它和高可用性技术之间的差别也就随之消失了。局域网的核心设备是服务器。用户不断从文件服务器中大量存取数据,文件服务器集中管理系统共享资源。但是如果文件服务器或文件服务器的硬盘出现故障,数据就会丢失,所以,本教材在这里讲解的容错技术是针对服务器、服务器硬盘和供电系统的。(1)双重文件分配表和目录表技术硬盘上的文件分配表和目录表存放着文件在硬盘上的位置和文件大小等信息,如果它们出现故障,数据就会丢失或误存到其他文件中。通过提供两份同样的文件分配表和目录表,把它们存放在不同的位置,一旦某份出现故障,系统将做出提示,从而达到容错的目的。(2)快速磁盘检修技术这种方法是在把数据写入硬盘后,马上从硬盘中把刚写入的数据读出来与内存中的原始数据进行比较。如果出现错误,则利用在硬盘内开设的一个被称为“热定位重定区”的区,将硬盘坏区记录下来,并将已确定的在坏区中的数据用原始数据写入热定位重定区上。(3)磁盘镜像技术磁盘镜像是在同一存储通道上装有成对的两个磁盘驱动器,分别驱动原盘和副盘,两个盘串行交替工作,当原盘发生故障时,副盘仍旧正常工作,从而保证了数据的正确性。(4)双工磁盘技术它是在网络系统上建立起两套同样的且同步工作的文件服务器,如果其中一个出现故障,另一个将立即自动投入系统,接替发生故障的文件服务器的全部工作。(5)网络操作系统具有完备的事务跟踪系统这是针对数据库和多用户软件的需要而设计的,用以保证数据库和多用户应用软件在全部处理工作还没有结束时或工作站或服务器发生突然损坏的情况下,能够保持数据的一致。其工作方式是:对指定的事务(操作)要么一次完成,要么什么操作也不进行。(6)UPS监控系统UPS监控系统用于监控网络设备的供电系统,以防止供电系统电压波动或中断。在实际工作中,选取的容错技术应根据实际情况而定(如资金,规模等)。12.2.2网络冗余网络主要是由全部的节点设备以及设备之间的连接组成的。因此,网络中的故障也主要包括节点设备的故障与连接故障两种。常见的节点设备的故障有硬件故障和软件故障(如操作系统崩溃,内存溢出,路由协议不收敛等).在很多行业和企业用户里,对网络都有实时性的要求,比如金融、证券、航空、铁路、邮政以及一些企业用户等,他们的网络是不允许出现故障的,一旦出现故障,那将带来非常巨大的经济损失;但网络涉及到的环节非常多,比如说线路、基带Modem、电信的设备等,这些都有可能出现问题,任何一个环节出现问题,都会导致整个网络传输运行的停止。所以应该给用户提供冗余的网络,作为重要的网络设备――路由器,就是通过备份来实现网络的冗余,确保网络的畅通。在网络系统中,作为传输数据介质的线路和其它的网络连接部件都必须有持续正常运行时间的备用途径。本节将主要讨论提高主干网、网络互连设备的可靠性的途径。(1)主干网的冗余主干网的拓扑结构应考虑容错性。网状的竹竿拓扑结构,双核心交换机、冗余的配线间连接等,这些都是保证网络中没有单点故障的途径。主干被用来连接服务器或网络上其它服务设备。通常,这些主干都具有较高的网络速度才能使服务器达到更好的性能。因此,当为服务器提供网各服务时,如果它发生了故障,即使服务器仍能运行,但实际上已经不能用了,因为对其访问被切断了。这就是使用双主干网络的原因所在。在使用双主干网络的网络系统中,如果原网络发生故障,辅助网络就会承担数据数据传输的服务。双主干的概念与网络拓扑结构无关,它更有助于实现Token-Ring、Ethernet、FDDI。双主干网在具体实施的时候,对于辅助网络最好是沿着原网络不同的线路铺设。(2)开关控制设备在网络系统中,集线器、集中器或开关设备。由开关控制的10Base-T和ATM网络系统中,每一台机器与网络的连接都是通过一些开关设备实现的。在这些网络中,可以通过在设备之间提供辅助的高速连接来建立网络冗余。这种网络设备能精确地检测出发生故障的段的能力,以及可用辅助路径来分担数据流量。网络开关控制技术是可以通过网络管理程序予以管理的。这意味着网络中部件故障发生时可以立即显示在控制程序的界面上,并且很快地对其进行响应。此外,开关控制可以通过对数据流量或误码率的分析能提前发现故障的网段。一旦发现数据流量有异常的情况或误码率超过了某一数值的时候,马上可以知道某一网段将发生的故障。通常,网络开关控制设备都设计成模块式的可热可更换电路板插件,这种设计的优点是当发现设备中某个电路板上的芯片损坏了,可立即用新的电路板来代替它。双电源和电池后备如使用了开关控制设备,能够起到延长网络的非故障时间。(3)路由器路由器是网络系统中最为灵活的网络连接设备之一。它为网络中数据的流向指明方向。目前,在网络系统中极大多数采用交换式路由器,这种路由器的性能是普通路由器的10~100倍,而价格只有后者的十分之一左右。交换式路由器VRRP(虚拟冗余路由器)和OSPF协议,前者用于2个交换式路由器互为备份,后者用于旁路出故障的连接。此外,交换式路由器通过复杂的队列管理机制来保证对时间敏感的应用(其数据流一般也是高优先级别的)优先被转发出目的端口。好的队列管理机制也可以进行流量控制和流量整形,以保证数据流不会拥塞交换机,以及获得平稳的数据流输出。交换式路由器的另一个功能是透过RSVP(资源保留协议)可以动态地为特定的应用保留所需的带宽和对应用层信息流进行控制,可以分辨出不同的信息流并为它们提供服务质量保证。在网络系统中,如果服务器发生了故障需要启动备用房间里的服务器或备份中心的服务器,此时,用户们如何访问更换了地点的服务器呢?这种在用户设备和服务器之间没有直接的网络连接的情况下,可以通过改变路由器的设置,就可以用已有的线路建立连接这些处于新位置的服务器。在极端的情况下,也可以移动用户设备,在电话和网络服务供应商的帮助下,在新站点增加路由器以建立一个承担用户和服务器之间的数据流量的临时网络。(4)Pipes软件前面所介绍的网络冗余都是通过硬设备来实现的。利用软件实现网络冗余虽说不常用,但不失是一种选择。美国Peerlogic公司生产的Pipes软件可以绕过网络中发生故障的线路,通过其它的网络连接为用户传输数据。Pipes网络共享一个目录服务机制,能够识别出网络中所有运行Pipes的机器之间所有可能的路由。该软件具有智能出错控制功能,使Pipes能动态并透明地在原始路由发生问题时使用其它的路由维持网络通信。这样的路由包括使用不同的通信协议的路径。需要说明的是Pipes并不是被设计用来安装在网络上的每台机器上的,它一般用来在能提供冗余和容错服务的中件开发平台上开发分布式应用程序。因此,如果使用Pipes这类产品,需要一些计划和开发工具。12.3网络备份系统当前网络建设的重要任务是如何保护关键的数据安全,如何建立完善的网络数据备份系统方案以达到数据安全的目的成为使用数据库应重视的地方。“数据”是财富这一点在当今信息社会中大家是有共识的。数据库的失效往往导致一个机构的瘫痪。然而,不幸的是任何一个数据库系统总不可能不发生故障。数据库系统对付故障有二种办法:其一是尽可能提高系统的可靠性;另一种办法是在系统发出故障后,把数据库恢复至原来的状态。仅仅有第一点是远远不够的,必须有第二种办法,即必须有数据库发生故障后的恢复原状态的技术。12.3.1网络数据备份系统方案需求分析1.计算机和通信技术在信息的收集、处理、存储、传输和分发中扮演着极其重要的角色,也大大提高了工作效率,但是,随之也带来了一些新的问题,如系统失效,数据丢失或遭到破坏。威胁数据的安全等,造成系统失效的主要原因有以下几个方面。硬盘驱动器损坏,由于一个系统或电器的物理损坏导致文件、数据的丢失。人为错误,人为删除一个文件或格式化一个磁盘(占数据灾难的80%)。黑客的攻击,黑客侵入计算机系统,破坏计算机系统。病毒,使计算机系统感染,甚至损坏计算机数据。自然灾害,火灾、洪水或地震也会无情地毁灭计算机系统。电源浪涌,一个瞬间过载电功率损害计算机驱动器上的文件。磁干扰,生活、工作中常见的磁场可以破坏磁碟中的文件因此,建立完整的网络数据备份系统必须考虑以下内容。2.网络数据备份系统方案备份设备的选择所谓数据备份,就是使用较低廉的存储介质,定期将系统业务数据备份下来,以保证数据意外丢失时能尽快恢复,将用户的损失降到最低点。常用的存储介质类型有:磁盘、磁带、光盘和MO(磁光盘)等,其中,磁带和光盘的费效比较高,在大容量的数据存储方面比较常用。3.网络数据备份系统方案四种磁带技术的比较目前,磁带技术与产品主要分DAT、DLT、LTO和8mm四种。DAT和8mm均采用螺旋扫描技术,但磁带宽度不同,DAT磁带宽度约4mm。最新的DAT磁带采用了和DLT类似的高强金属带,可靠性增加,容量也增加为20GB(非压缩)。DAT技术多用于单个磁带机设备,它的数据读写速率低于最新的DLT和8mm产品。8mm是Exabyte公司的独立技术,为增加磁带强度以提高读写速度和可靠性,最新的AME磁带产品具有一定的竞争性,但由于技术不开放,使得产品的市场占有率较低。DLT原为Quantum(昆腾)公司的专利技术,现以OEM方式向多厂家开放,在大容量磁带存储市场上DLT技术占据了主导地位。目前市场上使用的DLT8000磁带机是技术最成熟的磁带设备,它的读写速率压缩后可达12M/S。最新由HP,Seagate及IBM等厂商推出的敖群(ultrium)磁带机采用LTO(LineTapeOpen)技术,这是一项开放的标准磁带技术,可确保来自不同厂商的ultrium磁带机实现数据的互换性。开放性的标准及多厂商使用户可从创新、选择、服务、价值与灵活性中大获裨益。该磁带机可在两小时之内,将200GB压缩数据备份到单盘磁带上,从而将网络数据备份系统方案性能提升到新高,令其成为数据量庞大、备份窗口较小的公司的理想选择。高达30MB每秒的传输速率可实现更快速的数据备份和恢复。容量可达本机100GB,硬件数据压缩后的典型值为200GB,由于目前只有HP,IBM等厂商推出LTO技术的磁带库,其市场占有率不是很高,但是随着时间的推移,其市场占有率会越来越高。因此,在选择大容量磁带备份设备时,DLT及LTO磁带库应该是首选产品。4.网络数据备份系统方案的容量计算用户要求准确地计算出备份设备的容量,可以通过以下因素选取采用多大容量的备份设备:网络中的总数据量,Q1数据备份时间表(即增量备份的天数),假设用户每天作一个增量备份,周末作一个全备份,d=6天*每日数据改变量,即Q2期望无人干涉的时间,假定为3个月,m=3数据增长量的估计,假定每年以20%递增,i=20%考虑坏带,不可预见因素,一般为30%,假定u=30%通过以上各因素考虑,可以较准确地推算出备份设备的大概容量为:C=[(Q1+Q2*d)*4*m*(1+I)]*(1+u)DLT磁带单盒容量为40G,LTO磁带单盒容量为100G,用户根据推算的网络数据备份系统方案容量,再考虑一定的冗余,即可选择需要多少槽位的磁带库。如果需要提高网络数据备份系统方案速度,可考虑增加磁带库的驱动器。对于一般的网络环境,如果通过网络进行数据备份,采用DLT9槽位的磁带库已能够满足要求。对于需要进行更大规模的数据备份,建议选择目前较流行的SAN(光纤通道为基础的区域存储网络)数据备份方案。5.分析网络数据备份系统方案应用环境,选择网络数据备份系统方案通常数据备份的核心是数据库的备份,知道目前市场流行数据库如Oracle,Sybase,MS-SQL等均有自己的数据库备份工具,但它们既不能实现自动备份,而且只能将数据备份到磁带机或硬盘上,不能驱动磁带库等自动加载设备。显然利用数据库本身的备份工具远远达不到客户的要求,必须采用具有自动加载功能的磁带库硬件产品与数据库在线备份功能的自动备份软件。目前流行的网络数据备份系统方案有多种,如LegatoNetWorker、CAARCserve、HPOpenViewOmnibackII、IBMADSM及Veritas公司的NetBackup等。各家软件在备份管理方式上各有千秋。它们都具有自动定时备份管理、备份介质自动管理,数据库在线备份管理等功能。其中,Legato,Veritas和CA是独立软件开发商,注重于对各种操作系统和数据库平台的支持,而惠普和IBM等更注重于对本公司软/硬件产品的支持。6.网络数据备份系统方案的存储备份策略选择了存储备份软件、存储备份技术(包括存储备份硬件及存储备份介质)后,首先需要确定数据备份的策略。备份策略指确定需备份的内容、备份时间及备份方式。各个单位要根据自己的实际情况来制定不同的备份策略。目前被采用最多的备份策略主要有以下完全备份,增量备份,和差分备份。7.网络数据备份系统方案实施过程应注意的问题(1)统计备份客户机信息在实施备份方案之前,必须详细了解各台备份主机的系统配置、备份数据量、备份方式(文件、数据库在线)、允许的备份时间窗口,每日数据增量等信息。同时确定各机器的网络配置信息,如IP地址,主机名,域名等。(2)做好培训工作在网络数据备份系统方案实施过程中,必须做好对系统管理员的培训工作。培训需准备好各种操作系统的计算机主机、磁带库设备和投影仪等。培训内容一般包括备份软件的基本结构,备份管理程序的安装使用,数据库在线备份模块的安装与使用,数据备份与恢复方法,系统灾难备份方法,日常维护等。(3)制定备份策略制定备份日程表分析各备份客户机的数据量、数据增量、备份窗口等因素,制定可行的备份日程表。制定备份客户机分组方案每组客户机有相同的备份启动时间,可以使用具有属于本组的备份介质。同组机器也可以有相同的备份时间(日程)表。制定备份卷分组方案根据备份数据分类存储需求,建立不同的卷标格式和卷池(Pool)。并对备份介质做格式化。配置各客户机选项设定数据源、选择时间表、选择组别、设定与数据库备份有关的特殊选项、设定远程访问权限。其它选项配置包括管理员设置,数据远程恢复权限设置,设备并行流设置,设备自动管理选项,数据压缩选项等。(4)日常维护有关问题网络数据备份系统方案安装调试成功结束后,日常维护包含两方面工作,即硬件维护和软件维护。如果硬件设备具有很好的可靠性,系统正常运行后基本不需要经常维护。一般来说,磁带库的易损部件是磁带驱动器,当出现备份读写错误时应首先检查驱动器的工作状态。如果发生意外断电等情况,系统重新启动运行后,应检查设备与软件的联接是否正常。磁头自动清洗操作一般可以由备份软件自动管理,一盘DLT清洗带可以使用20次,一般一个月清洗一次磁头。软件系统工作过程检测到的软硬件错误和警告信息都有明显提示和日志,可以通过电子邮件发送给管理员。管理员也可以利用远程管理的功能,全面监控备份系统的运行情况。网络数据备份系统方案的建成,对保障系统的安全运行,保障各种系统故障的及时排除和数据库系统的及时恢复起到关键作用。通过自动化带库及集中的运行管理,保证数据备份的质量,加强数据备份的安全管理。同时,近线磁带库技术的引进,无疑对数据的恢复和利用提供了更加方便的手段。希望更多的单位能够更快地引进这些技术,让系统管理员做到数据无忧。12.3.2数据库备份的评估数据库如果发生故障可能会导致数据的丢失,要恢复丢失的数据,必须对数据库系统作备份。在此之前,对数据库的备份作一个全面的评估是很有必要的。1.数据库的特性网络系统中的数据库不同于网络上其它的应用程序。下面对数据库的一些特性作简单的介绍,以利于对数据库的备份。(1)多用户网络系统中服务器是用来共享资源的,不过,存储在服务器中的大多数文件是用来给单用户访问的。但是,网络系统上的数据库却又是提供给多个用户访问的。这意味着对数据库的任何管理操作,其中包括备份,都会影响到用户的工作效率,而且不仅是一个用户而是多个用户的工作效率。(2)高可靠性网络系统数据库有一个特性是高可靠性。因为,多用户的数据库要求具有较长的被访问和更新时间,以完成批任务处理或为其它时区的用户提供访问。在数据库备份中提到的所谓“备份窗口”指的是在二个工作时间段之间用于备份的那一段时间,在这段时间内数据库可被备份,而在其余的时间段内,数据库不能被备份。通常考虑将这段时间安排在LAN处于“安静”状态的时候,此时,LAN不做任何工作,并且所以的文件被关闭,因此,可以在不干扰用户的情况下进行备份。(3)频繁的更新数据库系统中数据的不断更新是数据库又一特性。一般而言,文件服务器没有太多的磁盘写入操作。但数据库系统由于是多用户的,对其操作的频率以每秒计远远大于文件服务器。(4)文件大数据库一般较文件有更多需要备份的数据和更短的用于备份的时间。另外,如果备份操作超过了备份窗口还会导致用户访问和系统性能方面的更多的问题,因为这时数据库要对更多的请求进行响应。2.备份方案的评估对数据库备份方案的评估主要指的是在制定数据库备份方案之前必须对下列问题进行分析,在分析的基础上作出评估:对数据库保护的内容;对数据被丢失必须作出其损失的评估;备份所需的费用的评估;备份所需的费用的评估。虽然说“数据”是一种财富,数据库的运行对一个机构会带来极大的帮助和好处,但对数据库作备份时必须权衡不同的备份保护等级的费用。如果数据花10000元就可以重新得到,并且可能三年才会丢失一次数据,那么,如果每年需花5000元去保护这些数据,就没有意义了。在作数据库备份之前,需要考虑如下的几个费用与风险问题:费用能负担得起吗?如果负担不起,需采用其它能负担得起的方式。所采用的措施能改善现状吗?在所采用的措施实施过程中会产生其它的问题吗?这其中包括所采用的方法在有用户使用系统时进行会受到什么影响?以及是否导致工作效率的降低?等等。该措施有所值吗?最坏的情况下会损失什么?技术评估数据库备份通常是一种要么全有要么全无的事情——如果不备份整个数据库,就不能将它恢复到系统上之后使用它。对极大多数数据库系统来说,数据库的任何更改都需要对整个数据库做完全备份。因此,在数据库备份前需要在备份的技术上必须作出评估。在对数据库做备份时最大的问题是备份打开的文件,因为这样做可能导致其备份拷贝失去数据完整性。在线数据库的主要特性中,有二个特性是频繁的更新和在用户需要时的可访问性。为了提高这些特性的功能,要求数据库系统在运行时使其数据库文件保持被打开的状态。这就意味着在数据库备份的过程中可能发生数据库文件的被更新。数据库备份过程中的更新有如下几种情况:(1)更新发生的文件已被拷贝的区域在备份过程中,文件的A处有一次数据库的更新,该更新发生在备份进程已经拷贝了该信息后,即更新发生在文件已被拷贝的那个区域中,对文件任何其他的部分没有影响,备份文件仍是完整的,一旦系统需要恢复,该文件仍能被恢复到它原始状态。重新输入在备份开始后所发生的更新将数据库恢复到出故障前一时刻的状态。(2)更新发生在文件未被备份区域这类更新也不会成问题。如果数据库需要恢复,该数据库文件就会恢复到一个包括B点的更新的完整状态。如将数据库恢复到故障的前一时刻的状态需要输入在备份结束后发生的那些更新。(3)二种不同状态处文件的更新因为文件的备份拷贝包括了A点处信息未改变的状态和B点处信息已被改变的状态。数据库文件的备芬拷贝现在失去了完整性。当这种情况发生时,相关数据可能变得没有意义,甚至还会导致数据库系统的崩溃。(4)冷备份所谓冷备份就是脱线备份。尽管在前面讨论过的更新不可能被写到数据库文件中时对数据库进行备份仍是有意义的,但毕竟不是好的办法。为了防止更新发生的最好办法是在开始对其进行备份之前将数据库关闭,即进行冷备份。冷备份通常在系统无人使用的时候进行。冷备份的最好办法是建立一个批处理文件,该文件在指定的时间先关闭数据库,然后对数据库文件进行备份,最后再启动数据库。12.3.3数据库备份的类型常用的数据库备份的方法如下三种:冷备份、热备份、逻辑备份。1.冷备份冷备份的思想是关闭数据库系统,在没有任何拥护对它进行访问的情况下备份。这种方法在保持数据的完整性方面是最好的一种。但是,如果数据库太大,无法在备份窗口中完成对它的备份,此时,应该考虑采用其它的适用的方法。2.热备份当数据库正在运行,更新也可能正在写入数据库所进行的备份称为热备份。数据库的热备份依赖于系统的日志文件。在备份进行时,日志文件将需要作更新或更改的指令“堆起来”,并不是真正将任何数据写入数据库记录。当这些被更新的业务被堆起来时,数据库实际上并未被更新,因此,数据库能被完整地备份。热备份方法的一个致命的缺点是具有很大的风险性。其原因有三个:第一,如果系统在进行备份时崩溃,那么,堆在日志文件中的所有业务都会被丢失,即造成数据的丢失。第二,在进行热备份时,要求数据库管理员(DBA)仔细地监视系统资源,确保存储空间不会被日志文件占用完而造成不能接受业务的局面。最后,日志文件在某种程度上也需要做备份以便重建数据,这样需要考虑其它的文件并使其与数据库文件协调起来为备份增加了复杂性。3.逻辑备份所谓的逻辑备份是使用软件技术从数据库中提取数据并将结构写入一个输出文件。该输出文件不是一个数据库表,而是表中的所有数据的一个映象。在大多数客户/服务器结构模式的数据库中,结构化查询语言(SQL)就是用来建立输出文件的。该过程较慢,对大型数据库的全盘备份不太实用。但是,这种方法适合用于增量备份,即备份那么上次备份之后改变了的数据,不失为一种好的选择。使用逻辑备份进行恢复数据必须生成逆SOL语句。尽管这个过程非常耗时,时间开销较大,但工作却非常另人满意!12.3.4数据库备份的性能数据库备份的性能可以用两个参数来说明其好坏,即被拷贝到磁带上的数据量和进行该项工作所花的时间。数据量和时间开销之间是一种很难解决的矛盾。如果在备份窗口中所有的数据都被传输到磁带上,就不存在什么问题。如果备份窗口中不能备份所有的数据,就会面临一个十分严重的问题。通常,提高数据库备份性能的办法有如下几种:升级数据库管理系统;使用更快的备份设备。备份到磁盘上。磁盘可以是处于同一系统上的,也可以是LAN的另一个系统上的。如能指定一个完整的容量或服务器作为备份磁盘之用的话,这种方法的效果最好。使用本地备份设备。使用此方法时应保证连接的SCSI接口适配卡能承担高速扩展数据传输。另外,应将备份设备接在单独的SCSI接口上使用原始磁盘分区备份。直接从磁盘分区读取数据,而不是使用危机系统API调用,可加快备份的执行12.3.5系统和网络完整性保护数据库的完整性,除了前面已经讨论过的提高性能的技术之外,也可以通过系统和网络的高可靠性得以实现。1.服务器保护服务器是LAN上的主要机器,如果保护网络数据库的完整性,必须作好对服务器的保护。保护服务器的办法包括:电力调节,以保证能使服务器运行足够长的时间以完成数据库的备份环境管理,应将服务器置于有空调的房间,通风口和管理应保持干净,并定期检查和清理服务器所在房间应加强安全管理,作好服务器中硬件的更换工作,从而提高服务器中硬件的可靠性,尽量使用辅助服务器以提供实时故障的跨越功能.通过映象技术或其它任何形式进行复制以便提供某种程度的容错。接收复制数据的系统应具有原系统的故障后能代替它在线工作的能力。这种类型的方案可以减少在系统故障之后网络数据库的损失。但这种方案不适用于原系统一次更新进行时中间发生的故障。2.客户机的保护对数据库的完整性而言,作好对客户机或工作站的保护如同服务器一样重要。对客户机的保护可以从如下几个方面进行:电力调节,保证客户机正常运行所需的电力供应;配置电池后备,确保电力供应中断之后客户机能持续运行直至文件被保存和完成业务;定期更换客户机或工作站的硬件。3.网络连接网络连接是处于服务器与工作站或客户机之间的线缆、集线器、路由器或其它类似的设备。为此,线缆的安装应具有专业水平,且用的配件应保证质量,还需配有网络管理工具监测通过网络连接的数据传输。此外,包括电池后备在内的电力调节设备也应该用于所有的网络连接部件。如果可能的话,应该为网络设计一条辅助的网络连接路径,即网络冗余路径,如双主干方案,或用开关控制连接,以便能快速地对网络连接故障作出反应并为用户重新建立连接。12.3.6数据库的恢复数据库系统对付故障无非采用如下二种措施:尽可能地提高系统的可靠性;在系统发生故障后,把数据库恢复到原来的状态。仅仅提高系统的可靠性是远远不够的。因为任何一个系统,无论其可靠性有多高,故障的发生总是难免的。在系统故障发生后,把数据库恢复到原来状态的技术,即恢复技术。1.恢复技术的种类恢复技术大致可以分为如下三种:单纯以备份为基础的恢复技术;以备份和运行日志为基础的恢复技术;基于多备份的恢复技术。(1)单纯以备份为基础的恢复技术单纯以备份为基础的恢复技术由文件系统恢复技术演变过来的,即周期性地把磁盘上的数据拷贝或转储到磁带上。由于磁带是脱机存放的,系统对它没有任何影响。当数据库失效时,可取最近一次从磁盘拷贝到磁带上的数据库备份来恢复数据库,即把备份磁带上的数据库拷贝到磁盘的原数据库所在的位置上。利用这种方法,数据库只能恢复到最近备份的一次状态,从最近备份到故障发生期间的所有数据库的更新将会丢失。这意味着备份的周期越长,丢失的更新数据也就越多。数据库中的数据一般只部分更新,很少全部更新。如果只转储其更新的物理块,则转储的数据量会明显减少,也不必用过多的时间去转储。如果增加转储的频率,则可以减少发生故障时已被更新过的数据的丢失。这种转储称为增量转储(incrementaldumping,简称ID)。利用增量转储作备份的恢复技术实现起来颇为简单,也不增加数据库正常运行的开销,其最大的缺点是不能恢复到数据库的最近一致状态。这种恢复技术只适用于小型的和不太重要的数据库系统。(2)以备份和日志为基础的恢复技术系统运行日志用于记录数据库运行的情况,一般包括三个内容:前象(beforeimage,简称BI);后象(afterimage,简称AI);事务状态。所谓的前象是指数据库被一个事务更新时,所涉及的物理块更新后的映象,它以物理块为单位。前象在恢复中所起的作用是帮助数据库恢复更新前的状态,即撤消更新,这种操作成为撤消(undo)。后象恰好与前象相反,它是当数据库被某一事务更新时,所涉及的物理块更新前的映象,其单位和前象一样以物理块为单位。后象的作用帮助数据库恢复到更新后的状态,相当于重做一次更新。这种操作在恢复技术中称为重做(Redo)。运行日志的事务状态记录每个事务的状态以便在数据库恢复时作不同处理。事务提高而结束,这说明事务已成功执行,事务对数据库的更新能被其他事务访问事务失败,需要消除事务对数据库的影响,对这种事务的处理称为卷回(rollback)基于备份和日志为基础的这种恢复技术,当数据库失效时,可取出最近备份,然后根据日志的记录,对未提交的事务用前象卷回,这称后恢复(backwardrecovery);对已提交的事务,必要时用后象重做,称向前恢复(forwardrecovery)。这种恢复技术的缺点是,由于需要保持一个运行的记录,既花费较大的存储空间,又影响到数据库正常工作的性能。它的优点可使数据库恢复到最近的一致状态。大多数数据库管理系统也都支持这种恢复技术。(3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文职聘用合同 2篇
- 二零二四年度电商平台用户服务合同3篇
- 劳务协议兼职合同完整版
- 物业管理合同模板锦集
- 装饰设计合同范本
- 铝板供应合同2024年度样本
- 2024年新公务员培训心得:从理论到实践的转变
- 班级文学活动的策划与实施计划
- 心房纤颤分类治疗
- 慢支肺气肿病人护理
- 期末(试题)-2024-2025学年人教PEP版(2024)英语三年级上册
- 院前急救技能竞赛(驾驶员)理论考试题库大全-上(选择题)
- 道法认识生命(作业)【后附答案解析】2024-2025学年七年级道德与法治上册(统编版2024)
- 9知法守法 依法维权 第2课时 守法不违法 (教学设计)-部编版道德与法治六年级上册
- 三方代付工程款协议书范本2024年
- 【道法】爱护身体 课件-2024-2025学年统编版道德与法治七年级上册
- 第二次月考测评卷(5-6单元)(试题)-2024-2025学年六年级数学上册人教版
- 医学课件抗痉挛体位摆放
- 2024年统编版七年级上册道德与法治 第三单元 珍爱我们的生命 第八课 生命可贵 第2课时 敬畏生命 教学课件
- IATF16949组织环境因素识别表
- 职业素质养成(吉林交通职业技术学院)智慧树知到答案2024年吉林交通职业技术学院
评论
0/150
提交评论