




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、分布式事务管理与恢复详细课件分布式事务管理与恢复事务概念事务是访问或更新各种数据项的程序执行单元.事务必须保证数据库的一致性事务执行期间数据库可能不一致事务概念-续 当事务提交(commit)时数据库必须是一致的DatabaseConsistentConsistent事务概念-续 两个问题:故障 各种软硬件故障并发执行 多个事务同时执行事务性质ACID原子性(Atomicity) 事务的操作要么全部执行, 要么全部不执行 一致性(Consistency) 并发执行的多个事务,其操作的结果应与以某种顺序串行执行这几个事务所得的结果相同. 持久性(Durability) 当事务提交后, 其操作的结
2、果将永久化, 而与提交后发生的故障无关 事务性质-续独立性( Isolation) 虽然可以有多个事务同时执行,但是单个事务的执行不应该感知其他事务的存在,因此事务执行的中间结果应该对其他并发事务隐藏 一对事务 Ti 和 Tj的执行, 看起来好像是或者 Ti 在Ti 执行结束之后才开始执行,或者Tj,是在 Ti执行结束之后才开始执行举例从账号A向账号B转账 $50: 1. read(A) 2. A := A 50 3. write(A) 4. read(B) 5. B := B + 50 6. write(B)举例-续 一致性要求 事务执行后A 和 B账号的总金额不变原子性要求 如果事务在第3
3、步和第6步之间故障, 系统应该保证事务对数据库的修改没有产生,否则将导致不一致性举例-续持久性要求 一旦用户通知说事务已经完成(即$50 转账成功),那么由该事务对数据库的修改就必须保证是永久的,即使是发生故障也如此举例-续独立性要求 如果在第 3步和第6步之间, 允许其他事务访问被修改的数据库的中间结果, 那么它将见到一个不一致的数据库 (也就是说, A + B 的和少于它的正确值) 当然事务的串行执行将不会出现这种情况,但是数据库中事务并行执行的优点就损失了事务状态活动 从事务开始执行的初始状态始, 事务执行中保持该状态部分提交 事务的最后一个语句执行后进入该状态失败 一旦发现事务不能正常
4、执行时进入该状态夭折 当事务被回滚后,数据库恢复到事务开始执行前的状态。 事务夭折后有两种选择重启动 仅当没有内部逻辑错误时KILL提交 当事务成功执行后.事务状态-续abortedcommittedfailedPartiallycommittedactive分布式事务分布式事务是由若干个不同Site上的子事务组成的事务事务的ACID性质此时事务的原子性、一致性、持久性、独立性等都要将每个Site上的子事务考虑在内分布式事务结构Begin Trans . . . .Abort/CommitBegin Trans T1 T2 . . . Tn Abort/Commit进程协作进程 系统中可以并行
5、执行的一段操作序列,分布式事务中的子事务序列是进程方式完成过程 不可并行执行的操作序列事务代理(Agent) 应用在各个Site上执行的若干进程,称作应用在该Site上的代理。代理可以执行应用程序员写的程序,也可以执行系统的原语函数,不同代理间通过报文实现通讯,根代理(Root Agent) 应用启动Site上的代理。根代理所在的Site称作原发Site。 一般,根代理负责发系统原语,只有根代理可以请求创建新代理。事务代理转账应用事务在两个账户之间执行“基金汇兑”操作。全局关系 Account (Account-number, Amount)假设账户分布在网络的不同站点上。全局级转帐事务FUN
6、D_TRANSFER:read (terminal,$AMOUNT,$FROM_ACC,$TO_ACC);begin_transaction;select AMOUNT into $FROM_AMOUNT from ACCOUNT where ACCOUNT_NUMBER=$FROM_ACC;if $FROM_AMOUNT-$AMOUNT0 then abortelse begin update ACCOUNT set AMOUNT = AMOUNT-$AMOUNT where ACCOUNT_NUMBER = $FROM_ACC; update ACCOUNT set AMOUNT = AM
7、OUNT+$AMOUNT where ACCOUNT_NUMBER = $TO_ACC; commitend输入:汇出金额和转入/转出帐号事务开始:检查转出帐号中是否 有足够的转出资金?更新转出帐号存款余额创建AGENT1向代理1送消息:转入帐号,金额等待来自AGENT1的消息成功?提交事务:成功结束撤消事务:失败结束ROOT_AGENTAGENT接收来自根代理的信息更新转入帐号存款余额发送执行消息给根代理(成功或失败)是否否转账应用处理流程ROOT_AGENT;read(terminal,$AMOUNT,$FROM_ACC,$TO_ACC);begin_transaction;select
8、AMOUNT into $FROM_AMOUNT from ACCOUNT where ACCOUNT_NUMBER=$FROM_ACC;if $FROM_AMOUNT-$AMOUNT0 then abortelse begin update ACCOUNT set AMOUNT = AMOUNT-$AMOUNT where ACCOUNT_NUMBER = $FROM_ACC;create AGENT;send to AGENT($AMOUNT,$TO_ACC);commit/*这里省略了等待消息和判别*/endAGENT;receive from ROOT_AGENT($AMOUNT,$T
9、O_ACC);update ACCOUNT set AMOUNT=AMOUNT+$AMOUNT where ACCOUNT=$TO_ACC;send to ROOT_AGENT(SUCCESS/FALL) 转账事务的两个代理事务管理目标效率的几个重要方面CPU和主存的使用控制报文响应时间可用性目标维护事务的ACID性质获得最小的主存和CPU开销,降低报文数目,加快响应时间获得最大限度的可靠性和可用性事务管理DTM功能 保证分布式Trans的特征,特别是原子性支持分布式Trans执行的位置传递LTM功能保证本地Trans的特征代替DTM把分布Trans的执行与恢复信息记入Log接收并遵从本Sit
10、e上DTM发来的Log原语,记入Log并执行之DTMLTMSiteLog原语: Local Begin-Trans, Local-Commit, Local-Abort分布式Trans执行的控制模型主从模型 LTM之间无通信三角模型 LTM之间有通信层次控制模型 LTM之间有通信,并且LTM还可再创建Agent,控制其它LTM执行分布式事务管理器局部事务管理器局部事务管理器局部事务管理器数据库数据库数据库命令命令命令回答回答回答主从控制分布式事务管理器局部事务管理器局部事务管理器数据库数据库命令命令回答回答临时数据三角控制分布式事务管理器局部事务管理器数据库命令命令回答回答局部事务管理器局部事
11、务管理器局部事务管理器局部事务管理器局部事务管理器命令命令命令命令回答回答回答回答数据库数据库数据库数据库数据库层次控制故障类型事务故障由非预期的、不正常的程序结束所造成的故障,即事务没有执行到Commit或显示Rollback语句的故障,如:溢出、死循环等内存、磁盘上信息没有损失,使用Log做Rollback系统故障造成系统停止运行的任何事件,要求系统重启动内存、I/O Buffer内容皆丢失,DB没有破坏,恢复时,搜索Log, 确定Rollback的Trans。设置检查点故障类型-续介质故障辅助存储器介质遭破坏数据丢失, 日志无损失 从某个Dump状态开始执行已提交事务数据与日志都丢失 不
12、可能完全恢复通讯故障前三种统称为站点故障. 通讯故障通讯发生, 既有某个报文Message从Site x 发往Site y, 正常情况:(a) 在Dmax 之后, x 站点收到y发回的应答信息(Ack)(b) y收到的Message是一个合适的次序(c ) Message本身的信息是正确的 但是当某个Dmax之后, x还没收到y的Ack, 则可能发生: (a) Message 或 Ack 信息丢失 (b) 网络分割, 及网络不通Site xSite ymessageAck通讯故障-续 问题可以进一步分为:a) 是否是所在Site故障, 还是系统慢下来了?b) 若是故障, 是通讯故障, 还是 y
13、 站点故障?c) Message 是否已到达 y 站点? 对上述故障, 其恢复程序可以有不同级别:一级: 仅处理Site故障二级: Site故障及Message故障三级: Site故障及Message故障, 还包括网络分割SiteSiteSite Site Site Site Site 恢复算法恢复算法是保证系统故障后数据库仍保持一致性,以及保证事务原子性和持久性的技术恢复算法有两部分组成在事务正常执行时,记录下足够的能使系统恢复的信息在故障发生时,恢复数据库到一致性、原子性和持久性状态事务日志日志Log 记录所有对DB的操作事务标识 每个事务给定一个具有惟一性的标识符Log记录项 : 开始,
14、 T, 提交, T, 夭折, T, 读, T, x, 写, T, x, 旧值, 新值DB写动作 Log优先 Log存储 一般存在盘上, 事务提交时, Log Buffer强迫写Log举例Log Write Output A = 950 B = 2050 BB, BA C = 600 BC 注: BX 表示含有X的存储块.数据访问xYABx1y1 缓冲区缓冲块 A 缓冲块 Binput(A)output(B) read(X)write(Y)磁盘 T1工作区T2 工作区主存x2基于日志的恢复当系统故障时:如果 log 含有记录, 但没有记录 ,事务 Ti 必须执行 undone 如果 log 即含
15、有 又有 记录,事务 Ti 必须 redone Undo 操作先执行, redo 操作后执行.举例 已知事务 T0 和 T1 (T0 在 T1前执行):T0: read (A)T1 : read (C)A: = A - 50C:=C- 100Write (A) write (C)read (B)B:= B + 50write (B)举例-续如下是系统在三个不同时刻的Log记录.举例-续 三个不同时刻的系统恢复动作:(a) undo (T0): B 恢复到 2000 ,A恢复到 1000.(b) undo (T1) 并且 redo (T0): C恢复到 700, 然后 A和 B 分别写入950
16、和 2050 .(c) redo (T0)和 (T1): A 和 B分别写入950 和 2050 .C 写入600检查点检查点设置一个周期性操作点a) Log Buffer写入Log数据集b) 写检查点Log项, 当前活动事务表, 每个事务最近一次Log记录在Log文件中的位置c) DB Buffer写入DBd) 将检查点Log项在Log文件中的位置记入“重启动文件”检查点恢复T1 可以忽略 (因为有检查点,更新已经被写入磁盘)T2 和 T3 redone.T4 undoneTcTfT1T2T3T4checkpointsystem failure事务故障恢复恢复原则孤立和逐步退出事务的原则 u
17、ndo 事务已对DB的修改 ( 不影响其他事务的可排除性局部故障)成功结束事务原则 Redo 已成功事务的操作夭折事务原则 撤销全部事务, 恢复到初态 (Undo)事务故障恢复-续本地事务恢复 (与集中式恢复相同)从“重启动文件” 读出最近Checkpoint的地址, 并定出Checkpoint在Log文件中的位置创建Redo表, Undo表(即Checkpoint相应内容中的活动事务表)检查得出Redo事务与Undo事务反向检索Log, 将Undo表中事务撤销, 直到遇到对应的Begin Trans正向检索Redo事务的Log记录, 并执行之, 直到对应的Commit记录2PC协议 (2-P
18、hase Commit )基本思想 将本地原子性提交行为的效果扩展到分布式事务, 保证了分布式事务提交的原子性, 并在不损坏Log的情况下, 实现快速故障恢复, 提高DDB系统的可靠性.第一阶段 表决阶段第二阶段 执行阶段两类代理协调者(Coordinator)参与者(Participants)初始写begin_commit到日志等待有要求撤消的?写commit到日志提交写end_of_transt到日志初始准备提交?写ready到日志就绪消息类型?写abort到日志写commit到日志提交撤消撤消写abort到日志写abort到日志协调者参与者nonoabortcommit准备撤消提交全局撤
19、消全局提交ACKACK2PC的通讯结构集中式通讯只发生在协调者和参与者之间,参与者之间不交换信息分层式协调者是在树根的DTM代理者,协调者与参与者之间的通讯不用直接广播的方法进行,而是使报文在树中上下传播。每个DTM代理这是通信树的一个内部节点,它从下层节点除收集报文或向他们广播报文。线性 参与者之间可以互相通信。系统中的站点间要排序分布式允许所有参与者在第一阶段相互通信,从而可以独立做出事务终止决定。23451234511协调者参与者协调者协调者参与者第一阶段第二阶段准备建议撤消/提交全局撤消/提交提交/撤消集中式34251511协调者参 与 者协调者协调者参 与 者第一阶段第二阶段准备建议
20、撤消/提交全局撤消/提交提交/撤消23422分层式1234n第一阶段第二阶段准备建议提交/撤消建议提交/撤消建议提交/撤消全局提交/撤消全局提交/撤消全局提交/撤消全局提交/撤消线性式1n4324321n协调者协调者协调者+参与者第一阶段准备建议撤消/提交全局撤消/提交可独立做决定分布式2PC与故障恢复站点故障a 参与者在将“Ready”记录入Log之前故障此时协调者达到超时,Abort发生。站点(P)恢复时,重启动程序将执行Abort,不必从其他站点获取信息。b 当将“Ready”写入Log后,P故障此时所有运行的站点都将正常结束事务(Commit/Abort)。P恢复时,因为P已Ready
21、,所以不可判定C的最终决定。因此恢复时,重启动程序要询问C或其他站点。c 当C将“Prepare”写入Log,但“G-commit”/”G-abort”还没有写入是故障所有回答“Ready”的P等待C恢复。C重启动时,将重开提交协议,重发“Prepare”,于是P要识别重发。d C在将“G-commit”/”G-abort”写入Log后,“Complete”没有写入前故障收到命令的P正常执行,C重启动程序必须再次向所有P重发命令。以前没有收到命令的P也必须等待C恢复,P要识别两次命令。e “Complete”写入Log后故障无任何动作发生2PC与故障恢复-续2. 报文丢失a 从P发出的“Rea
22、dy”/“Abort”报文丢失C达到超时,整个事务执行“G-abort”。该故障仅能被C识别,此时C认为P故障,但P并无故障,不需执行重启动程序。b “Prepare”报文丢失P等待,C得不到回答,结果同2.ac “G-commit”/”G-abort”报文丢失P处于不确定状态。回答“Abort”的可以确定其工作,回答“Ready”的不行。此时可以修改加入计时器,超时则申请重发命令。d “Ack”报文丢失C超时,可重发“G-commit”/”G-abort”命令,P无论是否有活动,都重发“Ack”报文2PC与故障恢复-续网络分割假设分成两组。一组是协调者,一组是参与者。于是从协调者看是参与者组故障,结果同1.a, 1.b。 从参与者组看是协调者站点故障,动作如1.c, 1.d。初始写begin_commit到日志等待有要求撤消的?写commit到日志提交写Complete到日志初始准备提交?写ready到日志就绪消息类型?写abort到日志写commit到日志提交撤消撤消写abort到日志写abort到日志协调者参与者nonoabortcommit 2. b 准备2.a撤消2.a 提交2.c全局撤消全局提交ACKACK1.c1.d1.e1.a1.b2.d业务规则的一致性有效性约束 域约束数据依赖约束 实体完整性和引用完整性例子取现金时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 环保与珠宝鉴定师考试试题及答案
- 2024年多媒体应用设计新策略试题及答案
- 备战2024年税务师考试试题及答案
- 动态系统的特征与分析问题试题及答案
- 实战模拟2024年试题及答案
- 2024年多媒体应用设计师考试前景试题及答案
- 助力成功复习 税务师考试试题及答案
- 初中物理波的干涉与衍射试题及答案
- 2024年统计师考试信息技术应用及试题及答案
- 2024年秘书证考试商务礼仪提升试题及答案
- 电网工程设备材料信息参考价(2024年第四季度)
- 电子产品生产工艺流程手册
- 部编版小学语文二年级下册第三单元集体备课教材分析
- 小学一年级地方课程《人自然社会》全册25课教案教学设计
- 斜抛运动的规律(课堂PPT)
- 打架赔偿协议书模板
- (完整)“六宫格”数独—中级—180题
- CTC循环肿瘤细胞
- 比例的基本性质例1学习任务单
- 考研分子生物学常见试题
- 西南联大附中大事记
评论
0/150
提交评论