资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第七章数据库恢复技术,事务,事务定义,事务是用户定义的一个数据库操作序列构成,这些操作要么全做,要么全不做,是一个不可分割的工作单位。,事务与应用程序是两个概念,一般来说,一个应用程序可以包含多个事务。,事务的开始与结束可以由用户显式控制。如果用户没有显式定义事务,则由,DBMS,按缺省规定自动划分事务。,SQL,中事务的定义,事务以,Begin transaction,开始,以,Commit work,或,Rollback work,结束。,Commit work,表示提交,事务正常结束。,Rollback work,表示事务非正常结束,撤消事务已做的操作,回滚到事务开始时状态。,事务的特性(,ACID,),原子性,(Atomicity),事务是数据库的逻辑工作单位,事务中包括的诸操作要么全做,要么全不做。,一致性,(Consistency),事务执行的结果应当使数据库从一个一致性状态转变为另一个一致性状态。,事务的特性(,ACID,),隔离性,(Isolation),一个事务的执行不能被其它事务干扰。即一个事务内部的操作及使用的数据对其它并发事务是隔离的,并发执行的各个事务之间不能相互干扰。,事务的特性(,ACID,),持久性,(Durability),一个事务一旦提交之后,它对数据库的影响必须是永久的。事务提交后,系统发生故障不能改变事务的持久性。,数据库恢复概述,虽然数据库系统中采用了各种措施来保证系统安全性和完整性,但计算机系统的故障是不可避免的,这些故障轻则造成运行事务的非正常中断,影响数据库中数据的正确性,重则破坏数据库,使数据库中的全部或部分数据丢失,因此数据库管理系统必须具有把数据库从错误状态恢复到某一已知正确状态的功能,这就是数据库的恢复。数据库恢复是通过数据库管理系统的恢复子系统完成的。,数据库恢复概述,数据库恢复子系统的目的包括:,保证事务的原子性,即确保一个事务被交付运行后,要么该事务中的所有数据库操作都被成功地完成,而且这些操作的结果被永久地存储到数据库中,要么这个事务对数据库没有任何影响。,当系统发生故障以后,数据库能够恢复到正确状态。,故障的种类,事务内部的故障,事务内部的故障包括可预期的和不可预期的。可预期的是指可以通过事务程序本身发现和处理的故障。而不可预期的错误是指那些不能由应用程序处理的事务故障,如死锁,运算溢出,违反完整性规则等。,故障的种类,系统故障,系统故障是指造成系统停止运行的任何事情,使得系统要重新启动。如硬件错误,操作系统故障,停电等。这类故障影响正在运行的所有事务,所有事务都非正常终止,但不会破坏数据库。恢复子系统必须清除所有未完成的事务对数据库的修改,同时重做所有已完成的事务,保证数据库的一致性。,故障的种类,介质故障,介质故障指外存故障,如磁盘损坏,瞬时强磁场干扰等。这类故障将破坏全部或部分数据库,并影响正在存取这部分数据的所有事务。,计算机病毒,计算机病毒是一种人为的破坏或故障,已成为数据库系统的主要威胁之一。,恢复的实现技术,数据库恢复的原理,数据库恢复的基本原理为冗余。如果数据库中任何一部分数据被破坏或处于不正确的状态,则可以通过存储在系统别处的冗余数据来重建。,数据库恢复的关键问题,如何建立冗余,如何利用冗余实施数据库恢复,恢复的实现技术,建立冗余的常用方法,数据转储,数据转储是数据库恢复中采用的基本技术。所谓转储即,DBA,定期地将整个数据库复制到磁带或其它存储设备上保存起来的过程。这些备用的数据文本称为后备副本或后援副本。,当数据库发生故障时,可以将后备副本重新装入,并重新运行自转储以后的所有更新事务。,恢复的实现技术,T,0,T,0,T,1,T,1,T,3,T,3,正常运行,恢复,重装后备副本,重新运行事务,恢复的实现技术,转储可以分为:,静态转储,静态转储是在系统中无事务运行时进行的转储操作。即转储开始时数据库处于一致状态,转储过程中,不允许对数据库的任何存取、更新活动。由于转储必须等待正在运行的事务结束才能开始,而新的事务必须等待转储结束才能执行,降低了数据库的可用性。,恢复的实现技术,动态转储,动态转储是指转储期间允许对数据库进行存取或修改,即转储和用户事务可以并发执行。动态转储克服了静态转储的缺点,但除了转储数据库的数据以外,还必须把转储期间各事务对数据库的修改记录下来,这样才能保证把数据库恢复到某一时刻的一致状态。,恢复的实现技术,转储的方式,海量转储,海量转储指每次转储全部数据库。,增量转储,增量转储指每次只转储上一次转储后更新过的数据。,恢复的实现技术,转储状态,动态转储,静态转储,转储,方式,海量转储,动态海量转储,静态海量转储,增量转储,动态增量转储,静态增量转储,恢复的实现技术,登录日志文件,日志文件是用来记录事务对数据库的更新操作的文件。日志文件主要有两种格式:以记录为单位的日志文件和以数据块为单位的日志文件。,以记录为单位的日志文件记录的内容包括:,各个事务的开始标记,各个事务的结束标记,各个事务的所有更新操作,恢复的实现技术,上述内容均作为日志文件中的一个日志记录,每个日志记录的内容包括:,事务标识(标明是哪个事务),操作的类型(插入、删除或修改),操作对象(记录的内部标识),更新前数据的旧值(对插入操作,此项为空),更新后数据的新值(对删除操作,此项为空),对于以数据块为单位的日志文件,日志记录的内容包括事务标识以及更新前和更新后的数据块。,恢复的实现技术,日志文件的作用,日志文件可以用来进行事务故障恢复和系统故障恢复,并协助后备副本进行介质恢复。其具体作用是:,事务故障和系统故障恢复必须使用日志文件。,在动态转储方式中必须建立日志文件,后备副本和日志文件综合起来才能保证备份的一致性,和有效地恢复数据库。,在静态转储方式中,也可以建立日志文件。当数据库发生故障时,用后援副本把数据库恢复到转储结束时的正确状态,然后利用日志文件重做已完成的事务,把数据库恢复到故障前的正确状态。,恢复的实现技术,登记日志文件,为保证数据库是可恢复的,登记日志文件时必须遵循两条原则:,登记的次序严格按并发事务执行的时间顺序。,必须先写日志文件,后写数据库。,恢复策略,事务故障的恢复,事务故障是指事务在运行至正常终止点之前被终止。事务故障的恢复是由系统自动完成的,其步骤是:,反向扫描文件日志(即从最后向前扫描日志文件),查找该事务的更新操作。,对该事务的更新操作执行逆操作,即将日志记录中的“更新前的值”写入数据库。这时,如果记录中是插入操作,则相当于做删除操作;如果记录中是删除操作,则相当于做插入操作;如果记录中是修改操作,则用修改前的值代替修改后的值。,继续反向扫描日志文件,查找该事务的更新操作,并做同样处理,如此处理下去,直到读到该事务的开始标志,。,恢复策略,系统故障的恢复,系统故障造成数据库不一致状态的原因有两个,一是未完成的事务对数据库的更新可能已经写入数据库;二是已提交事务对数据库的更新可能还留在缓冲区还没来得及写入数据库。因此恢复操作就是要撤销故障发生时未完成的事务,重做已完成的事务。,恢复策略,其步骤是:,正向扫描日志文件,找出故障发生前已经提交的事务,将其事务标识记入重做(,REDO,),队列。同时找出故障发生时尚未完成的事务,将其事务标识记入撤销(,UNDO,),队列。,对撤销队列中的各个事务进行,UNDO,处理。即反向扫描日志文件,对每个,UNDO,事务的更新操作执行逆操作,即将日志文件中的“更新前的值”写入数据库。,对重做队列中的各个事务进行,REDO,处理。即正向扫描日志文件,对每个,REDO,事务重新执行日志文件登记的操作,即将日志文件中的“更新后的值”写入数据库。,恢复策略,介质故障的恢复,介质故障将全部或部分地破坏数据库甚至是日志文件,其恢复的方法是:,装入最新的数据库后备副本(离故障发生时刻最近的转储副本),使数据库恢复到最近一次转储时的一致状态。对于动态转储的副本,还需要装入转储开始时刻的日志文件副本,将数据库恢复到一致状态。,装入转储以后的日志文件副本,重做已经完成的事务。,推迟更新技术,推迟更新技术在日志中记录对事务,T,的所有更新操作,并把所有对数据库的更新操作推迟到该事务提交时执行。它遵循以下推迟更新协议:,每个事务在到达提交点之前不能更新数据库。,一个事务的所有更新操作所对应的日志记录写入永恒存储器之前,该事务不能到达提交点。,当一个事务到达提交点时,我们称该事务进入部分提交状态。推迟更新协议保证当一个事务部分提交时,该事务的所有更新操作的信息已经记录在日志中。,推迟更新技术,当,T,开始执行时,推迟更新技术在日志中写入,。,如果,T,执行,Write(X),的操作,推迟更新技术在日志中写入,,,其中,V,1,为,X,的原始值,,V,2,为,Write(X),要,写入的,X,值。当,T,进入部分提交状态时,推迟更新技术在日志中写入,。,接着,所有日志记录都写入永恒存储器。然后,对于日志中的每个形如,的,记录,将数据库中,X,数据项的值更新为,V,2,。,推迟更新技术,试,考虑如下数据库事务,T,0,和,T,1,,,其中,A,、,B,和,C,的初值分别为,1000,,,2000,和,700,,,T,0,和,T,1,按照串行调度,执行:,T0:read(A),A=A-50,write(A),read(B),B=B+50,write(B),T1:read(C),C=C-100,write(C),推迟更新技术,日志文件,数据库,T,0,starts,T,0,A,950,T,0,B,2050,T,0,commit,A=950,B=2050,T,1,starts,T,1,C,600,T,1,commit,C=600,推迟更新技术,T,0,starts,T,0,starts,T,0,starts,T,0,A,950,T,0,A,950,T,0,A,950,T,0,B,2050,T,0,B,2050,T,0,B,2050,T,0,commit,T,0,commit,T,1,starts,T,1,starts,T,1,C,600,T,1,C,600,T,1,commit,即时更新技术,即时更新技术允许事务直接更新数据库。处于活动状态的事务直接在数据库实施的更新称为非提交更新。任何即时更新技术都必须遵循如下的即时更新协议:,所有,型日志记录安全的存储到永恒存储器之前,不允许事务,T,更新数据库。,所有,型日志记录安全的存储到永恒存储器之前,不允许事务,T,提交。,即时更新协议保证在系统故障发生时,每个运行事务的更新操作都安全地记录在日志中。,即时更新技术,当,T,开始执行时,,被写入日志,。在,T,运行期间,当,T,发出一个,Write(X),操作时,记录,首先被写入日志,然后,直接在数据库上执行,Write(X),。当,T,部分提交时,,被写入日志,。,为满足即时更新协议的要求,在,Write(X),直接作用到数据库之前,有关这个操作的日志记录必须安全地写入永恒存储器。,即时更新技术,日志文件,数据库,T,0,starts,T,0,A,1000,950,A=950,T,0,B,2000,2050,B=2050,T,0,commit,T,1,starts,T,1,C,700,600,C=600,T,1,commit,即时更新技术,T,0,starts,T,0,starts,T,0,starts,T,0,A,1000,950,T,0,A,1000,950,T,0,A,1000,950,T,0,B,2000,2050,T,0,B,2000,2050,T,0,B,2000,2050,T,0,commit,T,0,commit,T,1,starts,T,1,starts,T,1,C,700,600,T,1,C,700,600,T,1,commit,具有检查点的恢复技术,利用日志技术进行恢复时,恢复子系统通常需要检查所有日志记录,这
展开阅读全文