资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,备份与恢复概述,1,备份恢复的相关考虑,通常考虑备份恢复策略至少需要注意下面几个方面:,防止数据库在运行中可能发生的各种故障,增加数据库的连续可用时间Mean-Time-Between-Failures (MTBF),减低数据库的恢复用时间Mean-Time-To-Recover (MTTR),最小化数据的丢失,上面的几点要求使我们在制定备份恢复策略时,必须了解用户的实际需求、系统架构、资源情况、DBA的技术水平等各个方面,结合这些信息提出数据库配置的建议,执行合理的备份恢复策略,2,定义一个备份、恢复策略,制定的备份恢复策略应该结合用户的实际需求,商业需求,操作需求,实现上的考虑,管理的并发性,3,商业需求,连续高可用(MTBF),数据重要性,恢复速度快,故障时间短(MTTR),备份恢复策略的持续性,4,操作需求,24-hour 的连续操作,管理人员技术水平,是否有完善的备份恢复文档,能够在实际环境下测试备份的有效性,5,实现上的考虑,投入成本,可用资源: 硬件, 软件, 电源, 以及时间,执行操作系统级数据文件的物理拷贝,执行数据库对象的逻辑拷贝,数据库的配置,事务的频度和大小,6,灾难恢复的问题,如果遇到天灾人祸,对具有备份策略的数据库有多大的影响?,地震, 洪水, 火灾,机器完全丢失,软硬件的存储故障,数据库的关键人物不在了, 例如数据库管理员,能不能周期性的测试备份恢复策略?,7,备份恢复策略的考虑,备份策略中通常应该包括下列内容:,数据库健壮性建议,本地存储容灾方法,数据库备份的方法,备份涉及的文件,备份的执行时机,备份的执行频度,备份的存储方法和位置,异地容灾方案,针对各种故障的恢复策略,周期性的灾难恢复测试策略,8,故障类型,备份恢复策略用于解决数据库的一些故障,在数据库中可能存在很多故障,但不是所有的故障都需要执行恢复操作,下面是数据库中可能出现的故障:,语句故障,用户进程故障,用户错误,实例故障,介质故障,网络故障,9,引起语句失败的原因,应用的逻辑错误,语句语法错误,数据操作不合法,操作无权限,操作表时,超过了用户的空间配额,一些操作造成表的空间不足,在扩展时表空间剩余空间不足或者表达到了最大区数限制,10,解决语句的失败,修改程序的逻辑流.,修改并重新执行SQL语句.,提供必要的数据库权限.,使用,ALTER USER,命令改变用户的配额.,为表空间增加新的空间.,Oracle9i给用户了当因空间不足导致应用挂起时,通过分配空间而使挂起程序继续执行的能力.,alter session enable resumable;,11,用户进程失败的原因(PMON),用户异常断开了会话,客户端掉电,网络连接异常终止,服务进程被强制终止,用户的程序触发了非法地址异常错误,通过SP服务进程判断,12,解决用户进程的失败,PMON进程自动检测用户进程的非正常终止.,PMON自动回滚事务并释放所有被用户占用的资源和锁.,13,可能发生的用户错误,SQL DROP TABLE employees;,SQL TRUNCATE TABLE employees;,SQL UPDATE employees,2 SET salary = salary * 1.5;,SQL COMMIT;,SQL DELETE FROM employees;,SQL COMMIT;,14,解决用户错误,培训数据库用户.,根据故障及备份方法确定最佳恢复方案,从导出的文件中导入表和数据,使用LogMiner确定错误的时间,执行基于时间的恢复,使用LogMiner执行表数据的恢复,使用10G的FlashBack查询或者FlashBack表恢复单表数据(单表事务DML恢复),使用10G的FlashBack版本查询和FlashBack事务查询恢复复杂事务(单表复杂DML事务恢复),使用10G的FlashBack删除恢复误删除(还在recyclebin中),使用10G的FlashBack库恢复其他人为故障,15,Database,Datafile 1,Datafile 2,Datafile 3,Controlfiles,Redo log file 1,Redo log file 2,145,实例失败的原因,Instance,SGA,Redo log buffer,Data buffer,Large Pool,Locks,Shared pool,Data dict.cache,Shared SQLand PL/SQL,PMON,DBW,n,SMON,LGWR,CKPT,ARC,n,Userprocess,Serverprocess,PGA,Userprocess,Serverprocess,PGA,146,146,146,146,146,Parameterfile,Passwordfile,16,实例故障的原因,数据库非正常关闭,数据库崩溃,后台进程被强制Kill,系统资源耗尽,操作系统崩溃,服务器掉电,OS出现Bug,17,实例失败的恢复,不需要DBA执行恢复操作,立刻重启数据库,当数据库打开后立刻通知用户执行应用,检查OS中的日志文件和数据库的告警文件以确定实例失败的原因,18,介质故障的原因,存储控制卡故障,磁盘驱动器头损坏,数据文件读写故障,文件被意外的删除或者覆盖,19,解决介质故障,存储的冗余策略,异地的容灾策略,本地的恢复策略,介质故障需要由DBA手动执行,解决问题的方法依赖于故障的现场,恢复时间的要求,采取的存储冗余、容灾策略以及备份方法,也取决于哪些文件需要恢复,20,某银行的备份策略设置,异地容灾,三地异地容灾,通过复制软件形成业务数据备份,每晚对交易数据复制,实时复制用户数据,双机数据备份,交易数据同时写入主库和备库,数据实时同步,双机备份,本地容灾系统,通过存储复制软件周期性复制磁盘块,形成本地数据备份,每3小时同步一次,本地备份,每周执行全库备份,每天执行增量备份,本地磁盘保留两周的备份和归档,带库备份,每周对两周前形成的备份和归档文件执行备份,带库磁带由专门的部门异地存储,逻辑备份,服务器本地对重要数据表作逻辑备份,通常在发生数据大批量调整时对费率表、利率表、用户表等执行逻辑备份,备份文件存放服务器本地及磁带上,21,
展开阅读全文