资源描述
重要信息平安管理过程重要信息平安管理过程主讲樊山课程内容课程内容安全管理安全管理措施措施知识体知识体知识域知识域基本安全基本安全管理措施管理措施重要安全重要安全管理过程管理过程知识子域知识子域安全策略安全策略人员安全管理人员安全管理访问控制访问控制物理与环境安全物理与环境安全系统获取、开发和维护系统获取、开发和维护通信及操作管理通信及操作管理安全组织机构安全组织机构资产管理资产管理符合性管理符合性管理信息安全事件管理与应信息安全事件管理与应急响应急响应业务连续性管理业务连续性管理与灾难恢复与灾难恢复信息平安事件管理与应急响应信息平安事件管理与应急响应理解信息平安事件管理和应急响应的本概念了解我国信息平安事件应急响应工作的进展情况和政策要求掌握信息平安应急响应阶段方法论掌握信息平安应急响应方案编制方法掌握应急响应小组的作用和建立方法理解我国信息平安事件分级分类方法了解国际和我国信息平安应急响应组织3根本概念根本概念4平安事件平安事件 而平安事件那么是指影响一个系统正常工而平安事件那么是指影响一个系统正常工作的情况。这里的系统包括主机范畴内的问题,作的情况。这里的系统包括主机范畴内的问题,也包括网络范畴内的问题,例如黑客入侵、信息也包括网络范畴内的问题,例如黑客入侵、信息窃取、拒绝效劳攻击、网络流量异常等。窃取、拒绝效劳攻击、网络流量异常等。应急响应应急响应Emergency ResponseEmergency Response 是指组织为了应对突发是指组织为了应对突发/重大信息平安事件的重大信息平安事件的发生所做的准备以及在事件发生后所采取的措施。发生所做的准备以及在事件发生后所采取的措施。根本概念根本概念5应急响应方案应急响应方案Emergency Response PlanEmergency Response Plan 是指在突发是指在突发/重大信息平安事件后对包括计重大信息平安事件后对包括计算机运行在内的业务运行进行维持或恢复的策略算机运行在内的业务运行进行维持或恢复的策略和规程。和规程。信息平安应急响应方案的制定是一个周而复始、信息平安应急响应方案的制定是一个周而复始、持续改进的过程,包含以下几个阶段:持续改进的过程,包含以下几个阶段:1 1应急响应需求分析和应急响应策略确实定;应急响应需求分析和应急响应策略确实定;2 2编制应急响应方案文档;编制应急响应方案文档;3 3应急响应方案的测试、培训、演练和维护。应急响应方案的测试、培训、演练和维护。应急响应与应急响应方案的关系应急响应与应急响应方案的关系6政策要求政策要求7?关于加强信息平安保障工作的意见?中办发200327号文指出:“信息平安保障工作的要点在于,实行信息平安等级保护制度,建设基于密码技术的网络信任体系,建设信息平安监控体系,重视信息平安应急处理工作,推动信息平安技术研发与产业开展,建设信息平安法制与标准国家信息平安战略的近期目标:通过五年的努力,根本建成国家信息平安保障体系。相关标准相关标准8GB/T24364-2021?信息平安技术信息平安应急响应方案标准?GB/T20988-2007?信息平安技术信息系统灾难恢复标准?GB/Z20985-2007?信息技术平安技术信息平安事件管理指南?GB/Z20986-2007?信息平安技术信息平安事件分类分级指南?应急响应六阶段应急响应六阶段9第一阶段:准备第一阶段:准备让我们严阵以待让我们严阵以待第二阶段:确认第二阶段:确认对情况综合判断对情况综合判断第三阶段:遏制第三阶段:遏制制止事态的扩大制止事态的扩大第四阶段:铲除第四阶段:铲除彻底的补救措施彻底的补救措施第五阶段:恢复第五阶段:恢复系统恢复常态系统恢复常态第六阶段:跟踪第六阶段:跟踪还会有第二次吗还会有第二次吗第一阶段第一阶段准备准备10预防为主微观一般观点:帮助效劳对象建立平安政策帮助效劳对象按照平安政策配置平安设备和软件扫描,风险分析,打补丁如有条件且得到许可,建立监控设施宏观:建立协作体系和应急制度建立信息沟通渠道和通报机制如有条件,建立数据汇总分析的体系和能力有关法律法规的制定第一阶段第一阶段准备准备11制定应急响应方案资源准备应急经费筹集人力资源软硬件设备现场备份业务连续性保障系统容灾搭建临时业务系统第二阶段第二阶段确认确认12确定事件性质和处理人微观负责具体网络的CERT:确定事件的责任人指定一个责任人全权处理此事件给予必要的资源确定事件的性质误会?玩笑?还是恶意的攻击/入侵?影响的严重程度预计采用什么样的专用资源来修复?宏观负责总体网络的CERT:通过汇总,确定是否发生了全网的大规模事件确定应急等级,以决定启动哪一级应急方案第三阶段第三阶段遏制遏制13即时采取的行动微观:防止进一步的损失,确定后果初步分析,重点是确定适当的封锁方法咨询平安政策确定进一步操作的风险损失最小化最快最简单的方式恢复系统的根本功能,例如备机启动可列出假设干选项,讲明各自的风险,由效劳对象选择宏观:确保封锁方法对各网业务影响最小通过协调争取各网一致行动,实施隔离汇总数据,估算损失和隔离效果第四阶段第四阶段铲除铲除14长期的补救措施微观:详细分析,确定原因,定义征兆分析漏洞加强防范消除原因修改平安政策宏观:加强宣传,公布危害性和解决方法,呼吁用户解决终端的问题;加强检测工作,发现和清理行业与重点部门的问题;第五阶段第五阶段恢复恢复15微观:被攻击的系统恢复正常的工作状态作一个新的备份把所有平安上的变更作备份效劳重新上线持续监控宏观:持续汇总分析,了解各网的运行情况根据各网的运行情况判断隔离措施的有效性通过汇总分析的结果判断仍然受影响的终端的规模发现重要用户及时通报解决适当的时候解除封锁措施第六阶段第六阶段跟踪跟踪16关注系统恢复以后的平安状况,特别是曾经出问题的地方建立跟踪文档,标准记录跟踪结果对响应效果给出评估对进入司法程序的事件,进行进一步的调查,打击违法犯罪活动事件的归档与统计事件的归档与统计17处理人时间和时段地点工作量事件的类型对事件的处置情况代价细节信息平安应急响应方案编制方法信息平安应急响应方案编制方法18总那么角色及职责预防和预警机制应急响应流程应急响应保障措施附件总那么总那么19编制目的编制依据适应范围工作原那么角色及职责角色及职责20应急响应领导小组应急响应技术保障小组应急响应专家小组应急响应实施小组应急响应日常运行小组预防和预警机制预防和预警机制21应急响应流程应急响应流程22应急响应流程应急响应流程呼叫树呼叫树23应急响应保障措施应急响应保障措施24应急响应应急响应保障措施保障措施附件附件25具体的组织体系结构及人员职责应急响应方案各小组成员的联络信息供给商联络信息,包括离站存储和备用站点的外部联系点系统恢复或处理的标准操作规程和检查列表支持系统运行所需的硬件、软件、固件和其它资源的设备和系统需求清单供给商效劳水平协议SLA、与其它机构的互惠协议和其它关键记录备用站点的描述和说明在方案制定前进行的BIA,包含关于系统各局部相互关系、风险、优先级别等应急响应方案文档的保存和分发方法应急响应工作机构图应急响应工作机构图26职责例如职责例如27应急响应领导小组:应急响应领导小组:应急响应领导小组是信息安全应急响应工作的组织领导机构,组长应由组织最高管理层成员担任。领导小组的职责是领导和决策信息安全应急响应的重大事宜,主要如下:(1)对应急响应工作的承诺和支持,包括发布正式文件、提供必要资源(人财物)等;(2)审核并批准应急响应策略;(3)审核并批准应急响应计划;(4)批准和监督应急响应计划的执行;(5)启动定期评审、修订应急响应计划;(6)负责组织的外部协作工作。我国信息平安事件分类方法我国信息平安事件分类方法28GB/Z 20986-2007?信息平安事件分级分类指南?有害程序事件网络攻击事件信息破坏事件信息内容平安事件设备设施故障、灾害性事件其他信息平安事件我国信息平安事件分级方法我国信息平安事件分级方法29分级要素我国信息平安事件分级方法我国信息平安事件分级方法30特别重特别重大事件大事件重重 大大事事 件件较较 大大事事 件件一一 般般事事 件件国际信息平安应急响应组织国际信息平安应急响应组织31美国计算机紧急事件响应小组协调中心 Computer Emergency Response Team/Coordination Center,CERT/CC事件响应与平安组织论坛Forum of Incident Response and Security Teams,FIRST亚太地区计算机应急响应组Asia Pacific Computer Emergency Response Team,APCERT欧洲计算机网络研究教育协会Trans-European Research and Education Networking Association,TERENA)我国信息平安应急响应组织我国信息平安应急响应组织32国家计算机网络应急技术处理协调中心 National Computer network Emergency Response technical Team/Coordination Center of China,CNCERT/CC中国教育和科研计算机网紧急响应组(China Education and Research Network Computer Emergency Response Team,CCERT)国家计算机病毒应急处理中心国家计算机网络入侵防范中心国家863方案反计算机入侵和防病毒研究中心业务连续性管理与灾难恢复业务连续性管理与灾难恢复33理解业务连续性管理与灾难恢复的根本概念了解我国灾难恢复工作的进展情况和政策要求了解数据储存和数据备份与恢复的根本技术掌握灾难恢复管理过程:需求分析、灾难恢复策略制定、灾难恢复策略实现、灾难恢复预案制定和管理掌握国家有关标准对灾难恢复系统级别和各级别的指标要求什么是灾难什么是灾难灾难disaster?信息平安技术信息系统灾难恢复标准?GB/T209882007由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或效劳水平不可接受、到达特定的时间的突发性事件。通常导致信息系统需要切换到灾难备份中心运行。*典型的灾难事件包括:自然灾害,如火灾、洪水、地震、飓风、龙卷风、台风等,还有技术风险和提供给业务运营所需效劳的中断,如设备故障、软件错误、通讯网络中断和电力故障等等;此外,人为的因素往往也会酿成大祸,如操作员错误、植入有害代码和恐怖袭击。人员误操作人员误操作34业务持续性的重要性业务持续性的重要性“在经历过灾难的企业中,每在经历过灾难的企业中,每5家中有家中有2家在家在5年年内会完全退出市场。当且仅当企业在灾难前或内会完全退出市场。当且仅当企业在灾难前或灾难后采取了必要的措施后,企业可以改变这灾难后采取了必要的措施后,企业可以改变这种状况。业务持续性方案和灾难恢复方案效劳种状况。业务持续性方案和灾难恢复方案效劳将确保持续的生存性将确保持续的生存性Gartner,Disaster Recovery Plans and Systems Are Essential,by Roberta Witty,Donna Scott,12 September 2001.所有公司中,所有公司中,50-60%50-60%没有可以用于工作的灾难没有可以用于工作的灾难恢复方案恢复方案35备份与恢复备份与恢复灾难备份backupfordisasterrecovery为了灾难恢复而对数据、数据处理系统、网络系统、根底设施、专业技术支持能力和运行管理能力进行备份的过程。灾难恢复disasterrecovery为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态、并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态而设计的活动和流程。36规划和预案规划和预案灾难恢复规划disasterrecoveryplanning为了减少灾难带来的损失和保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作所做的事前方案和安排。灾难恢复预案disasterrecoveryplan定义信息系统灾难恢复过程中所需的任务、行动、数据和资源的文件。用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。37BCP和和BCM业务连续规划BusinessContinuityPlanning,简称“BCP是灾难事件的预防和反响机制,是一系列事先制定的策略和规划,确保单位在面临突发的灾难事件时,关键业务功能能持续运作、有效的发挥作用,以保证业务的正常和连续。业务连续规划不仅仅包括对信息系统的恢复,而且包括关键业务运作、人员及其它重要资源等的恢复和持续。业务连续管理(BusinessContinuityManagement,简称“BCM)为保护组织的利益、声誉、品牌和价值创造活动,找出对组织有潜在影响的威胁,提供建设组织有效反响恢复能力的框架的整体管理过程。包括组织在面临灾难时对恢复或连续性的管理,以及为保证业务连续方案或灾难恢复预案的有效性的培训、演练和检查的全部过程。38BCM、BCP、DRP对于信息化依赖程度高的单位,信息系统灾难恢复是其业务连续规划的重要组成局部。信息系统灾难恢复的目的是保证信息系统所支持业务的连续,业务连续规划面向信息系统及业务恢复。39BCP/DRP的指标的指标恢复点目标恢复点目标-RPO/恢复时间目标恢复时间目标-RTO秒秒分分小时小时日日 周周秒秒分分小时小时 日日 周周恢复点恢复点恢复点恢复点恢复时间恢复时间恢复时间恢复时间vRPORPORecovery Point ObjectiveRecovery Point Objective,恢复点目标,恢复点目标v定义:灾难发生后,系统合数据必须恢复到的时间点要求定义:灾难发生后,系统合数据必须恢复到的时间点要求v代表了当灾难发生时允许丧失的数据量代表了当灾难发生时允许丧失的数据量vRTORTORecovery Time Objective Recovery Time Objective,恢复时间目标,恢复时间目标v定义:灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。定义:灾难发生后,信息系统或业务功能从停顿到必须恢复的时间要求。v代表了系统恢复的时间代表了系统恢复的时间40主中心与灾难备份中心主中心与灾难备份中心主中心也称主站点或生产中心,是指主系统所在的数据中心。灾难备份中心也称备用站点。是指用于灾难发生后接替主系统进行数据处理和支持关键业务功能运作的场所,可提供灾难备份系统、备用的根底设施和专业技术支持及运行维护管理能力,此场所内或周边可提供备用的生活设施。41主系统与灾难备份系统主系统与灾难备份系统主系统也称生产系统,是指正常情况下支持组织日常运作的信息系统。包括主数据、主数据处理系统和主网络。灾难备份系统,是指用于灾难恢复目的,由数据备份系统、备用数据处理系统和备用的网络系统组成的信息系统。42灾难恢复过程灾难恢复过程43灾难恢复建设流程灾难恢复建设流程44我国国内灾难恢复的开展概况我国国内灾难恢复的开展概况 20世纪90年代末期,一些单位在信息化建设的同时,开始关注对数据平安的保护,进行数据的备份,但当时,不管从灾难恢复理论水平,重视程度,从业人员数量质量,还是技术水平方面都还很不成熟。2000年,“千年虫事件引发了国内对于信息系统灾难的第一次集体性关注,但“9.11事件所引起的震动真正地引起了大家对灾难恢复的关注。45我国国内灾难恢复的开展概况我国国内灾难恢复的开展概况各行业用户对信息平安的建设越来越重视投入呈现稳定增长的态势,但,大局部单位还没有有效的灾难恢复策略没有建立统一的业务连续管理机制。随着国内信息化建设的不断完善、数据大集中的开展和国家对灾难恢复工作的高度重视,越来越多的单位和部门认识到灾难恢复的重要性和必要性,开展灾难恢复建设的时机已根本成熟。46我国国内灾难恢复的国家我国国内灾难恢复的国家政策和标准政策和标准 2003年,?国家信息化领导小组关于加强信息平安保障工作的意见?,要求:各根底信息网络和重要信息系统建设要充分考虑抗毁性与灾难恢复,制定和不断完善信息平安应急处置预案。2004年,国信办?关于做好重要信息系统灾难备份工作的通知?,强调了“统筹规划、资源共享、平战结合的灾备工作原那么。2005年,国务院信息化办公室?重要信息系统灾难恢复指南?2007年,?信息平安技术信息系统灾难恢复标准?GB/T20988200747我国国内灾难恢复地方和行我国国内灾难恢复地方和行业的开展业的开展 北京市、上海市、深圳市、广州市、成都市等地都已出台或正在研究电子政务信息系统灾难恢复工作的意见和规划;人民银行、银监会、保监会出台了有关行业政策国税总局、海关总署、人民银行、商务部等部委均已完成或正在建设灾备中心;北京、上海、深圳、广州、杭州等各地政府已建设或启动灾备中心建设。其他信息化程度较高的行业如保险、证券、电力、民航、电信、石化、钢铁等企业正在开展和规划灾难恢复系统的建设48我国灾难恢复工作存在的主我国灾难恢复工作存在的主要问题要问题存在侥幸心理,缺乏开展灾难恢复工作的积极性;在没有统筹规划,各行业及地方自行建设灾难备份中心,造成社会经济资源的分散和浪费;从事灾难恢复建设和效劳的企业良莠不齐,局部企业缺乏专业化能力,不能满足灾难恢复的要求;已建成的灾备中心普遍缺乏严格的演练,灾备中心的运营缺乏有效的监管和审计,导致大量的灾备中心无法在灾难来临时有效发挥作用;灾难备份恢复有关人员意识欠缺、专业人才缺乏49灾难恢复规划的过程阶段灾难恢复规划的过程阶段业务影响分析制定恢复策略灾难恢复策略的实现灾难恢复预案的制定、落实和管理分析业务分析业务功能和相功能和相关资源配关资源配置置评估中断评估中断影响影响确定灾难恢确定灾难恢复资源获取方复资源获取方式式确定灾难恢确定灾难恢复等级的要素复等级的要素要求要求正式文档化正式文档化灾难备份中心灾难备份中心的选择和建设的选择和建设灾难备份系统灾难备份系统技术方案的实技术方案的实现现技术支持能力技术支持能力的实现的实现运行维护能力运行维护能力的实现的实现灾难恢复预案灾难恢复预案的制订的制订灾难恢复预案灾难恢复预案的教育、培训的教育、培训和演练和演练灾难恢复预案灾难恢复预案的管理的管理风险分析标识资产标识资产标识威胁标识威胁标识脆弱标识脆弱性性标识现有标识现有控制控制定量定量/定定性风险分性风险分析析灾难恢复需求分析灾难恢复需求分析灾难恢复策略灾难恢复策略制定制定灾难恢灾难恢复预案复预案制定和制定和管理管理灾难恢复策略灾难恢复策略实现实现确定灾难恢复目标关键业务关键业务功能及恢功能及恢复的优先复的优先级级RTO/RPO的范围的范围501.灾难恢复需求分析灾难恢复需求分析风险评估对我们为什么需要灾难恢复建设这一问题给出了答案业务影响分析BIA为我们后续的灾难恢复系统建设提供了以下信息:谁、什么、何地、何时、如何机构面临的风险有哪些?哪些风险的危害更大?哪些业务和系统对机构更重要?这些业务和系统的关系?这些业务和系统应该多久恢复?这些业务和系统谁应领先恢复?哪些业务数据不能丧失?需要依赖哪些外部机构?恢复时需要哪些资源?511.灾难恢复需求分析灾难恢复需求分析1.1 风险分析风险分析风险分析为机构提供:1.识别足以影响机构持续提供业务的各种潜在性风险;2.确定各种风险发生的可能性;3.制定并实施各特定风险的预防控制措施4.为剩余风险的应对处理做好准备。风险分析范围:1.机构所在地区范围和与之在经济、业务上有紧密联系的邻近地区的交通、电讯、能源及其它关键根底设施遭到严重破坏的风险;2.造成此地区的大规模人口疏散或无法联系后所面对的风险;3.机构信息系统中断所造成的系统性风险。52明确关键业务功能和支持关键业务功能的关键应用系统;明确系统中断对业务的损失和影响;明确各业务系统的恢复目标和内外部依赖关系;确定各业务功能灾难恢复指标RTO/RPO;明确各业务功能恢复的最小资源需求及恢复策略;1.灾难恢复需求分析灾难恢复需求分析1.2 BIA-业务影响分析业务影响分析531.灾难恢复需求分析灾难恢复需求分析1.3 确定灾难恢复目标确定灾难恢复目标542.制定灾难恢复策略制定灾难恢复策略什么是灾难恢复策略是机构为了到达灾难恢复的需求目标而采取的途径;它包含实现的方案、方法和可选的方案;是基于机构对自身灾难恢复需求确切了解的根底上做出的;其根本目的是为了到达在灾难恢复需求中描述的实现目标;是指导整个灾难恢复建设的纲领性文件;要遵循本钱风险平衡原那么;描述了灾难恢复需求的实现步骤和实现方法。55562.制定灾难恢复策略制定灾难恢复策略-主体内容主体内容数据备份系统备用数据处理系统备用网络系统备用根底设施技术支持能力运行维护管理能力灾难恢复预案策略策略要素要素主要主要内容内容 资源获取方式 要素 具体要求57例如:灾难恢复资源的获取方例如:灾难恢复资源的获取方式式备用根底设施a)由单位所有或运行;b)多方共建或通过互惠协议获取;c)租用商业化灾难备份中心的根底设施。备用数据处理系统a)事先与厂商签订紧急供货协议;b)事先购置所需的数据处理设备并存放在灾难备份中心或平安的设备仓库;c)利用商业化灾难备份中心或签有互惠协议的机构已有的兼容设备。58例如:确定灾难恢复等级各要素的例如:确定灾难恢复等级各要素的要求要求 数据备份系统a)数据备份的范围;b)数据备份的时间间隔;c)数据备份的技术及介质;d)数据备份线路的速率及相关通信设备的规格和要求。备用根底设施a)与生产系统所在的数据处理中心以下简称“生产中心的距离要求;b)场地和环境如面积、温度、湿度、防火、电力和工作时间等要求;c)运行和管理要求。593、灾难恢复策略的实现、灾难恢复策略的实现3.1灾难备份中心的选择和建设选址原那么根底设施要求3.2灾难备份系统技术方案的实现3.3技术支持能力的实现3.4运行维护管理能力的实现3.5灾难恢复预案的实现60灾难恢复根底设施的选择和建设灾难恢复根底设施的选择和建设选址原那么61设施类型设施类型设施名称设施名称说明说明工作设施工作设施信息系统工作设施信息系统工作设施 位于灾难备份中心的核心区域的信息系统设备及相关配套设备,主要包括:计算机机房、主操作室、通讯机房、介质机房、信息系统设备测试维修机房等。保障系统工作设施保障系统工作设施 位于灾难备份中心的保障设备区域,用来保障灾难备份中心7*24小时运行的设施,主要包括:供配电设施、空调暖通设施、给排水设施、消防设施、监控设施、货运设施等。辅助设施辅助设施灾难备份中心辅助灾难备份中心辅助设施设施 用于灾难备份中心运行所需的配套设施,主要包括:灾难备份中心办公室、会议室、资料室、值班室、仓库、客户接待室、客户休息室、客户活动区域、停车场、货物装卸区等。灾难恢复辅助设施灾难恢复辅助设施 灾难备份中心中提供灾难恢复用途的设施,主要包括:灾难恢复指挥中心、灾难恢复座席区、办公区、新闻发布中心(多媒体室)、会议室、打印传真室等。灾难恢复培训设施灾难恢复培训设施 灾难备份中心中提供用于灾难恢复或业务连续性培训的设施,主要包括:培训教室、模拟演练室、培训人员办公室等。生活设施生活设施保障人员生活设施保障人员生活设施 提供给灾难备份中心7*24小时运行而配备的人员生活所必须的设施,主要包括:宿舍、食堂、健身房、阅览室等生活设施。灾难恢复人员生活灾难恢复人员生活设施设施 提供给灾难恢复或灾难恢复培训人员所需要的生活设施,主要包括:客房、食堂等生活设施。灾难备份中心根底设施的要求灾难备份中心根底设施的要求62灾难恢复根底设施的选择和建设灾难恢复根底设施的选择和建设同城和异地63灾难备份技术方案要素灾难备份技术方案要素数据备份系统备份的数据范围恢复时间目标数据复制通信网络网络设备v 备用数据处理系统 恢复的处理能力要求 主机、存储 系统、数据库、中间件软件 应用软件 专用设备 本地网络v 备用网络系统 灾难恢复通信网络 网络设备64典型的灾难恢复技术方案架构典型的灾难恢复技术方案架构65实现对灾难备份系统的运行实现对灾难备份系统的运行维护及技术支持维护及技术支持为实现对灾难备份系统的运行维护及技术支持,该体系应至少包含以下几个组成局部:组织架构、运行维护要求、运行维护方式及管理制度。66实现对灾难备份系统的运行实现对灾难备份系统的运行维护及技术支持维护及技术支持组织架构:运行维护团队、技术支持团队、外部支持团队运行维护的内容:根底设施维护:供配电系统维护、发电机维护、UPS维护、空调系统维护、消防系统维护等灾难备份系统维护:数据备份介质的保管、数据备份系统的运行维护、备用数据处理系统及备用网络系统的运行维护等灾难恢复预案的维护:灾难恢复预案必须与恢复人员、恢复技术、恢复目标和范围的调整同步更新,才能够保证灾难恢复预案的有效性。67实现对灾难备份系统的运行实现对灾难备份系统的运行维护及技术支持维护及技术支持管理制度灾难备份的流程和管理制度;灾难备份中心机房的管理制度;按介质特性对备份数据进行定期存取、验证和转储管理制度;硬件系统、系统软件和应用软件的运行管理制度;灾难备份系统的变更管理流程;灾难恢复预案以及相关技术手册的保管、分发、更新和备案制度;非灾难恢复用的信息系统运行管理制度;平安管理规定;根底设施维护的工作规程及操作手册;各部门及岗位的管理规定;应急处理工作规程和操作手册。684、灾难恢复预案的制订、落、灾难恢复预案的制订、落实和管理实和管理4.1灾难恢复预案的制订4.2灾难恢复预案的教育、培训和演练4.3灾难恢复预案的管理69灾难恢复预案的制定灾难恢复预案的制定灾难恢复预案的包括的主要内容确定风险场景描述可能受到的业务影响描述使用的预防性策略描述灾难恢复策略识别和排列关键应用系统行动方案团队和人员的职责联络清单所需资源配置70灾难恢复预案的制定灾难恢复预案的制定制定灾难恢复预案的原那么首先,必须集中管理灾难恢复预案的版本和发布。其次,为了建立有效的版本控制体系,必须建立标准的灾难恢复预案的问题提交、解决、更新、跟踪、发布的渠道和流程。第三,建立相关的保密管理规定,保证灾难恢复预案中涉及的秘密信息得到保护。第四,灾难恢复预案在内容管理方面应注意内容的分布和粒度,可根据版本和内容的更新频度将灾难恢复的内容进行适当的分布。第五,建立合理的灾难恢复预案的保管制度,强调存放的平安性和易取得性。71灾难恢复预案的制定灾难恢复预案的制定清楚、简洁高级管理层支持/组织承诺不断改进和更新的恢复策略及时的更新维护v组织职责分工明确v保存、备份和异地存储方案v完整记录并定期演练v风险得到管理v弱点得到优先重视v灵活、可适应v成功预案的特点72灾难恢复预案的教育、培训和灾难恢复预案的教育、培训和演练演练在灾难来临前使相关人员了解熟悉恢复流程使灾难恢复预案得到理解并可以使用促进灾难恢复预案活动、更新、实用展示恢复的能力到达法律和内部审计要求73演练与演习的类型演练与演习的类型演练和演习的主要方式有:桌面演练;模拟演练;实战演练等根据演练和演习的深度,可分为:系统级演练;应用级演练;业务级演练等根据演练和演习的准备情况,可分为:方案内的演练和演习;方案外的演练和演习等74预案维护管理预案维护管理核对预案的功能性验证预案文档的精确性和完整性分发更新的文档文档方案分发和发布流程确保相关的团队收到更新的文档依靠维护来改变管理流程提供培训作为持续维护预案的一局部为与灾难恢复的相关人员开展定期培训,如:复习进修课程或灾难备份研讨会指派培训责任,如:部门经理要确保员工被送去参加培训完成时报告预案维护情况毁掉旧灾难恢复预案的复印件或电子版本。75预案变更管理预案变更管理业务操作的增长或变化如:新的分支、产品和业务功能的增加公司所有权的变化关键人员的变化硬件配置的变化使用新操作系统预案审核和演练后软件/应用软件的变化新的法律或审计要求定期审核和更新如:每年两次76需要备份的数据类型需要备份的数据类型系统数据主要是指操作系统、数据库系统安装的各类软件包和应用系统执行程序。系统数据在系统安装后根本上不再变动,只有在操作系统、数据库系统版本升级或应用程序调整时才发生变化。系统数据一般都有标准的安装介质如软盘、磁带、光盘。根底数据主要是指保证业务系统正常运行所使用的系统资产清单、用户清单、系统配置文件、网络配置文件、应用配置文件、存取权限控制等。根底数据随业务系统运行环境的变化而变化,一般作为系统档案进行保存。应用数据主要是指业务系统的所有业务数据,对数据的平安性、准确性、完整性、一致性要求很高,而且变化频繁。临时数据主要是指操作系统、数据库产生的系统运行记录、数据库逻辑日志和应用程序在执行过程中产生的各种打印、传输临时文件,随系统运行和业务的发生而变化。77需要备份的数据类型需要备份的数据类型临时数据系统数据基础数据应用数据小大数据量慢快变化与更新频度78备份类型备份类型全备份:所谓全备份就是对整个系统所有文件进行完全备份,包括所有系统和数据。增量备份:所谓增量备份就是每次备份的数据只是相当于上一次备份后增加和修改正的数据。差分备份:所谓差分备份就是每次备份的数据是相对于上一次全备份之后新增加和修改正的数据。79IDE电子集成驱动器,将硬盘控制器与盘体集成在一起的硬盘驱动器,采用PATA并行ATA接口。价廉、稳定、速率较慢最高133MB/S,适用于个人PCSATA串口硬盘,比PATA针脚数少,速率高SATA2.0可到达300MB/S,适用于中低端存储系统SCSI小型计算机系统接口,支持热插拔扩容能力强,传输速率高可到达320MB/S,CPU占用率低、并行处理能力强支持更多用户同时访问,适用于中高端存储系统光纤通道FC其实是使用SCSI-3标准,通过光学物理通道进行工作的光纤硬盘,传输速率最高500MB/S。支持热插拔、扩容能力强、速度快、远程连接硬盘接口类型硬盘接口类型80RAID 技术技术RAID 廉价冗余磁盘阵列,廉价冗余磁盘阵列,Redundant Array of Inexpensive Disk 技术提供了技术提供了在线储存计算机数据的方法。在线储存计算机数据的方法。RAID包含很多大约相同容量的磁盘,但是包含很多大约相同容量的磁盘,但是它整体磁盘子系统仍然看起来是一个单一它整体磁盘子系统仍然看起来是一个单一的、可靠的、和高速的逻辑磁盘。的、可靠的、和高速的逻辑磁盘。RAID技术的使用,不仅使得数据更加平安,技术的使用,不仅使得数据更加平安,而且保证了可靠数据的持续可用性。而且保证了可靠数据的持续可用性。RAID有有8种常见的实施方式,每一种都提供种常见的实施方式,每一种都提供了独一无二的特性。了独一无二的特性。这这8种是级别种是级别0、级别、级别1、级别、级别2、级别、级别3、级、级别别4、级别、级别5、级别、级别6和级别和级别10。RAID的级的级别并不代表它们性能的上下,每一级别的别并不代表它们性能的上下,每一级别的RAID都有着它自己的优势和劣势。都有着它自己的优势和劣势。81廉价磁盘冗余阵列廉价磁盘冗余阵列v廉价磁盘冗余阵列廉价磁盘冗余阵列Redundant Arrays of Redundant Arrays of Inexpensive DisksInexpensive Disks,RAID RAID使用三种技术:使用三种技术:v镜像镜像MirroringMirroring,系统同时,系统同时SimultaneouslySimultaneously将数据写到两个别离的硬盘驱动器或驱动器阵将数据写到两个别离的硬盘驱动器或驱动器阵列。列。优点是减少停机时间优点是减少停机时间DowntimeDowntime、简化数、简化数据恢复和提高从磁盘读取据恢复和提高从磁盘读取ReadingReading的性能。缺的性能。缺点是磁盘写入点是磁盘写入WritingWriting较慢。较慢。v较验较验ParityParity,确定数据是否丧失或被覆盖的,确定数据是否丧失或被覆盖的技术。技术。优点是无需存储数据拷贝就可以保护数据。优点是无需存储数据拷贝就可以保护数据。v条纹条纹StripingStriping,通过将数据分布,通过将数据分布DistributeDistribute到所有的驱动器来提高硬件阵列控到所有的驱动器来提高硬件阵列控制器的性能。条纹可以在字节制器的性能。条纹可以在字节Byte-levelByte-level或或数据块级别数据块级别Block-levelBlock-level进行。进行。82数据存储技术数据存储技术DAS,直接附加存储,通过电缆SCSI或光缆FC将存储设备直接连接到效劳器上优点适宜效劳器地理分布分散的情况实现大容量存储实现操作系统与数据的别离提高存取性能实施简单缺点对效劳器依赖性强,占用效劳器资源扩展性差,扩展时需要停机资源利用率底可管理性差、异构化严重83数据存储技术数据存储技术NAS,网络附加存储,不再通过I/O总线附属于某个特定的效劳器,而是通过网络接口将存储设备与网络相连,由用户通过网络访问,由存储设备、NAS控制器和网络局部构成。目前采用NFS基于Unix环境的网络文件系统和CIFS基于Windows的网络文件系统协议优点一台设备连接在网络上,易于安装、部署和管理不占用效劳器资源可以跨平台使用较DAS节省硬盘空间数据集中,便于管理和备份缺点占用网络带宽不易扩展,装一台NAS设备容易,再加一台难84数据存储技术数据存储技术SAN,存储区域网络,通过网络设备将磁盘阵列等存储设备与效劳器连接起来的高速专用子网。根据专用网络的不同可以分为FC-SAN和IP-SAN优点数据存储影响效劳器和网络的性能效率高、容量大、可扩展性强支持异构效劳器缺点价格高,对小型系统不划算效劳器物理位置很分散时不易实施85数据复制模式数据复制模式同步(Synchronous):数据高可用、对性能影响大、有距离限制异步(Asynchronous):数据有延迟、适于远距离定点拷贝Point-in-time):数据有延迟、适于远距离、充分利用网络带宽86数据复制的常见形式数据复制的常见形式1.基于主机的数据复制操作系统的基于主机的数据复制操作系统的I/O完成完成与存储设备无关、数据完全一致、灵活、对带宽与存储设备无关、数据完全一致、灵活、对带宽要求高、对不同的操作系统,需要专用的软件、要求高、对不同的操作系统,需要专用的软件、需要管理多个节点、需占用主机的处理能力需要管理多个节点、需占用主机的处理能力2.基于数据库的数据复制操作系统和数据库系基于数据库的数据复制操作系统和数据库系统共同完成统共同完成灵活、方便、对带宽要求低、通过复制数据库重灵活、方便、对带宽要求低、通过复制数据库重做日志来复制数据库数据、适用范围窄做日志来复制数据库数据、适用范围窄87数据复制的常见形式数据复制的常见形式3、基于磁盘的数据复制存储系统的微处理器、基于磁盘的数据复制存储系统的微处理器完成完成与主机无关、可支持异构平台环境、带宽要求高、与主机无关、可支持异构平台环境、带宽要求高、主备端需要使用同样的磁盘存储系统、在远程情主备端需要使用同样的磁盘存储系统、在远程情况下需要配置专用的通道延伸器、本钱较高况下需要配置专用的通道延伸器、本钱较高4.基于专有设备的数据复制在基于专有设备的数据复制在SAN架构中通过架构中通过虚拟存储软件完成虚拟存储软件完成在数据从效劳器传输到存储设备的网络中抓取数在数据从效劳器传输到存储设备的网络中抓取数据。任意的存储设备之间进行复制、通过异步机据。任意的存储设备之间进行复制、通过异步机制对数据的定点拷贝制对数据的定点拷贝point-in-time images 进行复制,确保数据的一致性,可点对点,或多进行复制,确保数据的一致性,可点对点,或多点对一点进行复制点对一点进行复制v通过负载均衡Load Balance,流量Traffic可以被动态Dynamically分配到一组运行相同应用程序的多个效劳器上。v负载均衡既可以提高整个系统的性能,又可以在效劳器出现故障时将该效劳器承担的效劳分配到运行中的效劳器执行。v在不同站点的效劳器之间进行的负载均衡还可以在某一站点无法提供效劳时将该站点承担的效劳分配到运行中的站点执行。89负载均衡负载均衡灾难恢复资源要素与等级灾难恢复资源要素与等级六个灾难恢复等级六个灾难恢复等级七大技术管理要素七大技术管理要素数据备份系统数据备份系统备用数据处理系统备用数据处理系统备用网络系统备用网络系统备用根底设施备用根底设施技术支持能力技术支持能力运行维护管理能力运行维护管理能力灾难恢复预案灾难恢复预案等级一:根本支持等级一:根本支持等级二:备用场地支持等级二:备用场地支持等级三:电子传输和局部设备支等级三:电子传输和局部设备支持持等级四:电子传输及完整设备支持等级四:电子传输及完整设备支持等级五:实时数据传输及完整设备支等级五:实时数据传输及完整设备支持持等级六:数据零丧失和远程集群支持等级六:数据零丧失和远程集群支持90灾难恢复等级划分灾难恢复等级划分国家标准?信息平安技术信息系统灾难恢复标准?GB/T2098891灾难恢复资源要素灾难恢复资源要素灾难恢复要素灾难恢复要素描述描述数据备份系统数据备份系统 一般由数据备份的硬件、软件和数据备份介质(以下简称“介质”)组成,如果是依靠电子传输的数据备份系统,还包括数据备份线路和相应的通信设备。备用数据处理系统备用数据处理系统 指备用的计算机、外围设备和软件。备用网络系统备用网络系统 最终用户用来访问备用数据处理系统的网络,包含备用网络通信设备和备用数据通信线路。备用基础设施备用基础设施 灾难恢复所需的、支持灾难备份系统运行的建筑、设备和组织,包括介质的场外存放场所、备用的机房及灾难恢复工作辅助设施,以及容许灾难恢复人员连续停留的生活设施。技术支持能力技术支持能力 对灾难恢复系统的运转提供支撑和综合保障的能力,以实现灾难恢复系统的预期目标。包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等。运行维护管理能力运行维护管理能力 包括运行环境管理、系统管理、安全管理和变更管理等。灾难恢复预案灾难恢复预案 定义信息系统灾难恢复过程中所需的任务、行动、数据和资源的文件。用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。92第第1级级根本支持根本支持要素要求数据备份系统a)完全数据备份至少每周一次;b)备份介质场外存放。备用数据处理系统 备用网络系统 备用基础设施a)有符合介质存放条件的场地技术支持能力 运行维护支持能力a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案93第第2级级备用场地支持备用场地支持要素要素要求要求数据备份系统a)完全数据备份至少每周一次;b)备份介质场外存放。备用数据处理系统a)灾难发生时能在预定时间内调配所需的数据处理设备到场。备用网络系统a)灾难发生时能在预定时间内调配所需的通信线路和网络设备到位。备用基础设施a)有符合介质存放条件的场地;b)有满足信息系统和关键业务功能恢复运作要求的场地。技术支持能力 运行维护支持能力a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用站点管理制度;d)与相关厂商有符合灾难恢复时间要求的紧急供货协议;e)与相关运营商有符合灾难恢复时间要求的备用通信线路协议。灾难恢复预案a)有相应的经过完整测试和演练的灾难恢复预案。第第3级级电子传输和局部电子传输和局部设备支持设备支持要素要素要求要求数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)每天多次利用通信网络将关键数据定时批量传送至备用场地。备用数据处理系统a)配备灾难恢复所需的部分数据处理设备。备用网络系统a)配备部分通信线路和相应的网络设备。备用基础设施a)有符合介质存放条件的场地;b)有满足信息系统和关键业务功能恢复运作要求的场地。95第第3级级电子传输和局部设备电子传输和局部设备支持支持要素要求技术支持能力a)在备用站点有专职的计算机机房运行管理人员。运行维护支持能力a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房管理制度;d)有备用数据处理设备硬件维护管理制度;e)有电子传输数据备份系统运行管理制度。灾难恢复预案 有相应的经过完整测试和演练的灾难恢复预案。96第第4级级电子传输及完电子传输及完整设备支持整设备支持要素要求数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)每天多次利用通信网络将关键数据定时批量传送至备用场地。备用数据处理系统a)配备灾难恢复所需的全部数据处理设备,并处于就绪状态或运行状态。备用网络系统a)配备灾难恢复所需的通信线路;b)配备灾难恢复所需的网络设备,并处于就绪状态。备用基础设施a)有符合介质存放条件的场地;b)有符合备用数据处理系统和备用网络设备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;d)以上场地应保持7x24小时运作。97第第4级级电子传输及完整设电子传输及完整设备支持备支持要素要素要求要求技术支持能力在备用站点有:a)a)7x247x24小时专职计算机机房管理人员;小时专职计算机机房管理人员;b)b)专职数据备份技术支持人员;专职数据备份技术支持人员;c)c)专职硬件、网络技术支持人员。专职硬件、网络技术支持人员。运行维护支持能力a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)有电子传输数据备份系统运行管理制度。灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案。98第第5级级实时数据传输及完实时数据传输及完整设备支持整设备支持要素要求数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)采用远程数据复制技术,并利用通信网络将关键数据实时复制到备份场地。备用数据处理系统a)配备灾难恢复所需的全部数据处理设备,并处于就绪或运行状态。备用网络系统a)配备灾难恢复所需的通信线路;b)配备灾难恢复所需的网络设备,并处于就绪状态;c)具备通信网络自动或集中切换能力。备用基础设施a)有符合介质存放条件的场地;b)有符合备用数据处理系统和备用网络设备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;d)以上场地应保持7x24小时运作。99第第5级级实时数据传输及实时数据传输及完整设备支持完整设备支持要素要求技术支持能力在备用站点7x24小时有专职的:a)计算机机房管理人员;b)数据备份技术支持人员;c)硬件、网络技术支持人员。运行维护支持能力a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)e)有实时数据备份系统运行管理制度。有实时数据备份系统运行管理制度。灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案。100第第6级级数据零丧失和远数据零丧失和远程集群支持程集群支持要素要求数据备份系统a)完全数据备份至少每天一次;b)备份介质场外存放;c)远程实时备份,实现数据零丢失。备用数据处理系统a)备用数据处理系统具备与生产数据处理系统一致的处理能力并完全兼容;b)应用软件是“集群的”,可实时无缝切换;c)具备远程集群系统的实时监控和自动切换能力。备用网络系统a)配备与生产系统相同等级的通信线路和网络设备;b)备用网络处于运行状态;c)最终用户可通过网络同时接入主、备中心。备用基础设施a)有符合介质存放条件的场地;b)有符合备用数据处理系统和备用网络设备运行要求的场地;c)有满足关键业务功能恢复运作要求的场地;d)以上场地应保持7x24小时运作。101第第6级级数据零丧失和远程数据零丧失和远程集群支持集群支持要素要求技术支持能力在备用站点7x24小时有专职的:a)计算机机房管理人员;b)专职数据备份技术支持人员;c)专职硬件、网络技术支持人员;d)专职操作系统、数据库和应用软件技术支持人员。运行维护支持能力a)有介质存取、验证和转储管理制度;b)按介质特性对备份数据进行定期的有效性验证;c)有备用计算机机房运行管理制度;d)有硬件和网络运行管理制度;e)有实时数据备份系统运行管理制度;f)有操作系统、数据库和应用软件运行管理制度。灾难恢复预案有相应的经过完整测试和演练的灾难恢复预案。102谢谢,请提问题!谢谢,请提问题!
展开阅读全文