长春富维江森公司数据备份容灾平台建设方案.doc

上传人:wux****ua 文档编号:8710910 上传时间:2020-03-31 格式:DOC 页数:53 大小:933.50KB
返回 下载 相关 举报
长春富维江森公司数据备份容灾平台建设方案.doc_第1页
第1页 / 共53页
长春富维江森公司数据备份容灾平台建设方案.doc_第2页
第2页 / 共53页
长春富维江森公司数据备份容灾平台建设方案.doc_第3页
第3页 / 共53页
点击查看更多>>
资源描述
吉林长春富维江森公司数据备份容灾平台建设方案编 制 单 位:北京众志和达信息技术有限公司编 制 日 期:2011年11月目 录第一章 项目背景4第二章 项目需求分析52.1 长春富维-江森公司系统现状52.2 系统建设需求分析62.2.1 数据备份系统存在的问题62.2.2 系统建设总体需求82.3 系统总体建设原则8第三章 数据保护方案的设计分析103.1 常用备份方式介绍103.1.1 采用物理磁带库备份面临的问题103.1.2 采用D2D备份面临的问题113.1.3 VTL(虚拟磁带库)主要技术优势133.2 备份架构介绍153.3 数据保护总体设计18第四章 容灾系统设计分析234.1 容灾标准概述234.2 容灾系统建设所面临的问题254.3 主流容灾技术分析与对比274.3.1 远程数据库复制技术274.3.2 基于逻辑磁盘卷的远程容灾技术294.3.3 基于智能存储的远程容灾技术304.3.4 基于虚拟磁带库的远程容灾技术33第五章 推荐的解决方案355.1 本地数据备份方案推荐355.1.1 建设目标355.1.2 整体拓扑图365.1.3 备份设备升级改造365.1.4 备份架构改造375.1.5 备份系统改造建设后的效果395.2 远程数据容灾方案推荐405.2.1 建设目标405.2.2 整体拓扑图415.2.3 本项目建设中需要注意的几个要点415.2.4 容灾平台建设方案425.2.5 方案优势435.2.6 产品配置44第六章 产品介绍446.1 SOUL SureSaveVTL 虚拟磁带库产品介绍446.1.1 产品描述-VTL5000系列44第七章 SOUL(众志和达)公司介绍46 第一章 项目背景长春富维-江森公司是一家集汽车内饰总成、座椅总成设计与制造的汽车零部件企业,主要客户有一汽大众、一汽轿车、一汽解放、济南重汽等主机厂商,总部位于吉林省长春市。目前在成都、济南、天津、吉林设有分公司,未来两年内还将在广州建立分公司。为满足公司技术中心产品研发数据的安全性和高可靠性的需求,准备在2012年首先对本地备份系统加以优化、完善,并且拟在长春与成都建立异地数据灾备中心,即将长春总部EMC NAS存储服务器(NS20FC)的产品研发数据进行异地数据灾备。当本地存储服务器发生异常故障时,从异地备份中心的数据恢复以确保长春总部的产品设计业务的连续性和可靠性。第二章 项目需求分析2.1 长春富维-江森公司系统现状目前核心业务系统使用的是EMC NAS存储,裸容量为12TB, 实际可用容量为10TB, 当前已使用7.5TB。当前每天的数据变化量大约为20GB。主要存储工程设计数据和文件,文件格式为二维图纸、三维数据(Catia, UG, AutoCAD, Alias, Hyermesh等),以及各种Office文件等。数据格式数据总量日增备份数据量备份设备,备份软件,版本纯文本、图像等纯文本图片(2D/3D)纯文本图片(2D/3D)工程制图、文档2TB5.5TB3G17GHP MSL8096磁带库,备份软件Symantec NBU6.0 现状拓扑图:备份系统使用的是Symantec NetBackup 6.0备份软件,通过千兆以太网络备份到HP8096磁带库。当前日备份窗口:日备份窗口时段时长(小时)21:00-7:00(次日)102.2 系统建设需求分析2.2.1 数据备份系统存在的问题在现有业务系统中,主要存储的是工程设计数据和文件,文件格式为二维图纸、三维数据(Catia, UG, AutoCAD, Alias, Hyermesh等),每天有大约20GB增量数据。按照这种增长速度计算:一个月的数据总量为:10TB+20GB*22(天)=10.4TB从上面的数据可以看到,富维江森公司需备份的数据量是巨大的,而现有的备份设备还是采用的性能和可靠性都很低下的物理磁带库,即无法满足业务系统数据保护的要求,又造成了管理和维护的复杂度。公司计划在2012年实现长春、成都两点数据容灾平台建设,如果采用物理磁带库这种功能单一备份设备将给容灾系统的建设带来很大难度。归纳总结现有系统的问题如下: 备份/恢复性能低下,RTO时间长根据前期调研结果显示,目前日增量数据的备份时间段为21:00-7:00(次日),备份窗口为10小时。随着业务规模的扩大,数据增长速度的加快备份窗口将会变得越来越紧张。磁带驱动器目前最新的是LTO-5技术,虽然速率有所提升但在实际环境中读写效率也仅仅为100MB/S,仍然无法满足大容量的数据备份要求。另外,在备份/恢复的过程中,磁带库需要抓取磁带、加载、机械定位文件等机械动作,如果数据跨带,还需要进行长时间的多带查询等,这些都大大的影响备份/恢复的效率。 安全性问题磁带介质本身是不具备数据校验功能的,需要通过备份软件等第三方工具来实现对备份数据的校验。另外,磁带介质本身对自然环境要求较高如果出现单盘磁带磨损、卡带、霉点、粘连等状况,会导致整个备份作业无法回复。这都给数据的存储安全性带来了极大的挑战。 管理复杂物理磁带库的配置、操作、运行状态监控等多项进程都需要手动处理。即便某些磁带库产品有了基于浏览器和终端的管理和访问功能,但需要购买RMU(远程管理模块)才能实现,增加采购成本和服务费用。 功能单一物理磁带库属于纯机械设备,没有任何上层功能,在数据容灾平台建设中,如果采用物理磁带库唯一的方式就是通过人工运输,将磁带送达灾备中心。这种方式不但操作繁琐,长期的成本投入也是巨大的。针对以上问题,有必要对现有备份环境进行优化,采用安全性、可靠性、稳定性都比较高的备份设备替换掉现有物理磁带库,为各个业务系统提供集中、统一的备份服务,提高备份性能以及数据的安全保障和系统管理水平,保证各业务系统数据安全和各业务系统的正常稳定运行。2.2.2 系统建设总体需求长春富维-江森公司目前大量数据都是采用LAN备份方式,并且备份设备是用的是性能低下的物理磁带库,使得整体备份性能低下,备份窗口紧张,数据安全性无法保证。通过更换备份设备和优化备份架构,采用虚拟磁带库做为一级备份设备,通过FC SAN网络和服务器、存储等设备互连可大幅度提升备份速率,解决备份窗口紧张的问题。同时,可以使数据容灾的实现变的简单。由于长春富维-江森公司核心数据仅在总部保存一份,为避免灾难的发生,将在成都建设灾备中心,实现数据级容灾。可以采用基于VTL远程数据复制功能,从单个或多个站点向一个集中位置传送数据,实现安全的基于网络的灾难恢复保护。将数据先备份到本地的VTL虚拟磁带库设备上,之后通过VTL远程复制功能定时复制或者根据策略传输到成都灾备中心VTL虚拟磁带库上。 在总部,虚拟磁带库保存最近6个月数据,将冷数据通过备份软件迁移到物理磁带库上,离线保存。2.3 系统总体建设原则本项目中,在设计数据备份容灾平台时,我们根据以下原则设计数据保护解决方案: 实用性系统设计以实用为主,以企业用户需求为出发点,以方便用户使用为原则;同时,系统在产品的选择上,采用符合实际需求、并为国际上广泛采纳的、主流的、支持开放标准的备份设备和软件。 先进性在设计过程中,始终遵循国际标准和规范。提供世界主流存储公司的产品,存储备份设备采用标准的接口、协议,借鉴国际上先进的存储备份系统体系结构、成熟的模式和最新的备份技术,使数据保护系统信息化建设不断保持先进性。 高性能备份设备必须具备高速处理能力,提供高速数据链路,保证系统高吞吐能力,满足各种应用对数据传送带宽的需求。 可靠性为了保证数据安全,我们在系统设计中会充分选择专业的、成熟的解决方案和产品,以保证备份系统的高可靠性。 可扩展/升级性随着时间的推移、技术的发展以及环境的变化,业务系统的数据量也会快速增长。在本方案中将会充分考虑备份设备的可扩展性。备份管理系统的模块化功能选择能力,可以随着业务系统不断更新、变化,随时增加必要的功能模块,以满足备份管理要求。 易于管理和维护所采用的备份设备需要具有良好的可管理性,系统要有监测、故障诊断、远程管理等功能,以便于系统的管理和维护。同时在产品选型方面尽可能选取集成度高、采用模块化通用设计的产品,以便于管理和维护。第三章 数据保护方案的设计分析3.1 常用备份方式介绍目前,市场上常用的数据备份介质主要有基于磁带介质的物理磁带库、采用硬盘做介质的磁盘阵列和虚拟磁带库,下面将分别介绍采用这三种存储介质的优势和劣势。3.1.1 采用物理磁带库备份面临的问题可以说备份系统中,最常见的备份设备要数物理磁带库(机)了,经过多年的发展,物理磁带库(机)在兼容性、存储容量上都有其它备份设备不可比拟的优势,相对于其它备份设备,物理磁带库的先期采购成本较低,可以以相对廉价的方式建立数据保护系统。当然,物理磁带库也有着与生俱来的劣势: 备份介质失效率高随着磁带技术的不断发展,最新的LTO-5格式的磁带介质存储容量为1.5TB(压缩后容量为3TB)。诚然,新技术在磁带容量和稳定性方面较以往有了很大的优势。但由于磁带介质本身是不具备数据校验功能的,需要通过备份软件等第三方工具来实现对备份数据的校验,另外,磁带介质出现一盘磁带磨损、卡带、霉点、粘连等状况,会导致整个备份作业无法回复。这都给数据的存储安全性带来了极大的挑战。 备份/恢复操作复杂、RTO时间长磁带驱动器技术虽然有了长足的发展,目前最新LTO-5磁带驱动器的读写效率也仅仅为150MB/S,但还是无法满足大容量的数据备份要求。另外,在备份/恢复的过程中,磁带库需要抓取磁带、加载、机械定位文件等机械动作,如果数据跨带,还需要进行长时间的多带查询等,这些都会影响备份/恢复的效率。 安装、管理复杂机械磁带库在安装时需要水平定位,大型机械磁带库安装时还需要进行设备连接,过程复杂。并且机械臂为灵敏机械部件,对包装和搬运要求都较高,不易进行设备搬迁。另外,物理磁带库的配置、操作、运行状态监控等多项进程都需要手动处理。即便某些磁带库产品有了基于浏览器和终端的管理和访问功能,但需要购买RMU(远程管理模块)才能实现,增加采购成本和服务费用。 机械故障多,维护成本高械磁带库是一个非封闭的物理机械设备,机械磁带库核心部件,如磁带驱动器、机械手、传送装置等均为机械易损件,这些设备对环境的要求很高,譬如:灰尘、湿度等都会造成设备设备故障,致使设备使用率低。另外,带库的维护需要专业的人员进行维护,同时,备件采购受制于生产厂家的垄断,部件的更换费用较为昂贵,这些都造成了用户TCO较高。3.1.2 采用D2D备份面临的问题由于磁带技术已经不能满足当今备份系统的发展趋势,同时,随着新一代ATA/SATA/SCSI磁盘技术的成熟和磁盘价格的下降,市场上出现了一系列以磁盘做为存储介质的设备和解决方案。基于主机的D2D(disk to disk)是通过备份策略将低成本的磁盘做为存储介质,提高了数据备份/恢复的传输速率。其主要优势包括: 独立磁盘冗余技术(RAID)不仅仅保证了数据存储的安全性,也大大的提高了数据存储的性能,提高了备份、恢复效率 投资、维护成本低磁盘阵列系统属于常见的存储设备,使用、维护简单,一般的系统管理员不需要过多的专业知识就可以自行维护,从而降低了管理成本。基于主机的D2D备份方式虽然解决了备份效率和介质安全性问题,但是基于主机的D2D在集成性、存储格式、文件系统尺寸、性能与碎片等方面存在一些问题,主要表现在: 设备共享性较差如果在一个有多台服务器的环境中要实现LAN-FREE备份,配置的复杂性和成本都会迅速提高。一般来说,实现备份到磁盘,都要在这台磁盘阵列上建立一个文件系统,才能够被备份软件识别。而一般的文件系统都不能被多服务器共享,只有磁带库可以实现共享。这就是说,如果想像使用传统磁带库一样,通过SAN实现多服务器共同使用一个磁盘阵列,必须要在磁盘阵列上建立多个逻辑设备,然后将每个逻辑设备分配给每台服务器。 安全性挑战基于主机的D2D是以文件系统的方式出现的服务器上的,这个文件系统可以由任意工具来操作,也可以被任何人访问。这会造成许多安全上面的挑战:1. 通用的文件系统会受到病毒感染、黑客攻击等2. 管理人员的误操作或其他人员的恶意删除会导致备份数据的丢失 性能挑战1. 文件系统本身就可能是性能瓶颈,尤其在多任务、多进程的时候,文件系统很有可能成为整个备份系统的瓶颈。2. 文件系统难以解决磁盘碎片的问题,磁盘碎片会导致文件系统的性能逐渐下降,而且,当数据量比较大的时候,磁盘碎片的问题很难以解决。3. 通过文件系统受到分区大小、文件大小等多方面的制约。 扩展性差备份管理软件是设计为磁带库使用的,虽然目前绝大部分备份软件都支持使用文件系统作为备份设备,但与使用磁带时的功能有一些差别。这些差别会导致一些严重的问题:1. 一些主流的备份软件在备份数据超过保存期限时,如果使用磁带介质,可以方便的进行介质回收。而如果使用磁盘文件系统,则无法自动回收这部分磁盘空间。系统管理员必须手动的用操作系统命令删除相应的文件。但这一工作是高风险的,因为文件系统是不能区分文件是否超出的了保存期限;2. 当备份系统因为某种原因丢失了介质索引的时候,一般都可以利用重新扫描磁带重建索引。但如果采用磁盘作为备份设备,备份系统无法对其进行扫描。这样,很有可能所有的数据仍然在存放在磁盘阵列上,但却无法恢复。3. 放在磁盘阵列上的备份数据,无法进行介质复制,将备份数据拷贝到磁带上,进行离线保存,这样,就失去了磁带因此带来的灵活性,如:离线保存、数据移植、异地容灾等。根据以上的分析,这种简单的利用磁盘阵列直接当备份设备的做法,虽然解决了来自磁带库的问题,但也产生了磁带库设备没有的新问题,而且难以解决。所以,能兼顾物理磁带库和基于主机D2D两方之长的备份设备是现在以及将来备份设备发展的方向,虚拟磁带库(VTL)就是这一理念的产物。3.1.3 VTL(虚拟磁带库)主要技术优势VTL(虚拟磁带库)底层是磁盘阵列系统,但是通过硬件(或软件)方式将磁盘阵列模拟为带库设备,也就是说服务器“看到的”是一个带库设备(系统识别为机械手、磁带驱动器),而不是一个磁盘设备。VTL主要具有如下优点: 安全性高备份系统首先要保证的就是保证备份数据的安全性,VTL采用类裸文件系统,存储的格式与磁带一致,这就保证了用户不能直接访问VTL数据,不仅仅提高了数据的安全性,也减少了被病毒感染和黑客攻击的几率。 可靠性高相对于物理磁带库,由于VTL采用了RAID技术保证数据存储,从而将备份的可靠性较常规磁带备份提高了若干量级。相对于基于主机的D2D,VTL不需要担心数据丢失问题。当备份系统因为某种原因丢失了介质索引的时候,可以利用备份系统重新扫描VTL模拟的磁带重建索引。 备份/恢复效率大大提高VTL 仅仅模拟了带库的操作,倒带、清点都是逻辑操作,不会涉及任何机械工作。从而提高了数据的备份/恢复效率。 保持数据的完整一致性当备份服务器进行数据备份时,就将数据快速传送到系统的磁盘存储中。而进行数据恢复时,备份服务器通过VTL系统将数据恢复到应用系统中。这些备份数据格式和传统备份到磁带上的完全一致。并且通过EXPORT(归档)命令可以将VTL的数据归档到磁带库,也通过IMPORT命令将磁带库上的数据恢复到VTL中。 支持远程的数据复制功能市场上的大部分VTL,不仅仅提供了备份、恢复功能,而且还提供了许多物理磁带库所不能提供的功能,譬如:远程数据复制,通过IP网络,能将本地的备份数据远程的复制到异地的虚拟磁带库系统中,这可以是客户能够以极低的成本建立起数据级的容灾系统。 不改变原有的业务逻辑虚拟磁带库产品可以虚拟包括ADIC、STK、Quantum 、HP、IBM在内的众多型号的磁带库库体以及DLT、LTO、9840、3590、3592等型号的磁带驱动器,可以支持Windows、Linux、Solaris、AIX、HP-UX操作系统,以及支持Veritas、CA、Legato、BakBone等所有的主流的备份软件。从而保证了系统管理员不用改变原有的工作方式、备份策略等。提高了系统迁移、管理、学习成本。 维护成本低、扩展方便由于 VTL的磁盘存储管理十分类似于一般磁盘阵列的方式,可以轻松地插入新磁盘,进行容量的扩展。因此,在首期采购的时候,不必像磁带库一样采用一个很高的配置,而完全可以随着数据量的增长,逐渐加入新磁盘。由于VTL不会发生磁带库和磁带机的机械故障,也没有磁带失效的问题,备份的成功率明显提升; 在后期维护上,其维护成本更加低廉。综上所述为数据备份系统提供高可靠、高性能、低成本的解决方案,虚拟带库对于操作系统、备份软件来说,就像真实的、自动化的传统物理磁带库设备一样,差别仅是数据存储在磁盘上。使用物理磁盘来加速数据备份并避免了传统备份介质的缺点,而保留了两者(磁带库、磁盘阵列)的优点。达到真正意义上的备份系统的革新,取代了数据存储起始阶段的基于磁带备份的机制。3.2 备份架构介绍目前,市场上最常见的数据备份系统按其架构不同可以分为四种:基于主机的HostBase、基于网络的LanBase、基于SAN结构的LAN-Free、Server-Free(也称为ServerLess)等四种方式。Host-Based备份:磁带机(库)直接连接在业务服务器上,而且只为该服务器提供数据备份服务。在大多数情况下,这种备份大多是采用服务器上自带的磁带机,而备份操作往往也是通过手工操作的方式进行的。Host-Based备份结构的优点是数据传输速度快,备份管理简单;通常用来备份单个服务器操作系统。缺点是不利于备份系统的共享,不适合于现在大型的数据备份要求。LAN-Based备份:数据的备份、恢复以网络作为传输媒介。通过在网络中部署一台服务器做为备份服务器,由备份服务器负责整个备份域中的备份、恢复操作。备份设备(磁带库、磁盘阵列)连接在备份服务器后端,在数据备份时,备份客户端将数据通过网络传输到备份设备中,实现数据的备份。基于LAN-Base的备份架构示意图采用基于LAN-Base的备份架构具有两大优势:部署数据保护系统成本低廉、对网络环境不需要做相应的修改,就可以对数据做一个统一、集中的管理。 LAN-Base备份架构劣势:备份数据通过网络进行传递,备份系统对网络带宽要求较高。因此,网络I/O成为数据备份效率的瓶颈,对于24小不间断运行的业务,通过LAN-Base方式进行数据的备份,会降低业务系统的响应速度。如果备份域中的主机节点较少,或者备份的数据量不是很大,采用基于LAN-Base的方式进行数据的备份和保护是比较合理的。基于SAN的备份是一种彻底解决传统备份方式需要占用LAN带宽问题的解决方案。它采用一种全新的体系结构,将磁带库和磁盘阵列各自作为独立的光纤结点,多台主机共享磁带库备份时,数据流不再经过网络而直接从磁盘阵列传到磁带库内,局域网只承担各服务器之间的通信(而不是数据传输)任务,是一种无需占用网络带宽的解决方案。LAN-Free备份:将备份设备(磁带库、磁盘阵列等)连接到SAN环境中,备份客户端将需要备份的数据直接写入到共享的备份设备中(前提:每个备份客户端需要识别备份设备)。大量的数据传输是通过SAN网络进行,网络只承担备份服务器和客户端的通讯任务。数据传输路径:从备份客户机开始,经过SAN交换机,最后到达共享磁带库。基于LAN-Free的备份架构示意图LAN-Free备份架构优势:通过基于SAN的LAN-Free方式,可以实现大数据量的数据备份,备份数据的传输不通过网络(使用高带宽、高性能的SAN存储网络),从而节省了网络带宽,缩减了备份的时间窗口。同时,通过动态驱动器共享 (DDS) 技术,不仅仅减少了对磁带驱动器的投资(多个节点共享一台磁带驱动器),而且也提高了备份设备的使用率。LAN-Free备份架构劣势:基于LAN-Free的备份方式,需要客户方具有SAN的存储环境,这对某些没有建立起SAN环境的用户来说,投资还是相对较高的。而且通过LAN-Free方式对数据进行备份,虽然对网络的带宽占用率较低,但是对备份节点的I/O占用率较高,比较影响数据的读写性能。基于LAN-Free的备份方式,一般使用在具有SAN存储环境,备份数据量较大,对备份时间安窗口要求比较严格的环境中。Server-Free (ServerLess)备份:备份数据不经过备份主机,直接从磁盘阵列中写入到备份设备中,从而极大降低备份操作对生产系统的影响。数据传输路径:从磁盘阵列开始,经过SAN交换机,最后到达共享磁带库。基于Server-Less的备份架构示意图Server-Less备份架构优势:相对于LAN-Free备份方式需要占用主机I/O资源,基于Server-Less备份方式不需要占用主机资源,从而减少了主机的压力。对于7*24不间断运营的业务,可以大大缩减因为备份对业务的影响。Server-Less备份架构劣势:采用Server-Less备份方式需要磁盘阵列支持快照和克隆功能,对SAN的环境要求比较苛刻,相应的部署成本较高。采用基于Server-Less架构进行数据的备份,通常是用户业务环境很苛刻:对业务的响应级别、备份的时间窗口都有很严格的要求情况下采用。3.3 数据保护总体设计数据保护平台是一个相对比较复杂的系统,需要考虑多方面的因素。通常来说,数据保护平台的设计和规划归纳起来主要包含六个方面的内容: 备份设备的选择 备份软件的选择 备份架构的选择 备份策略设置 数据灾难恢复计划 数据保护平台的管理及维护1. 备份设备的选择;对于选择什么样的设备作为备份设备,需要结合用户的具体应用环境和数据性质。通常,对于备份设备的选择,主要考虑如下几点:1) 备份速度、性能、可扩展性2) 备份介质的费用3) 备份数据的管理4) 备份硬件的可维护性备份设备主要是用来存储备份数据,备份时间窗口的大小除了与用户的业务环境有关,与备份设备的数据吞吐量也是息息相关的,这是购买备份设备必须重点考虑的要素。目前,市场上常用的存储介质主要有磁带和磁盘两种,采用磁带做为备份介质,相对经济存储容量大、价格低廉。但是由于磁带介质可靠性不高(非密封性属性,容易受到灰尘、湿度等环境的影响),且本身不具备容错校验机制,数据恢复的几率受到很大的挑战。采用密封的具有容错机制的磁盘做为备份介质,首先能保证数据的存储安全、可靠性(存储底层采用RAID容错技术),其次,相对于物理磁带库,读写的效率也大大提高。基于以上的认识,在本项目中,推荐采用基于以磁盘为介质的虚拟磁带库产品做为数据存储设备。虚拟磁带库设备不仅仅备份性能高、数据的安全性、可靠性也有很好的保障。2. 备份软件的选择;备份管理软件是整个数据保护平台的核心,备份软件不仅仅需要提供良好的备份、恢复功能,而且还需要考虑备份软件的备份策略是否灵活、备份技术是否先进、可靠;同时,简便的管理和维护以及未来的系统扩展性也是需要考虑的问题。简单来说,在选择备份管理软件时,需考虑三个方面的内容:1) 备份、恢复简单、可靠2) 模块化架构设计、可以满足复杂业务需求3) 维护、配置简单基于以上理解,我们推荐采用EMC/Legato Networker备份软件做为本方案数据保护的核心。作为信息保护领域的领头产品,EMC/Legato NetWorker以集中式、自动化的方式加速数据备份和恢复,安全且易于管理的方式保护关键业务数据。3. 备份架构的选择在设计一个数据保护平台时,数据的备份架构也是要必须考虑的问题。采用何种备份架构取决与用户的业务性质、备份数据量、备份的时间窗口等要求。市场上常用的备份架构主要有HostBase、LanBase、LAN-Free、Server-Free等四种。这四种架构已经在上一个章节比较系统的阐述了各自的优劣。HostBase备份架构适用于单台主机操作系统的备份。LAN-Base备份架构适用于备份数据量较少、备份时间窗口不影响业务的情况下使用。LAN-Free适用于备份数据量较大,对备份的时间窗口要求比较苛刻的环境下使用。ServerFree备份架构适用于724不间断运营,对I/O要求特别苛刻的业务环境。结合青岛市XX的实际生产环境来分析,本方案推荐采用基于LAN-Free的方式对HIS、LIS等系统的生产数据进行备份。4. 备份策略设计备份策略是备份系统日常工作的准则,备份策略的指定需要根据具体的应用和管理要求来制定。备份的目的是为了数据的恢复,所以备份策略的设定是为了更快、更安全、更便捷的恢复数据,采用合理的备份策略不仅仅可以节省备份设备存储空间,也可以实现数据快速恢复。数据的备份策略制定具有一定的规律性,对于数据库类型的数据,由于每天数据量都有变化,可以采用每周做全备份、每天做增量备份的方式备份。对于变化量不是很大的文件型数据,备份周期可以设置长一些,每月做全备,每周做一个增量备份方式备份。当然,以上的数据备份方式仅仅是数据备份的最一般方法,具体的应用环境需要具体配置。而且,数据的备份策略不仅仅包含数据的备份级别,备份数据的浏览、备份数据的回收也是需要考虑的问题。这些可以根据具体的生产环境,进行相应的设置。5. 数据灾难恢复计划;数据保护的根本是为了在数据丢失或损坏时,进行数据的恢复。在设计数据备份系统时,必须考虑灾难恢复的实现。灾难恢复计划并不仅仅是说通过数据保护平台,实现对数据的恢复,它还包含了管理的内容,实际上,备份系统本身可以实现所有数据的恢复,但是花费多长时间来恢复,恢复数据成功的几率、能恢复多少数据,丢失多少数据等都是需要后期的管理和完善。一个完整的灾难恢复计划包含有:全面的灾难防范考虑、系统信息收集、包括恢复步骤的灾难恢复文档、定期的灾难恢复演练等。这些是提高灾难恢复速度、数据恢复成功率的重要的因素,对这些需要做全面的考虑。总的来说,良好的灾难恢复计划是一个管理制度技术的组合,而不仅仅是技术的实现。6. 备份平台的管理及维护。良好的日常管理和维护是保证备份系统良好运行和可靠恢复的保障。它包括资料的完整性、管理人员的日常维护、后备的技术支持等。第四章 容灾系统设计分析4.1 容灾标准概述衡量容灾技术的两个技术指标RPO、RTORPO(Recovery Point Objective): 以数据为出发点,主要指的是业务系统所能容忍的数据丢失量。及在发生灾难,容灾系统接替原生产系统运行时,容灾系统与原生产中心不一致的数据量。RPO是反映恢复数据完整性的指标,在同步数据复制方式下,RPO等于数据传输时延的时间;在异步数据复制方式下,RPO基本为异步传输数据排队的时间。在实际应用中,考虑到数据传输因素,业务数据库与容灾备份数据库的一致性(SCN)是不相同的,RPO表示业务数据与容灾备份数据的SCN的时间差。发生灾难后,启动容灾系统完成数据恢复,RPO就是新恢复业务系统的数据损失量。RTO(Recovery Time Objective):以应用为出发点,即应用的恢复时间目标,主要指的是所能容忍的应用停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。是反映业务恢复及时性的指标,表示业务从中断到恢复正常所需的时间。RTO值越小,代表容灾系统的数据恢复能力越强。各种容灾解决方案的RTO有较大差别,基于光通道技术的同步数据复制,配合异地备用的业务系统和跨业务中心与备份中心的高可用管理,这种容灾解决方案具有最小的RTO。容灾系统为获得最小的RTO,需要投入大量资金。不同容灾方案的RTO和RPO是不相同的。要建设容灾系统,就必须提出相应的设计指标,以此作为衡量和选择容灾解决方案的参数。目前,国际上通用的容灾系统的评审标准为SHARE 78,主要包括以下内容。备份/恢复的范围灾难恢复计划的状态业务中心与容灾中心之间的距离业务中心与容灾中心之间如何连接数据是怎样在两个中心之间传送的允许有多少数据丢失保证更新的数据在容灾中心被更新容灾中心可以开始容灾进程的能力1、Tier 0 - 无异地数据备份(No off-site Data)Tier 0 被定义为没有信息存储的需求,没有建立备份硬件平台的需求,也没有发展应急计划的需求,数据仅在本地进行备份恢复, 没有数据送往异地。这种方式是最为低成本的灾难备份解决方案,但事实上这种灾难备份并没有真正灾难备份的能力,因为它的数据并没有被送往远离本地的地方,而数据的恢复也仅是利用本地的记录。2、Tier 1- PTAM车辆转送方式( Pickup Truck Access Method)作为 Tier 1 的灾难备份方案需要设计一个应急方案,能够备份所需要的信息并将它存储在异地,然后根据灾难备份的具体需求,有选择地建立备份平台, 但事先并不提供数据处理的硬件平台。3、Tier 2 - PTAM卡车转送方式+热备份中心 (PTAM+Hot Site)Tier 2相当于是Tier 1再加上具有热备份能力中心的灾难备份。热备份中心拥有足够的硬件和网络设备去支持关键应用的安装需求。对于十分关键的应用,在灾难发生的同时,必须在异地有正运行着的硬件平台提供支持。这种灾难备份的方式依赖于用PTAM的方法去将日常数据放在异地存储,当灾难发生的时候,数据再被移动到一个热备份的中心。虽然移动数据到一个热备份中心增加了成本,但却明显降低了灾难备份的时间。4、Tier 3 - 电子传送(Electronic Vaulting)Tier 3 是在Tier 2的基础上用电子链路取代了车辆进行数据传送的灾难备份。接收方的硬件平台必须与生产中心物理地相分离,在灾难发生后,存储的数据用于灾难备份。由于热备份中心要保持持续运行,因此增加了成本。但确实是消除了运送工具的需要,提高了灾难备份的速度。5、Tier 4 - 活动状态的备份中心 (Active Secondary Site)Tier 4 这种灾难备份要求两个中心同时处于活动状态并管理彼此的备份数据,允许备份行动在任何一个方向发生。接收方硬件平台必须保证与另一方平台物理地相分离,在这种情况下,工作负载可以在两个中心之间被分担,两个中心之间之间彼此备份。在两个中心之间,彼此的在线关键数据的拷贝不停地相互传送着。在灾难发生时,需要的关键数据通过网络可迅速恢复,通过网络的切换,关键应用的恢复时间也可降低到了小时级。6、Tier 5 - 两中心两阶段确认 (Two-Site Two-Phase Commit)Tier 5 是在Tier 4的基础上在镜像状态上管理着被选择的数据 (根据单一commit范围,在本地和远程数据库中同时更新着数据),也就是说,在更新请求被认为是满意之前,Tier 5需要生产中心与备份中心的数据都被更新。我们可以想象这样一种情景,数据在两个中心之间相互映像,由远程two-phase commit来同步,因为关键应用使用了双重在线存储,所以在灾难发生时,仅仅传送中的数据被丢失,恢复的时间被降低到了小时级。7、Tier 6 - 零数据丢失 (Zero Data Loss)Tier 6 可以实现零数据丢失率,同时保证数据立即自动地被传输到备份中心。Tier 6被认为是灾难备份的最高的级别,在本地和远程的所有数据被更新的同时,利用了双重在线存储和完全的网络切换能力。Tier 6是灾难备份中最昂贵的方式,也是速度最快的恢复方式,恢复的时间被降低到了分钟级。对于Tier 6 的灾难备份解决方案,可以应用两种远程拷贝技术来实现,即PPRC同步远程拷贝和XRC异步远程拷贝。 因此,需要根据其计算机处理系统中数据的重要性,以及需要恢复的速度和程度,来进行灾备系统建设的整体考虑和不同灾难对业务冲击的分析,并最终确定灾备系统建设的总体规划。4.2 容灾系统建设所面临的问题目前,市场上有很多关于容灾的解决方案,由于很多客户只是有模糊的需求,生产业务数据仅仅通过备份系统在本地备份是不够的,还需要在远程也部署灾难恢复中心,但是,由于客户对容灾的理解不够透彻和市场发展的不均衡等原因,很多厂商对容灾的理解也不一样,所提出的解决方案也不尽相同。客户选取容灾备份系统保护数据安全时,需要面对的问题归纳起来有以下几点: 是否支持异构存储系统,保护原有投资,降低其成本由于对系统安全的考虑是随着数据的重要性和数据量而不断发展的,因此用户可能保留有多种品牌、多种档次的磁盘存储介质,因此能够在容灾系统中能够使用它们,对企业在构造容灾系统时节约成本非常有帮助;而且,由于容灾备份数据中心的使用率非常低,因此如果能够在容灾数据中心采用较低档次的存储备份系统,也能够大大降低其成本。 是否受距离的限制容灾方案如果能够克服距离的限制,就能够比较好地帮助很多企业选择分支机构作为容灾数据中心,减少建设新的容灾中心的成本; 是否受带宽限制主数据中心和容灾数据中心之间的数据传输带宽,往往占整个方案中一个非常大的比例,因此,节约带宽的方案显然非常受欢迎; 是否需要对原有系统进行比较大的改动设计容灾恢复中心时,需尽量减少对现有的生产业务系统的变更,提高业务的可用性。 恢复时间如何当原始数据中心的数据出现一些问题时,从容灾数据中心恢复数据的速度,是考量容灾方案中一个非常重要的部分; 管理是否方便管理容灾方案的可操作性和简便性,是容灾方案成功的一个关键,因为真正出现灾害情形时,复杂和难于执行的方案,会大大增加系统恢复的所需时间; 是否与当前存储网络的体系方便集成新的容灾方案是否能够与现存的网络体系非常吻合,非常容易地进行集成而不影响现有系统的工作,是用户需要仔细考量的一个重要环节,很多重要的系统具有连续运行的高可靠性,系统维护时间非常少。4.3 主流容灾技术分析与对比4.3.1 远程数据库复制技术远程数据库复制技术主要集中在数据库领域,通过数据库重做日志(RedoLog)来实现数据库的远程复制和同步。即:将生产数据库产生的归档日志实时传输到灾备端,利用日志向备份数据库追加数据,保持备份数据与生产数据同步。在复制过程中,使用自动冲突检测和解决的手段保证数据一致性不受破坏。基于数据库的复制方式可分为实时复制、定时复制和存储转发复制。基于数据库的容灾根据工作方式的不同,有三种实现方式: 实时复制当生产中心的数据库内容被修改时,容灾备份中心的数据库内容实时地被修改,此种复制方式对网络可靠性要求高。 定时复制当生产中心的数据库内容被修改时,容灾备份中心的数据库内容会按照时间间隔,周期性地按照生产中心的更新情况进行刷新,时间间隔可长(几天或几个月)可短(几分钟或几秒钟)。 存储转发复制当生产中心的数据库内容被修改时,生产中心的数据库服务器会先将修改操作Log存储于本地,待时机成熟再转发给容灾备份中心。远程数据库复制的实质是实现主、备用系统的数据库的数据同步(实时或者准实时同步)。即是将主用系统数据库操作Log实时或周期性地复制到备用系统数据库中执行,实现二者数据的一致性。远程数据库复制对主机的性能有一定影响,可能增加对磁盘存储容量的需求(包括对Log的存储)。为远程数据库复制逻辑结构(举例)示意。图1:远程数据库复制示意图远程数据库复制需要主机、操作系统、数据库版本等大致相同,小版本可以略微不同。存储系统可以异构。目前市场上常见的基于应用的容灾解决方案主要有Oracle的Dataguard、DSG的Realsync等。优势分析: 由于是通过日志来复制,对存储容量要求较低,灾备端的备份存储空间只需和生产端配备相同空间即可(不含操作运行和测试空间),并且支持异构存储设备。 由于网络上传输的只是重做日志(如DataGuard),或是SQL语句(如GoldenGate、SharePlex),因而,网络资源占用相对较少。 由于灾备端数据库时刻处于激活状态,随时可以确认数据库状态,接管时间相对较短。劣势分析: 灾备端服务器档次、配置相对较高。远程容灾中心需配置与生产端相似的主机系统。 性能影响。由于通过数据库重做日志方式实现复制,生产端主机需要通过额外进程来捕获、传输重做日志。因而,容灾备份时影响生产端数据库主机性能。 扩展性差。只支持数据库灾备,不支持操作系统、应用等文件类型灾备。实施、维护、变更困难。生产端的数据库级发生变更、灾备端数据库系统需随时进行维护,以保证两端数据的一致性。如果多个业务系统需要做容灾备份,容灾备份系统维护工作量和难度成倍增加。4.3.2 基于逻辑磁盘卷的远程容灾技术基于逻辑卷的复制技术,简单地说,就是通过安装在服务器的数据复制软件,或是应用程序提供的数据复制、灾难恢复工具(如数据库的相关工具),利用TCP/IP网络连接远端的容备服务器,实现异地数据复制。基于逻辑卷的数据复制容灾方式工作在主机的卷管理器这一层,通过磁盘卷的镜像或复制,实现数据的容灾。将物理存储设备划分为一个或者多个逻辑磁盘卷(Volume),便于数据的存储规划和管理。逻辑磁盘卷可以理解为在物理存储设备和操作系统之间增加一个逻辑存储管理层。基于逻辑磁盘卷的远程容灾备份是指根据需要将一个或者多个卷进行远程同步(或者异步)复制。该方案的实现通常通过软件来实现,基本配置包括卷管理软件和远程复制控制管理软件。远程复制控制管理软件将主用节点系统的卷上每次I/O的操作数据实时(或者准实时、或者延时)复制到远程节点的相应卷上,从而实现远程两个卷之间的数据同步(或准同步)。主、备节点之间通常需要配置相应带宽的IP通道。根据数据的更新频度、广域通信条件和质量等因素,可将容灾备份设置成同步、准同步或者定期同步等方式(或者自动适应)。基于逻辑磁盘卷的远程容灾备份会增加各节点主机的一些处理性能要求,增加主机负载。优势分析: 通常被应用于规模较小的存储环境内。 成本较低。即使将软件许可费、硬件设备、服务费用一并算上,价格也只有基于存储的复制系统的几分之一。 用户不需更换太多现有的系统架构,也不用担心后端存储系统的兼容性问题,只需支付软件的授权费和灾备端的硬件设备费用即可。劣势分析: 基于主机实现,需要主机的CPU资源,同时由于TCP/IP的传输效率低于FC通道的效率,所以对系统的性能影响较大。 该模式只支持特定的操作系统,所以当客户有其他的应用系统,还需要另外的解决方案。这样,管理比较复杂,在软件上还需要巨大的投资。 基于主机实现的复制,不能满足项目技术要求中的“在某一时刻作一个数据的备份”要求。若通过原有的TCP/IP网络实现,可能会产生严重丢包的情况,并且性能较差。4.3.3 基于智能存储的远程容灾技术基于磁盘阵列复制技术的关键是实现盘阵之间的直接镜像,通过存储系统内建的固件(firmware)或操作系统,利用IP网络或DWDM、光纤通道等链路,将本地存储中的数据复制到远程阵列中,从而实现生产数据的灾难保护。采用存储系统提供的数据复制软件,复制的数据流通过存储系统之间传递,和主机无关,不影响主机系统的性能。基于存储数据复制技术的容灾方案示意图基于存储的复制可以是如上示意图的“一对一”复制方式,也可以是“一对多或多对一”的复制方式,即一个存储的数据复制到多个远程存储或多个存储的数据复制到同一远程存储;而且复制可以是双向的。基于存储的复制方式有两种:同步复制方式和异步复制方式同步方式:主/备中心磁盘阵列同步地进行数据更新。应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列将利用自身的机制(如EMC的SRDF/S)同时将写I/O写入远程磁盘阵列,远程磁盘阵列确认后,主中心磁盘阵列才返回应用的写操作完成信息。同步镜像使远程拷贝总能与本地机要求复制的内容相匹配。当主站点出现故障时,用户的应用程序切换到备份的替代站点后,被镜像的远程副本可以保证业务继续执行而没有数据的丢失。同步远程镜像的RPO值为零(即:不丢失任何数据),RTO也是以秒或分为计算单位。不过,由于往返传播会造成延时较长,而且本地系统的性能是与远程存储设备直接挂钩的,所以,同步远程镜像仅限于在相对较近的距离上应用,主从镜像系统之间的间隔一般不能超过160公里(约合100英里)。异步方式:在应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列立即返回给主机应用系统“写完成”信息,主机应用可以继续进行读、写I/O操作。同时,主中心磁盘阵列将利用自身的机制(如EMC的SRDF/A)将写I/O写入后备磁盘阵列,实现数据保护。异步远程镜像采用了“存储转化(store-and-forward)”技术,所有的I/O操作是在后台同步进行的,这使得本地系统性能受到的影响很小,大大缩短了数据处理时的等待时间。采用同步方式可能对生产系统性能产生影响,而且对通信链路要求较高,有距离限制,通常在近距离范围内实现(同城容灾或园区容灾方案)采用异步方式与其他种类的异步容灾方案一样,存在数据丢失的风险,通常在远距离通信链路带宽有限的情况下实施。优势分析: 将数据与应用系统分开,对主机系统的运行资源影响比较小。 对主机系统是完全透明的,对于将来增加新的操作平台,可不用增加任何复制软件的投资,即可完成实现数据复制 采用镜像技术来复制数据,并借助高速缓冲存储器加速I/O存取,两端的数据差异时间点比较小,加上存储系统本身具备一定的容错能力,使之具有较高的运行性能和可靠性。 灾备中心的数据可以得到有效利用。劣势分析: 本地端和灾备端需分别配置两套相同的存储系统,不仅采购成本高,而且还要受制于单一的设备厂商,未来的扩展性缺乏弹性。 对线路带宽的要求高。 由于数据复制是通过阵列控制器实现的,所以会占用生产端磁盘阵列资源,对其性能产生影响。 当异步同步不能最终成功完成的情况下,数据的一致性无法得到保证。4.3.4 基于虚拟磁带库的远程容灾技术通过在生产系统端实施备份系统,数据通过备份软件存储到虚拟带库设备中,在远程容灾站点同样部署一台虚拟带库,由虚拟磁带库自带的远程数据复制模块,实现两台或多台虚拟磁带库自动、手动数据复制,实现数据容灾。为确保数据远程的可靠复制,虚拟带库系统设计中采用了多种数据压缩、缓冲技术,确保数据的复制效率。大部分VTL提供基于以太网(WAN)的复制功能(VTL Replication),无需借助备份软件或第三方工具即可实现。分公司A:VTL1000公司总部:VTL3000分公司B:VTL1000分公司C:VTL1000LAN/WAN容灾中心:VTL3000图3 基于智能虚拟磁带库间的远程容灾复制技术VTL 复制功能: 支持通过IP网络在多台 VTL之前实现备份数据的复制; 支持手工发起和策略制定,容灾自动化完成; 支持复制方式:单对单、单对多、多对单; 支持增量复制,断点续传; 可设置复制占用的网络带宽,优化利用网络资源; 基于浏览器的完善系统状态和报告显示机制; 提供快速的本地和远程恢复,支持本地操作恢复和远程灾难恢复; 支持网络加密和压缩。VTL复制具有如下特点: VTL自主功能实现,无需借助第三方备份软件,无需改变原有策略; 自动化容灾代替人工操作,确保数据安全传送与存储,防止了病毒与黑客攻击,避免数据丢失、被盗等风险,从而节省管理时间和人力资源成本; 重复数据删除后再复制,节省带宽,同时带宽控制技术优化网络资源; 支持直接从远程VTL的灾难恢复功能,双重保障,避免单点造成的数据丢失; VTL 无论是单台对单台、单台对多台还是多台对多台,通过复制功能都能实现数据容灾复制。优势分析: VTL自主功能实现,无需借助第三方备份软件,无需改变原有策略; 成本低,管理简单; VTL容灾备份方案的实施对原有生产系统没有影响,只需要对其备份系统加以完善即可; 自动化容灾备份代替人工操作,确保数据安全传送与存储,防止了病毒与黑客攻击,避免数据丢失、被盗等风险,从而节省管理时间和人力资源成本; 重复数据删除后再复制,节省带宽,同时带宽控制技术优化网络资源; 支持直接从远程VTL的灾难恢复功能,双重保障,避免单点造成的数据丢失; VTL无论是单台对单台、单台对多台还是多台对多台,通过复制功能都能实现数据容灾复制; 容灾备份的两地没有备份软件必须统一的限制,不同站点间的备份软件和物理磁带库可以是不同品牌; 容灾演练简单,并且对生产系统影响最小。劣势分析: 备份的数据需要恢复才可以使用; 两端设备需要同一品牌。第五章 推荐的解决方案5.1 本地数据备份方案推荐5.1.1 建设目标提升备份速率,保证数据安全是富维江森公司本次系统建设的首要目标。目前核心备份设备采用的性能低下的物理磁带库,计划通过一套开放的、高性能的备份设备替换掉现有物理磁带库,保护公司核心业务数据安全,减少因数据丢失的计划外停机次数和时间。集中数据保护系统建设目标是: 采用高性能的虚拟磁带库设备替换现有的物理磁带库,提高备份效率; 升级现有备份软件到NetBackup 7.0版本,增加备份软件模块改变为LAN-Free备份架构,提高数据备份效率,缩短备份时间; 采用先进技术保证系统无间断的运行。5.1.2 整体拓扑图5.1.3 备份设备升级改造5.1.3.1.1 规划说明在本方案中将采用众志和达SureSave VTL5100企业级虚拟磁带库替换现有HP8096磁带库,实现对富维-江森公司核心IT业务系统数据备份保护。 新增一台SureSave VTL5100虚拟磁带库采用双控制器并行工作,每个控制器配置4个4Gb FC光纤接口,配置冗余电源、风扇。 目前数据总量为10TB左右,所有
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!