服务器双机热备建议方案设计.doc

上传人:jian****018 文档编号:8749290 上传时间:2020-03-31 格式:DOC 页数:33 大小:1.18MB
返回 下载 相关 举报
服务器双机热备建议方案设计.doc_第1页
第1页 / 共33页
服务器双机热备建议方案设计.doc_第2页
第2页 / 共33页
服务器双机热备建议方案设计.doc_第3页
第3页 / 共33页
点击查看更多>>
资源描述
(第一部分)ROSE双机热备解决方案项目方案前言数字化建设是一个庞大而复杂的系统工程,其整体系统由上百个业务子系统组建而成,而这些系统间又有频繁的数据交换和业务联动,数据/信息中心系统的建设和部署是整个数字化系统建设的核心和基础,其架构设计是一项复杂的工作。本方案提出双机热备硬件平台基础架构的概述。本方案针对数字化基础架构,帮助各个层次上保持正常、健康的运行。具体方案如下:一、 高可用性评估: 对 IT 可用性计划、流程、过程、角色、职责、报告、控制和服务水平实现情况进行分析;通过事后分析、故障成本或组件故障影响分析技术,对可能发生的故障进行分析;二、 高可用性规划与设计 对高可用性进行规划,包括计划、计划管理、报告和服务水平管理、高可用性流程和过程设计,包括角色和职责。三、 高可用性实施 各种服务器优化与整合服务规划、设计和实施。四、 容灾规划与实施服务 数据中心和灾备中心连续性接管服务,灾难恢复演练计划制定与实施。一系统环境1.1 方案业务简述本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。为支持越来越高的业务连续性要求。二关健业务连续性系统设计2.1 基础架构2.2 系统设计说明1. 服务器、存储和软件系统本方案的核心是统一的高性能的NAS架构,大部分数据都存储在NAS的环境中,通过交换机连接不同的数据库服务和应用服务器进行各种业务处理。根据我们对业务系统的分析,充分满足对系统数据容量的规划,建议配置如下: 2两台服务器建议选择IBM X3650,每台建议配置如下:IBM System X3650 服务器类型2U机架式CPU四核至强E5150(2.0G主频/20MB三级缓存/最高支持1600MHz内存频率),可扩展至2个处理器内存(RAM)4*4GB 1333MHz RDIMM内存硬盘2*1TB 2.5HDD网络4口千兆网卡光驱DVD光驱HBA 卡I BM 6Gb SAS HBA*2电源双电源冗余 磁盘阵列建议选择IBM DS3512,建议配置如下:IBM DS4200控制器类型 单控制器硬盘配置1TB 7.2K 3.5 NL HDD SAS*6 互联线3m SAS Cable*2电源双电源冗余 双机软件选择RoseHA 一套,配置如下:RoseHA 双机容错系统RoseHA for WindowsWindows 2000/2003/2008 Server for x86-64 (Standard / Advanced / Datacenter Edition)操作系统要求选择支持大内存和硬盘RAID功能。 两台IBM X3650双机系统为数据库服务器,两台互为备份,这大大提高了系统的可靠性,在任意一台服务器发生故障时整个系统能够继续安全良好的运行。数据存储方面,根据业务要求,确定了数据集中结构、数据冗余备份写入,服务器通过交换机和DS4200磁盘阵列组网。为提供存储底层可靠性,我们建议配置1台DS4200阵列柜,阵列各划分划分多外逻辑卷供不同的应用服务器使用。数据库文件和控制文件、应用程序文件全部建议放置在磁盘阵列上,在发生双机切换时无需手工同步文件。2.3 系统方案特点 存储使用阵列,即稳定可靠、绝对数据安全而且成本较低,充分节省用户投资; 服务器、网卡、电源模块等关健设备全部使用冗余设计,无单点故障; 双机软件快速反映,错误检测时间小于10秒,故障切换及恢复时间一般在10-20秒; 双机软件GUI与Server分离,可随时中断GUI而不影响Server的运行; 支持JOB和BRING IN/BRING OUT、在一台SERVER上停止JOB不会导致FAILOVER 在同一块网卡上建立多个活动的IP地址,支持多个JOB的运行 自动切换:当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。 三附录3.1 RoseHA 双机容错系统 RoseHA是利用共享磁盘阵列实现系统高可用性,保证应用系统7*24不间断运行的软件产品。ROSE HA软件同时安装在两台主机上,用于监视系统的状态,协调两台主机的工作,维护系统的可用性。它能侦测应用级系统软件、硬件发生的故障,及时地进行错误隔绝、恢复,以最低成本提供用户几乎不停顿的计算机作业环境。 RoseHA 以其稳定、可靠,在windows2000、windows2003、windows2008服务器的容错软件中占有绝对的优势,同时也成为国内绝大多数的磁盘阵列柜厂家的OEM容错软件。工作模式 主从方式(Active/Standby) 主机工作,从机处于监控准备状态。当主机宕机时,从机接管从机的工作,待主机恢复正常后,按使用者的预定以自动或手动的方式将服务切换到主机上运行。 双工方式(Active/Active) 两台主机同时运行各自的服务工作,且相互监测对方的情况。当一台主机宕机时,另外一台主机立即接管它的工作,保证工作不间断。 譬如:A机运行ORACLE数据库应用,B机运行IIS网站应用。 特 点 自动切换 当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。 支持多条心跳路径 可以将网线和RS-232串口线作为在RoseHA软件的心跳路径。配置多条心跳路径可以避免系统的单点故障。两台服务器的信息交换可通过:RS232、TCP/IP 自动检测 在集群系统的每一台服务器内,RoseHA具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复。 丰富的附加功能 提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),使用者可针对特定的服务编写Agent程序,执行与特定服务相关的状态诊断及错误恢复工作的。 RoseHA 采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时间并防范错误,提供故障警告; RoseHA 可设定故障排除后自动或手动回复(switch back); RoseHA 安装时不需要修改操作系统的核心、更改应用软件,也无需特殊的硬件; RoseHA 提供基于GUI的监控中心,管理员能查看ROSE HA的状态、检查错误信息和警告、修改系统参数及从远程工作站管理ROSE HA系统; RoseHA 支持各种数据库,包括ORACLE、Sybase、Informix、DB2、MySQL等 。 Private Net 私用网络 两台服务器通过私用网络心跳(HeartBeat)信号,使两台服务器能够相互了解对方的运行情况。为了避免不必要的失效切换,最好建立两条独立的物理路径作为通讯路径。 RS-232 Socket Private Net:配置服务器空闲的串口作为一条通讯路径。 TCP/IP Socket Private Net:两台服务器的网卡用反线(back to back)直接或通过LAN建立一条通讯路径。 如果所有的私用网均失效,服务器仍然可以用公用侦测对方服务器的可用性。如果对方服务器仍然可用,不触发接管动作;如果对方服务器不可用,立即接管动作。 Public Net 公用网络 客户端通过此网络与服务器通信,当两台服务器互为备份。对于不同的服务,可以用不同的公用网连接到两台服务器。ROSE HA支持TCP/IP协议,可以在EthernetFastEthernet、FDDI和ATM网上运行。 管理工具 友好、直观、易于操作的GUI界面 有关ROSE HA的配置都可以在GUI中完成,支持动态配置和实时同步 网卡的状态,磁盘的状态都可在GUI中显示出来 监控的对象资源 Volume IP地址 计算机别名 共享文件 NT服务 用户自定义 工作原理 系统启动后,ROSE HA首先启动HA Manager管理程序,根据高可靠性系统的配置结构初始化,然后启动必要的服务和代理程序来监控和管理系统服务。HA代理程序用来监控、监测、诊断和管理硬件软件服务。 代理程序检测到该服务器处于活动状态,HA Manager就会认为该服务处于活动状态,HA Manager会定时通知后备服务器上的HA Manager,其每项服务处于正常。 当代理程序检测到某个服务发生故障时,它就通知HA Manager管理程序。HA软件首先会重新启动该服务多次(可由用户设定)。如果启动不能成功,该服务会由HA转移到后备服务器上。 HA周期性地检测系统硬件的状态,如果硬件发生故障,HA会把与该硬件相关的服务转移到后备服务器上。当某项服务发生转移时,HA首先在运行服务器上停止该服务,之后,由备份服务器上的HA在备份服务器上启动该服务。由于停止和启动该服务需要一定的时间,所以,当服务被切换(转移)时,该服务会有短暂的中断,转移完成后,服务自动恢复正常运行。考虑到一些数据库系统(如ORACLE、SYBASE、INFORMIX等)以及其他一些应用软件(如Domino Server、WWW Server等),ROSE HA在HA管理模块(HA Manager)的基础上,提供了一系列的Agent软件模块。Agent为一个软件监视模块,监控数据库服务或其他应用服务的运行。当运行服务器发生故障时,由Agent向HA主控软件请求,进行相应的处理动作。 总之,ROSE HA软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的运行。(第二部分)双机热备系统实施方案 实施方案硬件准备1.安装前检查服务器IBM 3650两台(01号、02号表示),阵列柜1台,双机互联线1根,阵列柜电源线2根,服务器电源线2根,SCSI数据连接线2根。2.阵列柜安装事项先连接SCSI数据线,一头接阵列柜后方数据接口,一头接服务器上方非集成接口(服务器接口有两个,一个是主板集成,一个是非集成,非集成的在服务器背部上方),再分别将电源线两根接阵列柜后方风扇口一侧,扣好搭扣。3.网卡连接注意事项双机互联线,一头插在01服务器非集成网卡上,另一头插在02服务器上。业务用的网线一头插在服务器集成网卡上,另外一头插在交换机上,01、02都是这样安装。4.开机顺序先开阵列柜,直到看到上面出现英文提示“Startup Completed”后再开服务器01,直到出现登录窗口再开服务器02,到服务器02出现登录窗口后,双机开机过程结束。关机:先关服务器02,直到电源完全关闭。再关服务器01,直到电源完全关闭,最后按阵列柜电源开关,则阵列柜关闭。切记:1.不能双机同时读写文件到阵列柜相同分区,否则可能会造成文件或分区损坏。2.先保证服务器关机后方可关闭阵列柜,不然会造成阵列柜内数据丢失。3.一定要配置UPS,严防停电事故发生。软件使用双机容错的核心是双机热备软件通过互相监控来实现热备的效果。建议采用的软件是美国ROSE数据公司的ROSE HA。ROSE HA可及时地进行错误隔绝、恢复,保证服务器在出现意外及有计划的停机情况下均能为客户提供连续有效的服务。将ROSE HA软件同时安装在两台服务器上,用于监视系统的状态,协调两台服务器的工作,维护系统的可用性。将软件分别安装在01和02服务器上,并输入正确的授权号。它的安装很简单,一路“Next”即可,安装完成后请注意,要将它的服务改为随系统启动。注意:双机热备要求双机须超级用户密码相同,因此超级用户密码为都为123。服务器01为主机,服务器02为从机,当01出现中断或意外不能工作时,双机热备软件会自动切换到另一台服务器即02,直到服务器01恢复,软件会自动切换回01机。1.状态显示说明主界面中,两台PC机呈亮色,表示双机开启,中间绿线表示双机心路线(即蓝色网线)通讯正常,红色表示线路有故障或双机中有一台无响应!双机中屏幕有ZZZ标示的为从机,屏幕中有图标的是主机(图2)。主机工作时能看到阵列柜分区,即G、H盘。从机不能看到这两个分区。图22.资源界面说明图3所示server01(01机)和server02(02机)两边现在已经建立好了相应的同步资源,它们是IP地址、服务器名、NT服务、共享文件和磁盘卷。现在分别列出相关信息:资源工作状况说明,呈现亮色的为主机资源,绿色的为从机资源,黄色惊叹号的表示该资源有异常(如主机死机,从机就会显示此信息)。灰色表示资源刚建立但未激活。原则上两边的资源名称和数量是相同的,阵列柜资源必须全部包含在内。图3其中server表示虚拟服务器,它是由双机热备软件自动产生的PC机。server的特性基本与主机相同,如输入serverc$,可以访问的是server01的C盘,但它使用自己的IP地址,共享目录也是自己的,如servertest能够访问的前提是server01和server02都创建了test目录共享,且两个共享是指向同一个目录,如G:test,而不能建立在各自的独有盘符中,要建立在公用盘符(一般是阵列柜)上。当双机的共享都建立成功后,再使用双机软件创建一个虚拟共享资源如servertest即可。开设用户名为管理用账号“toway”,密码“toway”,如果新账号要求在server01中进行,它是主域控制器。数据库用户名system / twsa2004_comein. (注意后面有小数点)。出现意外时的处理方法1.双机配置时双机热备程序已经备份了注册表文件,分别对应在各自机器的 administrator我的文档中文件名为01.reg和02.reg,恢复时先停止双机服务,步骤为:进双机软件,点击快捷菜单中的红色图标,依次点ToolsRestore cluster configur01tion,选中相应的备份文件即可。2.资源丢失,如阵列柜盘符消失先停止双机服务,再分别在双机中使用磁盘管理器加入相应盘符,保证双机盘符相同再重启双机服务,点击失效的资源(一般呈灰色),右键选择“bring in cluster”,稍后即会恢复正常。3.切换服务器的主从顺序点击需要停止机器名,进入菜单选择resourceserver f01ilover。4.意外停电事故的处理如果遇到意外停电事故,可能会产生阵列柜分区丢失,双机不能正常工作的情况。请按下面的方式处理:1)先停止双机服务。2)使用磁盘管理器加入相应盘符,看此时是哪个盘符丢失,直接点击盘符在右键菜单中选择“更改驱动器名和路径”,分配原来正确的路径即可。3)重启服务器01,在我的电脑中查看阵列柜盘符是否已经出现,里面的内容是否还有。由于相关的备份内容已经全部拷贝到01机的E、F盘中,主要是mssql、server和toway等3个关键目录。如果损坏严重,可以用备份进行拷贝来恢复。不过最好是重启后仔细观察,不要轻易进行拷贝恢复,因为可能会丢失一些数据!一般来说,G 盘存放mssql(SQL安装路径)、server(程序共享路径)、towayhis(数据库日志)等文件夹,H 盘放数据库的目录和towayhis (数据库文件)文件夹。重启服务器01后,将服务器02也重启一遍,查看阵列柜分区是否正常。4)如果一切正常就可以启动双机程序,把服务恢复。检查资源窗口中的状态是否正常,如果呈现灰色,一般是阵列柜的盘符,可以手工启动它,启动方法是右键点击盘符选择“bring in”即可。提示:双机程序可以手工切换指定谁为主机,默认是01,如果想改为02,在资源界面中选中01机,再点击快捷菜单中“?”左边的第一个按钮即可。切换后原来的01机资源呈现绿色 ,02机资源呈现亮色,即表示切换成功!(第三部分)Windows 下 Rose 软件的安装与测试软件平台安装Rose HA for windows安装操作指南第一部分:准备工作1. 确认两台服务器操作系统及相应补丁安装正常;服务器网卡间通讯正常2. 确认磁盘阵列与主备机连接正常,对应的磁盘阵列上的数据分区在主备机上所分配的盘符一致,并且可以同时进行读写操作。3. 主备机都是以相同的管理员(administrator)的用户名登陆,并且口令不为空。4心跳连接线,包括串口线(如果需要)连接正确。第二部分:安装步骤1放入光盘,执行光盘中Setup.exe 2.选择Next,3选择Yes,4输入相应的用户名称及公司名称,选择下一步,5输入本地机器名称及远程机器名称,6选择软件安装路径,默认即可,选择Next,7默认即可,选择Next,8安装完成,选择Finish。注:主备机上都需要进行软件安装,步骤相同,只是在输入机器名称时,需要根据实际情况输入。第三部分:配置步骤1选择桌面,执行开始=程序=NT Cluster=Cluster Administration Tool,进入到如下界面,提示软件可以试用31天,2点击菜单栏Tools的License, 3可以得到如下界面,如果已经申请到Rose HA的正式注册码,可以在这里根据注册码的内容逐项填入Serial No. Data及License,然后点击OK,既可提交License;如果没有申请License,或者试用软件,则直接点击OK即可。4点击菜单栏Private Net中 TCP/IP Socket,配置心跳连接,建议配置两条TCP/IP的心跳连接,优先选择心跳直连网卡的IP地址,其次为连接交换机的网卡地址,如果需要,也可以创建RS232串口心跳连接,点击Private Net中RS232 Serial Port进行配置即可。以上14步,在主备机上均需要进行操作,才可以完成心跳连接的建立。5点击菜单栏View中Resource Objects,进行资源配置。 6选中主机,点击菜单栏中Create,可以看到我们可以建立的相应的资源,这里选择IP Address,7在Active IP Address 处填入需要绑定的虚拟IP地址,并且在Server处,根据服务器名称,选择对应虚拟IP的本地网卡,然后点击Add,添加到下面的空白处,要确认选择的网卡与虚拟IP属于同一网段,然后点击Create,可看到建立好IP的相应图示:8选中主机,点击菜单栏中Create,选择Company Alias Name,建立虚拟主机名在Computer Alias Name处输入需要建立的虚拟主机名,点击Create建立即可,可以看到如下图示:9选中主机,点击菜单栏中Create,选择Volume,建立卷资源,在Basic setup处,在Local Server Volume处和Remote Server Volume处分别选择对应共享磁盘阵列上的磁盘,可以看到在Drive letter 可以看到对应在主备机上的分区,点击create,建立卷资源,10选中主机,点击菜单栏中Create,选择NT Service,建立应用服务资源,在Basic Setup,从右边服务列表中,选择需要保护的服务,点击Select后,添加到左侧的NT Serivce,在界面的右上角,将前面建立好的虚拟IP、卷及虚拟主机名等资源从Available Objects加入到Pre-requisite Objects中去,点击Create,建立好NT Service资源可以得到如下的图示,所有建立好的资源成为一个资源组,选择主机的资源组,点击鼠标右键,选择Bring in Cluster,将资源组启动,主机为灰色,备机为绿色,至此,Rose Ha双机配置完成。第四部分:功能测试1 在windows服务列表中,停止所保护的服务,主机的资源组应该切换至备机,等切换完成后,在备机上检查应用服务的工组状态。2 拔掉主机上绑定虚拟IP的网卡的网线,等到主机资源组切换到备机后,在备机上检查应用服务的工组状态。3 关机切换,主机关闭后,备机应该接管主机的应用。4 主机强行断电,备机应该可以接管主机应用。
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!