浅谈机房跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警平台及实现技术V22

上传人:仙*** 文档编号:30357804 上传时间:2021-10-10 格式:DOC 页数:14 大小:463KB
返回 下载 相关 举报
浅谈机房跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警平台及实现技术V22_第1页
第1页 / 共14页
浅谈机房跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警平台及实现技术V22_第2页
第2页 / 共14页
浅谈机房跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警平台及实现技术V22_第3页
第3页 / 共14页
点击查看更多>>
资源描述
计算机网络管理技师专业论文组别: 组;编号: 号;广州市技师社会化考评论 文报考单位:广州市就业训练中心工作单位: 姓 名: 准考证号: 身份证号: 联系电话: 组别: 组;编号: 号;广州市技师社会化考评论 文浅谈机房跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警平台及实现技术【内容提要】目前,企事业单位IT基础系统的管理范围愈来愈大,结构愈来愈复杂,设备维护工作越来越繁重。确保IT环境的可用性需要一个复杂而且彼此相互依赖的部件集合:不同厂商的主机系统、各种IT设备等它们必须被有效地集成管理起来。传统的手工管理PC服务器模式已经不能满足对全部PC服务器进行统一管理的需求。如何快速定位PC服务器故障信息及故障点, 使信息科具有快速解除服务器故障并具有一定提前消除服务器故障隐患的能力,满足安全运营系统的最终目的呢。【关键字】跨品牌;跨平台; PC服务器;SNMP;硬件底层监控;应用系统监控;监控预警平台;预警系统; 1.1 背景很多企事业单位经过十多年的信息化建设,积累了大量不同类型的软硬件产品。大型企事业单位一般会把主要核心业务数据存放在小型机上,非核心业务多数通过PC服务器运行,由于业务应用的不断整合,应用系统的不断增加,PC服务器数量也不断增加,原来传统的手工管理PC服务器模式已无法满足IT管理部门的要求,须采用计算机硬件监控手段对全部PC服务器进行统一的管理,达到服务器软件故障/硬件故障自动预警通知IT部门负责人,实现快整定位故障点,故障原因或预警服务器故障,提前解除陷患的目的。跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警系统平台是通过HP Openview及PC服务器硬件平台厂商的底层监控软件有机集成设备配置和设备故障管理系统,通过该系统的应用将大大提高设备的整体管理水平,有效地控制设备管理的成本,实现设备运行管理的智能化与高效性,提高整体的维护水平,及时发现硬件故障信息。1.2 解决方案IBM厂家对PC服务器硬件底层监控有RSA II卡;HP厂家对PC服务器硬件底层监控有SIM卡;国内联想对PC服务器硬件底层监控有慧眼软件等等。但各厂家的软件均局限于可以监控自家厂家生产的服务器。大多数厂家监控卡的共性都是支持SNMP协议,SNMP是建立在TCPIP协议之上,用TCP/IP协议的传输层协议UDP(用户据报协议)作为传输协议。跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警系统平台主要功能分为:1) 收集数据中心PC服务器硬件、存储硬件发生故障,提供实时故障告警2) 收集数据中心PC服务器的性能数据,提供性能图表及查询功能3) 监控数据中心PC服务器硬件工作实时状态,提供硬件损坏预警功能4) 通过短信或邮件方式,及时把故障通知相应的设备负责人Open view事件管理的信息可来自系统的任何地方。首先,Open view同时作为故障管理控制台,可以采集各种数据源传来的消息和事件,能够及时发现、集中处理来自不同平台主机系统、存储设备、机房系统以及各种设备管理平台的消息和事件,主要包含以下几类:l 可以主动轮询,获取服务器的故障和性能数据l 可以接收SNMP Trap:相关的管理对象通过trap的消息传递接口主动地将消息和事件发送给管理站l 通过设备管理软件SNMP转发的设备故障l 集成其他的设备管理系统平台信息:l 这样所有设备的故障都可以集中汇总到Open view的消息和事件处理机制中,进行有效的管理。Open view事件管理信息来源于以下几个方面,以IBM/HP/联想/三家为例:1) HP System Insight Manager (SIM)是基于Web的企业管理控制台,它将有关 IT 基础设施的所有错误信息、性能信息和管理信息集中在一个地点。将当前的企业管理技术与 Web 技术的最新进展结合起来,就能够使 IT 管理员通过标准的网页浏览器来监视和管理服务器组、客户机、服务器群和其它网络产品。2) IBM Director 是IBM专门为其刀片式服务器BladeCenter开发的管理工具,配合IBM企业级X架构的领先硬件技术,IBM Director能够收集行业中常见的故障,并进行预测性故障分析,预防意外停机。一旦有问题出现,IBM Director即可同时通过电子邮件(带有事件日志)、LAN和SNMP几种报警方式,通知相关IT管理人员。3) 联想万全慧眼的原理是通过通用的服务器网络服务功能,将监控系统采集到的服务器系统原始监控信息,实时发送到远端平台进行处理和输出。处于远端的控制平台可根据对监控信息的处理和分析,对服务器发送远程控制指令,以实现远程监控服务器。1.3 示意图跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警系统平台解决方案示意图如下:解决方案说明:1) 所有服务器安装HP openview Agent,通过HP Openview收集各服务器硬件工作状态信息汇总到Train1中的Oracle数据库hpov实例;通过对收集的数据进行预订级别信息分析,依据预定级别信息通过预定的报警方式发出相应的系统报警信息。2) IBM Director 5.2服务器远程管理所有IBM 服务器; 收集所有IBM服务器硬件信息汇总到Oracle数据库director52实例3) HP Sim 5.2服务器远程管理所有HP 服务器; 收集所有HP服务器硬件信息汇总到Oracle数据库hpsim52实例4) 联想慧眼III服务器收集所有联想服务器硬件信息汇总到Oracle数据库hpsim实例;对于HP Openview/IBM Director/HP Sim/联想慧眼服务器端安装需准备的软件例表为:1) 操作系统:HP Unix 11.2.3/ Suse linux 10 Sp1/Windows server 2003 std2) 数据库系统:Oracle 10G 3) 应用系统软件:HP openview OVPM/ HP openview NNM/ HP SIM 5.2/ IBM Director5.2/ Lenovo 慧眼III专业版1.4 平台子系统运行环境1.4.1 HP Sim服务器运行环境1.4.1.1 Linux 中央管理服务器安装环境:1.4.1.2 硬件适应范围1. 对于 HP-UX: 任何 HP PA-RISC 系统 任何基于 HP Itanium 的系统2. 对于 Windows: 任何 HP x86 系统 任何 HP x64 系统3. 对于 Linux: 任何 HP x86 系统 任何 HP x64 系统 任何基于 HP Itanium 的系统1.4.1.3 软件需求1. 对于 Linux: SSH 适用于 Linux 7.0 或更高版本的 ProLiant 支持工具 SNMP(建议用作 WBEM 替代软件)1.4.2 IBM Director服务器运行环境1.4.2.1 支持硬件环境范围IBM System p ,系统I ,系统x ,系统Z的BladeCenter , OpenPower 等1.4.2.2 支持软件环境范围支持的操作系统有: Windows,Intel Linux, Power Linux, AIX, i5/OS, System z Linux environments, Red Hat Linux, SUSE LINUX, and ESX Server1.4.2.3 支持的数据库范围: Apache Derby (included with IBM Director) (local install only) IBM DB2 Microsoft SQL Server Oracle PostgreSQL1.4.3 联想慧眼服务器配置运行环境1.4.3.1 支持硬件环境范围包括联想万全服务器、非联想服务器、PC在内的大量主机设备。1.4.3.2 安装软件环境范围支持服务器端安装的的操作系统包括:1. Windows 2000 Server / Advanced Server SP4,2. Windows XP Professional,3. Windows 2003 Server Standard/ Enterprise Edition SP1服务器管理代理软件运行在被管理的联想万全服务器上,支持的操作系统包括:1. Windows 2000 Server/ Advanced Server SP4,2. Windows 2003 Server Standard/ Enterprise Edition SP1(32bit/64bit),3. Linux RedHat 9.0,4. Linux RedHat Enterprise Linux AS3.0, 5. Linux RedHat Enterprise Linux AS4.0(32bit/64bit)1.5 系统配置例表1.5.1 数据库服务器配置1. 安装HP Unix11.2.3操作系统2. 配置计算机名为:Train1 ;IP地址是86.1.1.10;3. 安装Oracle 10G std数据库,并建立HPOV实例,设置用户名及密码4. 安装HP Openview OVPM,设置用户名及密码5. 安装HP Openview NNM,配置连接HPOV实例,并初始化数据库。6. 在HPUX中增加Openview OVO节点命令如下:1) # opc2) 增加节点, VPO Node Bank - Window: Node Bank - Actions: Node - Add -ok 建立节点3) 将节点加入节点组; VPO Node Bank - Window: Node Group Bank - 将节点拖入节点组中4) 配置用户权限;VPO Node Bank - Window: User Bank - 选择相应用户点右键,选择Modify - Responsibilities 5) Close7. Openview Agent的分发:VPO Node Bank - Window: Node Bank - Action: Agents - Install/Update SW & Config-选择节点加入Nodes List - 选择Components “Agent Software,Templetes,Actions,Monitors,Command” - ok- exit。8. ITO 监 控 信 息 确 认; ITO 监 控 的 管 理 节 点 会 实 时 监 控 系 统 运 行, 然 后 对 发 生 的 事 件 以 信 息 方 式 发 送 到 网 管 服 务 器, 系 统 管 理 员 需 要 经 常 检 查 收 到 的 信 息, 然 后 加 以 确 认。Step 1 进 入 ITO 主 菜 单Step 2 选 择 Window - Message Browser 9. 添加新管理节点,详细如下:1) 从 OVO Node Bank 窗口选择ActionsNode Add,打开 Add Node 窗口。2) 在Hostname中输入新被管主机的IP地址,回车。3) 系统会自动解析IP地址对应的主机名,并判断该主机的系统 / 操作系统组合。如果系统无法自动识别,请手工指定。4) 其他选择保持默认值,点击OK。5) 新添加的主机会显示在OVO Node Bank的Holding Area中。双击进入Holding Area,然后点击WindowsNode Bank,新打开一个OVO Node Bank窗口,将Holding Area中新添加的主机拖动到OVO Node Bank。6) 从 OVO Node Bank 窗口选择ActionsNode Add,打开 Add Node 窗口。7) 在Hostname中输入新被管主机的IP地址,回车。8) 系统会自动解析IP地址对应的主机名,并判断该主机的系统 / 操作系统组合。如果系统无法自动识别,请手工指定。9) 其他选择保持默认值,点击OK。10) 新添加的主机会显示在OVO Node Bank的Holding Area中。双击进入Holding Area,然后点击WindowsNode Bank,新打开一个OVO Node Bank窗口,将Holding Area中新添加的主机拖动到OVO Node Bank。11) 在OVO Node Bank窗口中,点击WindowsNode Group Bank,打开OVO Node Group Bank窗口,将OVO Node Bank中新添加的主机拖动到OVO Node Group Bank中对应的分组中。1.5.2 HP Sim服务器配置1. 安装Suse linux 10 Sp1操作系统2. 配置计算机名为:Linux-hpsim ;IP地址是86.1.1.11;3. 在Train1数据库建立hpsim52实例。4. 安装HP Sim 5.2服务器端.5. 从网上通过浏览器连接SIM服务器,使用端口号280(自动转向安全的50000号端口)http:/ 86.1.1.11:280 账户和密码是安装了SIM服务器的Windows 账户和密码。6. 将装有SIM Agent的服务器添加到SIM平台。 在SIM管理页面的工具栏中,选择“选项”“发现功能”“手动”,输入被管理系统的名称或IP地址,点击“添加”,完成被管理服务器的添加。7. 配置自动发现: 选择“选项”“发现功能”“自动”, 在IP address ranges 默认会添入安装了SIM的服务器所在网段;可以根据网络情况和需管理设备修改和增加更多行;1.5.3 IBM Director器配置1. 安装Suse linux 10 Sp1操作系统2. 配置计算机名为:Linux-director ;IP地址是86.1.1.12;3. 在Train1数据库建立director52实例。4. 安装IBM Director5.2服务器端5. 通过客户端连接进入IBM Director 5.2系统6. 配置自动发现功能。1.5.4 联想慧眼服务器配置1. 安装Windows server 2003 std操作系统2. 配置计算机名为vcr-proxy ;IP地址是86.1.1.13;3. 在Train1数据库建立director52实例。4. 安装IBM Director5.2服务器端。5. 添加IBM Director的被现实发展需要所决定。1.5.5 被监控端PC服务器配置所有PC服务器开启SNMP服务,各PC服务SNMP Trap于PC服务器品牌产家提供的软件套件上, HP Open view访问厂家数据库提取常规PC硬件组件信息,使用HP Openview Agent抓取操作系统性能状态、硬件工作状态及应用系统工作状态;实现了在操作系统层面监控PC服务器的功能。1.Linux操作系统下SNMP配置步骤: A、修改SNMP有关配置 直接修改snmpd.conf文件。# vi /etc/snmp/snmpd.conf# rwcommunity public 127.0.0.1#rwcommunity public 86.1.1.13#trapcommunity public#trapsink 192.168.1.4 publicB、重启SNMP进程# /etc/init.d/snmpd stop# /etc/init.d/snmpd startC、将服务设成自动启动# chkconfig snmpd on2.Windows操作系统下SNMP配置步骤:在控制面板-添加与删除程序-添加与删除Windows组件-管理与监视工具中选项中增加SNMP协议,并同样设定Public 及trapsink 192.168.1.4 public1.6 远程监控管理卡PC服务器配置的远程监控管理卡是一个可通过任何服务器状态来管理主机服务器的自主管理分系统:操作系统加载前的初始开机测试,,即使系统失败它仍具备此功能, 是一个计算机内部的自主计算机系统:高度优化的体系结构,包括特有的使用单独指令集和数据缓存的 RISC 处理器,内存子系统和以太网控制器,可以提供一个可以让管理员控制的具有图形方式的远程管理控制平台,实现对服务器在任意时间和在任意操作系统下的图形方式控制。无论服务器是开机还是关机,只要电源供电,就可以通过网络直接和被管服务器的BMC交互,获取服务器硬件健康信息和事件,并且可以对服务器进行关机、开机和重启、点亮ID 灯、前面板锁定等功能。利用远程监控管理卡组成一个监控服务器监控专网,目前IBM PC服务器自带有RSA远程监控管理卡,HP PC服务器自带有ILO远程监控管理卡;HP PC服务器自带有慧眼III远程监控管理卡;因此,开启远程监控管理卡的SNMP功能,Trap至HP Openview数据库,获取PC服务器自带的远程监控管理卡监控信息,实现在PC服务器在OS存在故障时获取故障硬件信息。并通过HP Openview二次开发加入的分析功能提出软/硬件预警信息或故障信息。通过使用远程监控管理卡管理功能,实现了在硬件层面监控PC服务器的功能,并实现远程控制管理PC服务器功能。远程监控管理卡设置主要是在三个层面设置:1) 网络IP地址设置,一般使用静态IP地址。2) SNMP设置。3) 其它附属信息设置:如用户名/密码,服务器状态监控类别设置等等。1.7 信息传达方式跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警系统平台的预警功能则是需要把信息通知到责任人,传统的做法是使用电子邮件(带有事件日志)、LAN和SNMP几种报警方式为主,但这三种报警方式都存在一定的局限性,造成预警不及时。当今可以利用多媒体短信平台把预警信息发送至责任人手机,增加信息时效性从而提高系统预警的功效。 本项目利用移动提供的多媒体短信平台接口进行整合,对预警信息及故障信息分成紧急、严重、一般三个级别;所有运维人员分成四大群组:服务器硬件组、操作系统组、应用子系统群组、网络维护群组;对于最高级别的报警信息采用手机短信24*7H通知到相关群组员工,对于严重,一般级别的信息采用系统日志、邮件通知的方式。1.8 结束语跨平台、跨品牌PC服务器硬件底层及应用系统集中监控预警系统平台主要是利用SNMP协议整合了各PC服务器厂家管理软件及远程监控卡提供的软/硬件基础信息,并通过收集而来的海量数量进行二次分析处理,产生准确的预警信息,触发预警信息级别分类设定后通过多种类信息传达相关的预警信息至相关责任群组员工, 从而实现这套集中监控系统是可以在24*7小时支持自动监控所有PC服务器硬件底层信息状态及应用程序状态的系统,解放了传统的手工管理PC服务器模式,实现了对全部PC服务器进行统一管理的目的。能够通过这套系统进行快速定位PC服务器故障信息及故障点,从而具有快速解除服务器故障的能力;同时通过服务器性能状态分析预警,消除掉超过正常范围内的硬件/软件系统预警,提前消除服务器故障隐患,达到安全运营信息系统的目的。【参考文献】(1)HP Openview OVO操作说明书 2008(2)HP Openview NNM操作说明书 2008(3)HP Insight Manager 5.2操作说明书 2008 (4) IBM Director 5.2操作说明书 2008(5) Lenovo慧眼III高级版操作说明书 2008业绩报告共14页,第14页
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!