OneCenter 一体化智能运维管理平台 与解决与方案(长沙市轨道交通集团)

上传人:痛*** 文档编号:91686595 上传时间:2022-05-17 格式:DOCX 页数:69 大小:138.25KB
返回 下载 相关 举报
OneCenter 一体化智能运维管理平台 与解决与方案(长沙市轨道交通集团)_第1页
第1页 / 共69页
OneCenter 一体化智能运维管理平台 与解决与方案(长沙市轨道交通集团)_第2页
第2页 / 共69页
OneCenter 一体化智能运维管理平台 与解决与方案(长沙市轨道交通集团)_第3页
第3页 / 共69页
点击查看更多>>
资源描述
-让运维更智能,让业务更高效OneCenter一体化智能运维管理平台解决方案长沙市轨道交通集团技 术 方 案 建 议 书勤智(北京)科技有限公司_. z.-目录第1章.方案概述41.1.项目背景41.2.需求分析41.3.建设目标61.3.1.建立统一运维门户61.3.2.建立IT异构资源的全面集中化管理61.3.3.建立全面准确的资产配置管理61.3.4.建立符合最佳实践的服务流程管理71.3.5.建立IT资源全面直观的可视化管理7第2章.解决方案82.1.系统设计原则82.1.1.实用性和模块化原则82.1.2.一致性和开放性原则82.1.3.安全性与可靠性原则82.2.系统安全设计92.2.1.用户安全机制92.2.2.SSO统一认证92.2.3.权限分权分域92.3.系统建设方法92.3.1.体系架构92.3.2.功能架构122.3.3.技术架构132.3.4.部署架构13第3章.功能概述143.1.运维监控系统143.1.1.统一运维管理143.1.2.资源监控管理173.1.3.拓扑管理323.1.4.IP地址管理413.1.5.告警管理433.1.6.业务管理473.2.3D机房管理503.2.1.监控可视化管理513.2.2.资产管理可视化563.2.3.机房3D图形化展示583.2.4.配线可视化管理593.2.5.容量可视化管理613.2.6.资源分配情况管理633.2.7.上下架可视化643.2.8.自定义动画653.2.9.交互式演示汇报653.3.配置文件管理663.3.1.巡检管理663.3.2.机房虚拟现实展现693.3.3.资产管理系统713.3.4.供应商管理713.3.5.配置建模管理723.3.6.空间资源管理743.3.7.配置项导入753.3.8.配置项管理763.3.9.配置项视图783.4.运维流程管理系统803.4.1.服务台803.4.2.服务设计863.4.3.服务产品设计向导873.4.4.服务流程管理1023.4.5.服务量化管理1303.4.6.值班管理1453.4.7.任务管理1503.4.8.公告管理1513.4.9.移动终端运维1523.4.10.报表统计分析1533.4.11.第三方接口1573.4.12.运维知识库系统1583.5.统一运维大数据管理分析系统1643.5.1.统一运维大数据基础系统1643.5.2.统一运维数据分类管理1643.5.3.运维大数据检索与展现1683.5.4.海量日志文件分析1713.5.5.指标动态基线预测1743.5.6.运维支撑能力评估176. z.-第1章. 方案概述1.1. 项目背景长沙市轨道交通集团有限公司(以下简称轨道集团)于2006年6月根据长政办函200679号文件筹建成立。2007年1月,根据市编委关于成立长沙市轨道交通建设管理办公室的通知(长编委发20073号)精神,又成立了长沙市轨道交通建设管理办公室(以下简称轨道办)。2009年4月,市委、市政府对轨道集团进行重组,并撤销轨道办。重组后的轨道集团为国有独资企业,注册资金50亿元,主要承担轨道交通项目的融资、投资、建设、运营、管理。公司现设18个部门、13个子公司、1个分公司及6个参股公司,各部门、公司下设专业科室,履行相应职能职责。公司以“品牌企业 幸福员工”为企业愿景、“奉献担当、严谨创新、忠诚守纪、协同共享、至善超越”为企业核心价值观,在“安全地铁、精品地铁、绿色地铁、经营地铁、人文地铁”的发展理念指引下,公司员工铭记“强企兴业、责任在我”的企业座右铭,在轨道事业的征程中,齐心协力、勇往直前。众所周知,科技是现代化建设的第一生产力,当今社会正在逐步向信息化、网络化、数字化发展。轨道集团的信息化建设也在不断扩大,随着业务迅猛发展,轨道集团的IT信息系统规模日益庞大,IT业务应用也在不断增多。由于多系统、多业务、多厂商设备等原因导致IT网络管理环境复杂多变, IT维护难度成几何倍数增长, IT信息科技方面的风险及隐患也在不断的加大,如何保证整个IT系统稳定安全的运行也逐渐成为轨道集团的管理层和IT运维工程师日益关注的问题。在过去的IT运维管理中,由于没有一套先进的IT运维监控管理系统,使得客户对业务系统的运维管理比较被动且滞后。当系统出现严重故障时才能发现该异常,导致故障处理速度较慢,有时甚至会影响业务系统的正常运行。所以,及时准确的了解设备性能、资源利用率、业务系统运行瓶颈等指标对于客户的信息化建设有不可或缺的参考价值。综上所述,客户对信息中心各项运维工作提出了更高的要求,系统管理人员的工作压力越来越大。因此,对于轨道集团,建设一套功能先进、安全可靠的IT运维监控系统势在必行。1.2. 需求分析通过对客户的信息化建设和运维管理现状的调研和深入分析后,了解到目前客户IT运维发展的现状:v 公司IT应用不断扩大,越来越多的应用和业务在网络上运行,对网络的依赖越来越大,缺少一套针对IT软硬件的统一监控系统,无法及时了解IT软硬件设备的运行趋势,无法快速故障定位,故障处理效率低;v 业务服务的规模增大,规划、维护、安全、管理等分工更加细致,缺乏对业务系统健康状况和运行趋势的监测,无法判定业务系统是否存在运行瓶颈、是否需要扩容或网络调优;v 无法对多种设备系统、业务系统的运行信息、告警信息进行集中管理,并对以上信息进行智能化分析、统计,得出有利于网络管理和维护的数据,达到高效、快捷处理问题的目的;v 全网资产配置情况、使用状况和分布情况难以及时了解;v 缺乏对数据中心机房多样化资产可视化再现能力,不利于运维管理人员对机房资源的全面掌控;v 前端视频监控设备建设规模的不断扩大,缺乏有效的视频监控手段,无法诊断视频质量及内容,影响安全防护工作的开展;v 面对复杂的IT环境,缺乏规范化、自动化的运维管理流程,缺乏完善的故障处理和快速修复机制;v 管理人员不断增多,管理流程日益复杂,管理成本不断上升,没有建立统一、规范、层次化的服务管理流程和技术管理体系,同时缺乏对IT部门运维人员量化考核的依据;v 缺乏能够真实反映设备和业务运行情况与运行质量的统计分析报表,无法为决策层提供数据依据。通过对客户信息化和运维管理现状的深入了解,其运维服务需要改变传统的运维管理模式,变被动式为主动式运维,切实达到7*24小时不间断运维,进而保障客户的业务系统正常运转。因此该客户的信息中心运维服务管理平台的具体要求如下:v 能够全面详细地监视系统中所有IT资源的运行情况,提供一致的系统管理风格v 能够实时监视网络和业务的性能状况,能够通过客观数据分析当前系统性能状况和长期系统性能变化规律和趋势,为系统升级和扩容提供科学的依据。v 具有全面而深入的数据库管理功能,保证数据库系统的可靠和高性能运作,从而使数据库变成最优的后台支撑系统。v 提供运营商级IT系统中所需要的各种功能,及集成化的管理模式,可降低系统管理的成本v 实现业务可视化管理,分析深层次原因等问题1.3. 建设目标根据轨道集团数据中心信息化现有的建设和运维管理现状,此次OneCenter一体化智能运维管理平台的建设目标有:1.3.1. 建立统一运维门户通过建设统一的运维门户Portal,作为整个一体化智能运维管理平台的统一入口,具备统一认证、单点登录、自定义首页工作界面、分权分域管理等功能,统一建立用户账号,实现简单化用户管理。OneCenter一体化智能运维管理平台提供运维管理门户网站、移动APP、个人工作台、自助服务台等多种形式的服务窗口。v 向上对接上级轨道集团门户,实现从上级门户到运维门户的访问流程;v 向下对接集成展示动环监控、云平台监控、其他第三方系统等内容,并实现轨道集团信息系统的统一用户管理,实现统一认证登录;v 平台提供资源监控管理,运维服务流程管理等功能,在一个统一界面上形成快速呈现工作内容,提高工作效率。1.3.2. 建立IT异构资源的全面集中化管理随着IT信息化规模的发展和信息化建设水平的提高,轨道集团信息化建设已达到相当规模,设备种类多且规模大(网络设备、服务器、存储等);涵盖不同厂家,各种型号的IT设备,涉及传统的物理设备和云计算平台。通过OneCenter一体化智能运维管理平台,以统一监控管理为中心,实现对数据中心信息化IT基础设施的集中监控管理,提供数据中心基础软硬件资源及各类应用的监控管理,包括对网络设备、安全设备、服务器、存储、数据库、中间件、业务应用系统、虚拟化资源、网络服务等性能采集和事件处理,同时支持与第三方系统(如动环系统、安防系统、应急指挥系统等)对接,构建统一集成的系统资源监控平台,主动、及时地发现问题,解决被动服务的局面,提供集中的监控告警管理及监控性能数据展示。此外,通过OneCenter一体化智能运维管理平台的自动化运维功能,管理平台能够在故障发生时自动获取故障设备相关的各项指标数据及指标状态,确保相应告警和事件发生时的状态能够详细记录并关联,在必要时能够实现自动恢复、自动化巡检、批量操作作业等运维自动化场景。1.3.3. 建立全面准确的资产配置管理做好数据中心的IT运维管理,首先必须对种类繁多、规模庞大的IT资源进行有效管理,以免信息的更新不及时,造成信息难以统计、查询、分析和利用。理清IT资产配置台账,梳理配置项之间的关联关系,做好资产生命周期管理,这是实现数据中心一体化运维管理的基础。通过统一的配置管理库(CMDB),实现对云数据中心所有IT资源的配置信息管理,保证配置项的完整性和精准性,构建运维管理元数据,帮助用户建立统一的IT基础设施台帐。通过一系列配置建模、自动采集、调和、变更控制等手段,保证IT生产环境中配置项的完整性和精准性,为资源监控和服务流程提供数据支撑。1.3.4. 建立符合最佳实践的服务流程管理OneCenter一体化智能运维管理平台的流程管理提供了面向于最终用户的服务目录及服务级别管理,并提供规范的ITIL服务支撑流程及资产管理流程。通过流程管理系统进行IT运维服务的流程化、规范化管理;通过与底层统一监控系统的集成,实现了IT运维的自动化;通过完善知识库建设,实现知识库共享;从而提高信息服务效率,提高用户的满意度,帮助用户有效管理人员、信息、资产和知识库,为IT服务管理的规范化建立基础。1.3.5. 建立IT资源全面直观的可视化管理通过OneCenter一体化智能运维管理平台,用户可以实时查看管理对象的日常运行情况,操作简单,界面直观明了。在信息集成的基础上,通过提供的各种运行分析和性能报告,形成全网统一管理数据视图,提供关键绩效指标体系所需数据基础,管理人员能根据这些数据准确评估整个IT环境运行情况,及时发现故障隐患和评估威胁。平台预留了符合国家信息技术服务标准(ITSS)的多种对外标准接口,能够实现和第三方系统的功能或数据集成对接,包括短信系统、邮件系统等,有效整合信息展示。通过3D可视化管理功能,能够以3D技术实现对数据中心的真实展现,实现基于三维环境对数据中心、机柜和各类设备的管理功能,构建数据中心环境、设备和管理信息的可视化平台,实现所有资产对象的管理及相关监控信息整合展示,让相关管理人员清晰直观的掌握IT运营中的有效信息,实现透明化与可视化的管理。. z.-第2章. 解决方案勤智运维通过多年来在电信、金融、政府等行业的应用开发与维护经验,在国内首创基于ITIL的企业级业务服务管理平台。针对企、事业单位的IT支持和管理部门,OneCenter一体化智能运维管理平台基于ITIL的IT服务管理思想,整合了系统监控、应用监控、网络监控、机房监控、虚拟化资源管理、工作流、ITIL式报表和门户等多种技术手段,帮助用户解决IT支持与管理过程中的难题,提高IT服务水平和工作效率。OneCenter一体化智能运维解决方案是在基础架构管理、应用管理、业务服务管理的基础上,通过IT流程管理,帮助客户建立以ITIL流程为框架的一体化智能运维管理系统,实现自动化和规范化管理。2.1. 系统设计原则本次一体化智能运维管理平台项目建设与实施方案遵循如下设计原则:2.1.1. 实用性和模块化原则一体化智能运维管理平台应满足实用性和模块化原则,其提供的功能将保证满足轨道集团数据中心管理的实际需求,具备良好的实用性,从根本上减轻系统管理人员的工作负担,提高工作效率。同时采用灵活的模块化设计,可以方便系统管理人员对平台进行管理,实现灵活的管理权限分配,具备良好的系统访问权限控制策略。2.1.2. 一致性和开放性原则一体化智能运维管理平台应满足一致性和开放性原则,支持目前业界开放标准协议,如CORBA、J2EE、DCOM等,支持标准网络传输、加密和网管协议,如TCP/IP、SNMP(V1,V2,V3)、RMON(1、2)、RPC、CMIP/CMIS等。采用开放式API接口和高度模块化设计,方便用户进行二次开发以及与轨道集团数据中心其他系统进行无缝集成,从而实现管理资源整合,构建完善的一体化智能运维服务管理平台。2.1.3. 安全性与可靠性原则一体化智能运维管理平台应满足安全性与可靠性原则,保证系统的运行速度和数据可靠性,对现有的各类应用业务的正常运行不产生影响。一体化智能运维管理平台安全体系架构主要包括以下内容:v 用户登陆过程中通过用户名、密码进行身份认证,可配置只允许固定IP地址访问;v 对于用户所作的任何配置信息应能够采用加密方法进行本地存储;v 采用加密的登录过程(即SSH),保障远程登录的安全性;v 能通过在主机安装防火墙和防病毒软件的方式来保证一体化智能运维管理平台的安全;v 系统具备分权分域功能。2.2. 系统安全设计2.2.1. 用户安全机制OneCenter一体化智能运维管理平台的自身安全性是保证用户管理工作正常进行的基本因素,因此在进行产品架构设计时,充分考虑了管理系统的安全性,具体措施包括:v 系统支持https方式访问;v 用户登录失败次数限制;v 采用严格的权限控制机制,细划了每个用户的权限和管理范围;v 对用户的操作做详细的日志记录,满足安全审计要求;v 系统应经过权威的安全漏洞扫描测试,并提供测试证明;v 系统中所有涉及到的被管设备的连接信息采用密文存储。2.2.2. SSO统一认证OneCenter一体化智能运维管理平台采用SSO(Single Sign On)单点登录方式,即对所有用户实现统一界面登录,支持与ActiveDirectory,LDAP的用户同步。2.2.3. 权限分权分域OneCenter一体化智能运维管理平台可根据组织架构设置多用户管理权限;按照账户角色,实现资源分类、分级管理,可以实现多人同时操作,互不影响,并具有良好的审核和避免冲突的机制。一体化智能运维管理平台不仅可划分到具体的设备类型管理域,也可以划分到具体*台设备,实现了完整的分权、分域管理目标。2.3. 系统建设方法2.3.1. 体系架构一体化智能运维管理平台分为三个层次,即数据采集层、数据分析和处理层、数据展示层。平台采用模块化设计,模块之间松耦合。新模块可以直接接入平台中,模块之间通过接口、消息队列等方式进行通信。数据采集层是整个管理平台的基础,负责采集平台运行需要的数据。数据采集层通过多种网络协议,包括SNMP、SSH、TELNET、PING、JDBC、JM*、SMI-S等,从被管设备里获取需要的指标信息,将采集的数据放到缓存进行解析和运算,然后存入数据库,供上层平台进行分析和展示。平台内置可扩展的资源能力库模型,对于不满足的厂家、型号和指标,系统无需二次开发即可通过系统配置实现,支持通过SNMP方式、JDBC方式、JM*方式等方式实现监控指标的自定义扩展。数据分析和处理层包括资源监控、服务流程管理、配置管理、资产管理、运维大数据分析等多个子系统,所有系统均为勤智运维自主研发,具有同一品牌软件著作权,拥有完全自主知识产权。各个子系统独立工作又数据联动,具备良好的兼容扩展性。v OneCenter一体化智能运维管理平台资源监控,通过业务管理、资源管理、拓扑管理、巡检管理、报表管理、告警管理等功能对IT资源环境进行全面的管理,提供了大量的统计和分析数据以及展示页面,满足用户日常工作的需要。 v OneCenter一体化智能运维管理平台具备与云平台、动力环境系统等其他平台集成的能力,提供多种数据集成方式,并可利用大数据平台构建运维指数评估分析模型,按照历史数据变化规律,挖掘业务、指标、故障等关联信息,帮助运维人员找到问题根源改进点。在平台中进行一体化的监控信息、告警信息的呈现,并进行业务关联分析、告警关联分析。v OneCenter一体化智能运维管理平台服务流程遵循ITIL/ITSS等IT服务管理标准,建立以客户为中心的运维模式,将人、技术与流程进行有效地融合。通过流程管理平台,制定内部运维流程,将运维团队的服务产品化、标准化。OneCenter一体化智能运维管理平台提供服务过程的设计、过程记录、监督与考核等事务的管理能力,及对IT的各项服务、能力进行整合的职能。v OneCenter一体化智能运维管理平台通过数据中心3D可视化展示,从三维可视化的角度呈现机房及设备信息,提供美观形象的可视化展示平台,包括机房环境可视化、资产可视化、监控可视化、配线可视化、容量可视化、演示可视化,帮助运维管理人员准确掌握IT运行态势与运维服务水平。最上层是B/S架构的展示层,是整个服务管理平台的统一门户,通过统一的用户认证、单点登录,用户可以按不通角色权限通过浏览器轻松访问监控运维系统,查看各个系统、功能模块以及统计数据。同时系统还提供大屏展示的汇总数据和页面,可以满足多元化的监控管理需求。统一门户通过数据及页面集成、页面自定义可以统一呈现网络设备、服务器、操作系统、数据库、中间件、视频摄像头、业务服务、日志、标准服务、集群的状态和信息,统一展现网络拓扑、业务管理、地图拓扑、流量分析、大数据分析结果、配置管理、巡检管理、工单管理、值班管理、巡检管理、知识库管理、我的工作、我的报表、3D机房、2D机房等。第三方系统所使用的菜单名称、菜单图标、呈现位置等可以在页面直接设置。统一门户提供灵活的配置。监控对象的范围、支持的指标、业务流程、表单、报表、视图、首页呈现的内容、首页呈现的设备/告警/统计信息等都可以进行配置,以适应用户现场的不同需求。配置方式通过浏览器页面直接进行可视化配置,系统采用纯JS方式进行配置页面的开发,用户可以简单方便的进行配置,不需要进行软件修改和开发。资源能力库模型可以直接通过页面配置等方式进行扩展,对于不满足的厂家、型号和指标,系统无需二次开发即可实现。对应网络设备、服务器、操作系统、数据库、中间件、应用等都可以通过配置的方式支持。通过自定义OID的配置方式、自定义脚本、自定义SQL语句、自定义URL地址、自定义JM*内容等方式支持指标的扩展。系统还提供第三方标准数据接口,提供开放的API接口,支持二次开发,可随需扩展开发所需功能,可以接收包括云计算平台在内的第三方系统的数据或者发送数据给第三方系统,进行一体化整合,实现IT资源的集中统一管理。同时也可以结合短信平台、邮件系统、桌面客户端等,进行故障、工单等信息的消息通知发送。系统提供数据整合、接口整合、页面整合等方式,可以集成第三方系统的告警、监控、流程、资产、动环、3D等数据,也可以集成页面,并可以通过接口调用完成告警集成、工单自动生成、3D机房集成、动环数据集成、云平台监控数据集成、云平台配置等操作集成等,有效复用已有系统,不用重复投资。提供与华为云平台、阿里云平台接口集成的方式,统一汇总云平台监控数据、告警数据,在OneCenter一体化智能运维管理平台中进行一体化的监控信息、告警信息的呈现,并进行业务关联分析、告警关联分析。系统提供多种提醒及通知方式,包括:短信、邮件、电话、告警客户端、RT*等方式。告警客户端用户本地安装即可使用,当有新告警、新工单产生时,自动弹出提示,并可以在客户端中查看告警情况、工单情况,并可以直接进行关联处理,不同告警级别提供不同的声音提示。图 2.31平台体系架构2.3.2. 功能架构OneCenter一体化智能运维管理平台采用多层架构及模块化的设计模式,包括运维监控管理、运维流程管理、资产管理、运维自动化管理、运维大数据分析等多个子系统,所有系统均为勤智运维自主研发,具有同一品牌软件著作权,拥有完全自主知识产权。各个子系统独立工作又数据联动,可根据不同客户需求自由组合。同时OneCenter系统具备良好的扩展性,可以通过第三方数据接口、数据总线、大数据接入分析系统等方式接入第三方平台数据,并提供对数据的深入挖掘和对运维能力的整体评估。图 2.32平台功能架构2.3.3. 技术架构OneCenter一体化智能运维管理平台采用J2EE架构,全图形化B/S模式,可移植性强,可基于不同操作系统(Windows、Red Hat Linu*、国产麒麟等)实现了跨平台部署。统一开放的监控管理平台支持多种数据库(MySql、Oracle、国产神州通用等),支持国产的中间件如TongWeb,支持OpenJDK,提供符合国家信息技术服务标准(ITSS)的第三方系统集成接口。图2.33技术架构2.3.4. 部署架构OneCenter一体化智能运维管理平台分为Portal服务层、DHS(信息处理)服务层、DCS(信息采集)服务层,每层可根据客户IT环境的实际情况部署在相同或不同的主机上;可以根据客户的管理对象规模,采用单个或多个DCS进行管理容量规划,通过集中式或分布式部署,实现对企业内/外网、总部/分支等复杂结构的IT资源灵活管理。图 2.34部署架构. z.-第3章. 功能概述3.1. 运维监控系统3.1.1. 统一运维管理统一运维门户作为OneCenter一体化智能运维管理平台的统一入口,具备统一认证,单点登录,自定义首页工作界面等功能。统一运维门户包括资源监控管理,运维服务流程管理,资产配置管理等系统,快速呈现工作内容,提高工作效率;支持对云计算平台、动环监控等第三方系统的集成,实现对第三方系统的数据集中展示和告警统一推送。通过统一认证功能,用户能够在单一界面上对其他系统的用户账号进行管理,对不同角色权限进行修改和配置,并添加用户账号。图 3.11首页统一门户为了简化运维工作,聚焦工作核心事务,运维平台独创了极简模式运维,将复杂的操作与配置等功能隐藏在极简的设计中。系统根据管理者和运维工程师的日常工作内容提供两套完全不同的视图模式和操作体验及重点工作的便捷入口,让管理者和运维工程师更聚焦于核心业务。v 工程师工作内容聚焦于发现问题、分析问题和解决问题的过程。极简模式工程师视角是聚焦资源故障解决的最佳实践,提供告警列表展现;支持基于资源的一键式全局检索,可根据资源名称、IP地址进行各个功能模块的详细信息检索,覆盖业务管理、拓扑管理、资源管理、配置文件管理、巡检管理、报表管理、告警管理、知识管理等功能;支持内置智能分析引擎,基于知识库对告警进行故障分析,并提供解决方案建议。v 管理者工作内容聚焦于核心资源的管理和业务的把控,从人员、资源、技术等方面宏观调配,保障业务的可靠运行。极简模式管理者视角聚焦核心资源的管理和业务把控能力的分析视图;支持业务可用率的统计汇总数据呈现;支持关注的业务视图展现功能。图 3.12工程师视角图 3.13管理者视角OneCenter一体化智能运维管理平台提供对IT基础设施监控信息的展示;提供第三方接口集成,实现一体化的运维信息展示,将所有关注的信息都在同一个平台进行展示和操作。图 3.14一体化展示OneCenter一体化智能运维管理平台提供运维移动APP,支持Andriod、IOS操作系统,支持通知公告发布、告警通知、工单提交与处理、配置数据查询、知识库查询及移动巡检,使IT运维人员不再受到地域限制,可以在任何地方通过移动或无线网络连接到平台进行运维工作,不会因为突发事件找不到人员处理或维护人员无法赶往现场而延误处理时间。运维移动APP具备以下功能:v 提供用户随时随地处理工单功能,包括服务台故障申报、服务查询、我的待办工作等;v 提供用户及时接收和处理告警功能,包括故障告警查询,手动派单操作等;v 提供移动式日常巡检功能,包括巡检报告填写、巡检报告查询,值班计划查询、我的工作日历等;v 提供掌中知识宝典功能,包括最热知识、最新知识、最有价值知识的查询;v 提供作业浏览和执行功能,可以查看作业执行情况、手动执行任务等。图 3.15移动运维3.1.2. 资源监控管理OneCenter一体化智能运维管理平台支持对网络设备、服务器操作系统、数据库、中间件、存储等IT基础设施及虚拟化等资源的监控管理。监控管理扩展能力强,方便进行功能扩展和规模扩展;监控管理易用性强,方便管理人员进行日常运维工作,有效减轻运维压力。监控管理兼顾不同运维管理角色的运维管理需求,提供对IT环境的性能监控及分析、故障监控、故障分析及定位、网络配置文件、巡检管理。OneCenter一体化智能运维管理平台采用了模块化设计,全中文Web界面,易用性强,便于日常运维;通过灵活的阈值设置衡量网络使用情况,反映资源健康度。通过OneCenter一体化智能运维管理平台的告警管理模块与ITSM运维流程管理模块的接口,在指定事件发生后转发到运维流程管理模块,自动发起事件处理工单,及时解决告警故障。图 3.16资源管理OneCenter一体化智能运维管理平台能够反映用户网络系统中的各种设备的资源配备和重要参数的设置情况,自动搜索网络系统中的所有设备的相关配置信息,识别出设备的类型、型号、生产厂家、接口等硬件配置信息;同时引入ITIL最佳实践的配置管理库(CMDB),方便用户了解网络系统中各种关键资源的配置和使用情况。3.1.2.1. 网络管理OneCenter一体化智能运维管理平台支持自动发现和手动添加两种方式监控网络设备,可支持所有满足SNMP V1/V2/V3方式的厂家路由器、交换机、安全设备、负载均衡等设备的性能指标采集和预警,系统内置了丰富的主流厂家型号及其对应指标模板,例如CPU利用率、内存利用率、Ping延时和丢包、端口状态、端口出入流量、入错误帧速、出错误帧速、广播入帧速、广播出帧速等指标。图 3.17网络设备监控OneCenter一体化智能运维管理平台内置了可扩展的资源能力库模型,对于不满足的厂家、型号和指标,系统无需二次开发即可通过系统配置实现。图 3.18指标自定义3.1.2.2. 服务器管理OneCenter一体化智能运维管理平台通过对操作系统的监控获取主机设备运行状态和性能数据,从而实现服务器管理。管理平台支持对Windows、HP-Uni*、Solaris、Linu*、AI*等主流操作系统的监控。Windows操作系统通过SNMP和WMI方式获取主机设备的运行状态和性能数据,非Windows操作系统通过TELNET和SSH方式来获取数据。OneCenter一体化智能运维管理平台能够监控主机CPU利用率、DISK磁盘容量、系统内存(物理使用内存及缓存)使用情况、磁盘利用率、文件系统、关键进程、软硬件资源信息等性能数据;针对服务器相关的性能指标,按照实际情况可以设定不同级别的性能阈值;对于超过性能阈值的性能指标,系统能够进行故障告警或预警,并通知相应的网络运维人员。OneCenter一体化智能运维管理平台采用图表等方式展示主机的CPU利用率、CPU使用情况、内存利用率、磁盘信息、进程等相关信息,实时监控当前主机性能;并可根据性能指标进行深入的系统分析。OneCenter一体化智能运维管理平台进程分析能够实时监视系统进程的运行状况,显示进程所占用系统资源的情况;主机进程组通过关联相关的应用进程,反映应用程序的使用情况。在客户的IT管理中心网内有很多应用,如邮件服务、DNS服务、IIS服务等,它们会启用多个进程,为了监视这些服务的状态,将相关的进程作为一个进程组进行监控,一旦一个或者多个进程出现异常,系统就会对该进程所涉及的应用服务发出警告。OneCenter一体化智能运维管理平台提供了开放式的KPI接口和资源模型,以供用户便捷的添加特殊KPI;监控指标可通过页面配置或脚本修改进行快速扩展,提高了针对用户的特殊监测指标的响应速度。图 3.19服务器资源3.1.2.3. 数据库管理3.1.2.3.1. 关系型数据库数据库是客户信息系统中的核心应用,OneCenter一体化智能运维管理平台提供数据库监控功能,保障数据库的安全,优化数据库的性能。OneCenter一体化智能运维管理平台能够对运行在主机设备上各种数据库的运行状态和性能数据进行统一有效的监控管理,包括SQLServer、Oracle、Oracle RAC、Sybase、Informi*、DB2、MySQL、PostgreSQL、神通数据库、达梦、Cache等主流的数据库。可以使用预置账户对关系型数据库进行发现;支持在已有的发现信息的基础上对资源进行重新发现,并展示发现结果的内容,可以自行选择需要监控的子资源。图 3.110 Oracle数据库监控3.1.2.3.2. 非关系型数据库管理OneCenter一体化智能运维管理平台能够对类非关系型数据库进行监测,包括MongoDB等。系统通过SSH/Telnet/JM*等方式进行监控。可以使用预置账户对非关系型数据库进行发现;支持在已有的发现信息的基础上对资源进行重新发现,并展示发现结果的内容,可以自行选择需要监控的子资源。图 3.111MongoDB监控3.1.2.4. 中间件管理3.1.2.4.1. Web服务中间件OneCenter一体化智能运维管理平台能够对市场上各类主流Web服务中间件进行信息监测,包括:Apache、Tomcat、Ngin*、Weblogic、WebSphere AS、WebSphere Portal Server、Oracle AS、Sun JES AS、JBoss AS、Resin、TongWeb等。支持SSH、Telnet、WMI、HTTP、JM*、SDK等多种中间件监控方式;支持对中间件的各种性能指标的监控,包括中间件CPU利用率、内存利用率、请求数、响应时间、动态高速缓存、JCA连接池、JVM、JDBC连接池、EJB容器、Servlet容器等相关组件的性能监控;用户可自定义阈值,还可根据自己的需求定制监控指标,一旦出现故障立即报警;支持资源信息手工刷新,即时进行资源指标的信息采集,获取所有指标的最新采集数据;支持资源变更信息自动刷新。当数据文件等组件增删时,系统可以自动发现该变更内容并刷新设备的信息。图 3.112 Weglogic监控图 3.113 Apache监控3.1.2.4.2. 缓存中间件OneCenter一体化智能运维管理平台能够对各类缓存中间件进行监测,包括Redis等。支持对资源信息进行手工刷新,即时进行资源指标的信息采集,获取所有指标的最新采集数据。图 3.114Redis监控3.1.2.4.3. 消息与交易中间件OneCenter一体化智能运维管理平台可监测各类消息与交易中间件,包括: Tu*edo、TongLink/Q、Webspere MQ、Oracle AS、CICS 7、TongLINK/Q、SharePoint、ICE、Tu*edo。用户可自定义阈值,还可根据自己的需求定制监控指标,一旦出现故障立即报警。图 3.115 Webspere MQ监控3.1.2.5. 公共应用管理OneCenter一体化智能运维管理平台支持对IIS、SMTP、DNS、FTP、Domino、Ping、URL、Port、POP3、端到端Remote Ping、Directory Server等公共应用的管理。支持在已有的发现信息的基础上对资源进行重新发现,并展示发现结果的内容,可以自行选择需要监控的子资源。图 3.116公共应用管理HTTP/HTTPS/URL监测: 对HTTP /HTTPS服务的运行状况进行监测,包括端口和服务是否正常,计算主页存活率,并且可以对HTTP/HTTPS返回的结果进行分析,判断服务器的工作是否正常。SMTP服务、POP3服务监测:对邮件发送服务器的工作状态进行监测,包括邮件数量和邮箱使用量。FTP服务监测: 对FTP服务器的工作状态进行监测。在判断条件中可以选择是否允许匿名登录、验证登录、验证文件是否存在等。DNS服务监测:对DNS服务的运行、延时及正确性进行监测。Ping监测:通过Ping命令来监测设备是否正常运行。IIS监测:响应时间、版本、CPU利用率、内存利用率、IIS可用状态、IIS CPU利用率、内存总容量、主机名、IIS 内存利用率、每秒接收字节数、每秒传送的字节总数、每秒发送字节数、当前连接数、当前匿名用户数、GET请求速率、最大连接数、未找到错误的请求总数、当前非匿名用户数、最大匿名用户数、最大非匿名用户数、总匿名用户数、总非匿名用户数、每秒文件数、每秒接收文件数、文件发送速率、总接收字节数、总每秒字节数、总接收文件数、总发送文件数、总传送文件数、总GET请求数、总POST请求数、操作系统;Web应用:Web站点名称、正常运行时间、IIS总GET请求数、IIS总POST请求数、IIS总接收文件数、IIS总发送文件数、IIS最大匿名用户数、IIS最大非匿名用户数。Domino监测:响应时间、CPU利用率、内存利用率、连续运行时间、主机名称、服务器可用性、服务器端口状态、SERVER状态、AMGR状态、HTTP状态、Lotus Domino CPU利用率、Lotus Domino 内存利用率、SESSION数、丢弃的会话数、HTTP CPU利用率、HTTP 内存利用率、HTTP响应时间、服务器名、服务器标题、数据目录名称、数据库数量、数据目录数量、内存总容量、版本、操作系统、活动Task数、服务端口;数据目录:数据目录ID、数据目录全路径、目录中文件数、数据子目录名称、目录大小、目录中子目录数;数据库:数据库ID、数据库标题、所在数据目录全路径、数据库名称、数据库文档量;任务:Task ID、TASK启用状态、TASK名称、活动状态。E*change监测:响应时间、版本、CPU利用率、内存利用率、连续运行时间、连接总数、发信队列大小、输出队列长度、用户总数、RPC平均响应时间、拒绝的外部连接数、收信队列大小、当前用户数、服务可用性、POP3 CPU利用率、SMTP每秒接收的消息数、当前的外部连接数、每秒发送的消息字节数、信息存储服务可用性、MS E*change CPU利用率、物理磁盘当前列队长度、SMTP每秒接收的字节数、内存总容量、操作系统、SMTP每秒发送的字节数、每秒日志写入、主机名、当前活动用户连接数、等待传送的邮件数、数据库缓存大小、每秒打开消息数、SMTP CPU利用率、每秒打开文件夹数、每秒接收的消息字节数、当前活动连接数、SMTP每秒发送的消息数、MS E*change内存利用率、每秒日志延迟、每秒总的字节数、每秒总的消息字节数、SMTP队列长度、错误连接总数、实例名称。Directory Server监测:可用性。Connector:当前连接数、当前队列数、当前读操作等待数、当前写操作等待数等。数据库:支持对数据库实例名称、数据库链接数进行监控等。3.1.2.6. 存储管理管理员需要掌握各个设备的存储极限,保持对存储容量的警觉,保证存储可用性、可靠性和灵活性,以便快速准备和资源移动,并在需要的地方满足严格的计算需求。OneCenter一体化智能运维管理平台提供对主流厂商存储设备的监控,包括:IBM DS磁盘阵列、IBM NetAPP磁盘阵列、EMC VN*/UN*/C*/NS磁盘阵列、EMC ISILON磁盘阵列、HP MSA磁盘阵列、HP 3PAR磁盘阵列、日立HDS磁盘阵列、华为OceanStor磁盘阵列、华为DDN磁盘阵列、浪潮AS磁盘阵列、Synology(群晖) NAS、富士通磁盘阵列、海康威视DS磁盘阵列等存储设备。OneCenter一体化智能运维管理平台可同时对多个存储设备的自动监控,支持SMI-S、SNMP、SSH等监控方式。动态发现设备存储资源配置、存储卷配置以及存储卷的映射。用户自定义设置性能阈值,方便进行资源故障预警;支持在已有发现信息的基础上对资源进行重新发现,并展示发现结果的内容,可以自行选择需要监控的子资源。图 3.117存储监控图 3.118存储监控3.1.2.7. 硬件管理OneCenter一体化智能运维管理平台支持多协议方式(如SNMP、IPMI、Telnet、SSH等)对主流服务器进行监控,支持HMC方式对IBM小机进行监控。可以使用预置账户对服务器硬件进行发现,也可以在已有的发现信息的基础上对资源进行重新发现,并展示发现结果的内容,并且可以自行选择需要监控的子资源。OneCenter一体化智能运维管理平台支持主流服务器的各类组件基本信息的采集,采集内容包括:操作系统名称、BIOS版本、主板零件号、主板序列号、服务端口、产品型号、主机名、服务标识、主板产品名称等;支持主流服务器的各类组件状态的监控,监控指标包括:硬件可用性状态、电源过载状态、内存过热状态、BOMB电池状态、电源管理错误状态、PCIE严重错误状态、CMOS电池状态、风扇制冷错误状态、驱动器错误状态、主电源错误状态、机箱温度状态、内存校验错误状态、处理器状态等;支持主流服务器配置、性能情况的监控,监控指标包括:处理器的个数,风扇个数、风扇转速,电源个数、机箱温度、风扇转速。OneCenter一体化智能运维管理平台支持主流网络设备(如Cisco、华为、H3C、锐捷、Dptech、Nortel、迈普)、安全设备(如思科防火墙、华为防火墙、H3C防火墙、天融信防火墙、深信服防火墙、山石防火墙、联想防火墙、网御神州防火墙)等硬件监控,监控指标包括机箱温度,风扇,处理器,电源的硬件状态监控并对发生故障的硬件产生告警。3.1.2.8. 无线管理OneCenter一体化智能运维管理平台支持对各类无线设备的监控。通过对无线AC的管理,实现对AP设备的在线状态进行实时监控,对出现异常的AP设备进行告警。3.1.2.9. 虚拟化管理3.1.2.9.1. 虚拟化监控类型及指标OneCenter一体化智能运维管理平台虚拟化管理支持对VCenter、*en、KVM、华为虚拟化平台Fusion Compute、阿里云平台的管理。管理功能包括虚拟化资源管理、基础架构拓扑图、虚拟化指标TOPN排名、虚拟化报表统计、虚拟化资源发现以及策略配置等;提供了对Cluster集群、Es*i主机、数据存储及虚拟主机等资源的CPU、内存、存储分配及耗用情况实时监控,对各组件的占用情况、可用性及性能参数进行统计分析和排名,并以拓扑图形式将各虚拟化资源的连接关系直观展现给用户,便于用户全方位对虚拟化资源进行的查询和管理。图 3.119虚拟化监控系统通过虚拟化平台提供的API接口,对宿主机监测信息包括CPU占用率(%)、内存利用率(%)、已分配磁盘、磁盘占用率(%)等。对虚拟机的监测信息包括每个虚拟机的CPU状态、CPU占用率(%)、以分配内存大小、内存利用率(%)、磁盘占用率(%)、磁盘剩余空间(MB)、磁盘读速率(KBPS)、磁盘写速率(KBPS)等。对虚拟化接口监测信息包括接口名称、接口IP、MAC地址、掩码、MTU、接口流出速率(KBPS)等指标参数。支持自动发现宿主机、虚拟机、虚拟存储等的变化,当新增虚拟机、删除虚拟机等情况时,新增的虚拟机自动加入监控,删除的虚拟机自动进行删除。3.1.2.9.2. 虚拟化报表OneCenter一体化智能运维管理平台提供资源报告,统计虚拟化平台各资源数量及其CPU、内存和存储占用情况;提供性能报告,统计分析虚拟化平台各资源性能指标;提供告警报告,统计虚拟化平台各资源监控的告警信息;虚拟化报表统计的指标可以根据用户需要自由选择。图 3.120虚拟化报表3.1.2.10. 视频诊断管理OneCenter一体化智能运维管理平台提供视频诊断管理功能。视频质量诊断分析功能采用目前国际最先进的计算机智能视觉技术,对摄像机设备出现的常见故障,比如设备不连通、画面偏色、信号缺失、清晰度异常、亮度异常等故障;以及与视频监控相关的视频设备、网络设备运行状态监控,视频信号传输的链路可用性和质量监控。以视频监控点为单位,提供完整的智能故障分析功能,可进行整网运行的状态展示和查询,并为运维管理系统提供详尽的故障信息。3.1.2.10.1. 视频诊断系统采用最新智能诊断分析算法,模拟人类视觉反应,通过视频图像特征建模,以及自适应学习,检测视频存在的故障。视频故障分为视频清晰度异常、视频信号缺失、亮度异常、视频条纹干扰、视频雪花干扰、视频偏色、PTZ失效、画面冻结、场景变换等九种类型。图 3.121视频质量故障图OneCenter一体化智能运维管理平台视频诊断可以检测24种视频质量故障;准确度实际项目应用高于96%。模糊异常DVR冻结异常树叶遮挡普通噪声异常过亮异常画面冻结异常黑白异常人为遮挡过暗异常异物遮挡异常对比度异常偏色异常粗黑白条纹异常抖动异常PTZ运动速度异常网络丢包异常彩色条纹异常信号缺失异常PTZ运动角度异常视频标注异常细黑白条纹异常场景变换异常PTZ镜头缩放异常场景剧变异常表 3.11视频质量故障3.1.2.10.2. 设备诊断连通状态检测:智能检测设备因电路故障造成的设备主机断电以及网络故障造成的断线、视频阻塞、用户名/密码错误等原因造成的离线报警。磁盘状态检测:智检测前端编码设备中的硬盘状态信息,包括硬盘数量、硬盘容量、硬盘丢失报警。录像状态检测:智能检测前端编码设备的录像类型、设置时间段、保存时长是否符合要求,以及保存的录像文件是否完整,保存天数是否达标。综合检测检测:智能监测报警主机、门禁主机、网络设备等设备运行状态。系统可以监测16种设备异常信息:设备断线取流失败录像完整性信令延时监测设备断电外部报警录像时长监测视频流时延监测硬盘满报警声音异常监测录像规则监测I帧时延监测硬盘故障报警安全漏洞扫描网络监测登录失败表 3.12视频设备状态检测指标3.1.2.10.3. 状态巡检OneCenter一体化智能运维管理平台可以检测视频监控系统中摄像机、视频编码设备工作状态信息。视频图像巡检:系统可选择*一组织下的摄像机,使用巡检功能,实现摄像机的连通状态、信号缺失、画面偏色、清晰度故障、亮度故障、条纹干扰、雪花干扰、场景变换、画面冻结、云台控制失效、人为遮挡的故障检测,同时检测结果支持打印和导出E*cel文件。图 3.122视频图像巡检图编解码设备巡检:系统可选择*一组织下的编码设备,使用巡检功能,实现编码设备连接状态、硬盘占用、录像规则是否正确设置、录像文件是否正常保存、数据总流量的检测,同时检测结果支持打印和导出E*cel文件。编码设备单独巡检:实时检测显示编码设备每一个通道的编号、名称、报警状态、录像状态、录像文件完整性、设备的连接状态、硬盘总容量、硬盘剩余容量。图 3.123设备巡检图3.1.3. 拓扑管理拓扑管理通过自动发现物理设备和连接,生成局域网物理拓扑图;同时可以有效识别二级和三级拓扑,可直观清晰地显示所有网络设备、以及骨干网与子网之间互联关系。层次化的网络拓扑显示网络逻辑结构、同时关联设备性能和告警信息,便于故障隔离和快速定位。拓扑管理中提供了直观的2D机房拓扑管理、自动化的地图拓扑管理、真实面板管理等功能,还集成了Telnet,SSH,Web管理、TraceRoute、Ping等远程运维工具,便于运维工程师远程控制IT资源。3.1.3.1. 拓扑发现OneCenter一体化智能运维管理平台具有自动发现网络拓扑的功能,采用先进的网络拓扑发现算法和数据采集协议实现网络拓扑自动发现。自动发现网络拓扑是系统依据网络的路由信息,自动查找整个网络的路由器、网络交换机、服务器等支持SNMP协议的设备,并根据这些设备信息生成以图形化的网络拓扑结构。平台提供多种拓扑视图发现方式,网络管理员可以用设备的IP地址,对设备进行多种视图的拓扑发现。系统能够基于路由层的连接生成三层逻辑网络拓扑图,基于网段的连接生产二层物理网络拓扑图;网络拓扑结构的显示可以按照用户的爱好自行拖拽编排,从而以最直观的方式展示真实的网络结构。图 3.124拓扑发现发现算法支持常规设备算法和Cisco CDP算法,搜索方式采用路由搜索和ARP搜索;网络设备支持全网发现、扩展发现,多网段发现等自动发现模式;并可以自动的绘制出网络拓扑结构图。另外,对于单一设备可以单独添加发现;添加完成后,设备可以自动的建立连线。支持多核心的全网发现方式;设备探测方式:采用ICMP、SNMP GET对设备进行探测,SNMP支持V1、V2、V3;二层拓扑:对物理层网络拓扑进行发现,可以发现路由、交换、防火墙和主机系统之间的物理连接关系;三层拓扑:进行IP层的子网发现,展现路由、三层及以上交换设备之间子网的逻辑关系;子网拓扑发现:通过输入子网信息,只对*个子网内的拓扑进行发现;网段发现:用户可以输入多个IP范围,对这些范围的设备进行拓扑发现;扩展发现:可以在全网发现的基础上,进行扩展发现,一旦网络扩容则可以保持原有拓扑不变的情况下,对网络拓扑进行修改和补充;手工添加:可以在拓扑手工填写信息添加少量网络设备;通过发现配置向导,对发现参数进行配置,包括发现算法、发现设备类型、发现子网网段、搜索深度、探测方法和拓扑发现要使用的服务器(DCS);发现结果查询:可以在工具栏中查看最近一次的拓扑发现的历史结果。3.1.3.2. 拓扑绘制系统能够根据用户网络的实际情况,灵活地定制网络拓扑视图。用户可以从地域或业务的角度来定制和管理网络拓扑视图,从不同的关注点对网络拓扑的整体情况进行管理,方便网络
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 管理文书 > 施工组织


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!