NAGIOS服务器监控解决方案.doc

上传人:wux****ua 文档编号:7850672 上传时间:2020-03-25 格式:DOC 页数:21 大小:2.91MB
返回 下载 相关 举报
NAGIOS服务器监控解决方案.doc_第1页
第1页 / 共21页
NAGIOS服务器监控解决方案.doc_第2页
第2页 / 共21页
NAGIOS服务器监控解决方案.doc_第3页
第3页 / 共21页
点击查看更多>>
资源描述
NAGIOS服务器监控解决方案 目 录第一章 背景介绍31.1 背景描述3第二章 系统需求32.1硬件需求32.2软件需求32.3网络要求4第三章 系统架构43.1 结体架构53.2 系统组成63.2.1 关于NAGIOS63.2.2 NAGIOS配置文件关系说明73.2.3 关于nrpe83.2.4 关于NSClient+9第四章 系统功能94.1 Monitoring菜单94.2 Reporting菜单104.3 Configuration菜单134.4 短信警报功能14第五章 系统布署155.1 添加WINDOWS主机到监控服务器系统165.2添加Linux主机到监控服务器系统18第六章 系统优点196.1 NAGIOS的特性206.2 NAGIOS的优点206.3 NAGIOS的缺点20第一章 背景介绍1.1 背景描述 随着业务的增长网络规模也不断扩大、服务器或设备也相应增多,采用更加高效、更自动化、更节省运维成本的管理手段来控制故障发现、故障跟踪、故障恢复显得越来越重要。一旦网络、服务器、视频监控设备以及各种应用出现问题,常常会给企事业造成很大的损失。因此,必须有一个开源的的服务器监控平台能够提供7x24小时检测网络、服务器、视频监控设备以及各种应用,及时将服务异常终止的有用信息收集起来,通过短信、Email、声音反馈给管理人员,管理人员就可以及时排除故障,避免造成重大损失。采用开源的操作系统以及软件能有效提高效率降低运维成本。Nagios是一款开放源代码的软件,利用它可以实现服务器的各种资源检测(CPU、内存、硬盘、网络等等),当服务器或者服务中断nagios可以将这一信息以短信、声音的形式通告管理员,有效缩短故障发现的时间,将损失减至最低。第二章 系统需求2.1硬件需求服务器类型普通1U、2U服务器CPU2.0G内存1GB硬盘40GB网络100M网卡2.2软件需求系统类型 LINUX/UNIX建议CentOS5.5APACHE或者nagioshttpd-2.3.或nginx-0.7.30GCCgcc-4.xPHPphp-5.2.14MYSQLmysql-5.1.32nagiosnagios-3.0.6NSClient+NSClient+-0.3.8nrpenrpe-2.82.3网络要求监控服务器与被监控的服务器网络可以互通,监控服务器端需要开放TCP:80端口用于WEB浏览;被监控的WINDOWS主机安装NSClient+,被监控的LINUX要安装nrpe并且开放TCP:5666,TCP:12489端口用于收集服务器的CPU、内存、硬盘的使用情况。监控服务器必须要通外网,否则不能发送警报邮件到139邮箱给管理人员第一时间了解情况。如果不安装NSClient+和nrpe程序到被监控的服务器只能实现简单的检测服务端口是否通畅,不能检测进程、网络、硬件的使用情况。第三章 系统架构整个平台是以LAMP(linux+apache+mysql+php)为基础平台,通过nagios以及nrpe插件,实现监控服务器的硬盘使用、内存使用、CPU使用以及各种服务。管理人员日常通过web浏览器远程登录服务器监控系统,检测各被监控服务器的运行状态、服务状态、进程信息、操作日志等信息。在出现异常时,通过WEB可以查看到具体的异常服务器、进程等信息,并根据这些信息来处理异常。3.1 结体架构 3.2 系统组成整个监控服务器系统的构成主要有nagios、nagios-plugins、nrpe、NSClient+,各模块有机地组合、提供了一个强大的监控管理服务器的平台。Nagios 提供了一个由CGI程序编写的WEB界面,所以apache或者nginx必须要先支持cgi模块才能正常登录管理平台。Nagios本身不自带插件,需要另外安装nagios-plugins插件,nagios-plugins插件位于/usr/local/nagios/libexec/目录下。Nagios 使用Nagios-plugins功能下达指令,被监控的服务器需要安装nrpe或者NSClient+用于收集服务器的硬件资源使用情况、服务运行情况。3.2.1 关于NAGIOSNagios是一款用于系统和网络监控的应用程序。它可以在你设定的条件下对主机和服务进行监控,在状态变差和变好的时候给出告警信息。Nagios最初被设计为在linux系统之上运行,然而它同样可以在类Unix的系统之上运行。Nagios更进一步的特征包括: 监控网络服务(SMTP、POP3、HTTP、NNTP、PING等); 监控主机资源(处理器负荷、磁盘利用率等); 简单地插件设计使得用户可以方便地扩展自己服务的检测方法; 并行服务检查机制; 具备定义网络分层结构的能力,用parent主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态; 当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式); 具备定义事件句柄功能,它可以在主机或服务的事件发生时获取更多问题定位; 自动的日志回滚; 可以支持并实现对主机的冗余监控; 可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等; Nagios所需要的运行条件是机器必须可以运行Linux(或是Unix变种)并且有C语言编译器。你必须正确地配置TCP/IP协议栈以使大多数的服务检测可以通过网络得以进行。 你需要但并非必须正确地配置Nagios里的CGIs程序,而一旦你要使用CGI程序时,你必须要安装以下这些软件. 一个WEB服务(最好是Apache) Thomas Boutell制作的gd库版本应是1.6.3或更高(在CGIs程序模块statusmap和trends这两个模块里需要这个库)Nagios版权遵从于由自由软件基金会所发布的GNU版权协议第二版。有关GNU协议请查阅自由软件基金会网站。该版权协议允许你在某些条件下可以复制、分发并且或者是修改它。可以在Nagios软件发行包里阅读版权文件LICENSE或是在网站上阅读在线版权文件以获取更多信息。Nagios is provided AS IS with NO WARRANTY OF ANY KIND, INCLUDING THE WARRANTY OF DESIGN, MERCHANTABILITY, AND FITNESS FOR A PARTICULAR PURPOSE.Nagios官网http:/www.nagios.org3.2.2 NAGIOS配置文件关系说明 主配置文件选项n Nagios的主配置文件为/usr/local/nagios/etc/nagios.cfg 对象配置文件n 格式:cfg_file=样例:n cfg_file=/usr/local/nagios/etc/objects/contacts.cfgn cfg_file=/usr/local/nagios/etc/objects/commands.cfgn 如添加一个新的主机配置 server1.cfgn cfg_file=/usr/local/nagios/etc/server1.cfg nagios用户及组n nagios_user=nagiosn nagios_group=nagios 通知选项n Enable_notifications=1n 该选项决定了Nagios在初始化启动或重启动时是否要送出通知。如果这个选项不使能,Nagios将不会向任何主机或服务送出通知。注意,如果你打开了状态保持选项,Nagios在其启动和重启时将忽略此设置并用这个选项的最近的一个设置(已经保存在状态保持文件)的值来工作,除非你取消了use_retained_program_state选项。如果你想在使能状态保存选项(并且是use_retained_program_state使能)的情况下更改这个选项,你必须要通过合适的外部命令或是通过Web接口来修改它。选项的取值可以是:n 0 = 关闭通知n 1 = 打开通知(默认) 对象配置文件选项n cfg_file=/usr/local/nagios/etc/objects/contacts.cfg /联系人/组配置文件n cfg_file=/usr/local/nagios/etc/objects/localhost.cfg /本机配置文件n cfg_file=/usr/local/nagios/etc/objects/timeperiods.cfg /监视时段配置文件n cfg_file=/usr/local/nagios/etc/objects/commands.cfg /监视脚本配置n cfg_file=/usr/local/nagios/etc/objects/templates.cfg /监视服务,报警配置n cfg_file=/usr/local/nagios/etc/objects/switch.cfg /监视路由n cfg_file=/usr/local/nagios/etc/objects/windows.cfg /监视微软 验证配置文件的正确性n 每次修改过你的配置文件,你应该运行一次检测程序来验证配置的正确性。在运行你的Nagios程序之前这是很重要的,否则的话会导致Nagios服务因配置的错误而关闭。n /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg 启动 nagiosn /etc/rc.d/init.d/nagios start 重启动Nagiosn /etc/rc.d/init.d/nagios reload 停止Nagiosn /etc/rc.d/init.d/nagios stop3.2.3 关于nrpe Nrpe安装在被监控的linux服务器上,用于用于收集服务器的硬件资源使用情况、服务运行情况,程序需要开放tcp5666端口。监控linux服务器内部通信构架:说明:nagios通过check_nrpe插件获取linux服务器的硬盘、内存以及服务。3.2.4 关于NSClient+NSClient+,安装在Windows服务器上,负责收集windows服务器的硬件资源使用率,网络使用率等等,需要开放5666端口。说明:监控Windows服务器内部通信构架,nagios使用外置插件与nsclient+通信获取当前服务器的硬件资源、服务、网络的使用情况。Nsclient+服务需要开放5666端口。第四章 系统功能 Nagios的管理界面主要有三大功能:Monitoring、Reporting、Configuration。在此界面下展示了服务器当前的各服务器状态,很直观地显示了服务器是否存活、进程服务是否异常退出、内存、CPU、硬盘、网络等的使用情况。还提供了日志查询,可以查询某服务器或者某服务以及所属组近期的故障周期。详细的日志记录,记录每一个监视的对像的详细运行情况。4.1 Monitoring菜单Tactical Overview 简单显示了当前实监控的主机名称、主机的状态(正常异常),以及日期、异常情况说明。Service Detail 详细列出被监控的HOST和Server还有状态、状态信息,绿色”OK” 表示服务存活,红色CRITICAL表示异常。如图:Host Detail 简单地显示当前被监视中的服务器和它的状态如图:HostgroupOverview将监视的对像分成二个组Linux Server和Windows Server Status Map 3D展示了nagios与被监视的主机之间的联系,如图:4.2 Reporting菜单提供了一个监视报告查询功能,可以方便查询主机、服务的运行情况。查询功能非常强大也很详细,如果服务器或者设备很多的情况下,或者想查询某时间段内出现问题的主机的情况下,可以方便查询到想要的内容,强大的查询功能是必不可少的。Trends 可以查询某主机或者某服务的运行情况,以下是查询、创建一个Host运行的情况: Alert Histogram查询、创建localhost主机的SSH服务,近一年的运行的情况:4.3 Configuration菜单 提供了一个检查nagios当前配置的操作界面。可以检查主机配置、Server配置、主机组配置、Server组配置等等。4.4 短信警报功能警报功能是nagios的一大特色,警报的类型可以是声音、MSN、电子邮箱以及短信。当服务或者主机以及一切受监控中的其它资源如果存在异常,监控服务器系统会发送电子邮件到指定的管理手机中。发警报邮件的功能可以购买短信网关或者使用139邮箱实现手机短信接收。当服务存在异常,139邮箱会收到监控服务器发送的一件警报信息,手机和邮箱各收到一份。警报的内容包括:服务器的IP、状态、IP地址、以及其它信息,如图: 第五章 系统布署 监控服务器系统基于LAMP(Linux+Apache+Mysql+PHP)环境,确认基础承载环境就绪之后开始将被监控的对像加到监控服务器系统上。配置基础承载环境时要注意将CGI模块的支持问题。 5.1 添加WINDOWS主机到监控服务器系统a) 安装NSClient+被监控的服务器上,nsclient+.exe -installNsclient+的配置文件在安装目录下的nsc.ini,如图:b) 监控服务器端增加一个配置文件,监控新加的服务器。编辑/usr/local/nagios/etc/nagios.cfg增加一行:cfg_file=/usr/local/nagios/etc/objects/new-host.cfg编辑/usr/local/nagios/etc/objects/new-host.cfg定义主机名称、IP、定义接受监控的服务、端口、硬件资源等等。定义监控的服务器:定义监控主机的内存使用率: 定义监控主机的CPU使用率: 定义监控TCP554端口: 定义监控某一个进程: 5.2添加Linux主机到监控服务器系统a) 被监控的Linux主机安装npre并设置开机自动启动,在/etc/rc.local增加一行:nrpe -c /usr/local/nagios/etc/nrpe.cfg -d& nrpc的配置文件如图: 注意:allowed_hosts=需要填入监控服务器的对应IPb) 监控服务器上增加一行,定义被监控的服务器名称、IP、服务对像、硬件资源等 定义监控SSH服务 定义监控nginx服务 定义监控80端口 定义监控网卡流量 第六章 系统优点 一些研究已经显示了open-source软件与别的可比商业软件具有可靠性上的极大优势。采用Open-Source可以有效降低风险、提高质量、增加透明度、支持剪裁等。采用开源的nagios作为监控服务器平台,同时支持强大的系统脚本功能(SHELL、python、perl等),可以自行编写系统脚本让nagios触发系统去做指定的工作,以满足实际运行的不同需求,达到智能化监控管理。6.1 NAGIOS的特性 可以方便监控大多数网服务(HTTP、POP3、SMTP、PING、MYSQL、进程等等) 监控主机资源(磁盘空间利用率、内存使用率、CPU负载等) 简洁的插件设计接口,使得用户可以轻松开发所需的检测脚本 并行服务模式 轻松描述网络结构,并且能够辨别“宕机”和“主机不可达” 通过邮件或者用户自定义的方式将主机或者服务工作状态变化情况通知给管理员 自动日志滚动 支持以冗余方式进行主机监控 可以通过WEB方式直观查看当前网络状态、通知和问题历史、日志文件等,此组件为可选 支持手机短信通知功能,同时声音警报、MSN、邮件提醒功能这些也是属于在能力范围6.2 NAGIOS的优点 良好的稳定的系统管理代码 在服务事件和主机事件之间良好的相关性 命令检查配置文件的验证 命令重新加载配置文件无需打扰nagios的运行 良好的文档6.3 NAGIOS的缺点 没有自动发现 事件控制台不完美 无OOTB采集或者性能数据的阈值 没有简单的方法来接收和解释的SNMP TRAP 没有MIB编译器或者浏览器
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!