广告
返回顶部
首页 > 资讯 > 操作系统 >Nagios利用NRPE监控Linux主
  • 349
分享到

Nagios利用NRPE监控Linux主

NagiosNRPELinux 2023-01-31 03:01:54 349人浏览 薄情痞子
摘要

介绍本文描述了如何监控linux/UNIX的“私有”服务和属性,如:CPU负载内存占用率磁盘利用率登录用户运行进程等等一、利用NRPE监控远程Linux的”本地信息“    前面已经对远程Linux 主机是否存活做了监控,而判断远程机器是否

介绍

本文描述了如何监控linux/UNIX的“私有”服务和属性,如:

  • CPU负载

  • 内存占用率

  • 磁盘利用率

  • 登录用户

  • 运行进程等等

一、利用NRPE监控远程Linux的”本地信息“

    前面已经对远程Linux 主机是否存活做了监控,而判断远程机器是否存活,我们可以使用ping 工具对其监测。还有一些远程主机服务,例如ftp、sshHttp,都是对外开放的服务,即使不用NagiOS,我们也可以试的出来,随便找一台机器看能不能访问这些服务就行了。但是对于像磁盘容量,cpu负载这样的“本地信息”,Nagios只能监测自己所在的主机,而对其他的机器则显得有点无能为力。毕竟没得到被控主机的适当权限是不可能得到这些信息的。为了解决这个问题,Nagios为我们提供了多种解决方案。

    有几种不同方式来监控远程Linux/UNIX服务器的服务与属性。一个是应用共享式SSH密钥运行check_by_ssh插件来执行对远程主机的检测。这种方法本文档不讨论,但它会导致安装有Nagios的监控服务器很高的系统负荷,尤其是你要监控成百个主机中的上千个服务时,这是因为要建立/毁构SSH联接的总开销很高。

    另一种方法是使用NRPE外部构件监控远程主机。NRPE外部构件可以在远程的Linux/Unix主机上执行插件程序。如果是要象监控本地主机一样对远程主机的磁盘利用率、CPU负荷和内存占用率等情况下,NRPE外部构件非常有用。 nagios 有这样一个附加组件--“NRPE”,用它就可以完成对Linux 类型主机"本地信息”的监控。


1、NRPE介绍

    NRPE是Nagios的一个功能扩展,它可在远程Linux/UNIX主机上执行插件程序。通过在远程服务器上安装NRPE插件及Nagios插件程序来向Nagios监控平台提供该服务器的本地情况,如CPU负载,内存使用,磁盘使用等。这里将Nagios监控端称为Nagios服务器端,而将远程被监控的主机称为Nagios客户端。

   Nagios监控远程主机的方法有多种,其方式包括SNMP,NRPE,SSH,NCSA等。这里介绍其通过NRPE监控远程Linux主机的方式。NRPE(Nagios Remote Plugin Executor)是用于在远端服务器上运行监测命令的守护进程,它用于让Nagios监控端基于安装的方式触发远端主机上的检测命令,并将检测结果返回给监控端。而其执行的开销远低于基于SSH的检测方式,而且检测过程不需要远程主机上的系统账号信息,其安全性也高于SSH的检测方式。

2、NRPE的工作原理

wKiom1PZ4hOj2vmOAACGgmR6MEk841.jpg


NRPE 总共由两部分组成:

  • check_nrpe 插件,位于监控主机上

  • NRPE daemon,运行在远程的Linux主机上(通常就是被监控机)(agent)

按照上图,整个的监控过程如下:

当Nagios 需要监控某个远程Linux 主机的服务或者资源情况时:

  1. Nagios 会运行check_nrpe 这个插件,告诉它要检查什么;

  2. check_nrpe 插件会连接到远程的NRPE daemon,所用的方式是SSL;

  3. NRPE daemon 会运行相应的Nagios 插件来执行检查;

  4. NRPE daemon 将检查的结果返回给check_nrpe 插件,插件将其递交给nagios做处理。

注意:NRPE daemon 需要Nagios 插件安装在远程的Linux主机上,否则,daemon不能做任何的监控。

3、在被监控端上,安装Nagios插件及NRPE

1、添加nagios用户

[root@localhost ~]# useradd -s /sbin/nologin nagios

2、安装nagios-plugins,因为NRPE依赖它

注意:请自行安装GCc make wget openssl openssl-devel等包。

[root@localhost ~]# wget http://sourceforge.net/projects/nagios/files/nrpe-2.x/nrpe-2.15/nrpe-2.15.tar.gz
[root@localhost ~]# wget http://nagios-plugins.org/download/nagios-plugins-2.0.3.tar.gz

[root@localhost ~]# tar xf nagios-plugins-2.0.3.tar.gz -C /usr/local/src
[root@localhost ~]# cd /usr/local/src
[root@localhost src]# cd nagios-plugins-2.0.3/ 
[root@localhost nagios-plugins-2.0.3]# ./configure --with-nagios-user=nagios --with-nagios-group=nagios
[root@localhost nagios-plugins-2.0.3]# make && make install

3、安装NRPE

[root@localhost ~]# tar xf nrpe-2.15.tar.gz -C /usr/local/src
[root@localhost ~]# cd /usr/local/src
[root@localhost src]# cd nrpe-2.15/
[root@localhost nrpe-2.15]# ./configure --with-nrpe-user=nagios --with-nrpe-group=nagios --with-nagios-user=nagios --with-nagios-group=nagios --enable-command-args --enable-ssl

[root@localhost nrpe-2.15]# make all
[root@localhost nrpe-2.15]# make install-plugin
# 安装成守护进程
[root@localhost nrpe-2.15]# make install-daemon
# 安装配置文件
[root@localhost nrpe-2.15]# make install-daemon-config

# 编辑nrpe配置文件
[root@localhost ~]# vi /usr/local/nagios/etc/nrpe.cfg
allowed_hosts=192.168.11.103    # 修改为监控端的IP,多个IP以逗号分隔,中间不能留空格

4、启动nrpe

# 以守护进程的方式启动
[root@localhost ~]# /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
[root@localhost ~]# netstat -tulpn | grep nrpe
tcp        0      0 0.0.0.0:5666       0.0.0.0:*             LISTEN      30009/nrpe          
tcp        0      0 :::5666            :::*                  LISTEN      30009/nrpe

有两种方式用于管理nrpe服务,nrpe有两种运行模式:

-i        # Run as a service under inetd or xinetd
-d        # Run as a standalone daemon
  • 可以为nrpe编写启动脚本,使得nrpe以standard alone方式运行

[root@localhost ~]# vi /etc/init.d/nrped
#!/bin/bash
# chkconfig: 2345 88 12
# description: NRPE DAEMON

NRPE=/usr/local/nagios/bin/nrpe
NRPECONF=/usr/local/nagios/etc/nrpe.cfg
case "$1" in
   start)
       echo -n "Starting NRPE daemon..."
       $NRPE -c $NRPECONF -d
       echo " done."
       ;;
   stop)
       echo -n "Stopping NRPE daemon..."
       pkill -u nagios nrpe
       echo " done."
       ;;
   restart)
       $0 stop
       sleep 2
       $0 start
       ;;
   *)
       echo "Usage: $0 start|stop|restart"
       ;;
   esac
exit 0

[root@localhost ~]# chmod +x /etc/init.d/nrped
[root@localhost ~]# chkconfig --add nrped
[root@localhost ~]# chkconfig nrped on

定义服务端口:在/etc/services中增加一行
[root@localhost ~]# vi /etc/services 
nrpe            5666/tcp                # nagios_client

## 然后重启 xinetd服务即可
# [root@localhost ~]# service xinetd restart
  • 或者通过xinetd服务来管理nrpe,当然前提是安装了xinetd服务。

这里只需要修改only_from项即可,修改为Nagios监控中心的IP地址,多个IP用空格分隔。这样一来监控端就可以和被监控端进行nrpe通信了。

[root@localhost ~]# vi /etc/xinetd.d/nrpe

wKiom1PaK1_A5PGaAADlO8v2lfY751.jpg

当nrpe由xinetd控管时,其配置文件nrpe.cfg中的allowd_hosts选项将被忽略。而由only_from所取代。

## 重启xinetd
# service xinetd restart


4、在监控端上安装NRPE插件

需安装openssl openssl-devel包

[root@localhost ~]# wget http://sourceforge.net/projects/nagios/files/nrpe-2.x/nrpe-2.15/nrpe-2.15.tar.gz
[root@localhost ~]# tar xf nrpe-2.15.tar.gz -C /usr/local/src
[root@localhost ~]# cd /usr/local/src
[root@localhost src]# cd nrpe-2.15/

[root@localhost nrpe-2.15]# ./configure --with-nrpe-user=nagios --with-nrpe-group=nagios --with-nagios-user=nagios --with-nagios-group=nagios --enable-command-args --enable-ssl

[root@localhost nrpe-2.15]# make all
[root@localhost nrpe-2.15]# make install-plugin
# 安装完成后,会在Nagios安装目录的libexec下生成check_nrpe的插件

5、使用nrpe监控LINUX主机

[root@localhost ~]# cd /usr/local/nagios/libexec/
# 我们通过 -h 选项,可以知道插件使用的语法格式
[root@localhost libexec]# ./check_nrpe -h

[root@localhost libexec]# ./check_nrpe -H 192.168.11.101
NRPE v2.15
# 如果出现上述提示,那么说明能够正常监控的

[root@localhost ~]# cd /etc/nagios/monitor/
## 定义命令
# vim command.cfg
define command
   {
       command_name check_nrpe
       command_line $USER1$/check_nrpe –H "$HOSTADDRESS$" -c $ARG1$
   }

## 定义主机
# vim hosts.cfg
define host{
       use             linux-server    
       host_name       linuxhost      
       alias           My linux host    
       address         192.168.1.12    
       }

## 定义服务
# vim services.cfg
define service{
       use                     generic-service
       host_name               linuxhost
       service_description     CHECK USERS
       check_command           check_nrpe!check_users
       }
define service{
       use                     generic-service
       host_name               linuxhost
       service_description     load
       check_command           check_nrpe!check_load
       }        
define service{
       use                     generic-service
       host_name               linuxhost
       service_description     disk sda1
       check_command           check_nrpe!check_sda1
       }
define service{
       use                     generic-service
       host_name               linuxhost
       service_description     Zombile procs
       check_command           check_nrpe!check_zombie_procs
       }
define service{
       use                     generic-service
       host_name               linuxhost
       service_description     total procs
       check_command           check_nrpe!check_total_procs
       }  
       
注释:
# check_nrpe –H 被监控的主机 -c 要执行的监控命令
注意:-c 后面接的监控命令必须是nrpe.cfg 文件中定义的。也就是NRPE daemon只运行nrpe.cfg中所定义的命令。
### 在被监控端查看
# grep -v -e '^#' -e '^$' /usr/local/nagios/etc/nrpe.cfg

# check_nrpe!后面接的命令是在 /usr/local/nagios/etc/nrpe.cfg里写定义好的命令,如下面只有 # 五个,中括号内的为命令名, [command_name]
# 如果我们想定义更多的命令, 添加在这里就可以了
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_sda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda1
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200  

检查语法错误:
# /usr/local/nagios/bin/nagios -v /etc/nagios/nagios.cfg  
没有提示错误,则下一步
# service  nagios restart

然后我们打开Nagios WEB监控页查看

wKiom1PaChKhNeSFAABZpsocV6M391.jpg

OK, 可以看到我们刚才定义的主机linux-192.168.11.101已经被监控。


6、Nagios邮件报警配置

安装sendmail 组件

首先要确保sendmail 相关组件的完整安装,我们可以使用如下的命令来完成sendmail 的安装:

# yum install -y sendmail* mailx

然后重新启动sendmail服务:

# service sendmail restart

因为我们只是单纯的用来发送邮件,也不需要进行额外的配置。直接mail发送邮件即可。然后发送测试邮件,验证sendmail的可用性:

# echo "Hello World" | mail  920297262@qq.com

wKioL1PaD9yDH3fqAABvOgmurkA543.jpg

OK, sendmail可以发送邮件了。

无法收到邮件,问题排查?

    如果服务器一切正常,当然是不会发送报警邮件的,但是如果服务器关机肯定会发邮件的。如果nagios配置文件正确,却收不到邮件,是什么原因呢? 您可以按照以下几步进行排查。

1、查看邮件服务是否启动,nagios服务器和客户端是否启动。可以通过ps -ef ,或者 netstat 命令查看

2、如果上述检查通过, 那么手动通过mail命令来发送邮件,测试能否收到。因为nagios也是调用mail命令来发送邮件的,确保这一步是通的,则说明问题出在接收端。

[root@localhost ~]# echo 'nagios mail test' | mail -s 'nagios' 920297262@qq.com

然后查看邮件日志

[root@localhost ~]# tail -n30 /var/log/maillog

如果表面发送成功,但是却没有收到邮件,则可能是被拦截了。

wKiom1Pd2y2SAP-IAAFG7-_eJRY736.jpg

注意一般自定义域名会被QQ邮箱当作垃圾邮件处理,QQ邮箱一般会拦截邮件,为了避免这种情况,需要添加白名单才可以收到邮件。

这里又涨姿势了,跟随时代的潮流,我们也可以通过微信来报警。

首先,QQ邮箱要把我们nagios监控中心的域名添加到白名单,然后微信设置QQ邮箱推送即可。微信: 设置 - 通用 - 功能 - QQ邮箱提醒 - 启用该功能即可。


好了,言归正传,不要扯得太远了。

修改上面的配置:

# cd /etc/nagios/monitor
# vim hosts.cfg
    #    use             linux-server
我们发现它使用的linux-server这个模板, 然后我们去看一下linux-server模板的定义:

# vim templates.cfg
    # contact_groups                  admins
找到linux-server的定义,发现其配置的contact_groups为 admins, 然后我们去看admins的定义:

# vim contacts.cfg

wKioL1PaEbayknOEAAMKZz6WFDY832.jpg

转了一圈,终于找到最终的地方。

然后,邮件是如何发送的呢? 请自己找找看。 提示:generic-contact

还有很多地方需要学习, 先写到这里,回头再改改

--结束END--

本文标题: Nagios利用NRPE监控Linux主

本文链接: https://www.lsjlt.com/news/187651.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • Nagios利用NRPE监控Linux主
    介绍本文描述了如何监控Linux/UNIX的“私有”服务和属性,如:CPU负载内存占用率磁盘利用率登录用户运行进程等等一、利用NRPE监控远程Linux的”本地信息“    前面已经对远程Linux 主机是否存活做了监控,而判断远程机器是否...
    99+
    2023-01-31
    Nagios NRPE Linux
  • shell脚本监控linux系统内存使用情况的方法(不使用nagios监控linux)
    一、安装linux下面的一个邮件客户端msmtp软件(类似于一个foxmail的工具) 1、下载安装: # tar jxvf msmtp-1.4.16.tar.bz2# cd msmtp-1.4.16# ...
    99+
    2022-06-04
    脚本 内存 情况
  • nagios中如何使用check_mysql监控mysql
    nagios中如何使用check_mysql监控mysql,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。 nagios监控mysql服务器:...
    99+
    2022-10-18
  • 利用zabbix监控ogg进程(Linux平台)
    前段时间生产的一个数据库的ogg进程挂了快半个月才被发现,已经起不来了,只有重新初始化再同步。因此很有必要监控下ogg的进程,这里给大家介绍如何使用zabbix监控oracle的ogg的进程。思路就是利用oracle...
    99+
    2022-06-03
    zabbix监控ogg进程 zabbix监控ogg linux
  • 如何使用linux系统性能监控工具KSysguard监控远端主机
    小编给大家分享一下如何使用linux系统性能监控工具KSysguard监控远端主机,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!KDE System Guard默...
    99+
    2023-06-13
  • Shell脚本编写Nagios插件监控程序资源占用
    一般情况下,我们只需要监控程序进程在没在就可以了。但是这次遭遇了这样的事,公司开发的程序,程序进程还在,但是死锁了。导致大范围的影响,更要命的是根本不知道问题出在哪里,还是别的测试部同事帮忙发现的,真是丢尽...
    99+
    2022-06-04
    脚本 插件 程序
  • CentOS7如何搭建Prometheus监控Linux主机
    这期内容当中小编将会给大家带来有关CentOS7如何搭建Prometheus监控Linux主机,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。 简介prometheus可以拆分成多个节点进行指标收...
    99+
    2023-06-15
  • Zabbix基于snmp实现监控linux主机
    前言:   linux主机的话还是比较好处理的,无论是安装agent代理程序还是使用snmp,都是比较方便的,本文旨在介绍通过snmp使client与server进行连接。 环境:   server:192.168.2...
    99+
    2022-06-04
    zabbix snmp 监控 linux主机
  • 利用python监控天气
    需求:从天气网站抓取天气,在每天6点,检查当天是否会下雨。如果下雨,邮件提醒带伞。代码:[root@pos ~]# cat weather.py #!/usr/bin/python # -*- coding: UTF-8 -*- impor...
    99+
    2023-01-31
    天气 python
  • Linux怎么使用KSysguard工具监控远端主机
    这篇文章主要介绍“Linux怎么使用KSysguard工具监控远端主机”,在日常操作中,相信很多人在Linux怎么使用KSysguard工具监控远端主机问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Linux...
    99+
    2023-06-13
  • Linux下MySQL主从同步监控shell脚本
    说明: 操作系统:CentOS 目的:定时监控MySQL主从数据库是否同步,如果不同步,记录故障时间,并执行命令使主从恢复同步状态 1、创建脚本文件 vi /home/crontab/ch...
    99+
    2022-06-03
    Linux 监控
  • 用SNMPTRAP实现主动监控
    要使用SNMPTRAP实现主动监控,您需要按照以下步骤进行配置:1. 安装SNMPTRAP管理工具:首先,您需要安装一个SNMPTR...
    99+
    2023-09-08
    SNMPTRAP
  • 利用Prometheus和Grafana监控MySQL
     一、 Prometheus 是一个开源的服务监控系统和时间序列数据库。:官方GitHub地址为:https://github.com/prometheus/prometheus 官方地...
    99+
    2022-10-18
  • 怎么在Linux中快速监控多个主机
    小编给大家分享一下怎么在Linux中快速监控多个主机,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!有很多监控工具可用来监控本地和远程 Linux 系统,一个很好的...
    99+
    2023-06-16
  • 如何编写Shell脚本使Nagios插件监控程序资源占用
    本篇内容主要讲解“如何编写Shell脚本使Nagios插件监控程序资源占用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何编写Shell脚本使Nagios插件监控程序资源占用”吧!一、shel...
    99+
    2023-06-09
  • 监控软件Nagios的服务器端如何在Linux系统上进行安装和配置
    本篇内容主要讲解“监控软件Nagios的服务器端如何在Linux系统上进行安装和配置”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“监控软件Nagios的服务器端如何在Linux系统上进行安装和配...
    99+
    2023-06-12
  • 如何利用Bash脚本监控Linux的内存使用情况
    前言 目前市场上有许多开源监控工具可用于监控 linux 系统的性能。当系统达到指定的阈值限制时,它可以发送电子邮件警报。它可以监视 CPU 利用率、内存利用率、交换利用率、磁盘空间利用率等所有内容。 如果你只有很少的系...
    99+
    2022-06-04
    linux监控内存 linux监控内存命令 linux 内存
  • 怎么利用Bash脚本监控Linux的内存使用情况
    本篇文章为大家展示了怎么利用Bash脚本监控Linux的内存使用情况,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。现在用于监控Linux系统内存的工具有很多,当系统到达指定的阈值时,监控工具可以发送...
    99+
    2023-06-28
  • 如何入门Linux网络流量监控利器iftop
    这篇文章给大家介绍如何入门Linux网络流量监控利器iftop,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。 iftop 是什么在 Linux 系统下即时监控服务器的网络带宽使用情况,有很多工具,比如 ipt...
    99+
    2023-06-15
  • 利用Python监测MySQL主从状态
        探测MySQL主从状态,如果从未同步,则发邮件通知运维人员。利用定时任务秒级监测!# -*- coding: utf-8 -* #! /usr/bin/env python from fabric.api import * fro...
    99+
    2023-01-31
    主从 状态 Python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作