Nagios NRPEを使ったリモートホストの監視でSocket timeout発生回数を減らす設定

Nagiosの監視対象サーバで「Additional Info: CHECK_NRPE: Socket timeout after 10 seconds」アラートが最近よく出るようになりました。その監視対象サーバがダウンした訳ではなく、最近あるミドルウェアプログラムを動かしはじめたため、Nagios監視に対する応答が遅くなる時があるからかな?と考えています。(その監視対象サーバは、USにあるAWS無料インスタンスなので大したリソースもありません。) Continue reading

Nagios NRPEを使ったリモートホストのリソース監視(ディスク使用率監視)

監視ツールNagiosを使って、リモートホストのリソース監視(CPU使用率やメモリ使用率、ディスク容量使用率など)を実施する為の設定を行います。

実現する為にNRPE(Nagios Remote Plugin Executor)を導入する事にします。

NRPEは、Nagiosで広く使われているリモートホスト監視用のプラグインです。 Continue reading

Nagios 設定の整理と確認

Nagios の基本的な構成について、あらためて見直した部分を記録しておきます。

Nagios設定ファイルの整理

Nagiosの設定ファイルは、デフォルトでは /usr/local/nagios/etc 配下に配置されています。

cgi.cfg CGI関連の設定ファイル
nagios.cfg Nagios全体の設定ファイル
resource.cfg リソース関連の設定ファイル(編集の機会は少なさそう)
objects/commands.cfg 監視コマンドの定義がされている設定ファイル
objects/contacts.cfg 通知用の定義がされている設定ファイル
objects/templates.cfg CONTACT、HOST、SERVICEのテンプレート
objects/timeperiods.cfg 監視を行う時間帯が定義されている設定ファイル

Continue reading

Nagios Pingが通らないHostを監視する場合

Nagiosで、Ping(ICMP)がFireWallでブロックされているホストを監視する場合、Nagiosの「Host Status」がDOWNになってしまいます。

監視対象のHTTPサービスやSSHサービスは問題ないにも関わらず、DOWN表示されるのは意図に反するので、UPとして表示される方法を探しました。check_dummy を利用する方法が紹介されていたので、その設定を実施しました。備忘録も兼ねて記録しておきます。 Continue reading