Zabbixで出来ることあれこれ

書籍購入支援制度で購入したZabbix統合監視実践入門で、
業務で使用しているモニタリングツールの見直し等を行いました。

半年くらい前にモニタリングとはみたいな事を書きましたが、もう少し具体的な事を書こうと思います。

モニタリングツールで出来ること

〇システムのリソース監視(CPU使用率、メモリ使用量、プロセス)
時間毎のCPU使用率が分かれば、バッチなどの処理において負荷が掛かっている箇所が把握しやすくなり、サーバのダウン回避にもつながります。

〇各種ログの監視
アプリ等の生ログは実行サーバ上にあるため、インシデント発生時には問題が発生したサーバへログインしてログを確認しますが
Zabbix等のモニタリングツールがあれば、WEB上から対象サーバのログを即時に確認することができます。

〇正規表現による柔軟なトリガーの生成
ログ監視からの流れになりますが、ログ監視では出力されたログをチェックしてアラートを発報するのですが
発報条件(トリガー)に正規表現が使えるため、「ERROR」「WARN」等のキーワードだけでなく
ログコメントから正規表現にて検索を行い、発報のレベルを柔軟に変更することも可能になります。

〇DB接続によるデータベース上の情報の可視化
モニタリングツールで意外な機能がこれかもしれません。
モニタリングツールでは指定した時間毎にSQLを発行し情報を保管しておくことが可能です。
例えば会員向けのシステムであれば、日々の会員数の増減数の把握や特定のサービスの使用状況も
グラフ化して確認できるので非常に把握しやすいです。

私のメイン業務が運用のため、ログ等の確認は多いのですが
もともとバックオフィスツールとして動いていたZabbixを参考書を見ながら設定を見直したことで
執務室からログを確認できるようになったので、マシン室に行く頻度が減りました。
またシステムの利用会員向けキャンペーン時にはキャンペーンの利用状況も確認できるようになったので
業務チームとも情報の連携を迅速に連携できるようになりました。

もし、Zabbixやhinemosを使用している業務があるのであれば、
どんどん活用して開発や運用の改善を行ってみてはどうでしょうか。

About the author

take0089

システムの運用、改善、案件対応と幅広くやってる何でも屋
言語はPHP、Java、C#をメインにしつつ最近はPythonも勉強中

Add Comment

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

By take0089

最近の投稿

アーカイブ

カテゴリー

タグクラウド

コーポレートサイト

メタ情報