システムの監視

職場のネットワークトラフィックを知りたくて仕方がなかった。SNMPでHUBからデータを取る方法があるのは知っていたけど、SNMPって取れるデータが5分平均なのでバースト的に現れるトラフィックも平準化されてしまって狙ったデータが取れず、いまいちその気になれなかった。
ある時、試しにと言うことで外部の人間の薦めもありMRTGを入れて貰ったところ、トラフィックのトレンドがわかる。バースト的なトラフィックも大事だけど基本はトレンドの把握だね、と言うことがよ〜〜くわかった。(当たり前か)
先日、システムが原因不明の能力低下を起こしたときにシステムベンダは無責任にも「ネットワークじゃないですか?」と言いやがる。そのときにはMRTGからCactiに移行していた。そして、システムのサーバ群のネットワークのトラフィックデータを取っていた。
そのデータのおかげでサーバ間通信で高負荷が発生しており、ネットワーク障害がその原因ではないと言うのが推定できた。
本日、そのサーバ群からネットワークトラフィックだけではなくてCPU usageやらLoad Average、Memory Usageが取れるようにnet-snmpのインストールを行う。
現在問題になっているシステムのパフォーマンス問題の原因究明の助けになるデータが取れる。