こんちは。開発2部の吉岡です。
オーツー社内には様々なサーバーがあります。ファイルサーバーや、バックアップ用サーバー、Jenkins、Jenkinsのスレーブ、Redmineなど…
サーバーが増えていくのは良いのですが、どのサーバーはどんな状況なのかさっぱり把握出来ていません。
そこでサーバー状況を一括で管理するために、Zabbixを導入してみました。
Zabbixについて
Zabbixは死活監視+負荷監視なオールインワンな感じのサーバー管理ツールです。
Webブラウザ上で設定を行うことが出来、項目や画面が多く、かなり高機能な印象です。
インストールしてみた
インストールはマニュアルを参考に行ったのですが、意外と簡単で躓くこともなかったです。
被監視サーバーにはzabbix-agentをインストールするのですが、とりあえず使うにはzabbix-serverのIPアドレスを設定するぐらいでした。
インストールは簡単なのですが、サーバー側で監視出来る項目は多岐にわたります。
自分用に欲しい情報やグラフを集めたカスタム監視画面を作成出来たりと、使いこなすと管理業務がかなり捗りそうです。
Chatworkに発報する
開発2部では、社内のコミュニケーションツールとしてChatworkを使用しています。
そこでZabbixからの各種通知もChatworkに流れるようにしてみました。
Chatworkに投稿するスクリプトは、ググると色々と出てきますので省略…
スクリプトをZabbixに設定するのには、下記のような感じで行います。
- 管理 > メディアタイプ を選択
- 「メディアタイプの作成」を押下
- タイプをスクリプトに設定し、スクリプト名を入力して保存
- サーバーの/usr/lib/zabbix/alertscripts/ に上記スクリプト名のスクリプトを設置する
スクリプトへの第1引数が、「管理 > ユーザー」で個々のユーザーに設定する「送信先」、第2引数が「設定 > アクション」から設定する件名、第2引数が同じく「設定 > アクション」から設定するメッセージの内容となります。
なので、Chatworkへの投稿スクリプトを上記のような引数を処理するようにしておけばOKです。
かなりざっくりな説明になってしまいましたが…
おまけ:Smokepingを導入した。
予てからビミョウな印象のある弊社のLANですが、GrowthForecastで社内ブロードキャストで監視してみましたが、今回Smokepingという管理ツールを導入してみました。
Smokepingについては
【メモ】SmokePingでlatency視覚化はじめました(1)導入編
などの記事が詳しいかと思いますが、pingのレスポンス状況を可視化してくれます。
グラフを見て一目瞭然、弊社LANは結構スモーキーです…
時々、スパイクが立つことがあるのですが原因は今から調査です…
ただ、状況が分かると、どのように対策して良いかの参考になります。
ZabbixもSmokepingもまだまだ使いこなすには程遠いですが、色々試しながら使い方を覚えていきたいと思います。