toto_1212

技術のログをツラツラ書きます。自分用ですが参考にしていただけたら嬉しいです。間違ってたらドンドン突っ込んでください。

【勉強会】『いまさら聞けない!システム運用・管理のコツVol.3』

運用監視ツールの勉強会に行ってきました。

『いまさら聞けない!システム運用・管理のコツVol.3』と題し、新宿区大久保にあるフォースクーナ株式会社 様主催で開催されました。

プログラムは、、、、
No.1 「Icinga使って見ませんか?」 フォースクーナ株式会社 大久保智之

No.2 「はじめてのグラモニ」フォースクーナ株式会社 斉藤孝之

No.3  「監視オペレーターにとってやさしいログ監視運用 」 フォースクーナ株式会社 小林敏男

No.4 「実践!Munin で実現する効率的トラブルシューティング(仮)」  株式会社リンク 前佛雅人
となります。

業務で Zabbix + MUNIN を使っており、MUNINは難しいことせずに動作するので、メインで聞きたかったのはZabbix関連でメイン業務でやられれている会社さんの運用まわりのお話を聞きに行った感じです。
私のZabbixのレベルとしては、基本的なホスト登録やアイテム/トリガーといったところから、グラフ書きやローレベルディスカバリで環境変数の扱えるレベルなので、まだまだ初心者でフォースクーナーさんはゴリゴリに使っていそうな感じがしたので、その辺りを盗めればと思い参加しました。


No.1 「Icinga使って見ませんか?」
監視ツール特集なんかで目にする程度でほぼ初見という感じで聞いてきました。
Nagiosベースの監視ツールで、Nagiosからforkしているだけあって機能は豊富になっている印象でした。
率直な意見としてZabbixよりも手軽そうだし、軽そうな感じ。ログ監視とかプロセス監視とかカテゴリだけをみるのであればなかなか良さそう。
逆に、監視しやすさの観点からみるとZabbixのほうが上な感じ。(単に慣れの問題かもしれないが)
それを補うためにIcinga-webがあると思うが、動きがもっさい感じ。
今後Webが早くなれば試してみる価値ありかと。。。

No.2 「はじめてのグラモニ」
正式名称は「GroundWork Monitor」。
その昔、Zabbixとの比較対象になった製品でもあり、たしか導入の検証までした記憶があります。
ネックだったのはハードウェア要件。GroundWork MonitorはMEM:4GB、CPU:2 CPU、HDD:160GBで、監視ツール選定当時は監視製品は仮想上にのせる方針で最大でメモリ2GBでの稼働が必須だったこともあり、とりあえず物理サーバにのせて検証した記憶があります。
正直、悪くなく要求スペックさえ合えばもしかしたらZabbixではなかった可能性があります。

NO.3  「監視オペレーターにとってやさしいログ監視運用 」
お目当てだったZabbix。フォースクーナさんの監視サービスのお話を頂きました。ログ監視に特化した話ではありましたが、監視方法等参考になりました。各社様でクローズされているように聞こえたのでZabbix Proxyとか使ってるんですかね。。。
監視モニターはあまりほぼ見ていなく、メールトリガーで検知した後に確認する程度だとか。。。
うちは友人監視なのでトリガー + ひとの目みたいな所があるので、拾うアラートとゴミアラートの仕分けはきっちり事前調査されているんだなという印象です。
ログ監視の場合でのZabbixユーザーファイルのパーミッション問題やOOM-Killerといった運用の話を聞けたのは収穫でした。

NO.4 「実践!Munin で実現する効率的トラブルシューティング(仮)」
リンク社の前佛さんからのお話。この方の影響でMUNINを始めたので、この話も楽しみ。。。
リンク社もうちと同じZabbix + MUNINで、リソース監視をMUNINが担い、HW監視をZabbixでやっているそうで、この辺りうちも取り込みたいと思う。ネットワークはSNMPでの監視。
MUNINの5分計測では取りきれないものをZabbixで補うような使い方をしているので、前佛さんはこのツールがいいとかそういうものではなく、共存し補い合うべきだという考え。共感するところ。
MUNINは5分が限界の説明に対し、質問する方もいて、実際はパラメータにて1分間隔とかもできるがノードが100超えるとかなり厳しくMUNINサーバ自体の増強を検討しなくてはいけないため手軽なMUNINではなくなってしまうとのこと。


今回の勉強会で思うことは、監視方法は10社あれば10通りで、おそらく正解はない。何か障害が発生して対応してまた新たに障害…これを繰り返し繰り返し行い、それで監視方法やツールを工夫するものなのではないかなと思う。
登壇者が言っていた、これがイイというものではなく、この部分はこのツール、みたいにツール個々の得意分野に任せそれをうまく自動化なりをするのが運用者の腕の見せ所なのではないかなと思う。監視ツールは稼働してしまうとロックインしがちなので、トレンドを追っていいものがあれば変える検討であったり、部分的に使えば楽になりそうなものがあればドンドン採用すべきでプロアクティブ思考でいくべきだなと感じた。

最後に、、、、
Zabbixステッカー頂きました。早速PCに貼ってます。
f:id:toatoshi:20130712111745j:plain

あと、懇親開催中に竹田さんからお声掛け頂き、なんとZabbix Tシャツ頂きました。寺島さんから頂いたものらしいです。
f:id:toatoshi:20130712003652j:plain