今日は私の専門分野であるITシステム運用を扱います。もはやビジネスの基盤といえるITですが、その運用現場にはまだまだ非効率な部分が残っています。
システム運用の改善ポイントはズバリ、「見える化」「標準化」を実施した上での「自動化」です。今日は、「意外と知らない、システム運用の効率化テクニック」を、『IT運用管理 攻めのツール活用術』も参考にご紹介します。
1.システム監視のテクニック
システムが正常に動いているかどうかを確認し、もし異常が発生したとき、もしくは異常の兆候があったときに、素早くそれを発見し、リカバリにつなげるのがシステム監視です。ITシステム運用において非常に重要な業務であるとともに、実は非常に無駄も多い業務でもあります。
テクニック①イベント対応コストを半分にする
左の図は少し前のNRIのシステム運用における、オペレーション作業の内訳データです。驚くことに、障害メッセージの「無視」だけに全体の4割近くの工数をかけていることがわかります。
障害メッセージのほとんどは警告レベルの無視してもよいイベントなのですが、その中に紛れている重要なメッセージを見逃さないよう、無視しても良いメッセージの切り分けは慎重にやる必要があります。先日訪問した顧客でも「うちは全体の工数の半分以上を費やしていると思います…」と言われており、これに悩まされている企業は多いのです。
しかし、RunBookAutomation(以下、RBA)を使うと、これは簡単に自動化できてしまいます。
監視ツールでメッセージのフィルタをかけるのが基本ですが、その上で発行されたメッセージを切り分けて、必要なものだけを運用管理者に通知する、もしくは手順を元に自動で復旧対応をする、ということが、今の技術では既に可能になっています。運用手順が見える化・標準化されていることが前提ですが、その上でRBAにのせて自動化してしまえば、運用工数の大幅な削減と、ミスの抑制による品質向上が見込めます。
2.ジョブ管理のテクニック
売上データの転送、地域や店舗・商品ごとの売上集計から在庫引き落とし、販売予測に基づく仕入先や仕入れの数の決定、発注処理など、システム運用の現場では、日々様々なバッチ処理を実行しています。これらが決められたスケジュールに従って実行されているかどうかを管理するジョブ管理においても、まだ改善できる部分が残っています。
テクニック②ジョブのネーミングルールで障害対応を効率化する
ジョブに異常があったとき、すぐに対象のサービスや影響範囲が把握出来れば、便利ですよね。実はジョブのネーミングルールを少し工夫するだけで、それが出来てしまいます。ジョブ名の中にシステムIDや、サーバの番号、重要度を示すキーワードなどを盛り込むことで、素早いリカバリ処理を実現しましょう。
テクニック③一時切り分けから対応オペレーションまでを自動化する
ジョブが異常終了したときに、内容を確認し、切り分ける作業は手間がかかります。
また、対応手順は日々更新されるため、うっかり確認を忘れるとミスが発生することになります。ここでも、RBAでの自動化が有効です。
切り分けと対応オペレーションを手順化し、手順の実行・管理・レポートまでをRBAにのせておけば、運用管理者は想定外の事象が起こった場合のみ対応すれば良くなります。加えて、開発と運用のコミュニケーションギャップによる手順変更の連絡漏れ等のリスクも抑えることが出来ます。
3.ITサービスマネジメントのテクニック
ITサービスマネジメントとは、ITサービスの品質・コスト・納期を日々改善するためのマネジメントのことです。今回は、ITサービスマネジメントをうまく導入するテクニックと、構成管理をスマートに実行するソリューションを紹介します。
テクニック④Quick-Winで導入
ITサービスマネジメントは領域が多岐に渡るため、その導入計画は壮大になりがちです。しかし2つの理由から、時間をかけて全社最適で導入するITサービスマネジメントは失敗してしまいます。
1.部門間の調整がネックとなり、途中で挫折する
-
全社最適での導入において、無理に業務を合わせようとすると、関係者の反発や技術上の問題に直面しやすい
2.成果を得るのに時間がかかる
-
壮大な計画では中長期的な目標を設定しがちだが、それではなかなか効果を実感できず、関係者のモチベーションも低下し、次第にトーンダウンしてしまう
成功の可能性を高めるには、Quick-Winで導入することです。つまり短期的に解決が可能な課題を設定して、狙い撃ちですばやく成果を出してしまうのです。それにより、確実な効果を確保しつつ、成功体験を積み重ねることで関係者のモチベーションを段階的に高めることが出来ます。
テクニック⑤構成管理情報のアップデートをスマートに実行
障害時にすばやく影響範囲を把握するには、構成管理が欠かせません。しかし、構成管理は情報を最新にたもつのが難しく、更新が漏れてしまいがちです。
これをスマートに解決する方法があります。手順は以下のとおり。
1.インベントリ情報収集ツールで、自動的に構成情報をひっぱってくる
2.ひっぱってきた情報をCSV出力し、構成管理台帳の中身と自動的に突き合わせ
3.突き合わせた結果の差分のみを抽出し、更新漏れとしてレポート通知
今は2.の突き合わせを目視でがんばってらっしゃる方もいますが、機能が備わっている構成管理ツールを入れることで自動化は可能です。今までとは比べものにならない小さい労力で、構成管理情報をスマートにアップデート出来るようになります。
関連記事:
「頼りないSE」と周囲から思われないための20のチェックリスト: 問題解決に効く1日10分の仕事ネタ
『CIOハンドブック』まとめ: 問題解決に効く1日10分の仕事ネタ
IT運用管理 攻めのツール活用術 ~NRIのデータセンター運用から生まれた「Senju Family」 | |
野村総合研究所 システムマネジメント事業本部 千手事業部
日経BP社 2011-09-19 |