運用ノウハウは障害の対応履歴
システムの運用ノウハウをためて、活用しようと様々な方法を取ってきました。
特に、システム構築時の設定の仕方で工夫した点や、特殊なやり方でなけれなならない点などは、ドキュメントに残しています。
しかし、このドキュメントが、その後の設定時に活用されたかというと、いまいち活用されていないような気がします。
また、このような特殊な施し自体を、ドキュメント化することは、ベテランの作業者でもない限り、あまりドキュメントに残してくれません。
しかし、一点、記録に残すことが習慣化され、後に活用されていると思われるものがあります。それが、運用時に発生したシステム障害の対応履歴です。
障害発生時には、通常、障害の記録をトラブルチケットのような形で残すと思います。障害管理の一貫です。
この記録をきちんと残しておくと、後々に、同様なトラブルが起きたときに、対応がかなり楽になります。そのトラブルを初めて経験する人でも、その履歴情報が良いものであれば、最善の対応ができることになります。
そのため、このようなトラブル履歴には、そのときに実行した、単なる履歴ではなく、障害復旧のための理想的な対応方法として残しておくことが重要です。
トラブル発生後、そのトラブルの対処が一段落したあとには、必ずその対応履歴を見直し、ベストな対応方法は何だったのか、反省してみる必要があります。
障害対応手順があるのであれば、その対応手順通りにできたか、できなかった理由なにか、対応手順自信は理想的な対応なのかどうか、いろいろと考えてみると良いと思います。
こうしてブラッシュアップしてできあがった障害の対応履歴は、後々に使えるものになっていきます。障害管理のデータベースとして記録し、検索が容易にできるようにしておくと良いです。
Since Feb. 19th, 2003