うまいこと時間を作ることができず、今日も終わってしまうなぁとじっと手を見る、しょっさんです( ノ゚Д゚)こんばんわ。
突然ですが、甘い物苦手です。と言うか嫌いです。アイスとシュークリームは平気です。アイスは多分甘いから麻痺してるのと、シュークリームの主成分が卵だからだと思います。
にも関わらず、ここ数週間、「マヌカハニー」なるものをなめては「(‘A`)」こんな顔してます。なんか良いらしいです。私の一番の弱点であるノド、扁桃肥大なもんで、いつでもすぐに扁桃炎から上気道炎を引き起こし、気管支炎やら肺炎まで幅広く病気になる諸悪の根源なんですが、そのノドを中心に、予防・対策として効果が高いようです。なもんで、先日肺炎になったころから、ずっと舐めたり、溶かして飲んだりイロイロやってるわけですが、ここ一週間「しょっつるヘア」なるスポーツ刈りに毛が生えたような頭にした途端に、冬に逆戻りしてしまったもんだから、風邪ひきました。効果ないじゃん。予防効果あるんじゃなかったのかよ!! と泣きながら、さっきも舐めてました。頼るものがないので、こうやってなんとかしてます。良薬は口に余し。
さて、予防に効果がないことなんてものはいくらでもありまして。IT運用でも「予防保守」というなの、表からしてみれば何をやっているかよく分からない運用作業をたまにやってます。金融関係は特に明示的に週一や隔週、月一で決まったときに「システムメンテナンス」と称して停止していることが多いです。何してんのかは謎です。概ね想像つきますが、ここではその想像はおいといて。そのメンテナンス作業の中で「予防保守」を実施しているケースがあります。
「予防保守」たって、イロイロありますけれども。
- セキュリティインシデントや、バグへのパッチ適用
- データ保護の観点から、データのバックアップやアーカイブ、は日々やっているので、だいたいデータベースの再構築や再インデックスとかかな
のように、そのまま放置しておくと、問題が発生するかも知れない事情に事前に対処しておきましょう、と言うものです。パッチ適用はシステム停止からの保護、情報漏洩やクラッキングなどへの対処で、データ保護は、データベースがふくれあがってしまって、オンラインやオフライン処理の遅延を事前に抑制しようという魂胆です。RDBMSにデータを溜め続けていくと、どうしても、アーカイブや再インデックス、削除と再構築はやっておいたほうが良いモノが多いでしょう。溜め続けながら、サーバかリソースを追加し続けていくという方向性もあるやも知れませんが、どっかで行き詰まるでしょう。多分。
まぁ、見て分かるとおりやりたくない作業です。何をどうやりたくないかというと。
- パッチ当てて動かなかったら、アプリがこれまでとはちがう動作になったらどうしよう。
- データの再構築に失敗して、データロストしたらどうしよう
どっちもしにたくなるレベルのインシデントです。
きっと、直前にバックアップなどを取得しておくことが基本ですが、バックアップしていなかったら死んでもわびられません。生きていたところで地獄ですが。じゃ、バックアップが残っていれば安心かというと、そういった重要なシステムに限って、リカバリに数時間から数日かかります。
そうそう、数日もデータのマイグレーションに時間のかかるような作業とかしたことあります? 例えば、外部のストレージの移行とかで、一度バックアップしてから、新しいストレージへリストアするとか、データを移行するなどで、そのバックアップやリカバリ、データ移行に数日かかるようなヤツ。しかも、ゴールデンウィークとかの期間限定の作業。要は、その長期連休内で終わらなかったら泣いてもダメなヤツ。昔のコマンドって、ホントにセンスというか他人様に向かって失礼なシステムが多くて、バックアップしている最中とか残り時間なんてものは勿論でなくて、そもそもなにも出力されないようなコマンドがあるの。あれひどいよね。ディスクがアクセスされてるからきっと動いてるだろうとか、ps -ef したら出てくるし、topでも常に上にあるからきっと動作しているだろう、みたいに「だろう」でしか物事片付けられないくせに、それでいてそのコマンドの終了に 12時間とかかかるヤツ。真っ黒な画面見ながらの 12時間の緊張感ってハンパないわ。11時間半くらいでエラー出たらどうしようとか。精神的に追い詰められすぎるので、マジで、長期間にわたるコマンドを実装するような人は、ちゃんとプログレス表示して欲しいです。おっさんからの切ないお願いです。ホントにお願いします。普段は -q とかつけたら表示しない、とかにします。後生だからお願いします。
ということで、失敗すると遠くの国へそのまま逃げ込みたくなるような作業を良くやっているわけですよ、運用者たちは。こわいでしょ。こわかったです。だから、もう二度と運用やらないって決めたんです。というかね「システムを安定稼働させるため」の予防保守なのに、その予防保守作業のためにシステムが動かなくなる可能性があるわけですよ、怖すぎない?
だから、システムのメンテナンスとか、臨時メンテとかは、裏ではみんなそんな戦々恐々としながら作業をしているので、優しく見守っていてあげてください。