システム管理者として大切にしてきたこと。災害やトラブルに見舞われて思うこと。

私はシステム管理者として10年以上働いています。さる2018年9月4日台風21号によって私の職場も建物の被害やシステムが停止するなど少なからず被害を見舞われました。日頃とは違う緊急時の対応が求められました。折しも数ヶ月先の退職を前に次の方に引き継ぎを開始した直後のことでした。

手前味噌ですが、日頃の心がけとこれまでの経験と知識を活かして役に立つことができたと自分なりに思っています。次もシステム管理者をやるかどうか考え中ですが、私がどういう考え方で取り組んできたか、この機会に記しておきたいと思いました。

「私の場合」という注釈付きで、システム管理者として大切にしてきたことをご紹介します。


[Sponsor]

 

部門を超えて情報のありかを把握する

仕事をする上で自然と知ることになるという方がいいかもしれませんね。知らないと仕事になりません。

私はシステム管理者としてソフトウェアやツールを作成したり、文書を作成したりしてきました。ただ作成するだけではなくて、誰が何の目的でそれを使うのか把握した上で作っていました。それによって、作るものも変わってくるからです。ですので、仕事の特性上、どこにどんな情報があるか、それを誰がどのように使っているか把握している人になのです。

この台風によって一部のシステムが停止したり、スタッフが出勤できなかったり、建物が損傷を受けたりしました。限られたリソースの中で、最大限のパワーを発揮するために事務局は様々な判断を要求されました。システム管理者として持てる情報をフル稼働して代替システム等のアイデアを出し、また現場の指揮にあたることができました。

誰に何を聞いたら分かるか把握する

自分自身が知識を身につけることはもちろん大事ですが、それだけだと限界があります。誰がその道の専門家なのかを、常に意識しています。会社の内外関わらず誰に聞いたらいいか、またどのサイトが有益な情報源か、どうやって調べたらいいかということを分かっておく必要があります。

今ある資源の中で何ができるか常に考える

資源つまりハード、ソフト、データ、人がどれだけあって、それを使って何ができるかということを常に考えています。そのうちのどれかが変化した時にどう対応するかということを考えます。

ここに障害が起きたら、あそこに障害がおきたら・・、常に代替案を考えています。新しいシステム導入を検討する時にベンダーさんに「この部分が止まったらどういう対応が考えられますか」と、いの一番に質問して「聞かれると思いました」と笑われたことがあります。システムに関わらず「万一、これがこうなったら・・」という仮定を立てる習慣になってしまいました。

ダブルの対策を考えておく

うまく動いている時に管理するのは誰にでもできることです。トラブルが起きた時にどう動くかで真価が問われます。日頃からここが止まったらこれ、そっちが止まったらこれ、というように仮設を立ててスタンバイしているので、すぐに代替のシステムに切り替えることができます。

例えば最も重要なプリンターが停止したり、不具合があった時のために、予備のプリンターを同じ設定でスタンバイしておいて、底にはキャスターを付けておいて移動式にして別の用途に使用しています。いざとなったら切り替えるだけですので5分以内に置き換えることができるようにしています。また、メインのシステムが停止した時に使用する予備のプログラムを別のサーバに保管しています。

バックアップから復旧できるか考えておく

今のハードが完全になくなってしまっても、バックアップから復旧ができるか、またどのくらいの時間で復旧できるか日頃から考えておくことが重要です。専門業者に相談しておくのもよいでしょう。

現場に必ず足を運ぶ

常に現地に足を運びます。平常時、障害時に関わらず、自分の目で見ることを重要視しています。本当にその現場で必要なことが見ることで実感できるのです。「必要な場所に人を動かす(再配置する)」「機能を追加する」「別のシステムに置き換える」など見ることでアイデアがわくことが多いのです。

現場の人はどういうコンピュータシステムをどう変えれば自分たちの仕事が改善されるか分からないのです。時には自分でツールの機能追加をしたり、ツールを新たに作ったり、専門家へシステム作成や機能追加を依頼したりします。自分が作れるからどう変えられるか思いつくのです。システム管理者は通訳のような仕事でもあります。思い通りに実現して改善できた時には「やった!」という気持ちになります。

リソースを把握して現場とトップへ情報共有する

システム一部停止、スタッフ一部出勤不能、一部建物の損壊が起きました。これらが同時に発生しました。

そこで、自分は各現場へ向かう必要がありましたので、これらの雛形を指示して出来そうな人に集約を依頼しました。

  • スタッフ一覧に出勤情報を書き込んで掲示する
  • 起きている問題(被害状況と対応状況)をリストアップして掲示する

通常は私の上司の仕事ですが出来なかったため、報告は現場にいた私が代行しました。綺麗な書類にする必要はなく、走り書きでもいい。出来るだけ早く、まめに状況を伝えるよう心がけました。

端的に指示をする

緊急時には、部門を超えて状況、目的を伝え、現場へ指示をすることがあります。通常の運用とは違う体制で動いてもらわないといけなかったため、はっきりと分かりやすく伝えることを心がけました。日頃から部門を超えて組織全体の人と関わって仕事をすることが多く、人間関係を良好に築けていたこもありスタッフには快く力を合わせて動いてもらうことができました。システム管理者はパソコン関係などデジタルに関してヘルプを求められることが多く、それに応えることで感謝される仕事でもあります。人のために頑張ってありがとうと言われているうちに、人間関係ができてきたという感じです。

即興でツールを作成することもある

私はExcelやAccessには自信があります。データを取り出して自由自在に集計したり、表や文書の作成ができます。組織内の誰よりも早くできます。パソコンが苦手な人でも使えるツールを作成することもできます。

メインシステムが停止してしまい、台風で一部の重要な機能が停止しましたが、一部のデータベースは参照できたので、Accessを使って帳票出力ツールを1、2時間程で作成しました。ただデータを引っ張ってきて帳票を印刷するというだけのツールですが、これがなければ手で書いて帳票を作成しなければならないもので、大幅な労力軽減になります。時にはそのような即興の対応も必要になります。

もちろんシステム管理者といっても様々で、私のようにExcel、Access、VBを使って集計や帳票作成ツールを製作する人もいれば、もっと専門的な言語を操ってプログラミングができる人、ネットワークやハードに精通している人など得意分野はさまざまです。

ちなみに私の場合はこの他にパソコンの基本的な使い方やWord、PowerPoint、動画加工、音声加工、HTML、PDF、Photoshop、Illustratorを使う仕事が多いです。パソコンに関することは何でも詳しいと思われているので、幅広い知識が求められます。A4一枚ぐらいの紙の文書は、ものにもよりますがほぼ10〜15分程でWordなどでそっくりに作成できます。何かこう書くとシステム管理というよりはパソコンサポートですね。でももちろん、システム導入、運用管理、ネットワーク管理もやりますよ。

自分の作業量と得られる効果を天秤にかけて行うべきか判断する

時間はいくらでもかけられますが、天秤にかけて測れる能力が必要です。先にツールの作成の話を書きましたが、作ったからといってそれなりの効果が予想されないのであれば、むしろ作るべきではありません。かける時間と得られる効果を天秤にかけて、本当にそれをやる価値があるか、優先順位をしっかりと見極めることが必要です。日頃から膨大な業務量をかかえていて、やろうと思えばいくらでも仕事があるから

呼べるだけの専門家を呼ぶ

自分一人だけで何とかしようとして時間をロスしないことです。早めにできるだけ多くの専門家(保守業者など)に連絡する。その上で待ち時間に自分のできることをやります。システムごとに保守に入っているかどうかで、訪問の費用がかかるかどうかは変わっているので、その辺りも把握しておく必要はあります。

ただ、とにかく緊急時は早めの判断をすることです。判断するまでの時間の長さによって復旧までの時間が変わってくることがあります。

連絡先を整理しておく

必ずしも自分がその場所に居るかは分かりません。特に災害時は自分自身が出勤できないということも今後想定されます。どのスタッフでも専門家へ連絡ができるように連絡先リストは分かりやすく整理しておく必要があります。

実は今回の災害でも自分が現場を離れたすきにトラブルが起きました。連絡先は他のスタッフに伝えていたものの、普段使っていなかったため、すぐに思いつきませんでした。これは自戒も込めての話です。

適度な休息をとるのも仕事のうち

疲れすぎると正しい判断ができません。システムの復旧には専門家が夜通し対応にあたってくれました。不安な一夜を明かしたわけですが、実はその夜なかなか眠れませんでした。翌朝システムが復旧しなかった場合、今ある資源で最大限の稼働をさせる必要があります。翌日こそ冴えた頭で考えなくてはいけません。

他のスタッフは横になりませんでしたが、その作業は専門家にしかできないことなのです。見ていても仕方がないと判断して私は眠りました。結局、翌日もシステムが一部停止した状態で業務を開始しました。私は数時間しか眠れなかったものの、なんとか乗り切ることができました。横にならなかったスタッフは朝からウトウトしていました。休むべき時には休む。優先順位を判断することも重要だと思います。

抽象的になってしまいました。残念ながらあまり具体的に書けませんので・・。

これからシステム管理者の仕事に就く方の参考になるかもしれません。そうであれば嬉しく思います。

では、また。

スポンサーサイト

▼現金でギフト券チャージ、初回購入で1,000ポイント!
さらにチャージするたび最大2.5%ポイント貯まります。