限りなくゼロに近いダウンタイムを目指す

 インターネットの普及により、企業の基幹システムやECサイトなど24時間365日休みなく稼働するシステムが求められ、多くのシステム稼働率99.99%や99.999%といった高可用性が求められている。利用するユーザーからすれば、システムはいつでも稼働しているのが当たり前と思うのは当然だろう。

 身近なところで考えると、新聞やテレビで話題となっている金融機関のATMの停止や、24時間×365日利用できるショッピングサイト、航空会社の予約システムなど、これらシステムにトラブルが発生すれば、利用しているユーザーに影響を及ぼすだけでは済まされない。受注システムが止まったとしたら、失われる利益は1秒あたり数千万円ということもありえるだろう。

 おそらく損害は、直接的なものだけにとどまらず、停止するたびにメディアに大きく取り上げられ、マスコミ各社はその企業のリスクへの不備を興味本位に書き立てる。その結果、企業信用の失墜は金額では計り知れないものになる。たった一度のトラブルで企業の存続さえも左右されてしまうこともあるのだ。

 人間というのは、一度感じた印象をいつまでも持ち続ける。印象を変えることは容易なことではない。システム利用時にたまたまシステムにトラブルが起きたら、その一回で印象が決まってしまう。オンラインでサービス提供している企業や担当者は、「たまたま」とか、「たった一回のトラブル」などとの言い訳では済まされないことを覚悟しなければならない。

なんかふつーに「99.99%」とか「99.999%」とかって数字が並んでますけど、それを維持することが如何に大変かが判らない限り、エンジニアはおろか、運用オペレーターさんたちの地位向上ってありえないんだろうなぁと、思ってみたり。