連載コラム 第89回:日本で相次ぐシステム障害 ― フェイスブックから学ぶインフラ運用の「訓練」とは ?

昨今、日本を支える大企業において、大規模システム障害が多発しています。復旧に時間がかかることも多く、ニュースで大きく取り上げられることもありますね。「IT 障害をゼロにする」をミッションに掲げている弊社にとっては、心が痛む状況です。

実は、海外企業でもシステムトラブルが多発しています。2021 年 10 月初めにも、米国 Facebook(フェイスブック)社(※ 当時)で、大規模なシステム障害が発生しました。みなさんも、Instagram(インスタグラム)や Messenger(メッセンジャー)などのサービスが利用できなくなったことは、記憶に新しいのではないでしょうか?
しかし、フェイスブックは、短期間(約 6 時間)、かつ、安全にシステム復旧した、と評価されています。
※ 現在は、Meta(メタ)へ社名変更しています。

このような例を端緒として、日本企業と海外企業では、システム障害発生時の対応が「雲泥の差」とも言われています・・・。では、その差とは一体、何でしょうか。本コラムで、フェイスブックの事例を手掛かりにして、その違いを紐解いてみましょう。