クラウドでの障害実例から見るトラブルの予防策

最近はクラウドを利用する企業が増えています。クラウドを利用することで費用削減が見込めたり、管理も簡単になったりするケースが多々あります。

ただ、クラウドを利用すると障害が発生し、業務にトラブルが波及してしまうことも。クラウドを利用するのであれば、障害などのトラブルが発生することもを認識しておかなければなりません。

それでは具体的にどのようなトラブルが発生する可能性があるのでしょうか。実際にクラウドを利用している企業で起こったトラブルをご紹介し、それを踏まえた予防策についても解説をします。

クラウドに起因するトラブル事例

クラウドに起因するトラブルにはどのようなものがあるのでしょうか。実例がなければイメージしにくい部分もあるでしょう。以下ではクラウドに起因するトラブルの中でも、特に注目してもらいたいものを4種類ご紹介します。これらの実例を踏まえてクラウドに対してどのような対策を持つべきかを考えていきましょう。

ストレージ障害により保存データが消失

クラウドの障害でも特に影響が大きいものがストレージ障害です。場合によっては業務に必要なデータが消失してしまうこともあります。以下では実際にストレージに保存されているデータが消失した例をご紹介します。

トラブルの概要

クラウドの一つであるAWSにて、ストレージサービスのS3に障害が発生しました。エンジニアの操作ミスという人的障害でしたが、この影響で格納されているデータの一部が消失し復旧不可となりました。

AWSのS3はストレージの中でも高い堅牢性をアピールしているものです。そのため、S3を信じてデータの大半をクラウドで管理しているような企業もありました。しかし、理論的にはほぼ安全なクラウドも、人的ミスによって安全性が失われてしまったのです。このトラブルは人的ミスが引き起こしたものであり、これに起因する障害はゼロにできないことを示す例でもあります。

トラブルから見る予防策

クラウドのストレージも完璧なものではありません。データが消失しないように複数のクラウドやローカルでバックアップを取ることが予防策です。

大半のクラウドでストレージの堅牢性が高いことをアピールしています。上記のAWSが提供するS3であれば、1年間に99.999999999%と示されています。つまり、設計通りに運用されていればストレージに格納されている情報が消失することはほぼ考えられません。

しかし、実際には障害が起こっています。そのため、この値を過信せずに自分でもバックアップを取得することが重要です。バックアップの取得先も同じクラウド環境ではなく、他のクラウドにしたりローカルにしたりするなど分散させることが求められます。同じ環境でのバックアップは全てが一度に消失するリスクがあります。

バックアップを取得することは幅広く理解されているデータの保護方法です。クラウドを利用する場合は、ここから一歩進んで異なる環境でバックアップを取得することを意識しましょう。

ネットワーク障害によりデータの読み書きができず業務がストップ

ネットワーク障害により、クラウドへとアクセスできない障害も発生します。アクセス不能になると対処のしようがないケースが大半です。特にデータがクラウドに格納されている場合、読み書きができないことで業務がストップしてしまいます。以下ではクラウドへアクセスできなくなったことで、データの読み書きができなくなった例をご紹介します。

トラブルの概要

ネットワーク障害によりクラウドへとアクセスができなくなりました。その結果、アプリケーションにもデータベースにもアクセスできなくなり、データの読み書きが不可能となりました。そのことが原因で業務が完全にストップした例です。

こちらの障害はローカル側のネットワーク障害でクラウドへアクセスできなくなったことが原因です。クラウドのネットワーク障害が発生することもありますので、どちらにもリスクがあると考えるべきです。ただ、ローカル側のネットワーク障害が発生していますので、自分の管轄範囲内では可能な限り対策をしておくことが理想的です。

トラブルから見る予防策

ネットワーク障害が発生することは容易に考えられることです。そのため、ネットワーク障害が起こらないように冗長化するなどの対策が必要です。一つのネットワークに障害が起きたとしても、他のネットワークでカバーできるようにすることが予防策です。

ただ、ネットワーク障害はクラウド側で発生することもあります。また、ネットワーク障害に備えて冗長化することは簡単にできることではありません。そのため、他の予防策も必要とされます。

その予防策として採用しやすいものは、クラウドを利用せずに紙媒体にて業務を継続できるようにすることです。何かしら入力するものがあるのであれば、フォーマットを紙に印刷しておくことで業務が継続できる可能性があります。また、クラウドとは遮断されたローカルに緊急用のアプリケーションを用意しておく予防策も考えられます。

クラウドへの不正アクセス

インターネットに接続されているシステムは不正アクセスの被害に遭う可能性があります。クラウドはセキュリティの高いものが多いですが、それでも被害にあってしまうことがありえます。以下では不正アクセスが原因となり、情報漏えいの可能性が指摘された例をご紹介します。

トラブルの概要

クラウドでは様々なセキュリティ対策が提供されていますので、初心者でも簡単に高いセキュリティが手に入るようになっています。しかしこの例では、設定が必要なセキュリティ対策に不備がありました。その点を突かれて外部からの攻撃を受けたことが障害に繋がった例です。

インターネットに繋がっているシステムでセキュリティ対策をすることは当たり前の時代です。ここに問題があると、社会的にバッシングを受けることも多々あります。しかし、この例では対策自体に不備があったことが障害に繋がっています。幸い個人情報の流出などにつながるものではありませんでしたが、場合によっては社会的にも大きな問題になっていた可能性のある例です。

トラブルから見る予防策

クラウドはセキュリティ対策も完璧だと思われていることもあります。この理解は概ね間違いではなく、個別にサーバなどを用意するよりも、クラウド完了を利用したほうがセキュリティ対策が取られていると考えられます。

ただ、重要なことは完璧なセキュリティ対策は存在しないということです。攻撃をしてくる側と攻撃を防ごうとする側はいたちごっこの状態です。この状況で最善の策を用いてセキュリティ対策をすることが求められています。

ただでさえ完璧なセキュリティ対策は存在していません。それに加えてヒューマンエラーがあると、さらにセキュリティ対策が崩れてしまうこともあります。正しく設定されていれば守れた情報も設定ミスにより攻撃を受けてしまう可能性があります。

この問題の予防策はとにかくセキュリティ対策においてヒューマンエラーを防ぐしかありません。セキュリティ対策に完璧は無いことを理解して、その中でも最善の策を尽くせるように人員などを用意するのです。ダブルチェックなどを活用し、ヒューマンエラーを可能な限り防ぐことが予防策です。

AWSの大規模障害により各種SaaSが停止

AWSの大規模障害が発生したことで、AWSを基盤に利用しているSaaSが停止しました。利用者からはAWSを利用しているか判断できない状況が多々ありました。そのため、単純にシステム障害であると思われていることも多かったようです。

こちらはAWSが社会的に普及してきた中で起こったものです。同じような障害が起こると、再度社会的に影響を与える可能性があります。

トラブルの概要

2019年にAWS東京リージョンにおいて排熱設備の故障による障害が発生しました。これによりサーバなどが過熱で強制シャットダウンとなり、AWSを基盤として利用しているサービスが多数停止しました。

社内で利用するツールや有名なスマホアプリなども停止したこともあり、AWSの障害はTwitterなどで一気に広がりました。復旧にも時間を要したことで、社会的に大きな影響を与えた例です。

トラブルから見る予防策

利用者側からすると、SaaSやアプリの基盤がAWSで構築されているかどうかは判断できないものです。自分でAWSが利用されているかどうかを確認するようなこともしないでしょう。

しかし、AWSなど有名なクラウドを利用しているサービスが急に停止することが実際に発生しました。障害が発生しないと考えられていたサービスでも停止してしまったのです。自分で取れる予防策は少ないものですが、こちらも業務にクリティカルな影響を与えるようなものであれば、紙媒体での運用などを予防策として考えておく必要があります。

クラウドでもトラブルが起こると業務にクリティカルな影響が発生

クラウドを利用していてもトラブルが起こる可能性はあります。クラウドだから完璧なサービスであるということではありません。どのようなサービスを利用しても、完璧であるということはあり得ないと考えましょう。

この点を勘違いしていると、クラウドでトラブルが起こった時に、業務にクリティカルな影響が出てしまう可能性があります。場合によってはクラウドが復旧するまで業務が進められないことも考えられます。そのようなことが起こってしまっては、企業としての信頼性に影響してしまうことも考えられます。

社内で完結することもありますが、障害が波及してクライアントに影響を与える可能性もあります。これは信用力の低下につながりかねません。そのような事態は可能な限り避けなければならないのは言うまでもないのです。

クラウドを利用していればとにかく安全であると誤解している人がいます。しかし、クラウドを利用しても障害などか発生することはあります。その点には十分注意をして、ここでご紹介している事例などを踏まえた対策をしておくことが重要です。