Azureを利用して大丈夫!?Azureの過去のトラブルを解説

Azureとトラブル

はじめに

WEBサービス開発をはじめとしてあらゆる場面においてクラウドインフラが利用されているという状況から、クラウドインフラは今や世界中で普及していると断言することが可能です。ここまで市場が活発になっている以上、クラウドインフラの知識が何もないという状況は、現代社会で生き抜くにあたってはあまりにも厳しい状況と言わざるを得ないでしょう。

クラウドサービスは敷居の高いものではなく、むしろ私たちの身近に存在するものでもあり決して利用のハードルが高いものではありません。企業としても、個人としても利用可能な手軽さを持ち合わせています。AWSやAzureに代表されるクラウドサービスに至ってはその参入のしやすさから、エンジニア界隈における一般教養であると言う位置付けにもなっています。

今現在、実務で使う機会がない人であってもクラウドインフラというものは学習しておく価値のある、むしろ学習しなければならないものと言うことになります。

もちろん、クラウドサービスというものはサーバを自前で用意するものではありません。よく分からずにクラウドサービスに手を出して色々使っていたものの、サービスが終了してしまったり、サーバがダウンしたりして自分が利用していたサービスの供給がストップしてしまうといった事態になってしまっては元も子もありません。それゆえ手を出すのを躊躇う人もいると思います。サーバダウンを恐れ手を出せないといった懸念もあるでしょう。

しかしながらこういった懸念は事前に正しく知識を身につけておきさえすれば解消できるものです。

本記事では、Azureで今までに発生したトラブルに着目し、Azureを使用するに当たってトラブルにぶつかったときにどのように対応すれば良いのか、どんな方法で事前に対策すれば良いのかを、記事を読んだみなさんが自主的に考えていただけるようなヒントにできるようにしてまとめます。

Azureのトラブルについて色々と調べるために時間を要するよりも、みなさんにはAzureの利用に時間を使っていただき、またこれからAzureを始めようと考えている皆さんがより不安に感じることなく安心してAzureをはじめていただきたいと思います。ぜひ、本記事を活かしていただき、Azureについて考えていただきたいと思います。

そもそも Azure とは何?

“Azure” とは、マイクロソフトが提供しているクラウドサービスであり、主にさまざまな開発者向けのサービスを中心に提供しています。代表的なクラウドサービスは世の中に色々ありますが、例えば代表的な他のサービスには“AWS”などが存在します。

「クラウドサービス」といっても様々な種類があり、一般的にイメージされるような仮想マシン、サーバだけではなく、「認証管理」、「IoT」、さらには、「機械学習」、「災害対策」などの多種多様なサービスがあり、今現在もサービスの種類は増え続けています。サービスといっても、数人程度のユーザーを想定した小規模のものから、何百万人ものアクセスが想定される大規模サービスまでをも対応しており、ユーザーの幅広いニーズに応えることができるようになっています。

Azureでは特に、ビジネス上の課題に対する対応に強く、サービスもさらに拡大を続けています。

クラウドインフラサービスで起こりうるトラブル

Azureに限らず、クラウドインフラサービスを利用するに当たって起こりうるトラブルについての知識がない場合、いざトラブルが起こった場合に対処することができず、復旧に長い時間を要した場合、お客様が離れる原因になったり、コミュニケーションが取れなくなったり、メールが使えなくなったりしてしまうなどの問題になります。事前にしっかり知識を身につけておきましょう。

米国中南部リージョンにおけるデータセンターの冷却トラブルによる障害

日本時間の2018年9月4日、米国中南部リージョンに障害が発生した事件です。

突如障害が発生し、その後24時間以上にわたって復旧しませんでした。その後の調査の結果、荒天によりAzureのデータセンターに問題が発生したと言うものでした。

この日アメリカ、テキサス州南部は大規模な荒天であり、データセンターの電圧が大幅に低下することになりました。そして、データセンターの周辺に落雷したことにより、下がっていた電圧が急激に高電圧に切り替わり、電力システムに異常が発生、その結果、一部停電なども発生したと考えるのが自然でしょう。

落雷によって異常をきたしたデータセンターは、データの冷却システムにも悪影響を及ぼしました。冷却システムが作動しなくなり、オーバーヒート。通常の処理が不可能となり、シャットダウンすることになりました。

この落雷でシャットダウンした冷却機能が機能しなくなったことにより、設備の温度が急激上昇することになりました。

この復旧には長い時間がかかることになります。ロードバランサーであるAzure Software Load Balancer(SLB)の復旧から取り掛かり、ストレージサーバや保存データを復旧させるために尽力することになります。この作業はデータの整合性を保つために乱雑に扱うことはできず、より慎重な作業が求められたことからも、短時間の復旧というわけにはいかなかったのでしょう。

結果として、南米リージョンだけに止まらず、広範囲に渡ったクラウドインフラの障害となったのです。リージョンというものはデータセンターをいくつも抱えているものが基本ではあります。ただ、芋づる式に問題は広がっていくもので、期間も長かったこともあり大規模な問題となってしまいました。

このように、クラウドインフラサービスというものは人為的ミスで発生するというよりは、自然災害的に発生するという性質を持ち合わせており、障害発生の予測が非常に困難であることや、致命的な被害が出たときに復旧に長い時間がかかるという問題もあります。

特に日本は地震が多い土地柄ということもあり、米国中南部リージョンの障害のような事案が発生しないと言い切ることは難しいでしょう。このことから、覚悟してAzureを利用する必要があると考えられるでしょう。

日本のリージョンで1ヶ月に3回も障害が発生するトラブル

2017年の3月8日に東日本リージョンにおいて2時間、ストレージの障害が、

同年3月28日に西日本リージョンにおいて3時間に渡って仮想マシンの障害が、

そして同年3月31日に東日本リージョンにおいて、仮想マシンやストレージなど、Azureの殆どのサービスがダウンするという大規模な障害がそれぞれ発生しました。

これも冷却装置のトラブルによるものだと考えられています。冷却装置が機能しなくなれば、データの整合性を保つためにストレージなどはシャットダウンするのです。

海外の話だけではなく、日本でも起こりうるトラブルであるということから、注意しなければなりませんね。

Azureでトラブルが起きたらマイクロソフトを訴えることはできる?

いくらクラウドサービスを提供していると言えど、サービスを利用した結果それで損害が起きたとなれば利用する側としてもたまったもんじゃありません。

Azureを利用していたのに、Azureにトラブルが発生したおかげでサイトが落ちてしまい、それにより取引やサービスが停止してしまって大損害が発生したら、これはAzureを利用していた側に非はない以上はトラブル発生の原因となったAzureの提供元であるマイクロソフトに全責任があると言い切ることも可能だと考える人も出て当然ではないでしょうか?

特にWEBサービスで得られる利益は500円のようなお小遣い程度ではなく、何万円もの規模になることも想定できます。

そこで、何かトラブルが起きた際にはマイクロソフトに損害賠償を求めて訴えるというのはどうでしょうか?「劣悪なサービスを提供したのだから責任を取れ」と言う気持ちを持つ人もいるとは思いますが実際いかがでしょう?

結論から言うと、マイクロソフトを訴えることは現実的に考えて難しいと言えるでしょう。

Azureの利用規約には以下の通りあります。

10. 保証の免責

(中略)

本アプリケーションを使用することで生じるリスクは、お客様が負うものとします。アプリケーション パブリッシャー、マイクロソフト (マイクロソフトがアプリケーション パブリッシャーではない場合)、本アプリケーションの頒布に利用されるネットワークの無線通信事業者、ならびに、それぞれの関連会社、ベンダー、エージェント、およびサプライヤー (以下「関係当事者」といいます) は、本アプリケーションに基づくかまたは関連する明示的な保証、または条件を一切負いません。本アプリケーションの品質、安全性、快適性、および性能に関するリスクはすべてお客様が負うものとします。本アプリケーションに欠陥があることが証明された場合、お客様は必要なすべての修正または修理の費用をすべて負担するものとします。お客様は、法域や国によっては、本ライセンス条項によって変更することのできないその他の消費者としての権利を有する場合があります。お客様の地域の法令によって認められる限りにおいて、関係当事者は、商品性、特定目的に対する適合性、安全性、快適性、権利侵害の不存在などの黙示の保証または条件については一切責任を負いません。

つまりAzureを利用することで損害が発生したとしても、それは利用者がわかって利用しているということなので責任は自分で負うということです。

Azureを利用する際には利用規約をよく読みましょう。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です