ネットワーク上で課題とされることの多い大容量データ移行でソリューションとなる「Azure Data Box Disk」とは?

はじめに

今回は「クラウドファースト」と言われるように多くのシステムがクラウド化を遂げて仮想環境上で運用されるようになっている中、少々異色とも言える「Azure Data Box Disk」を含めた「Azure Data Box」というサービスについて詳しく紹介していきます。

名称に「Azure(アジュール)」と付いていることからわかるようにMicrosoft Azureのサービスの一部ではありますが、このサービスはクラウドの常識を覆すようにアナログな手法が採られる仕組みとなっています。しかし敢えてそのような仕組みとなっていることには確固たる理由があります。

クラウドサービスやMicrosoft Azureについて学習している方や現在オンプレミス環境からクラウドへの移行を検討している方、「Azure Data Box」の存在については知っているもののさらに掘り下げたいと思っている方はぜひご覧ください。

Microsoft Azureの概要

AmazonのAWS(Amazon Web Services)やGoogleのGCP(Google Cloud Platform、現在のGoogle Cloud)にやや遅れてクラウドサービスとして2010年に提供が開始されたMicrosoft Azureですが、「Synergy Research GroupとCanalys」という調査会社による2023年第1四半期の調べによると世界的なクラウドサービスのシェア率はAWSに次いで単独2位となっています(3位がGCPで以降は各社が続く)。また2023年においてはAWSのシェア率が32%に対してMicrosoft Azureが23%と、これまで10%以上あった差が少しずつ縮まる傾向もあります。

シェア率の上位を占める3社は例えば仮想マシンやデータベースシステム、コンテナシステム等それぞれに似た用途を持ったサービスを展開していますが、Microsoftは自社に同等のサービスがない場合はミート戦略のようにすかさず開発を進めてリリースしています。このように優れた技術を積極的に自社サービスに取り入れる姿勢や、2023年6月1日にリリースされた「Azure OpenAI Service(自然言語処理技術が搭載されたサービス)」に現れているように、他社サービスとの連携も臆さず行いAzureが活用できる分野を広げるという動きがシェア率の成長させている理由となっていると言えます。

Microsoft Azureのサービス形態について

クラウドサービスには一般的に、システムを稼働させたままでのスペックアップやサーバー増設といった柔軟なスケーリング、独自の従量課金システムやマネージド・フルマネージドなサービスを提供することによるコスト削減やエンジニアの負荷軽減、開発のスピードアップ、セキュリティ機能の充実といったメリットがあります。もちろんAzureを利用することでもこれらのメリットを享受できますが、それとは別に独自の特徴も持ち合わせているため今回はそちらに着目して紹介します。

なおクラウドサービスには主にIaaS(Infrastructure as a Service)、PaaS(Platform as a Service)、SaaS(Software as a Service)と呼ばれるサービス形態があり、それぞれユーザー側の管理・責任範囲、仕様が異なります。このうちAzureで提供されているサービスはIaaSとPaaSとなります。突き詰めるとさらに細かくBaaS、CaaS、DaaSのように「○aaS」という名称で表すことができるものの(「○」の部分に入るアルファベットが同じでも正式名称が異なる場合もある)、通常そこまで細かく意識する必要はなくIaaS、PaaS、SaaSの3つのみを抑えておけば問題ないです。

IaaSとはクラウド上でインフラ環境そのものをユーザー側で構築・管理できるサービスのことを表し、Azureでは「Azure Virtual Machines」「Azure AKS(Kubernetes Service)」「Azure Disk Storage」等が該当サービスとなります。

PaaSは開発やデプロイを行う環境(プラットフォーム)を提供しているサービスであり、OSのインストールやサーバー・ネットワークの基本的な設定を省略することで本来の作業に専念できるようになります。AzureにおけるPaaSサービスとしては「Azure App Service」「Azure SQL Database」「Azure Functions」等が該当します。

Microsoft Azureの特徴

1つ目の特徴はMicrosoft Azureのサービスのみで様々な分野の開発が可能という点です。Azureには仮想マシンやストレージ、データベース、DNS、VPN、ファイアウォールといった基本的なサービスが一式揃っています。しかしそれだけではなく、機械学習プラットフォームの「Azure Machine Learning」、プログラミング言語の知識を持たずともAIシステムの開発が可能な「Machine Learning Studio(クラシック)」、データ分析のために収集した様々なデータを扱いやすいように整形する「Azure DataFactory」、IoT管理システムを構築できる「Azure IoT」のように2023年時点で比較的新しい技術とされている分野の開発が行えるサービスも提供されています。

2つ目の特徴は無料枠が設けられているという点です。Azureのサービスは基本的に従量課金制ですが、代表的なサービスにおいては12ヶ月の無料枠がある他、Azureアカウントを作成した際に200ドルのクレジット(30日間利用可能)が付与されます。クレジットを使い切るか30日経過後もサービスを継続したい場合は従量課金にて引き続き利用できます。Azureアカウントの作成自体も無料で行えます。さらに55のサービスにおいては常時無料で利用できます。なおこれら対象のサービスに関してはAzure公式サイト内の「Azure の無料アカウントを使ってクラウドで構築」というページに掲載されているため、アカウントを作成した際にぜひ合わせてご覧ください。

以上のような無料枠があるため、テストやお試し程度であれば特にコストを掛けることなく利用できる可能性があります。AWSやGCPにも同じように無料枠がありますがそれぞれ内容が異なるため、サービスの選定段階であればコスト削減のためにも十分に比較しておくことをおすすめします。

3つ目は料金関連のサポートが充実しているということが挙げられます。従量課金制のサービスは実際に使った分だけ支払えば良いためコスト削減をしながらの運用をしやすく、Azureのサービスに関してはリソースを無駄に確保して費用をかけないよう自動でスケールダウンしてくれるという仕組みもあります。しかしコストが動的となるため組織として予算が立てづらいという課題が発生します。

この問題へのソリューションとして、Azureでは料金計算ツール、TCO(Total Cost of Ownership)計算ツールが提供されています。料金計算ツールは利用したいサービスや台数、容量等を選択することで簡単な見積もりが出せます。一方のTCO計算ツールは光熱費、人件費等を含め将来の利用料を想定したうえで見積もりを出してくれます。これらを必要に応じて使い分けることで組織でのクラウド利用がより安易にできるようになることでしょう。

またAzureでは「節約プラン」という割引サービスが設けられています。1年または3年のコンピューティングサービス利用をあらかじめ予約しておくことで、最大65%程のコスト削減が可能となります。なお契約期間が1年か3年かによって料金が異なります。仮にこのプランで契約したにもかかわらず、従量課金制で計算すると利用料がその料金にも及ばないということがあった場合も低い方の料金にて請求されるため安心です。節約プランはレンタル型のサーバーの年払いに似ているところがありますが、臨機応変に低い方の料金を請求金額としてくれる点では異なると言えます。

4つ目の特徴はMicrosoft製品との相性が良いという点です。AzureはMicrosoftが開発したクラウドサービスとなるため、オンプレミスのWindows ServerやOffice365、SharePointといった企業で幅広く利用されているMicrosoftのソフトウェアとの連携や移行において他のサービスより不都合が発生しづらいです。さらに専用回線やWAN回線を利用した帯域保証型ネットワークサービス「Azure ExpressRoute」や各種環境の統合管理サービス「Azure Arc」を利用することで、クラウドに移行せずともAzureとオンプレミス環境が混在したハイブリッドクラウド(もしくはマルチクラウド)でのシステム運用も可能となります。

Microsoft製品との相性が良いとは言っても、Azure上ではWindowsしか利用できないわけではなくオープンソースのLinuxOSや付随するライブラリやフレームワークも利用できます。代表的なデータベースであるOracleデータベース、MySQL、PostgreSQL等が利用できる他、プログラミング言語としては.NET、PHP、Java、Node.js、Python、Ruby等を使った開発も可能です。

最後に紹介する独自の特徴は、Microsoftの保有する強力なバックボーンネットワークを利用できるという点です。Microsoftの拠点は世界中にあり、拠点間は専用のバックボーンネットワークで接続されています。ユーザーはAzureを利用することで、全54か所のリージョンから希望の場所を選択してこのMicrosoftの巨大なネットワークを利用しながらシステムの運用をすることができることとなります。なおAzureはアメリカ法人でありながら日本の法律が適用されるサービス仕様となっていて、裁判管轄も東京地方裁判所となっています。そのため企業の法務においてAzureで開発したサービスの利用規約を海外用に作り直す必要はなく、もし裁判が必要な事態が発生したとしても海外の法律に当てはめて考える必要がありません。

Azureのデメリットを一つだけ挙げるとすると、学習コストが発生するということが言えます。AWSやGCPも同様ですがクラウドサービスは独自の仕様や管理方法があり、その仕様を理解するまでには時間を要します。一度習得してしまえば同じものを利用する限り問題ないですが、これまでオンプレミスで運用管理していた知識だけでは対応するのが難しいと言えるでしょう。クラウドサービスはプログラミング言語やインフラに関して深い知識がなくても利用できる便利なサービスである反面、クラウド独自の仕様については正しく理解しておく必要があります。

このことはセキュリティリスクにも繋がり、クラウドで発生するセキュリティインシデントのほとんどが人的な設定ミスと言われています。特に知識の浅いエンジニア・開発者がリスクに遭遇する可能性が高いのは容易に想像がつくと思いますが、ITシステムを運用したことがある人であっても正しく仕様を把握していなかったために設定が行き届いていなかった、設定が解除されていた・有効になっていなかったという状況にもなりかねないため十分な注意が必要です。

Azure Data Boxについて

Azure Data Boxに関しては冒頭でアナログなサービスであることを述べていました。これはクラウドやネットワークといった仮想環境上だけで完結するサービスではなく、実際に物理的なディスクの受け渡しが発生するためです。クラウドとしては稀な形態を採るサービスですが、Azure Data Boxと似たサービスはAWSに「AWS Snowball」として、GCPに「Google Transfer Appliance」としてそれぞれ存在します。

なぜせっかくネットワーク上で完結するクラウドという便利なサービスがあるにもかかわらずディスクの配送というアナログな手法を採るのかというと、大容量データ移行作業の効率化やコスト削減を実現するためです。一見クラウド化と矛盾しているように思えますが、実際に一般的なネットワーク回線を利用してTB単位のデータを一括で移行しようとするとそれなりに時間を要します。時間がかかるだけであればまだ良いですが、帯域の多くを占めてしまうことで同ネットワークを利用しているその他サービスに影響を与えてしまう可能性があります。さらに使用量に対して課金が発生するクラウドサービスにおいては多大なコストが発生することもあります。また帯域が限られている環境下において、数十TBのデータを移行しようとすると数ヶ月かかってしまうこともあります。

Azure Data Box DiskをはじめとするAzure Data Boxはディスクの配送やデータの保存、Azure側への送り返し作業が発生するため完了までに2週間程度は見込んでおく必要はありますが、それでも大容量データの取り扱いにおいては、この方法を取った方がより確実で早く完了する可能性があります。ディスクの発注はAzure portalから可能となっており、ログインしてData Boxディスクの注文を作成し発送を待ちます。

Azureの提供リージョンであればどこでも利用可能ですが、配送先と同じ国・地域内での利用に限ります(欧州連合域内は例外)。もし別のリージョンへ移行させたい場合は、一度Azure Import/Exportサービスを利用して別のリージョンのデータセンターに発送することとなります。もしくは移行元の国でディスクを発注してデータをコピー後に同国のデータセンターに返送すると同国のストレージアカウントにアップロードされるため、AzCopy等のツールを利用して別のストレージアカウントへコピーすることとなります。なお料金についてはAzure Data Boxのタイプによって異なるため次に詳しく紹介します。

Azure Data Boxのタイプを紹介

タイプは3種類ありますが、2023年時点で日本で発注可能なのは「Azure Data Box Disk」「Azure Data Box」の2種類です。「Azure Data Box Disk」はUSB/SATAインターフェースで128ビット暗号化が適用されたSSDが採用されており1枚当たり7TBが利用可能、一回の注文で最大5枚(35TB)まで発注が可能となっています。

「Azure Data Box」は標準のNASプロトコルと一般的なコピーツールが使用されていてAES256ビットの暗号化が適用されているタイプで、一回の注文で最大80TBまで使用可能となっています。なお現在日本で発注ができない「Azure Data Heavy」というタイプはこれらの上位プランとなります。「Azure Data Heavy」では最大800TBまでのデータ保存が可能となっているのでAzure Data Box DiskやAzure Data Boxで収まらない場合はAzure Data Heavyが適していますが、日本では発注ができないので現状は複数回の発注を行う必要があります。以上で紹介している各タイプの容量はあくまで実際に利用可能な容量であり、各タイプで表記されている容量は例えば「Azure Data Box Disk」で40TB、「Azure Data Box」で100TBといったようにこれより大きい内容となっている点にご注意ください。

また以上3タイプとは仕組みが異なるものとして「Data Box Gateway」もあり、AzureではこちらもAzure Data Boxの一種としています。「Data Box Gateway」は従来のクラウドサービスのようにNFSおよびSMBプロトコルを使用してオンラインで利用する仕組みとなっています。仮想デバイスにおいてシームレスで継続的なデータ移行を可能とします。

料金はその他Azureサービス同様に従量課金制で、各タイプに設定された単位日数ごとの料金を使用した日数分支払うこととなります。なお延長した場合はその分の料金がプラスされ、ディスクの配送料はユーザー側が負担します。西日本・東日本と日本では2リージョンで提供されているAzure Data Box Diskにおいて、2023年7月時点の料金は注文処理料金としておよそ「7,227円」、1日あたりのディスク使用料が1日当たりおよそ「1,445円」、標準送料がおよそ「5,059円」となっていました。料金は変動する可能性もあるので、実際に利用する直前にAzure公式サイトで確認し、オンラインで実施する場合と比較したうえでメリットがある場合に申し込みを行うようにしましょう。

ユースケースを紹介

ここまで概要を紹介してきましたが、わざわざオフラインで利用するメリットについてまだイメージが湧かないという方もいると思われるのでユースケースを紹介します。

一つはオンプレミスからAzureへのシステム移行におけるデータ転送です。オンプレミスで運用していた期間が長ければ長い程多くのデータが保存されていると思いますが、これら大量データを一括で転送する際にData Box Diskは適していると言えます。もちろんData Box Diskで初期一括転送後にネットワーク経由で増分のみの転送を行うことも可能です。またテープ等の古いメディアにおける大量データをオンラインに保存するために利用する、大容量となったVMファームやSQL Server、アプリケーションの移行、長期運用で大容量となったバックアップデータのクラウドへの移行といったユースケースも考えられます。運用自体はオンプレミスのままであるものの、「Azure Synapse Analytics」等のAzureで提供されている分析ツールを利用するために様々なデータを定期的に転送するというユースケースも考えられます。SharePoint Online、Azure File Sync、Azure Backup、HDFS ストアといったサービスとの連携もユースケースの一つです。

Azure Data Box利用の流れ

今回は「Azure Data Box Disk」を利用する流れを紹介します。全てAzure Portal内からの操作のみで完了しますが、あらかじめ有効なAzureサブスクリプション(Azureサービスを一元管理する単位)の準備とそのサブスクリプションに含まれるリソースグループの作成、ストレージアカウント(ストレージの管理単位)またはマネージドディスクを用意しておきましょう。

Azure Portal内の検索欄に「Azure Data Box」と入力し、表示されたら選択します。画面上に表示された「+作成」もしくは「Azure Data Boxの作成」をクリックして注文を開始しましょう。転送の種類(インポート・エクスポート)、サブスクリプション(利用するサブスクリプション)、リソースグループ(利用するリソースグループ)、リソースの国/リージョン(転送元データがあるリージョン)、宛先Azureリージョン(データの転送先となるリージョン)をそれぞれ選択し、Azure Data Box Disk、Azure Data Box、Azure Data Box Heavyのタイプから選択できる画面となるので「Azure Data Box Disk」を選択してください。

次からは注文に関する設定画面となります。「基本」画面でAzure Portalや注文伝票に記載される注文名やディスクの枚数、Azure Data Box Diskにかかったロックを解除するキーを指定します。特に指定しない場合は自動生成されるのでご安心ください。

「データの格納先」タブで格納先をストレージアカウントにするかマネージドディスクにするかを選択します。いずれを選択した場合も「大きいファイルの共有を有効化(推奨)」を有効化できるようになるので必要に応じて有効化しましょう。有効にすると容量が最大100TBとなりますが元のサイズに戻すことはできない点にご注意ください。

続いて「セキュリティ」画面に移り暗号化について設定しますが、特に自分で任意に設定する必要がなければ設定の変更は行わずにAzureの自動生成に任せても問題ありません。

次の「連絡先の詳細」画面では発送方法や配送先住所、通知先のメールアドレスを設定します。Azure Data Boxは発送の管理をQuantam Solution社、運用を日本郵便で行うように設定(Microsoftマネージド)されていますが、「セルフマネージド」を選択すると管理を自分にして配送業者も自身で指定することが可能となります。配送先には実際に配送して欲しい住所情報を設定し、メールアドレスには注文処理、発送、データコピーのタイミングで通知を受け取りたいメールアドレスを最大10個まで設定しましょう。なお、Azure Portalでも進捗確認は可能です。

次の「タグ」画面ではタグを使ってリソース管理をしたい場合にのみ名前、値を設定しましょう。最後に「確認と注文」画面にて選択・入力内容に問題ないかを確認し、プライバシー条項への同意を済ませたら「Order」(あるいは「順序」)ボタンで注文を完了しましょう。Azure PortalのData Box画面やメールの通知で注文状態にあることが確認できたら成功です。

まとめ

クラウドサービスで利用するストレージはあまり容量を気にすることなく利用できる等、システムを運用する上でディスク容量に囚われることは少なくなってきました。しかしながら、大容量のデータをネットワーク経由で移行するとなると帯域の不足やその他サービスへの影響、コスト面において懸念する部分があり、場合によっては断念せざるを得ないこともあります。そのような中で提供されているのが、今回紹介したAzure Data Box Diskのようなディスクの配送・データのコピーサービスです。クラウドサービスの中では異色とも言えますが効率的、かつ確実にデータ移行を行うためには非常に秀逸なサービスです。オンプレミスからクラウドへの移行はもちろん、古くなったメディアに残された大量データの保存を検討している場合は、ぜひ今回の記事をきっかけにAzure Data Box Diskを利用してみてはいかがでしょうか。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です