Azureで活用するデータ分析を成している基盤

1.はじめに

現代社会において、データ活用サービスの開発競争で、3大クラウドサービスが鎬を削る中、「Microsoft Azure」は幅広いサービスを「Active Directory」によるアクセス制御で使用できるようにするなど、データ分析基盤の拡充に力を入れています。
今回はそんな「Azure」におけるデータ活用の分析と基盤について展開しました。

2.データ活用

1.分析ソリューションの利点

「Azure Analytics」と呼ばれるエンタープライズ規模で革新的かつ安全な分析ソリューションの構築が可能となるサービスを使用することで幅広いデータ資産を最大限活用することができます。
使用されているマネージドサービス中には、「Azure Data Lake Storage Gen2」「Data Factory」「Databricks」「zure Synapse Analytics」などがあります。これらを使用することで、「BI」レポート作成、高度な分析、リアルタイム分析のソリューションを簡単にデプロイできます。

2.分析サービス

以下は「分析サービス」で使用されているモノになります。

  • Azure Synapse Analytics
  • パフォーマンスと安全性に優れ、グローバル利用が可能となったクラウドデータウェアハウスとなります。また、最新の「Azure SQL Data Warehouse」を使用しているため、ペタバイト規模でリレーショナルデータと非リレーショナルデータの両方をクエリすることができます。

  • Power BI
  • マイクロソフトが提供しているセルフサービスBI(ビジネス・インテリジェンス)ツールです。その機能は「各種データの抽出、変換、統合などの処理の実行と作成」「視覚化されたレポートの作成」「作成したレポートを組織内で共有」「作成したレポートを定期的に更新する」ことができ、これら機能をノンプログラミングで実行することが可能です。

  • Azure Data Lake Storage
  • 単一のストレージプラットフォームでデータサイロを解消してデータ分析基盤の構築、階層型ストレージとポリシー管理のもと、コストの最適化を実現しています。「Azure Active Directory」とロールベースのアクセス制御を使用してデータの認証を行います。またデータ保存時の暗号化や脅威からの保護などのセキュリティ機能を有しています。

  • Azure Data Factory
  • SQLデータベースやファイルシステムなど、多様なデータソースからデータを取得し、クレンジングをしてからデータストアに格納するデータの移動と変換を「自動化」するデータ統合サービスになります。

  • Azure Databricks
  • クラウドサービスプラットフォームに最適化された「Apache Spark」ベースの分析サービスになります。主に「分析ワークフロー」の場面で使用され、「Azure Data Lake Storage」などのデータソースから、当分析サービスを使用してデータを読みとってそのデータをコラボレーション対応の「Apache Spark」で変換して、重要な分析情報が得られます。

  • Azure Machine Learning
  • 多様なまでのアルゴリズムライブラリを利用して、予測ソリューションを迅速にデプロイすることができるサービスになります。またコーディング作業を行わないユーザーでも扱えることが特徴で、Webブラウザ上で学習データや分析の手法をドラッグ&ドロップするだけで機械学習モデルの作成が可能です。

  • Azure Data Share
  • あらゆる形式、データサイズを問わず、他の組織とデータの共有を簡単に行えます。共有するデータ、それを受信する先、使用条件などの制御もでき、使いやすいインターフェイスを使用してデータ共有の関係性の可視化もできます。

3.データ分析基盤と情報基盤を整えていくには

1.Power BIを活用

Microsoftが提供している「Power BI」は「BI(ビジネス・インテリジェンス)」ツールであり、データ収集、集計、整形、表現、配信などを実施するためのクラウドツールです。
利用するにあたって多くの場合が、「データ活用」に取り組みますが、「費用が高い」や「操作が難しい」などの理由から使わなくなっていくこともあります。しかし、Microsoftが提供している「Power BI」は、そのような理由とは裏腹に無料で始めることができ、以降の継続費は手軽ゆえに操作も簡単です。これが評価され、2019年2月に発表されたBI分野の調査レポートでは、「Power BI」がBI専門ベンダーの製品と並ぶ結果となりました。
また「Power BI」は、万人が扱いなれている「Excel」のような操作性で設計されています。普段から慣れ親しんでいる操作性であれば、作業時に生じるもたつきもなくスムーズに操作することができます。

2.Microsoftサービスの「中核」

「BIツール」を活用していけば、おのずと「今以上にデータを活用していきたい」という要望に行きつきます。そのためには「データソース」を増設していく作業が必要となります。増設することでデータソースが多様化することで分析のためのデータ準備が課題となってきます。この課題に直面すればビジネス上求められる速さでの可視化が難しく、リアルタイムでの経営・事業戦略、意思決定を阻害しかねません。この課題解決で欠かせないのが、Microsoftが提供している「Azure Data Factory」の存在が欠かせません。
「Azure Data Factory」とは、「ETLツール」の一種であり、「Extract(抽出)」「Transform(変換)」「Load(読み込み)」というデータ活用には欠かせないプロセスを自動化するツールになります。また、あらゆるシステムやサービスに散在するデータを統合し、データ活用を促進しますので、いわば、「Power BI」のためにデータを収集してくれる「分析の基盤」ともいえます。

3.「Azure Data Factory」の利点

「Azure Data Factory」を使用する利点は、何も「Power BI」のためだけではありません。営業・マーケティングツールとして使用する「Salesforce」や「Marketo」のほか、AWSやGoogle Cloudなどの外部クラウドプラットフォームなど多様なソースからデータを統合する中核の存在でありながら、それらをデータ分析が可能な状態へと自動変換作業を行います。
一般的なBIツール換気用においては、分析の対象となるデータを一度読み込んでから、ツールが分析しやすいように「加工する」ひと手間が必要となります。しかし、「Azure Data Factory」がある環境では、あらゆる媒体のデータを取り込み保管して、データが更新された状態で「Power BI」を通してリアルタイムでの分析を行います。

4.まとめ

データをうまく活用していくには、状況や用途に合わせて形式や着眼点を変化させる必要性があります。この現代を生きる企業が求めるのは、そのような変化に対応しつつ迅速な分析と処理を行う情報基盤です。その基盤の中核を担うにふさわしいのが「Azure Data Factory」であり、情報分析に長けた「Power BI」なのです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です