データの急激な増加に伴い、組織は、Azureの無限のコンピューティング、ストレージ、分析能力を利用して、データのスケーリング、ストリーミング、予測、および表示を行います。 分析ソリューションによって大量のデータが、レポートや視覚化などの有用なビジネス インテリジェンス (BI) や、機械学習に基づく予測などの独創的な人工知能 (AI) に変わります。
組織がクラウドベースの分析ツールの評価を始めたばかりの場合でも、現在の実装を拡張しようとしている場合でも、Azureには多くのオプションが用意されています。 このワークフローは、一般的なアプローチについて学習し、プロセスとロールをクラウドの考え方に合わせて調整する作業から始まります。
データは、バッチやリアルタイムで、オンプレミスやクラウドで処理できますが、すべての分析ソリューションの目的は、データを大規模に役立てられるようにすることです。 組織が人、マシン、モノのインターネット (IoT) によって生成されるすべてのリレーショナル データと非リレーショナル データに対して、信頼できる単一の情報源を構築する必要性はますます高まっています。 ビッグ データ アーキテクチャまたは IoT アーキテクチャを使用して生データを構造化された形式に変換し、分析データ ストアに移動するのが一般的です。 このストアは、多数の分析情報ソリューションに力を与える信頼できる単一の情報源になります。
アーキテクチャ
このアーキテクチャのVisio ファイルをダウンロードしてください。
上の図は、一般的な基本的/ベースライン分析の実装を示しています。 Azure で構築できる実際のソリューションについては、このセクションで提供される アーキテクチャ を参照してください。
分析のアーキテクチャとガイドを調べる
このセクションの記事には、Azure にデプロイし、運用グレードのソリューションとガイドに拡張できる、完全に開発されたアーキテクチャが含まれています。 これらは、Azure での分析テクノロジの使用方法に関する重要な決定を下すのに役立ちます。 ソリューションのアイデアは、分析の概念実証開発を計画する際に考慮する実装パターンと可能性を示しています。
分析アーキテクチャ ガイド
テクノロジの選択 - これらの記事は、ワークロード要件に最適な分析テクノロジを評価して選択するのに役立ちます。
- 分析とレポート - Azure でのデータ分析と視覚化のオプションを比較します。
- バッチ処理 - ビッグ データ ワークロードのバッチ処理テクノロジを評価します。
- ストリーム処理 - リアルタイム分析のためのストリーム処理テクノロジを比較します。
- 分析データ ストアの選択 - 適切な分析データ ストアの選択に関するガイダンス。
- Microsoft Fabric で分析データ ストアを選択する - Microsoft Fabric でのデータ ストアの選択に関するガイダンス。
Azure データ プラットフォームのディザスター リカバリー - これらの記事では、ディザスター リカバリー戦略を実装するための包括的なガイダンスを提供します。
- 概要 - Azure データ プラットフォームのディザスター リカバリー戦略の概要。
- Architecture - Azure データ プラットフォームでのディザスター リカバリーのアーキテクチャ パターン。
- シナリオの詳細 - ディザスター リカバリーを実装するための詳細なシナリオ。
- 推奨事項 - ディザスター リカバリーに関するベスト プラクティスの推奨事項。
Analytics アーキテクチャ
これらの運用対応アーキテクチャは、デプロイおよびカスタマイズできるエンドツーエンドの分析ソリューションを示しています。
- Microsoft Fabric を使用したエンドツーエンドの分析 - Microsoft Fabric の統合機能を使用して最新の分析プラットフォームを構築します。
- データ ウェアハウスと分析 - 複数のソースからの大量のデータを統合された分析プラットフォームに統合します。
- Microsoft Fabricを使用してエンタープライズ BI ソリューションを設計します - Microsoft Fabricを使用してエンタープライズ ビジネス インテリジェンス ソリューションを設計します。
- ほぼリアルタイムのレイクハウスデータ処理 - ほぼリアルタイムデータレイクハウス処理には、Azure Synapse AnalyticsとAzure Data Lake Storageを使用します。
- MongoDB Atlas から Azure Synapse Analytics へのリアルタイム同期 - MongoDB Atlas データを Azure Synapse Analytics にリアルタイムで同期します。
- Azure Databricks を使用したストリーム処理 - Azure Databricks を使用してエンドツーエンドのストリーム処理パイプラインを作成します。
- Azure Stream Analytics を使用したストリーム処理 - データを取り込み、レコードを関連付け、ローリング平均を計算するストリーム処理パイプラインを構築します。
- 中小企業向けの最新のデータ ウェアハウス - 中小企業向けに設計された最新のデータ ウェアハウス ソリューションを構築します。
分析ソリューションのアイデア
これらのソリューションのアイデアは、実装パターンと探索する可能性を示しています。
- Azure Databricks を使用した取り込み、ETL、およびストリーム処理パイプライン - データレイクへの取り込みを簡略化するために、バッチ データとストリーミング データ用の ETL パイプラインを作成します。
- Azure Databricks を使用した最新の分析アーキテクチャ - 最新のデータ アーキテクチャを使用してデータを収集、処理、分析、視覚化します。
- 中小企業向けの最新のデータ プラットフォーム - Microsoft Fabric と Azure Databricks を使用して、中小企業向けの最新のデータ プラットフォーム アーキテクチャを構築します。
- Azure Data Explorer を使用したリアルタイム分析 - Azure Data Explorer と Azure Service Bus を使用してリアルタイムでデータを分析します。
Azureの分析について学習する
Microsoft Learn では、Azure 分析テクノロジ用の無料のオンライン トレーニング リソースを提供しています。 このプラットフォームでは、特定の製品やサービスのビデオ、チュートリアル、ハンズオン ラボ、およびジョブロール別に整理されたラーニング パスが提供されます。
次のリソースは、Azure での分析の実装に関する基礎知識を提供します。
ロール別のラーニング パス
- データ アナリスト: Microsoft データ分析の概要
- データエンジニア: Azure Databricks を使用してデータ分析ソリューションを実装します
- データ サイエンティスト: Azure Databricks を使用して機械学習ソリューションを構築する
組織の準備
クラウド導入を開始する組織は、クラウド導入を促進するように設計された実証済みのガイダンスに クラウド導入フレームワーク を使用できます。 クラウド規模の分析ガイダンスについては、 クラウド規模の分析に関するページを参照してください。
Azureで分析ソリューションの品質を確保するために、Azure Well-Architected Framework に従うことをお勧めします。 アーキテクチャの卓越性を求める組織に規範的なガイダンスを提供し、コスト最適化されたAzure ソリューションを設計、プロビジョニング、監視する方法について説明します。
Well-Architected Framework の柱に沿ったデータ ワークロード ガイダンスについては、 データ ワークロード用の Azure Well-Architected Framework に関するページを参照してください。
運用へのパス
データ ストアの選択 は、Azure に分析を実装する際の基本的な決定です。 ストレージ アプローチを選択したら、シナリオに適した データ分析テクノロジ を決定できます。
重要な決定ポイントは次のとおりです。
データ ストレージ: データ構造とクエリ パターンに基づいて、データ レイク、データ ウェアハウス、またはレイクハウスのいずれかを選択します。 分析ワークロードを強化するデータベース ソリューションの選択と設計に関するガイダンスについては、「 データベース アーキテクチャの設計」を参照してください。
処理モデル: バッチ処理、ストリーム処理、または組み合わせがワークロードの要件に最も適しているかどうかを判断します。
分析ツール: チームのスキルとビジネス ニーズに合った BI および AI テクノロジを選択します。
分析ソリューションのさまざまなアーキテクチャ スタイルを表示するには、 アーキテクチャを参照してください。
ベスト プラクティス
高品質の分析は、堅牢で信頼性の高いデータから始まります。 最高レベルの情報セキュリティ プラクティスは、データが転送中および保存中に保護されるのを保証するのに役立ちます。 そのデータへのアクセスも信頼されている必要があります。 信頼できるデータとは、設計に次が実装されていることを意味します。
ガバナンス ポリシー - 明確なデータの所有権、分類、アクセス ポリシーを定義します。
ID とアクセス管理 - ロールベースのアクセス制御と最小特権の原則を実装します。
ネットワーク セキュリティ制御 - サービス間のデータ フローを保護し、承認されていないアクセスを防ぎます。
データ保護 - 保存データと転送中のデータを暗号化します。
プラットフォーム レベルでは、次のビッグ データのベスト プラクティスAzureの信頼できる分析に貢献します。
データ インジェストを調整 する - Azure Data Factory や Microsoft Fabric パイプラインでサポートされているようなデータ ワークフローまたはパイプライン ソリューションを使用します。
データのインプレース処理 - 分散データ ストアを使用します。ビッグ データ アプローチでは、大量のデータと幅広い形式をサポートします。
機密データを早期にスクラブ する - データ レイクに格納されないように、インジェスト ワークフローの一部として機密データを削除またはマスクします。
総コストを考慮 する - 必要なコンピューティング ノードのユニットごとのコストと、それらのノードを使用してジョブを完了する分単位のコストとのバランスを取る。
統合データ レイクの作成 - 構造化、半構造化、非構造化のいずれであっても、複数の形式のファイルのストレージを結合します。 Azure Data Lake Storage Gen2 を単一の信頼のソースとして使用します。 たとえば、センター オブ エクセレンスの BI ソリューション アーキテクチャに関するページを参照してください。
分析を最新の状態に保つ
Azure Analytics サービスは、最新のデータの課題に対処するために進化しています。 最新の更新プログラムと計画された機能に関する最新情報を入手します。
Azure製品と機能の最新の更新プログラムを取得します。
次の主要な分析サービスを最新の状態に保ちます。
その他のリソース
Analytics は幅広いカテゴリであり、さまざまなソリューションを対象にしています。 次のリソースは、Azureの詳細を確認するのに役立ちます。
ハイブリッド
組織の大部分は、データがオンプレミスとクラウドの両方でホストされているので、分析に対するハイブリッドのアプローチを必要とします。 多くの場合、組織はオンプレミスのデータ ソリューションをクラウドに拡張します。 これらの環境を接続するには、組織はハイブリッド ネットワーク アーキテクチャを選択する必要があります。
主要なハイブリッド分析シナリオ:
- メインフレームの最新化: メインフレームとミッドレンジ のデータを最新化 する - 従来のデータ ソースを最新の分析プラットフォームと統合します。
- オンプレミス統合: 統合されたハイブリッド操作とマルチクラウド操作 - オンプレミスデータベースをクラウド分析に接続します。
- エッジ分析: エッジでデータを処理し、クラウドで分析情報を集計します。
リアルタイム分析
リアルタイム分析を使用すると、組織は到着したデータに対してアクションを実行できます。 Azureでのリアルタイム分析の開始に役立つリソースを次に示します。
- ビッグ データ アーキテクチャに関するリアルタイム分析 - ストリーミング データを大規模に処理および分析します。
- Azure Data Explorer を使用した IoT 分析 - IoT テレメトリ データをリアルタイムで分析します。
- Azure Stream Analytics を使用したストリーム処理 - サーバーレス ストリーミング ソリューションを構築します。
- Azure Databricks - Apache Spark を使用したエンタープライズ グレードの分析を使用して、最新の分析アーキテクチャを作成します。
AWS または Google Cloud プロフェッショナル
これらの記事は、Azure分析オプションを他のクラウド サービスと比較することで、迅速に立ち上げるのに役立ちます。