Azure Data Explorer を使用する場合

完了

ここでは、自分のビッグ データ分析のニーズにとって Azure Data Explorer が適した選択かどうかを判断する方法について説明します。 次の条件を評価することで、Azure Data Explorer がパフォーマンスと機能の目標を満たしているかどうかを判断できます。

  • 対話型分析
  • データの多様性
  • データのベロシティ
  • データ ボリューム
  • データの編成
  • クエリのコンカレンシー
  • 構築と購入

意思決定の基準

Azure Data Explorer は、人々が高度なアジャイル環境でデータに基づいた意思決定を行うことを支援するビッグ データの対話的な分析プラットフォームです。 以下で列挙する要素は、Azure Data Explorer が手元のワークロードに適しているかどうかを評価するのに役立ちます。 次の重要な質問をする必要があります。

対話型分析

データを対話形式で分析する必要はありますか。

データ分析には、集計、スコープ、評価、相関関係、異常検出、予測、一般的なモデル評価などの手法が含まれます。 これらは、大量のデータを実用的な結論に減らすのに役立ちます。 このようなアクティビティを対話形式で行うことが、Azure Data Explorer の特徴です。 これらのアクティビティは、対話型ダッシュボード、分析カスタム アプリケーション、または人間に優しいクエリと視覚化を介してデータと直接やり取りすることで発生する可能性があります。 Azure Data Explorer は、データに対する長期のバッチ ジョブの実行には最適なテクノロジではない可能性があります。 長期タスクには、Azure Data Explorer と上手く連携できる Microsoft Spark のようなテクノロジの使用を検討してください。

データの多様性

データ構造にはどのような種類がありますか。

Azure Data Explorer は、スケーラブルでハイパフォーマンスなフル テキスト インデックスと動的スキーマをサポートしています。 構造化データ、半構造化データ (json/xml)、およびテキスト データを分析して処理する必要がある場合は、Azure Data Explorer がワークロードに関連していることを示します。

データのベロシティ

リアルタイムのデータ分析は重要な要素ですか。

Azure Data Explorer では、大量のデータを迅速かつ低待機時間で取り込むことができます。 一般的なデータ セットには、トレース、トランザクション ログ、時系列、メトリック、アクティビティ レコード ストリームなどがあります。 最新データに対する凖リアルタイムの分析は、よくあるユース ケースです。 Azure Data Explorer は、Azure Event Hubs、IoT Hubs、Kafka などのストリーミング テクノロジに接続して、このようなワークロードを実現します。 しかし、リアルタイム分析の必要性がある場合、Azure Data Explorer は最適な選択ではない可能性があります。

データ ボリューム

取り込む必要があるデータの量はどのくらいですか。

Azure Data Explorer は、大量のデータ ワークロードに対して、対話形式と API 経由でウォーム パス分析を提供するように構築されています。 累積データの合計サイズが数ギガバイト程度の場合は、よりコスト効率の高いソリューションが他にあるかもしれません。

データの編成

データはどのくらい一貫して整理されていますか。

Azure Data Explorer は、生データに対してスキーマオンリードを適用するように構築されています。 このアプローチにより、現在のニーズに基づいて、さまざまな方法や視点でデータを調査する柔軟性が生まれます。 この機能は、セキュリティ、運用、および他の領域と競合する環境における予期しない課題に対処する場合に価値を発揮します。 Azure Data Explorer を使用すると、極めて高い速度、スケーラビリティ、コスト効率で生データを分析できます。 多くの場合、データ ウェアハウスのデプロイでは、抽出、変換、読み込み (ETL) プロセスによって、適切にキュレーションされ、一貫性が高く、文書化されたエンティティと属性のセットが定期的に生成されます。 このような複雑なスター スキーマの分析には、通常、大規模なファクト - ファクト - ファクト間の結合が必要であり、Azure Data Explorer はこれに最適化されていません。

クエリのコンカレンシー

"同時にデータのクエリ/取り込み/処理を行う必要があるユーザーの人数は何人ですか?"

Azure Data Explorer は、分析 SaaS オファリングの実装に広く使用されています。 もし、並行する多数の要求に起因する多様で特有の分析ニーズをサポートする必要があるのなら、Azure Data Explorer は優れたソリューションを提供するはずです。

構築と購入

データ プラットフォームをどの程度カスタマイズしたいですか。

Azure Data Explorer は、フル マネージド型のサービスとしてのプラットフォームです。 しかし、すぐに使用できるターンキー ソリューションを提供するわけではありません。 このソリューションを実現 (構築) するには、これを基にしてエクスペリエンスのカスタマイズ、構成、接続、および作成が必要です。 Azure Data Explorer を使用して、さまざまなドメインや業種でこのようなターンキー ソリューションを提供する Microsoft やサード パーティのさまざまなソリューションがあります。 たとえば、IT 運用用の Azure Monitor、セキュリティ ドメイン内の Microsoft Advanced Threat Protection と Microsoft Sentinel、IoT ドメイン内の Azure Time Series Insights と Azure IoT Central などです。

基準を適用する

Azure Data Explorer は、高速で多様な生データに対してナレッジ ワーカーに対話型分析機能を有効にするのに最適です。 衣料品会社のシナリオのプロセス例に、上記の基準をどのように適用できるかを考えてみましょう。

製造データに Azure Data Explorer を使用すべきか

例に挙げた衣料品会社の製造部門では、在庫量と製造量をどのように管理するかを判断する必要があります。 在庫に関するデータの受信ログがあります。 また、マーケティングからの地理空間データを使用して、地域ごとの製品ニーズを予測したいと考えています。 このデータには、さまざまな多様性ベロシティがあります。 これは一貫した方法で "組織化" されておらず、多くの関係者がこのデータに対して "同時に" クエリを実行する必要があります。 インジェストからクエリまで、低待機時間にする必要があります。 クエリの応答時間は 1 秒未満にする必要があります。 意思決定の基準に基づくと、Azure Data Explorer はこの衣料品会社の製造部門に適しています。

マーケティング データに Azure Data Explorer を使用すべきか

衣料品会社のマーケティング部門では、キャンペーンの効果を評価したいと考えています。 Web サイトと広告キャンペーンのクリックストリーム データがあります。 また、ソーシャル メディアのフリー テキスト (非構造化) データもあります。 このデータは非常に多様であり、整理されていません。 この部門では、探索的な対話型分析を実行したいと考えています。 意思決定の基準に基づくと、Azure Data Explorer はこの衣料品会社のマーケティング部門に適しています。

ガイダンスのまとめ

次の表は、新しいユース ケースを評価する方法を示しています。 ここではすべてのユース ケースを網羅しているわけではありませんが、これは Azure Data Explorer が自分にとって適したソリューションかどうかを判断するために役立つと私たちは考えています。

ユース ケース 対話型分析 ビッグ データ (多様性、ベロシティ、量) データの編成 コンカレンシー 構築と購入 Azure Data Explorer を使用すべきか
セキュリティ分析 SaaS の実装 対話型で凖リアルタイムの分析の多用。 セキュリティ データは多様で、大量で高速です。 可変 このシステムは多くの場合、複数のテナントからの複数のアナリストによって使用されます。 SaaS オファリングの実装は構築のシナリオです。 はい
CDN ログ分析 トラブルシューティング、QoS 監視のための対話型。 CDN ログは、多様、大量、高速です。 個別のログ レコード。 データ サイエンティストの少数のグループは、これらの分析を使用できますが、多くのダッシュボードに電力を供給することもできます。 CDN 分析から抽出される値はシナリオ固有であり、カスタム分析を必要とします。 はい
IoT テレメトリのための時系列データベース トラブルシューティング、傾向と使用状況の分析、異常の検出に関して対話的です。 IoT テレメトリは高速ですが、構造化されたものだけであったり、サイズが中規模である可能性があります。 関連するレコードのセット。 データ サイエンティストの少数のグループは、これらの分析を使用できますが、多くのダッシュボードに電力を供給することもできます。 データベースを検索する場合、コンテキストは通常、構築です。 はい

次のフローチャート表は、Azure Data Explorer の使用を検討する際に自問するべき主な点をまとめたものです。

Azure Data Explorer を使用する状況を示すフローチャート。質問には、特定のレコードを読み書きする必要があるか、長期のタスク、クラシック データ ウェアハウスを実行する必要があるか、他のクラウド上で実行する必要があるか、小さいデータかなどがあります。