データラングリングとは

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。データ統合を初めて使用する場合は、Fabric Data Factory から始めます。既存の ADF ワークロードをFabricにアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Azure Data Factory から Microsoft Fabric の Data Factory へのアップグレード

データラングリングでは、元のソースからのデータをさまざまなダウンストリームアプリケーションに適した便利なものするために、変換と再フォーマットが行われます。

組織は、日々増加し続ける複雑なデータを正確に分析するために、データの準備とラングリングの目的で重要なビジネスデータを調査する能力を必要としています。さまざまなビジネスプロセスのデータを使用して、価値創造までの時間を短縮できるようにするには、データの準備が不可欠です。

Data Factory を使用すると、Power Queryを使用して、クラウド規模でコード不要のデータ準備を繰り返し行うことができます。 Data Factory は、Power Query Online と統合され、Power Query M 関数をパイプラインアクティビティとして使用できるようにします。

Data Factory は、Power Query Online Mashup エディターによって生成された M を、M を Azure Data Factory データフローに変換してクラウドスケール実行用の Spark コードに変換します。 Power Queryとデータフローを使用したデータラングリングは、データエンジニアや "市民データインテグレーター" に特に役立ちます。

利用事例

迅速な対話型のデータ探索と準備

複数のデータエンジニアやシティズンデータインテグレーターが、データセットをクラウド規模で対話的に探索し、準備することができます。データレイク内のデータの量、種類、速さが増大するなか、ユーザーは、データセットを探索して準備するための効果的な方法を必要としています。たとえば、2017 年以降の新規顧客を対象に、すべての顧客人口統計情報を含んだデータセットを作成するようなケースもあるでしょう。既知のターゲットにマッピングしていません。レイクに公開する前に、データセットの探索、ラングリング、準備を行って、要件を満たすことになります。ラングリングは、それほど厳格ではない分析シナリオでよく使用されます。準備されたデータセットは、変換や機械学習のために使用できます。

コードフリーのアジャイルなデータ準備

シティズンデータインテグレーターは、データを探して準備するのに、業務時間の 60% 以上を費やしています。業務の生産性を向上させるため、彼らはこれらの作業をコーディングなし行う方法を探しています。市民データインテグレーターが、スケーラブルな方法で Power Query Online などの既知のツールを使用してデータを強化、整形、公開できるようにすることで、生産性が大幅に向上します。 Azure Data Factoryでラングリングを使用すると、使い慣れたPower Query Online マッシュアップエディターを使用して、市民データインテグレーターがエラーを迅速に修正し、データを標準化し、高品質のデータを生成してビジネス上の意思決定をサポートできます。

データの検証と調査

コードを使用せずにデータを視覚的にスキャンして、外れ値や異常を除外し、データを高速分析用に整形することができます。

サポートされているソース

コネクタ	データ形式	認証の種類
Azure Blob Storage	CSV、Parquet、Excel	アカウントキー、サービスプリンシパル、MSI
Azure Data Lake Storage Gen1	CSV、Parquet、Excel	サービスプリンシパル、MSI
Azure Data Lake Storage Gen2	CSV、Parquet、Excel	アカウントキー、サービスプリンシパル、MSI
Azure SQL Database	-	SQL 認証、MSI、サービスプリンシパル
Azure Synapse Analytics	-	SQL 認証、MSI、サービスプリンシパル

マッシュアップエディター

Power Query アクティビティを作成すると、すべてのソースデータセットがデータセットクエリになり、ADFResource フォルダーに配置されます。既定では、UserQuery は最初のデータセットクエリを指します。データセットクエリに対する変更はサポートされておらず、永続化もされないため、すべての変換は UserQuery で実行される必要があります。クエリの名前変更、追加、削除は、現在サポートされていません。

ラングリング

現時点では、作成中に使用可能であるにもかかわらず、すべての Power Query M 関数がデータラングリングでサポートされているわけではありません。 Power Query アクティビティのビルド中に、関数がサポートされていない場合は、次のエラーメッセージが表示されます。

The Power Query Spark Runtime does not support the function

サポートされている変換の詳細については、「Power Query データラングリング関数を参照してください。

Power Query のデータラングリングマッシュアップを作成する方法について学びます。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-07

次の方法で共有

データ ラングリングとは