APPLIES TO:
Azure Data Factory
Azure Synapse Analytics
ヒント
Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。 データ統合を初めて使用する場合は、Fabric Data Factory から始めます。 既存の ADF ワークロードをFabricにアップグレードして、データ サイエンス、リアルタイム分析、レポートの新機能にアクセスできます。
- Fabric無料試用版を開始します。
Microsoft Fabric
データ フローは、Azure Data Factory パイプラインとAzure Synapse Analytics パイプラインの両方で使用できます。 この記事は、マッピング データ フローに適用されます。 変換を初めて使用する場合は、入門記事「 マッピング データ フローを使用したデータの変換」を参照してください。
この記事では、マッピング データ フローでAzure Data FactoryおよびAzure Synapse Analyticsでサポートされるウィンドウ関数について詳しく説明します。
ウィンドウ関数一覧
次の関数は、ウィンドウ変換でのみ使用できます。
| ウィンドウ関数 | タスク |
|---|---|
| cumeDist | パーティション内のすべての値に対する値の位置を計算します。 結果は、パーティションの順序内で現在行以前の行数を、ウィンドウ パーティション内の合計行数で除算した値です。 順序の同値はすべて同じ位置に評価されます。 |
| denseRank | ウィンドウの order by 句で指定した値のグループ内の値の順位を計算します。 結果は、パーティション順位内の現在行以前の行数に 1 を加算した値です。 値によってシーケンスにギャップが生じません。
denseRank関数は、データが並べ替えられていない場合や、値の変更を探す場合でも機能します。 |
| 遅延 | 現在の行より前の行 n 評価された最初のパラメーターの値を取得します。 2 番目のパラメーターは、参照する行の数であり、既定値は 1。 行数が少ない場合は、既定値が指定されていない限り、 null の値が返されます。 |
| 鉛 | 現在の行からn行後に評価される最初のパラメーターの値を取得します。 2 番目のパラメーターは、先読みする行の数であり、既定値は 1。 行数が少ない場合は、既定値が指定されていない限り、 null の値が返されます。 |
| nTile | 各ウィンドウ パーティションの行を、nから最大1までのnバケットに分割します。 バケットの値は、最大で 1によって異なります。 パーティション内の行数がバケットの数に均等に分割されない場合、剰余の値は、最初のバケットから始まり、バケットごとに 1 つずつ分散されます。
NTile 関数は、tertiles、四分位数、十分位数およびその他の一般的な集計統計情報を計算する場合に便利です。この関数は、初期化中に 2 つの変数を計算します。 通常のバケットのサイズには、追加の行が 1 つ追加されています。 どちらの変数も現在のパーティションのサイズに基づいています。 この関数は、計算プロセス中に、現在の行番号、現在のバケット番号、バケットが変更された行番号 ( bucketThreshold) を追跡します。 現在の行番号がバケットのしきい値に達すると、バケット値は 1 ずつ増加します。 しきい値は、バケット サイズによって増加します (現在のバケットが埋め込まれている場合は 1 つ追加されます)。 |
| rank | ウィンドウの order by 句で指定した値のグループ内の値の順位を計算します。 結果は、パーティション順位内の現在行以前の行数に 1 を加算した値です。 値によってシーケンスにギャップが生じます。
rank関数は、データが並べ替えられていない場合や、値の変更を探す場合でも機能します。 |
| rowNumber |
1で始まるウィンドウ内の行に連続する行番号を割り当てます。 |