Azure Data FactoryとAzure Synapse Analyticsのデータセット

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。データ統合を初めて使用する場合は、Fabric Data Factory から始めます。既存の ADF ワークロードをFabricにアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Azure Data Factory から Microsoft Fabric の Data Factory へのアップグレード

この記事では、データセットとは何か、JSON 形式で定義される方法、およびデータセットが Azure Data Factory および Synapse パイプラインでどのように使用されるかについて説明します。

Data Factory を初めて使用する場合は、 Azure Data Factoryを参照してください。 Azure Synapseの詳細については、「Azure Synapse

概要

Azure Data Factoryワークスペースまたは Synapse ワークスペースには、1 つ以上のパイプラインを含めることができます。 パイプラインは、1 つのタスクを連携して実行するアクティビティの論理的なグループです。パイプライン内の複数のアクティビティは、データに対して実行するアクションを定義します。ここで、データセットとは、アクティビティで入力と出力として使用するデータを単に指定または参照するデータの名前付きビューです。データセットは、テーブル、ファイル、フォルダー、ドキュメントなど、さまざまなデータストア内のデータを示します。たとえば、Azure BLOB データセットは、アクティビティがデータを読み取るBlob Storage内の BLOB コンテナーとフォルダーを指定します。

データセットを作成する前に、リンクされたサービスを作成して、データストアをそのサービスにリンクする必要があります。リンクされたサービスは、接続文字列によく似ており、サービスが外部リソースに接続するために必要な接続情報を定義します。データセットはリンクされたデータストア内のデータの構造を表すもので、リンクされたサービスはデータソースへの接続を定義するもの、と捉えることができます。たとえば、Azure Storageリンクされたサービスは、ストレージアカウントをリンクします。 Azure BLOB データセットは、処理する入力 BLOB を含む BLOB コンテナーとそのAzure Storage アカウント内のフォルダーを表します。

次に示のはサンプルシナリオです。 BLOB ストレージから SQL Database にデータをコピーするには、Azure Blob StorageとAzure SQL Databaseという 2 つのリンクされたサービスを作成します。次に、2つのデータセットを作成します。1つは、Azure Blob Storageにリンクされたサービスを参照する区切りテキストデータセット（ソースとしてテキストファイルがあると仮定します）であり、もう1つはAzure SQLデータベースにリンクされたサービスを参照するAzure SQLテーブルデータセットです。 Azure Blob StorageとAzure SQL Databaseのリンクされたサービスには、サービスが実行時にAzure StorageとAzure SQL Databaseに接続するために使用する接続文字列が含まれています。区切りテキストデータセットは、Blob Storage内の入力 BLOB を含む BLOB コンテナーと BLOB フォルダーを、形式関連の設定と共に指定します。 Azure SQL テーブルデータセットは、データのコピー先となる SQL Database 内の SQL テーブルを指定します。

次の図は、パイプライン、アクティビティ、データセット、リンクされたサービスの関係を示しています。

パイプライン、アクティビティ、データセット、リンクされたサービスの関係

Azure Data Factory Studio でデータセットを作成するには、[Author]\(作成\) タブ (鉛筆アイコン付き) を選択し、プラス記号アイコンを選択して Dataset を選択します。

新しいデータセットボタンが選択されたAzure Data Factory Studio の [作成者] タブを表示します。

既存または新しいリンクされたサービスを設定するために、Azure Data Factoryで使用可能なコネクタのいずれかを選択するための新しいデータセットウィンドウが表示されます。

サポートされているいずれかのデータファクトリコネクタへのリンクサービスの種類を選択できる [新しいデータセット] ウィンドウを示しています。

次に、データセットの形式を選択するように求めるメッセージが表示されます。

新しいデータセットの形式を選択できるデータセット形式ウィンドウを示しています。

最後に、データセットに対して選択した種類の既存のリンクされたサービスを選択するか、サービスがまだ定義されていない場合は新しいサービスを作成できます。

前に選択した種類の既存のデータセットを選択するか、または新しいデータセットを作成できる [プロパティの設定] ウィンドウを示しています。

データセットを作成したら、Azure Data Factory内の任意のパイプライン内でデータセットを使用できます。

データセットの JSON

データセットは JSON 形式では次のように定義されます。

{
    "name": "<name of dataset>",
    "properties": {
        "type": "<type of dataset: DelimitedText, AzureSqlTable etc...>",
        "linkedServiceName": {
                "referenceName": "<name of linked service>",
                "type": "LinkedServiceReference",
        },
        "schema":[

        ],
        "typeProperties": {
            "<type specific property>": "<value>",
            "<type specific property 2>": "<value 2>",
        }
    }
}

次の表では、上記の JSON のプロパティについて説明します。

プロパティ	内容	必須
名前	データセットの名前。「キューの名前付け規則」を参照してください。	はい
型	データセットの型。 Data Factory でサポートされている型のいずれかを指定します (たとえば、DelimitedText、AzureSqlTable)。詳細については、データセットの型を参照してください。	はい
スキーマ	データセットのスキーマは、実際のデータ型と形状を表します。	いいえ
タイププロパティ	型のプロパティは型によって異なります。サポートされている型とそのプロパティの詳細については、「データセットの型」セクションを参照してください。	はい

データセットのスキーマをインポートするときに、 [スキーマのインポート] ボタンを選択し、ソースまたはローカルファイルのどちらからインポートするかを選択します。ほとんどの場合、ソースからスキーマを直接インポートします。ただしローカルスキーマファイルが既にある (Parquet ファイルまたはヘッダー付きの CSV) 場合は、そのファイルのスキーマを基に、サービスに指示できます。

コピーアクティビティのデータセットは、ソースとシンクで使用されます。データセットで定義されているスキーマは、参照用として省略可能です。ソースとシンクの間に列/フィールドマッピングを適用する場合は、スキーマと型のマッピングに関するページを参照してください。

Data Flowでは、データセットはソース変換とシンク変換で使用されます。データセットは、基本的なデータスキーマを定義します。データがスキーマを持たない場合は、ソースとシンクのスキーマドリフトを使用できます。データセットから取得されたメタデータは、ソース変換でソースプロジェクションとして表示されます。ソース変換のプロジェクションは、定義された名前と型を持つData Flow データを表します。

データセットの型

サービスでは、使用するデータストアに応じて、さまざまな種類のデータセットがサポートされています。サポートされているデータストアの一覧については、コネクタの概要に関する記事を参照してください。データストアを選択すると、それに対応するリンクされたサービスとデータセットの作成方法を確認できます。

たとえば、区切りテキストデータセットの場合、次の JSON サンプルに示すように、データセットの型は DelimitedText に設定されます。

{
    "name": "DelimitedTextInput",
    "properties": {
        "linkedServiceName": {
            "referenceName": "AzureBlobStorage",
            "type": "LinkedServiceReference"
        },
        "annotations": [],
        "type": "DelimitedText",
        "typeProperties": {
            "location": {
                "type": "AzureBlobStorageLocation",
                "fileName": "input.log",
                "folderPath": "inputdata",
                "container": "adfgetstarted"
            },
            "columnDelimiter": ",",
            "escapeChar": "\\",
            "quoteChar": "\""
        },
        "schema": []
    }
}

注意

スキーマ値は JSON 構文を使用して定義されます。スキーママッピングとデータ型マッピングの詳細については、Azure Data Factoryコピーアクティビティスキーマと型マッピングドキュメントを参照してください。

データセットを作成する

データセットは、.NET API、PowerShell、REST API、Azure Resource Manager テンプレート、Azure ポータルのいずれかを使用して作成できます。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-07

次の方法で共有

Azure Data FactoryとAzure Synapse Analyticsのデータセット

概要

UI を使用して、データセットを作成します。

データセットの JSON

データセットの型

データセットを作成する

最新バージョンとバージョン 1 のデータセットの比較

関連するコンテンツ

クイックスタート

データセット スキーマの参照

フィードバック

その他のリソース

データセットスキーマの参照