適用対象:
Azure Data Factory
Azure Synapse Analytics
Tip
Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。 データ統合を初めて使用する場合は、Fabric Data Factory から始めます。 既存の ADF ワークロードをFabricにアップグレードして、データ サイエンス、リアルタイム分析、レポートの新機能にアクセスできます。
この記事では、リンクされたサービスの内容、それらが JSON 形式で定義される方法、およびAzure Data FactoryとAzure Synapse Analyticsでの使用方法について説明します。
詳細については、Azure Data Factory または Azure Synapse の入門記事を参照してください。
Overview
Azure Data FactoryとAzure Synapse Analyticsには、1 つ以上のパイプラインを含めることができます。 パイプラインは、1 つのタスクを連携して実行するアクティビティの論理的なグループです。 パイプライン内の複数のアクティビティは、データに対して実行するアクションを定義します。 たとえば、コピー アクティビティを使用して、SQL ServerからAzure ブロブ ストレージにデータをコピーできます。 次に、Azure HDInsight クラスターで Hive スクリプトを実行する Hive アクティビティを使用して、Blob Storage からのデータを処理して出力データを生成できます。 最後に、2 つ目のコピー アクティビティを使用して、どのビジネス インテリジェンス (BI) レポート ソリューションが構築されているかに基づいて、出力データをAzure Synapse Analyticsにコピーできます。 パイプラインとアクティビティの詳細については、「パイプラインとアクティビティ」を参照してください。
ここで、データセットとは、アクティビティで入力と出力として使うデータを単に指定または参照するデータの名前付きビューです。
データセットを作成する前に、リンクされたサービスを作成して、データ ストアとデータ ファクトリを Data Factory または Synapse ワークスペースにリンクする必要があります。 リンクされたサービスは、接続文字列によく似ており、サービスが外部リソースに接続するために必要な接続情報を定義します。 このように考えてみましょう:データセットはリンクされたデータ ストア内のデータの構造を表し、リンクされたサービスはデータ ソースへの接続を定義します。 たとえば、Azure Storageリンクされたサービスは、ストレージ アカウントをサービスにリンクします。 Azure BLOB データセットは、処理する入力 BLOB を含む BLOB コンテナーとそのAzure Storage アカウント内のフォルダーを表します。
サンプルシナリオを次に示します。 BLOB ストレージから SQL Database にデータをコピーするには、Azure StorageとAzure SQL Databaseという 2 つのリンクされたサービスを作成します。 次に、Azure Blob データセット (Azure Storageリンクされたサービスを参照) および Azure SQL テーブル データセット (Azure SQL Databaseリンクされたサービスを参照) の2つのデータセットを作成します。 Azure StorageとAzure SQL Databaseのリンクされたサービスには、サービスが実行時にAzure StorageとAzure SQL Databaseに接続するために使用する接続文字列が含まれています。 Azure BLOB データセットは、BLOB ストレージ内の入力 BLOB を含む BLOB コンテナーと BLOB フォルダーを指定します。 Azure SQL テーブル データセットは、データのコピー先となる SQL Database 内の SQL テーブルを指定します。
次の図は、サービスでのパイプライン、アクティビティ、データセット、およびリンクされたサービスの関係を示しています。
UI を持つ連携サービス
Azure Data Factory Studio で新しいリンクされたサービスを作成するには、Manage タブを選択し、リンクされたサービスを選択します。ここで、定義した既存のリンクされたサービスを確認できます。 新しいリンク サービスを作成するには、[+ 新規] を選択します。
[+ 新規] を選択して新しいリンクされたサービスを作成したら、サポートされているコネクタのいずれかを選択し、それに応じて詳細を構成できます。 その後、作成した任意のパイプラインで、リンク サービスを使用できます。
リンクされたサービスの JSON
リンクされたサービスは、次のように JSON 形式で定義されます。
{
"name": "<Name of the linked service>",
"properties": {
"type": "<Type of the linked service>",
"typeProperties": {
"<data store or compute-specific type properties>"
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
次の表では、上記の JSON のプロパティについて説明します。
| Property | Description | Required |
|---|---|---|
| name | リンクされたサービスの名前。 「名前付け規則」を参照してください。 | Yes |
| 型 | リンクされたサービスの種類 次に例を示します。AzureBlobStorage (データ ストア) または AzureBatch (コンピューティング)。 typeProperties の説明を参照してください。 | Yes |
| typeProperties | 型のプロパティは、データ ストアまたはコンピューティングごとに異なります。 サポートされているデータ ストア型と、その型のプロパティについては、コネクタの概要に関する記事を参照してください。 データ ストアに固有の型のプロパティについては、データ ストア コネクタに関する記事に移動してください。 サポートされているコンピューティング型とその型のプロパティについては、コンピューティングのリンクされたサービスに関する記事を参照してください。 |
Yes |
| connectVia | データ ストアへの接続に使用するIntegration Runtime。 Azure Integration Runtimeまたはセルフホステッド Integration Runtimeを使用できます (データ ストアがプライベート ネットワークにある場合)。 指定しない場合は、既定のAzure Integration Runtimeが使用されます。 | No |
リンクされたサービスの例
次のリンクされたサービスは、Azure Blob Storage のリンクされたサービスです。 Azure Blob ストレージの種類に設定されていることを確認してください。 Azure Blob Storage のリンクされたサービスの型プロパティには、接続文字列が含まれます。 サービスでは、この接続文字列を使用して実行時にデータ ストアに接続します。
{
"name": "AzureBlobStorageLinkedService",
"properties": {
"type": "AzureBlobStorage",
"typeProperties": {
"connectionString": "DefaultEndpointsProtocol=https;AccountName=<accountname>;AccountKey=<accountkey>"
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
リンクされたサービスを作成します
リンクされたサービスは、管理ハブおよびそれらを参照するすべてのアクティビティ、データセット、またはデータ フローを介して、Azure Data Factory UX に作成できます。
リンクされたサービスは、次のいずれかのツールまたは SDK (.NET API を使用して作成できます。 PowerShell、REST API、Azure Resource Manager Template、および Azure portal。
リンク サービスを作成する場合、ユーザーは指定されたサービスに対して適切な承認を得る必要があります。 十分なアクセス権が付与されていない場合、ユーザーは使用可能なリソースを表示できないため、手動入力オプションを使用する必要があります。
データ ストアのリンクされたサービス
サポートされているデータ ストアの一覧については、コネクタの概要に関する記事を参照してください。 サポートされている接続プロパティを確認するには、データ ストアを選択してください。
コンピューティングのリンクされたサービス
ご利用のサービスから接続できるさまざまなコンピューティング環境と構成の詳細については、「サポートされるコンピューティング環境」を参照してください。
関連するコンテンツ
これらのツールや SDK のいずれかを使用してパイプラインとデータセットを作成する詳しい手順については、次のチュートリアルを参照してください。