Azure Data Factory および Azure Synapse Analytics のデータコピーツール

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。データ統合を初めて使用する場合は、Fabric Data Factory から始めます。既存の ADF ワークロードをFabricにアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Azure Data Factory から Microsoft Fabric の Data Factory へのアップグレード

データのコピーツールを使うと、通常はエンドツーエンドのデータ統合シナリオの最初の手順である、Data Lake へのデータの取り込みプロセスが容易になり、最適化されます。時間が短縮され、サービスを使って初めてデータソースからデータを取り込むときに特に効果があります。このツールには次のような利点があります。

データのコピーツールを使用する場合、リンクされたサービス、データセット、パイプライン、アクティビティ、トリガーのサービス定義を理解する必要はありません。
データのコピーツールでは、直感的にわかるフローでデータを Data Lake に読み込むことができます。ツールでは、選んだコピー元データストアから選んだコピー先/シンクデータストアにデータをコピーするために必要なすべてのリソースが自動的に作成されます。
データのコピーツールでは、作成時に取り込まれるデータを検証できるので、データ自体に最初からエラーが存在する可能性を回避するのに役立ちます。
Data Lake にデータを読み込むために複雑なビジネスロジックを実装する必要がある場合でも、UI でのアクティビティごとの作成を使って、データのコピーツールによって作成されるリソースを編集できます。

次の表では、データのコピーツールを使う場合と、UI のアクティビティごとの作成を使う場合の指針を示します。

データコピーツール	アクティビティごと (コピーアクティビティ) の作成
エンティティ (リンクされたサービス、データセット、パイプラインなど) について理解することなく、データ読み込みタスクを簡単に作成したい場合。	Lake にデータを読み込むための複雑で柔軟性の高いロジックを実装したい場合。
大量のデータアーティファクトを Data lake にすばやく読み込みたい場合。	データをクレンジングまたは処理するために、Copy アクティビティを後続のアクティビティと連結する必要があります。

データのコピーツールを起動するには、Data Factory または Synapse Studio UI のホームページで Ingest タイルを選択します。

Azure Data Factory
Synapse Analytics

ホームページを示すスクリーンショット - データのコピーツールへのリンク。

コピーデータツールを起動すると、2 種類のタスクが表示されます。1 つは 組み込みのコピータスク で、もう 1 つは メタデータ駆動型のコピータスクです。組み込みのコピータスクを使用すると、5 分以内にパイプラインが作成され、エンティティについて学習しなくてもデータをレプリケートできます。大量のオブジェクト (数千のテーブルなど) の大規模なコピーを管理するための、パラメーター化されたパイプラインと外部制御テーブルを簡単に作成できる、メタデータ駆動のコピータスク。詳細については、メタデータ駆動のデータのコピーに関する記事を参照してください。

Data lake にデータを読み込むための直感的なフロー

このツールを使うと、直感的なフローに従って、さまざまなコピー元からコピー先にデータを数分以内で簡単に移動することができます。

ソースの設定を設定する。
宛先の設定を行います。
列のマッピング、パフォーマンスの設定、フォールトトレランスの設定など、コピー操作の詳細な設定を構成します。
データ読み込みタスクのスケジュールを指定します。
作成されるエンティティの概要を確認します。
必要に応じてパイプラインを編集し、コピーアクティビティの設定を更新します。

このツールは最初からビッグデータを考慮して設計されており、さまざまな種類のデータとオブジェクトをサポートしています。何百ものフォルダー、ファイル、テーブルの移動に使うことができます。このツールは、自動データプレビュー、スキーマのキャプチャと自動マッピング、およびデータのフィルター処理にも対応しています。

データのコピーツール

自動データプレビュー

選んだコピー元データストアのデータの一部をプレビューすることができ、コピーされているデータを検証できます。さらに、コピー元データがテキストファイル内にある場合は、データのコピーツールによってテキストファイルが解析され、行および列の区切り記号とスキーマが自動的に検出されます。

ファイルの設定

検出が完了したら、 [Preview data (データのプレビュー)] を選択します。

検出されたファイルの設定とプレビュー

スキーマのキャプチャと自動マッピング

データコピー元のスキーマがデータコピー先のスキーマと異なることがよくあります。このシナリオでは、ソーススキーマの列を宛先スキーマの列にマップする必要があります。

データのコピーツールは、ソースストアとコピー先ストアの間で列をマッピングするときの動作を監視し、学習します。ユーザーがコピー元データストアから 1 つまたはいくつかの列を選び、それをコピー先スキーマにマップすると、データのコピーツールはユーザーが両方の側で選んだ列ペアのパターンの分析を開始します。その後、ツールは残りの列に同じパターンを適用します。数回クリックするだけで、すべての列が望み通りに宛先にマッピングされることが確認できます。データのコピーツールによって提供される列マッピングの選択に満足できない場合は、無視して、列の手動マッピングを続行できます。その間もデータのコピーツールはパターンの学習と更新を続けており、最終的にはユーザーが望む正しい列マッピングのパターンになります。

注釈

SQL ServerまたはAzure SQL DatabaseからAzure Synapse Analyticsにデータをコピーする場合、コピー先ストアにテーブルが存在しない場合、データのコピーツールでは、ソーススキーマを使用したテーブルの自動的な作成がサポートされます。

データのフィルター処理

ソースデータをフィルター処理して、シンクデータストアにコピーする必要があるデータのみを選択できます。フィルター処理によって、シンクデータストアにコピーするデータの量が削減されるため、コピー操作のスループットが向上します。データのコピーツールを使用すると、SQL クエリ言語を使用してリレーショナルデータベース内のデータをフィルター処理したり、Azure BLOB フォルダー内のファイルを柔軟にフィルター処理したりできます。

データベース内のデータのフィルター処理

次のスクリーンショットでは、データをフィルター処理する SQL クエリを示します。

データベース内のデータのフィルター処理

Azure BLOB フォルダー内のデータをフィルター処理する

フォルダーパスに変数を使って、フォルダーからデータをコピーできます。サポートされている変数は、 {year} 、 {month} 、 {day} 、 {hour} 、 {minute} です。例: inputfolder/{year}/{month}/{day}。

次の形式の入力フォルダーがあるとします。

2016/03/01/01
2016/03/01/02
2016/03/01/03
...

[ファイルまたはフォルダー] の [参照] ボタンを選択し、次のいずれかのフォルダー (2016->03->01->02 など) を参照して、[選択] を選択します。テキストボックスに 2016/03/01/02 と表示されます。

次に、2016 を {year} 、03 を {month} 、01 を {day} 、02 を {hour} にそれぞれ置き換え、Tab キーを押します。 ファイル読み込みの動作のセクションで増分読み込み: 時間的に分割されたフォルダ/ファイル名を選択し、プロパティ ページでスケジュールまたはタンブリングウィンドウを選択すると、これら4つの変数の形式を選択するドロップダウンリストが表示されます。

ファイルまたはフォルダーのフィルター処理

データのコピーツールでは、式、関数、システム変数でパラメーターを生成し、パイプラインを作成するときにそれを使って {year}、{month}、{day}、{hour}、{minute} を表すことができます。

スケジュールオプション

コピー操作は 1 回だけ実行することも、スケジュールに従って (毎時、毎日など) 実行することもできます。これらのオプションは、オンプレミス、クラウド、ローカルデスクトップといった異なる環境のコネクタに使うことができます。

1 回限りのコピー操作では、ソースからコピー先に 1 回だけデータを移動できます。これは、サポートされている形式のあらゆるサイズのデータに適用されます。スケジュールされたコピーでは、指定した繰り返しでデータをコピーできます。豊富な設定 (再試行、タイムアウト、アラートなど) を使用して、スケジュールされたコピーを構成できます。

スケジュールオプション

データのコピーツールを使う以下のチュートリアルを試してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-07

次の方法で共有

Azure Data Factory および Azure Synapse Analytics のデータコピー ツール

Data lake にデータを読み込むための直感的なフロー

自動データ プレビュー

スキーマのキャプチャと自動マッピング

データのフィルター処理

データベース内のデータのフィルター処理

Azure BLOB フォルダー内のデータをフィルター処理する

スケジュール オプション

関連するコンテンツ

フィードバック

その他のリソース

Azure Data Factory および Azure Synapse Analytics のデータコピーツール

自動データプレビュー

スケジュールオプション