この記事では、パイプラインでコピー アクティビティを使用して、フォルダーとの間でデータをコピーする方法について説明します。
前提条件
フォルダーからデータをコピーするには、オンプレミス データ ゲートウェイを設定する必要があります。 詳しくは、「Data Factory でオンプレミスのデータ ソースにアクセスする方法」をご覧ください。
サポートされている形式
フォルダー コネクタは、次のファイル形式をサポートしています。 形式ベースの設定については、各記事を参照してください。
ソースでサポートされている形式
変換先でサポートされている形式
サポートされている構成
コピー アクティビティの下の各タブの構成については、それぞれ次のセクションを参照してください。
全般
[ 全般 設定] タブを構成するには、[ 全般 設定] ガイダンスを参照してください。
情報源
コピー アクティビティの [ ソース ] タブの下のフォルダーでは、次のプロパティがサポートされています。
次のプロパティは必須です。
接続: 接続リストからフォルダー接続を選択します。 接続が存在しない場合は、新しいフォルダー接続を作成します。
ファイル パスの種類: ファイル パス、 ファイル フィルター、 ワイルドカード ファイル パス、またはファイル パスの種類として ファイルの一覧 を選択できます。 各設定の構成は次のとおりです。
ファイル パス: [参照] を選択して、コピーするファイルを選択するか、パスを手動で入力します。
ファイル フィルター: ファイル サーバー側のネイティブ フィルター。ワイルドカード フィルターよりもパフォーマンスが向上します。
- フォルダー パス: フォルダーへのパスを指定します。
-
ファイル フィルター:
*を使用して 0 個以上の文字に一致し、?を使用して 0 文字または 1 文字に一致させます。 構文と注意事項の詳細については、このセクションの 「解説 」を 参照してください。
ワイルドカード ファイル パス: ワイルドカード パスを指定します。
ワイルドカード パス: ソース フォルダーまたはファイルをフィルター処理するワイルドカード文字を含むフォルダーまたはファイル パスを指定します。
使用できるワイルドカードは、
*(ゼロ文字以上の文字に一致) と?(ゼロ文字または 1 文字に一致) です。 フォルダー名にワイルドカードまたはこのエスケープ文字がある場合は、^を使用してエスケープします。ワイルドカード フォルダー パス: ソース フォルダーをフィルター処理するワイルドカード文字を含むフォルダー パスを指定します。
ワイルドカード ファイル名: ソース ファイルをフィルター処理するために、指定したフォルダー パス (またはワイルドカード フォルダー パス) の下にワイルドカード文字を使用してファイル名を指定します。
ファイルの一覧: 特定のファイル セットをコピーすることを示します。
- フォルダー パス: フォルダーへのパスを指定します。
- ファイル リストへのパス: コピーするファイルの一覧を含むテキスト ファイルをポイントします。構成されているパスへの相対パスであるファイルを 1 行につき 1 つずつ指定します。
ファイル形式: ドロップダウン リストから適用されるファイル形式を選択します。 [設定] を 選択してファイル形式を構成します。 さまざまなファイル形式の設定については、 サポートされている形式の記事を参照してください。
次のプロパティは 省略可能です。
- 再帰的: データをサブフォルダーから再帰的に読み取るか、指定したフォルダーからのみ読み取るかを指定します。 このプロパティは既定で選択され、 ファイルの一覧を構成するときに適用されません。
- 完了後にファイルを削除する: コピー先ストアに正常に移動した後、バイナリ ファイルがソース ストアから削除されるかどうかを示します。 ファイルの削除はファイルごとに行われます。 このプロパティは、バイナリ ファイルのコピー シナリオでのみ有効です。
[詳細設定] では、次のフィールドを指定できます。
最終更新日でフィルター処理: 最後に変更された日付に基づいてファイルがフィルター処理されます。 ファイル パスの種類をファイルのリストとして構成する場合、このプロパティは適用されません。
開始時刻 (UTC): ファイルは、最終変更時刻が構成された時刻以上の場合に選択されます。
終了時刻 (UTC): 最終変更時刻が構成された時間より短い場合、ファイルが選択されます。
開始時刻 (UTC) に datetime 値があるのに終了時刻 (UTC) が NULL の場合、最終変更属性が datetime 値以上のファイルが選択されることを意味します。 終了時刻 (UTC) に datetime 値があるのに開始時刻 (UTC) が NULL の場合、最終変更属性が datetime 値より小さいファイルが選択されることを意味します。 プロパティには NULL を指定できます。つまり、ファイル属性フィルターはデータに適用されません。
パーティション検出を有効にする: ファイル パスからパーティションを解析し、追加のソース列として追加するかどうかを指定します。 既定では選択されず、バイナリ ファイル形式を使用する場合はサポートされません。
パーティション ルート パス: パーティション検出が有効になっている場合は、パーティション分割されたフォルダーをデータ列として読み取るために絶対ルート パスを指定します。
これが指定されていない場合は、既定で次のようになります。
- ソースでファイル パスまたはファイルの一覧を使用する場合、パーティション ルート パスは構成したパスです。
- ワイルドカード フォルダー フィルターを使用する場合、パーティション ルート パスは最初のワイルドカードの前のサブパスです。
最大同時接続数: このプロパティは、アクティビティの実行中にデータ ストアに対して確立された同時接続の上限を示します。 同時接続を制限する場合にのみ値を指定します。
行き先
コピー アクティビティの [ 宛先 ] タブの下のフォルダーでは、次のプロパティがサポートされています。
次のプロパティは必須です。
接続: 接続リストからフォルダー接続を選択します。 接続が存在しない場合は、新しいフォルダー接続を作成します。
[ファイル パス]: [参照 ] を選択して、パスを手動でコピーまたは入力するファイルを選択します。
ファイル形式: ドロップダウン リストから適用されるファイル形式を選択します。 [設定] を 選択してファイル形式を構成します。 さまざまなファイル形式の設定については、 サポートされている形式の記事を参照してください。
次のプロパティは 省略可能です。
[詳細設定] では、次のフィールドを指定できます。
コピー動作: ソースがファイル ベースのデータ ストアのファイルである場合のコピー動作を定義します。 ドロップダウン リストからビヘイビアーを選択できます。
- 階層のフラット化: ソース フォルダーのすべてのファイルがコピー先フォルダーの第一レベルに配置されます。 コピー先ファイルには自動生成された名前があります。
- ファイルのマージ: ソース フォルダーのすべてのファイルを 1 つのファイルにマージします。 ファイル名を指定した場合、マージされたファイル名は指定した名前になります。 それ以外の場合は、自動生成されたファイル名です。
- 階層の保持 (既定値): ターゲット フォルダー内のファイル階層を保持します。 ソース ファイルからソース フォルダーへの相対パスは、ターゲット フォルダーへのターゲット ファイルの相対パスと同じです。
最大コンカレント接続数: アクティビティの実行中にデータ ストアに対して確立されるコンカレント接続数の上限。 同時接続を制限する場合にのみ値を指定します。
地図作成
[マッピング] タブの構成については、「[マッピング] タブでマッピングを構成する」を参照してください。
Settings
設定 タブの構成については、設定タブのの下で他の設定を構成するに移動します。
表の概要
次の表に、フォルダー内のコピー アクティビティの詳細を示します。
ソース情報
| 名前 | 説明 | 価値 | 必須 | JSON スクリプト プロパティ |
|---|---|---|---|---|
| 接続 | ソース データ ストアへの接続。 | <フォルダー接続> | はい | 接続 |
| ファイル パスの種類 | ソース データの取得に使用されるファイル パスの種類。 | / | はい | / |
| ファイル パスの場合 | ||||
| ファイル パス | ファイルの読み取り先となるフォルダーまたはファイル パス。 | <フォルダーまたはファイル パス> | いいえ | folderPath fileName |
| ファイル フィルターの場合 | ||||
| フォルダー パス | フォルダーへのパスを指定します。 | <あなたのフォルダー パス> | いいえ | folderPath |
| ファイル フィルター | ファイル サーバー側のネイティブ フィルター。 | <ファイル フィルター> | いいえ | fileFilter |
| ワイルドカード ファイル パスの場合 | ||||
| ワイルドカード フォルダーのパス | ソース フォルダーのフィルター処理に使用されるワイルドカード フォルダー パス。 | <ワイルドカード文字を使用したフォルダー パス> | いいえ | wildcardFolderPath |
| ワイルドカード ファイル名 | ソース ファイルのフィルター処理に使用されるワイルドカード ファイル名パターン。 | <ワイルドカード文字を使用したファイル名> | いいえ | wildcardFileName |
| ファイルの一覧 | ||||
| フォルダー パス | フォルダーへのパスを指定します。 | <あなたのフォルダー パス> | いいえ | folderPath |
| ファイル一覧へのパス | コピーするファイルを一覧表示するテキスト ファイルへのパス (構成されたパスに対する相対パス)。 | <ファイル リストのパス> | いいえ | fileListPath |
| ファイル形式 | ソース データのファイル形式。 さまざまなファイル形式については、 サポートされている形式の記事を参照してください。 | / | はい | / |
| 再帰的に | データをサブフォルダーから再帰的に読み取るか、指定したフォルダーからのみ読み取るかを指定します。 このプロパティは、 ファイルの一覧を構成するときに適用されません。 | true/false | いいえ | recursive |
| 完了後にファイルを削除する | バイナリ ファイルを宛先ストアに正常に移動した後、それらのバイナリ ファイルをソース ストアから削除するかどうかを示します。 | true/false | いいえ | 処理完了後にファイルを削除 |
| 最終更新日時でフィルター処理 | 最終変更時刻が [開始時刻] から [終了時刻] の範囲内にあるファイルは、さらに処理するためにフィルター処理されます。 時刻は、 YYYY-MM-DDTHH:mm:ssZの形式で UTC タイム ゾーンに適用されます。 これらのプロパティはスキップできます。つまり、ファイル属性フィルターは適用されません。 ファイル パスの種類をファイルのリストとして構成する場合、このプロパティは適用されません。 |
<日付時刻> | いいえ | modifiedDatetimeStart 変更日時終了 |
| パーティション検出を有効にする | ファイル パスからパーティションを解析し、追加のソース列として追加するかどうかを示します。 | true/false | いいえ | enablePartitionDiscovery |
| パーティションのルート パス | パーティション検出が有効になっている場合は、パーティション分割されたフォルダーをデータ列として読み取るための絶対ルート パスを指定します。 | <パーティションのルートパス> | いいえ | パーティションルートパス (partitionRootPath) |
| 最大同時接続数 | アクティビティの実行中にデータ ストアに確立される同時接続の上限。 同時接続を制限する場合にのみ値を指定します。 | <整数> | いいえ | maxConcurrentConnections |
宛先情報
| 名前 | 説明 | 価値 | 必須 | JSON スクリプト プロパティ |
|---|---|---|---|---|
| 接続 | 宛先データストアへの接続。 | <あなたのフォルダー接続> | はい | 接続 |
| ファイル パス | ファイルの書き込み先となるフォルダー パス。 | <あなたのフォルダー パス> | はい | folderPath fileName |
| ファイル形式 | 送信先データのファイル形式。 さまざまなファイル形式の情報については、 サポートされている形式の記事を参照してください。 | / | はい | / |
| コピーの動作 | ファイルを宛先に書き込む方法を定義します。 | 階層を平坦化 MergeFiles PreserveHierarchy (既定値) |
いいえ | copyBehavior |
| 最大同時接続数 | データ ストアへの同時接続の最大数。 | <整数> | いいえ | maxConcurrentConnections |