コピー アクティビティでフォルダーを構成する

この記事では、パイプラインでコピー アクティビティを使用して、フォルダーとの間でデータをコピーする方法について説明します。

前提条件

フォルダーからデータをコピーするには、オンプレミス データ ゲートウェイを設定する必要があります。 詳しくは、「Data Factory でオンプレミスのデータ ソースにアクセスする方法」をご覧ください。

サポートされている形式

フォルダー コネクタは、次のファイル形式をサポートしています。 形式ベースの設定については、各記事を参照してください。

ソースでサポートされている形式

変換先でサポートされている形式

サポートされている構成

コピー アクティビティの下の各タブの構成については、それぞれ次のセクションを参照してください。

全般

[ 全般 設定] タブを構成するには、[ 全般 設定] ガイダンスを参照してください。

情報源

コピー アクティビティの [ ソース ] タブの下のフォルダーでは、次のプロパティがサポートされています。

フォルダーの [ソース] タブの構成を示すスクリーンショット。

次のプロパティは必須です。

  • 接続: 接続リストからフォルダー接続を選択します。 接続が存在しない場合は、新しいフォルダー接続を作成します。

  • ファイル パスの種類: ファイル パスファイル フィルターワイルドカード ファイル パス、またはファイル パスの種類として ファイルの一覧 を選択できます。 各設定の構成は次のとおりです。

    • ファイル パス: [参照] を選択して、コピーするファイルを選択するか、パスを手動で入力します。

    • ファイル フィルター: ファイル サーバー側のネイティブ フィルター。ワイルドカード フィルターよりもパフォーマンスが向上します。

      • フォルダー パス: フォルダーへのパスを指定します。
      • ファイル フィルター: * を使用して 0 個以上の文字に一致し、 ? を使用して 0 文字または 1 文字に一致させます。 構文と注意事項の詳細については、このセクションの 「解説 」を 参照してください
    • ワイルドカード ファイル パス: ワイルドカード パスを指定します。

      • ワイルドカード パス: ソース フォルダーまたはファイルをフィルター処理するワイルドカード文字を含むフォルダーまたはファイル パスを指定します。

        使用できるワイルドカードは、* (ゼロ文字以上の文字に一致) と ? (ゼロ文字または 1 文字に一致) です。 フォルダー名にワイルドカードまたはこのエスケープ文字がある場合は、 ^ を使用してエスケープします。

        • ワイルドカード フォルダー パス: ソース フォルダーをフィルター処理するワイルドカード文字を含むフォルダー パスを指定します。

        • ワイルドカード ファイル名: ソース ファイルをフィルター処理するために、指定したフォルダー パス (またはワイルドカード フォルダー パス) の下にワイルドカード文字を使用してファイル名を指定します。

    • ファイルの一覧: 特定のファイル セットをコピーすることを示します。

      • フォルダー パス: フォルダーへのパスを指定します。
      • ファイル リストへのパス: コピーするファイルの一覧を含むテキスト ファイルをポイントします。構成されているパスへの相対パスであるファイルを 1 行につき 1 つずつ指定します。
  • ファイル形式: ドロップダウン リストから適用されるファイル形式を選択します。 [設定] を 選択してファイル形式を構成します。 さまざまなファイル形式の設定については、 サポートされている形式の記事を参照してください。

次のプロパティは 省略可能です

  • 再帰的: データをサブフォルダーから再帰的に読み取るか、指定したフォルダーからのみ読み取るかを指定します。 このプロパティは既定で選択され、 ファイルの一覧を構成するときに適用されません。
  • 完了後にファイルを削除する: コピー先ストアに正常に移動した後、バイナリ ファイルがソース ストアから削除されるかどうかを示します。 ファイルの削除はファイルごとに行われます。 このプロパティは、バイナリ ファイルのコピー シナリオでのみ有効です。

[詳細設定] では、次のフィールドを指定できます。

  • 最終更新日でフィルター処理: 最後に変更された日付に基づいてファイルがフィルター処理されます。 ファイル パスの種類をファイルのリストとして構成する場合、このプロパティは適用されません。

    • 開始時刻 (UTC): ファイルは、最終変更時刻が構成された時刻以上の場合に選択されます。

    • 終了時刻 (UTC): 最終変更時刻が構成された時間より短い場合、ファイルが選択されます。

    開始時刻 (UTC) に datetime 値があるのに終了時刻 (UTC) が NULL の場合、最終変更属性が datetime 値以上のファイルが選択されることを意味します。 終了時刻 (UTC) に datetime 値があるのに開始時刻 (UTC) が NULL の場合、最終変更属性が datetime 値より小さいファイルが選択されることを意味します。 プロパティには NULL を指定できます。つまり、ファイル属性フィルターはデータに適用されません。

  • パーティション検出を有効にする: ファイル パスからパーティションを解析し、追加のソース列として追加するかどうかを指定します。 既定では選択されず、バイナリ ファイル形式を使用する場合はサポートされません。

    • パーティション ルート パス: パーティション検出が有効になっている場合は、パーティション分割されたフォルダーをデータ列として読み取るために絶対ルート パスを指定します。

      これが指定されていない場合は、既定で次のようになります。

      • ソースでファイル パスまたはファイルの一覧を使用する場合、パーティション ルート パスは構成したパスです。
      • ワイルドカード フォルダー フィルターを使用する場合、パーティション ルート パスは最初のワイルドカードの前のサブパスです。
  • 最大同時接続数: このプロパティは、アクティビティの実行中にデータ ストアに対して確立された同時接続の上限を示します。 同時接続を制限する場合にのみ値を指定します。

行き先

コピー アクティビティの [ 宛先 ] タブの下のフォルダーでは、次のプロパティがサポートされています。

フォルダーの [宛先] タブの構成を示すスクリーンショット。

次のプロパティは必須です。

  • 接続: 接続リストからフォルダー接続を選択します。 接続が存在しない場合は、新しいフォルダー接続を作成します。

  • [ファイル パス]: [参照 ] を選択して、パスを手動でコピーまたは入力するファイルを選択します。

  • ファイル形式: ドロップダウン リストから適用されるファイル形式を選択します。 [設定] を 選択してファイル形式を構成します。 さまざまなファイル形式の設定については、 サポートされている形式の記事を参照してください。

次のプロパティは 省略可能です

[詳細設定] では、次のフィールドを指定できます。

  • コピー動作: ソースがファイル ベースのデータ ストアのファイルである場合のコピー動作を定義します。 ドロップダウン リストからビヘイビアーを選択できます。

    • 階層のフラット化: ソース フォルダーのすべてのファイルがコピー先フォルダーの第一レベルに配置されます。 コピー先ファイルには自動生成された名前があります。
    • ファイルのマージ: ソース フォルダーのすべてのファイルを 1 つのファイルにマージします。 ファイル名を指定した場合、マージされたファイル名は指定した名前になります。 それ以外の場合は、自動生成されたファイル名です。
    • 階層の保持 (既定値): ターゲット フォルダー内のファイル階層を保持します。 ソース ファイルからソース フォルダーへの相対パスは、ターゲット フォルダーへのターゲット ファイルの相対パスと同じです。
  • 最大コンカレント接続数: アクティビティの実行中にデータ ストアに対して確立されるコンカレント接続数の上限。 同時接続を制限する場合にのみ値を指定します。

地図作成

[マッピング] タブの構成については、「[マッピング] タブでマッピングを構成する」を参照してください。

Settings

設定 タブの構成については、設定タブのの下で他の設定を構成するに移動します。

表の概要

次の表に、フォルダー内のコピー アクティビティの詳細を示します。

ソース情報

名前 説明 価値 必須 JSON スクリプト プロパティ
接続 ソース データ ストアへの接続。 <フォルダー接続> はい 接続
ファイル パスの種類 ソース データの取得に使用されるファイル パスの種類。 / はい /
ファイル パスの場合
ファイル パス ファイルの読み取り先となるフォルダーまたはファイル パス。 <フォルダーまたはファイル パス> いいえ folderPath
fileName
ファイル フィルターの場合
フォルダー パス フォルダーへのパスを指定します。 <あなたのフォルダー パス> いいえ folderPath
ファイル フィルター ファイル サーバー側のネイティブ フィルター。 <ファイル フィルター> いいえ fileFilter
ワイルドカード ファイル パスの場合
ワイルドカード フォルダーのパス ソース フォルダーのフィルター処理に使用されるワイルドカード フォルダー パス。 <ワイルドカード文字を使用したフォルダー パス> いいえ wildcardFolderPath
ワイルドカード ファイル名 ソース ファイルのフィルター処理に使用されるワイルドカード ファイル名パターン。 <ワイルドカード文字を使用したファイル名> いいえ wildcardFileName
ファイルの一覧
フォルダー パス フォルダーへのパスを指定します。 <あなたのフォルダー パス> いいえ folderPath
ファイル一覧へのパス コピーするファイルを一覧表示するテキスト ファイルへのパス (構成されたパスに対する相対パス)。 <ファイル リストのパス> いいえ fileListPath
ファイル形式 ソース データのファイル形式。 さまざまなファイル形式については、 サポートされている形式の記事を参照してください。 / はい /
再帰的に データをサブフォルダーから再帰的に読み取るか、指定したフォルダーからのみ読み取るかを指定します。 このプロパティは、 ファイルの一覧を構成するときに適用されません。 true/false いいえ recursive
完了後にファイルを削除する バイナリ ファイルを宛先ストアに正常に移動した後、それらのバイナリ ファイルをソース ストアから削除するかどうかを示します。 true/false いいえ 処理完了後にファイルを削除
最終更新日時でフィルター処理 最終変更時刻が [開始時刻] から [終了時刻] の範囲内にあるファイルは、さらに処理するためにフィルター処理されます。 時刻は、 YYYY-MM-DDTHH:mm:ssZの形式で UTC タイム ゾーンに適用されます。 これらのプロパティはスキップできます。つまり、ファイル属性フィルターは適用されません。 ファイル パスの種類をファイルのリストとして構成する場合、このプロパティは適用されません。 <日付時刻> いいえ modifiedDatetimeStart
変更日時終了
パーティション検出を有効にする ファイル パスからパーティションを解析し、追加のソース列として追加するかどうかを示します。 true/false いいえ enablePartitionDiscovery
パーティションのルート パス パーティション検出が有効になっている場合は、パーティション分割されたフォルダーをデータ列として読み取るための絶対ルート パスを指定します。 <パーティションのルートパス> いいえ パーティションルートパス (partitionRootPath)
最大同時接続数 アクティビティの実行中にデータ ストアに確立される同時接続の上限。 同時接続を制限する場合にのみ値を指定します。 <整数> いいえ maxConcurrentConnections

宛先情報

名前 説明 価値 必須 JSON スクリプト プロパティ
接続 宛先データストアへの接続。 <あなたのフォルダー接続> はい 接続
ファイル パス ファイルの書き込み先となるフォルダー パス。 <あなたのフォルダー パス> はい folderPath
fileName
ファイル形式 送信先データのファイル形式。 さまざまなファイル形式の情報については、 サポートされている形式の記事を参照してください。 / はい /
コピーの動作 ファイルを宛先に書き込む方法を定義します。 階層を平坦化
MergeFiles
PreserveHierarchy (既定値)
いいえ copyBehavior
最大同時接続数 データ ストアへの同時接続の最大数。 <整数> いいえ maxConcurrentConnections