Condividi tramite


Configurare la cartella in un'attività di copia

Questo articolo illustra come usare l'attività di copia in una pipeline per copiare dati da e in cartella.

Prerequisiti

Per copiare dati da Cartella, è necessario configurare un gateway dati locale. Per altre informazioni, vedere Come accedere alle origini dati locali in Data Factory.

Formato supportato

Il connettore Folder supporta i formati di file seguenti. Per impostazioni basate sui formati, fare riferimento ai singoli articoli.

Formati supportati dall'origine

Formati supportati dalla destinazione

Configurazione supportata

Per la configurazione di ogni scheda nell'attività di copia, vai rispettivamente alle sezioni seguenti.

Generali

Fare riferimento alle indicazioni generali sulle impostazioni per configurare la scheda Impostazioni generali .

origine

Le proprietà seguenti sono supportate per Folder nella scheda Origine di un'attività di copia.

Screenshot che illustra la configurazione della scheda Origine per Cartella.

Le proprietà seguenti sono necessarie:

  • Connessione: selezionare una connessione cartella dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione alla cartella.

  • Tipo di percorso file: è possibile scegliere Percorso di file, Filtro file, Percorso file con caratteri jolly o Elenco di file come tipo di percorso del file. La configurazione per ogni impostazione è:

    • Percorso file: selezionare Sfoglia per scegliere il file che si vuole copiare o compilare manualmente il percorso.

    • Filtro file: filtro nativo lato server di file, che offre prestazioni migliori rispetto a un filtro con caratteri jolly.

      • Percorso cartella: specificare il percorso della cartella.
      • Filtro file: usare * per trovare la corrispondenza con zero o più caratteri e ? per trovare la corrispondenza con zero o un singolo carattere. Per altre informazioni sulla sintassi e sulle note della sezione Osservazioni , vedere questa sezione.
    • Percorso del file con caratteri jolly: Specificare i percorsi con caratteri jolly.

      • Percorsi jolly: specificare il percorso della cartella o del file con caratteri jolly per filtrare cartelle o file di origine.

        I caratteri jolly consentiti sono: * (corrispondenza di zero o più caratteri) e ? (corrispondenza di zero caratteri o di un carattere singolo). Utilizza ^ per eseguire l'escape se il nome della cartella contiene caratteri jolly o il carattere di escape specificato all'interno.

        • Percorso della cartella con caratteri jolly: specificare il percorso della cartella con caratteri jolly per filtrare le cartelle di origine.

        • Nome file con caratteri jolly: specificare il nome del file con caratteri jolly nel percorso della cartella specificato (o percorso della cartella con caratteri jolly) per filtrare i file di origine.

    • Elenco di file: indica che si vuole copiare un determinato set di file.

      • Percorso cartella: specificare il percorso della cartella.
      • Percorso per la lista di file: Indica un file di testo che include un elenco di file da copiare, con un file per riga, che rappresenta il percorso relativo del file configurato.
  • Formato file: selezionare il formato di file applicato dall'elenco a discesa. Selezionare Impostazioni per configurare il formato di file. Per le impostazioni di formati di file diversi, vedere gli articoli in Formato supportato.

Le proprietà seguenti sono facoltative:

  • Ricorsivamente: specificare se i dati vengono letti in modo ricorsivo dalle sottocartelle o solo dalla cartella specificata. Questa proprietà è selezionata per impostazione predefinita e non si applica quando si configura l'elenco di file.
  • Elimina file dopo il completamento: indica se i file binari vengono eliminati dall'archivio di origine dopo il corretto spostamento nell'archivio di destinazione. L'eliminazione dei file avviene per file. Questa proprietà è valida solo nello scenario di copia dei file binari.

Sotto Avanzate, è possibile specificare i campi seguenti:

  • Filtro in base all'ultima modifica: i file vengono filtrati in base alle date dell'ultima modifica. Questa proprietà non si applica quando si configura il tipo di percorso del file come Elenco di file.

    • Ora di inizio (UTC): i file vengono selezionati se l'ora dell'ultima modifica è maggiore o uguale all'ora configurata.

    • Ora di fine (UTC): i file vengono selezionati se l'ora dell'ultima modifica è inferiore all'ora configurata.

    Quando l'ora di inizio (UTC) ha un valore datetime ma l'ora di fine (UTC) è NULL, significa che verranno selezionati i file il cui ultimo attributo modificato è maggiore o uguale al valore datetime. Quando l'ora di fine (UTC) ha un valore datetime, ma ora di inizio (UTC) è NULL, significa che i file il cui ultimo attributo modificato è minore del valore datetime verrà selezionato. Le proprietà possono essere NULL, il che significa che ai dati non verrà applicato alcun filtro sugli attributi del file.

  • Abilita l'individuazione della partizione: specificare se analizzare le partizioni dal percorso del file e aggiungerle come colonne di origine aggiuntive. Non è selezionata per impostazione predefinita e non è supportata quando si usa il formato di file binario.

    • Percorso radice della partizione: quando l'individuazione delle partizioni è abilitata, specificare il percorso radice assoluto per leggere le cartelle partizionate come colonne di dati.

      Se ciò non è specificato, per impostazione predefinita,

      • Quando si usa il percorso dei file o l'elenco dei file sull'origine, il percorso principale della partizione è il percorso configurato.
      • Quando si usa il filtro di cartelle con wildcard, il percorso radice della partizione corrisponde al sotto-percorso che precede il primo wildcard.
  • Numero massimo di connessioni simultanee: questa proprietà indica il limite massimo di connessioni contemporanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.

Destinazione

Le proprietà seguenti sono supportate per Folder nella scheda Destinazione di un'attività di copia.

Screenshot che mostra la configurazione della scheda Destinazione per Cartella.

Le proprietà seguenti sono necessarie:

  • Connessione: selezionare una connessione cartella dall'elenco delle connessioni. Se non esiste alcuna connessione, creare una nuova connessione di cartella.

  • Percorso file: selezionare Sfoglia per scegliere il file che si vuole copiare o compilare manualmente il percorso.

  • Formato file: selezionare il formato di file applicato dall'elenco a discesa. Selezionare Impostazioni per configurare il formato di file. Per le impostazioni di formati di file diversi, vedere gli articoli in Formato supportato.

Le proprietà seguenti sono facoltative:

Sotto Avanzate, è possibile specificare i campi seguenti:

  • Comportamento di copia: si definisce comportamento di copia quando l'origine è costituita da file di un archivio dati basato su file. È possibile scegliere un comportamento dall'elenco a discesa.

    • - FlattenHierarchy: tutti i file della cartella di origine si trovano nel primo livello della cartella di destinazione. I nomi dei file di destinazione vengono generati automaticamente.
    • Unire i file: unisce tutti i file della cartella di origine in un solo file. Se si specifica il nome di file, il nome del file unito sarà il nome specificato. In caso contrario, verrà usato un nome di file generato automaticamente.
    • Mantieni gerarchia (impostazione predefinita): mantiene la gerarchia di file nella cartella di destinazione. Il percorso relativo del file di origine nella cartella di origine è identico al percorso relativo del file di destinazione nella cartella di destinazione.
  • Connessioni massime simultanee: il limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione dell'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee.

mappatura

Per la configurazione della scheda Mapping, accedere a Configurare i mapping nella scheda Mapping.

Settings

Per la configurazione della scheda Impostazioni, vedere Configurare le altre impostazioni nella scheda Impostazioni.

Riepilogo della tabella

Le tabelle seguenti contengono altre informazioni sull'attività di copia in Cartella.

Informazioni sull'origine

Nome Descrizione Valore Obbligatorio Proprietà dello script JSON
Connessione La tua connessione all'archivio dati di origine. <tua connessione alla cartella> connessione
Tipo di percorso del file Tipo di percorso del file utilizzato per ottenere i dati di origine. / /
Per Percorso file
Percorso file Percorso della cartella o del file da cui vengono letti i file. <percorso della cartella o del file> No folderPath
nome del file
Per Filtro file
Percorso cartella Specificare il percorso della cartella. <percorso della cartella> No folderPath
Filtro dei file Filtro nativo lato file server. <filtro file> No fileFilter
Per Percorso file con caratteri jolly
Percorso cartella con caratteri jolly Percorso della cartella con caratteri jolly usato per filtrare le cartelle di origine. <il percorso della cartella con caratteri wildcard> No wildcardFolderPath
Nome file con carattere jolly Modello di nome file con caratteri jolly usato per filtrare i file di origine. <il tuo nome file con caratteri jolly> No wildcardFileName
Per Elenco di file
Percorso cartella Specificare il percorso della cartella. <percorso della cartella> No folderPath
Percorso all'elenco di file Percorso di un file di testo che elenca i file da copiare (rispetto al percorso configurato). <percorso di elenco file> No fileListPath
Formato di file Formato di file per i dati di origine. Per informazioni sui diversi formati di file, vedere articoli in Formato supportato. / /
Ricorsivamente Indica se i dati vengono letti in modo ricorsivo dalle cartelle secondarie o solo dalla cartella specificata. Questa proprietà non si applica quando si configura l'elenco di file. true/false No ricorsivo
Eliminare i file dopo il completamento Indica se i file binari vengono eliminati dall'archivio di origine dopo il passaggio all'archivio di destinazione. true/false No deleteFilesAfterCompletion
Filtra per data ultima modifica I file con ora dell'ultima modifica nell'intervallo (Ora di inizio, Ora di fine) verranno filtrati per un'ulteriore elaborazione. L'ora sarà applicata al fuso orario UTC nel formato YYYY-MM-DDTHH:mm:ssZ. Queste proprietà possono essere ignorate, a indicare che non viene applicato alcun filtro di attributo di file. Questa proprietà non si applica quando si configura il tipo di percorso del file come Elenco di file. <Data e ora> No modifiedDatetimeStart
modifiedDatetimeEnd
Abilitare l'individuazione delle partizioni Indica se analizzare le partizioni dal percorso del file e aggiungerle come colonne di origine aggiuntive. true/false No enablePartitionDiscovery
Percorso radice partizione Quando l'individuazione delle partizioni è abilitata, specificare il percorso radice assoluto per leggere le cartelle partizionate come colonne di dati. <il percorso della radice della tua partizione> No partitionRootPath
Numero massimo di connessioni simultanee Limite massimo di connessioni simultanee stabilite all'archivio dati durante l'esecuzione di un'attività. Specificare un valore solo quando si desidera limitare le connessioni simultanee. <Intero> No maxConcurrentConnections

Informazioni sulla destinazione

Nome Descrizione Valore Obbligatorio Proprietà dello script JSON
Connessione La tua connessione all'archivio dati di destinazione. <la tua connessione alla cartella> connessione
Percorso file Percorso della cartella in cui vengono scritti i file. <percorso della cartella> folderPath
nome del file
Formato di file Formato di file per i dati di destinazione. Per informazioni sui diversi formati di file, vedere articoli in Formato supportato. / /
Comportamento di copia Definisce la modalità di scrittura dei file nella destinazione. FlattenHierarchy
MergeFiles
PreserveHierarchy (impostazione predefinita)
No copyBehavior
Numero massimo di connessioni simultanee Numero massimo di connessioni simultanee all'archivio dati. <Intero> No maxConcurrentConnections