Condividi tramite


Formato XML in Data Factory in Microsoft Fabric

Questo articolo illustra come configurare il formato XML nella pipeline di Data Factory in Microsoft Fabric.

Funzionalità supportate

Il formato XML è supportato per le seguenti attività e connettori come origine.

Categoria Connettore/Attività
Connettori supportati Amazon S3
Amazon S3 Compatibile
Azure Blob Storage
Azure Data Lake Storage Gen2
File di Azure
Sistema di file
FTP
Google Cloud Storage
HTTP
Lakehouse Files
Archiviazione in Oracle Cloud
SFTP
Attività supportata Attività di copia (origine/-)
Attività di Ricerca
Attività GetMetadata
Elimina attività

Formato XML nell'attività di copia

Per configurare il formato XML, scegliere la connessione nell'origine di un'attività di copia della pipeline e quindi selezionare XML nell'elenco a discesa Formato file. Selezionare Impostazioni per configurare ulteriormente questo formato.

Screenshot che mostra le impostazioni del formato dei file.

XML come origine

Dopo aver selezionato Impostazioni nella sezione Formato file, nella finestra di dialogo Impostazioni formato file vengono visualizzate le seguenti proprietà.

Screenshot che mostra la selezione del formato del file.

  • Tipo di compressione: codec di compressione usato per leggere i file XML. Nell’elenco a discesa è possibile scegliere tra i tipi None, bzip2, gzip, deflate, ZipDeflate, TarGzip oppure tar.

    Se si seleziona ZipDeflate come tipo di compressione, nelle impostazioni Avanzate nella scheda Origine viene visualizzato Mantenere il nome del file ZIP come cartella.

    • Mantenere il nome del file ZIP come cartella: indica se mantenere il nome del file ZIP di origine come struttura di una cartella durante la copia.
      • Se questa casella è spuntata (impostazione predefinita), il servizio scrive i file decompressi in <specified file path>/<folder named as source zip file>/.
      • Se questa casella non è spuntata, il servizio scrive i file decompressi direttamente in <specified file path>. Assicurarsi di non avere nomi di file duplicati in file ZIP di origine diversi per evitare competizione o comportamenti imprevisti.

    Se si seleziona TarGzip/tar come tipo di compressione, nelle impostazioni Avanzate nella scheda Origine viene visualizzato Mantenere il nome del file di compressione come cartella.

    • Mantenere il nome del file di compressione come cartella: indica se mantenere il nome del file compresso di origine come struttura di una cartella durante la copia.
      • Se questa casella è spuntata (impostazione predefinita), il servizio scrive i file decompressi in <specified file path>/<folder named as source compressed file>/.
      • Se questa casella non è spuntata, il servizio scrive i file decompressi direttamente in <specified file path>. Assicurati di non avere nomi di file duplicati in diversi file sorgente per evitare problemi di concorrenza o comportamenti imprevisti.
  • Livello di compressione: Specificare il rapporto di compressione quando si seleziona un tipo di compressione. È possibile scegliere tra Fastest o Ottimale.

    • Fastest: l'operazione di compressione deve essere completata il più rapidamente possibile, anche se il file risultante non viene compresso in modo ottimale.
    • Optimal: l'operazione di compressione deve comprimere il file in modo ottimale, anche se il completamento richiede più tempo. Per maggiori informazioni, vedere l'argomento relativo al livello di compressione .
  • Codifica: specificare il tipo di codifica utilizzato per scrivere i file di test. Selezionare un tipo dall’elenco a discesa. Il valore predefinito è UTF-8.

  • Valore Null: Specifica la rappresentazione di stringa del valore Null. Il valore predefinito è stringa vuota.

In Impostazioni avanzate nella scheda Origine vengono visualizzate le seguenti proprietà correlate al formato XML.

  • Modalità di convalida: Specifica se convalidare lo schema XML. Selezionare una modalità dall'elenco a discesa.

    • Nessuna: selezionare questa opzione per non usare la modalità di convalida.
    • xsd: selezionare questa opzione per convalidare lo schema XML tramite XSD.
    • dtd: selezionare questa opzione per convalidare lo schema XML tramite DTD.

    Screenshot che mostra le modalità di convalida.

  • Namespace: indicare se abilitare il namespace durante l'analisi dei file XML. È selezionato per impostazione predefinita.

  • Coppie di prefissi dello spazio dei nomi: se gli spazi dei nomi sono attivi, selezionare + Nuovo e specificare l'URL e il Prefisso. È possibile aggiungere altri abbinamenti selezionando + Nuovo.
    L'URI dello spazio dei nomi viene utilizzato per il mapping dei prefissi al fine di denominare i campi durante l'analisi del file XML. Se un file XML ha uno spazio dei nomi ed è abilitato, da predefinito, il nome del campo è lo stesso di quello nel documento XML. Se nella mappa è definito un elemento per l'URI dello spazio dei nomi, il nome del campo è prefix:fieldName.

    Screenshot che mostra le coppie di prefisso dello spazio dei nomi.

  • Rilevare il tipo di dati: Specificare se rilevare i tipi di dati interi, doppi e booleani. È selezionato per impostazione predefinita.

Tabella riepilogativa

XML come origine

Le seguenti proprietà sono supportate nella sezione Origine dell'attività di copia quando si utilizza il formato XML.

Nome Descrizione Valore Richiesto Proprietà script JSON
Formato di file Formato che si desidera usare. XML tipo (sotto datasetSettings):
XML
Tipo di compressione Codec di compressione usato per leggere file di XML. Nessuno
bzip2
gzip
deflate
ZipDeflate
TarGZip
tar
No tipo (in compression):

bzip2
gzip
compressione
ZipDeflate
TarGzip
tar
Livello di compressione  Rapporto di compressione. Il più rapido
Ottimale 
No livello (sotto compression):
Il più rapido
Ottimale
Encoding Tipo di codifica usato per leggere file di test. "UTF-8" (predefinito),"UTF-8 senza BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-1252", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" No encodingName
Mantenere il nome del file ZIP come cartella Indica se mantenere il nome del file ZIP di origine come struttura di una cartella durante la copia. selezionato (impostazione predefinita) o deselezionato No preserveZipFileNameAsFolder
(in compressionProperties->type come ZipDeflateReadSettings):
true (valore predefinito) o false
Mantenere il nome del file di compressione come cartella Indica se mantenere il nome del file compresso di origine come struttura di una cartella durante la copia. selezionato (impostazione predefinita) o deselezionato No preserveCompressionFileNameAsFolder
(in compressionProperties->type come TarGZipReadSettings o TarReadSettings):
true (valore predefinito) o false
valore NULL Rappresentazione in forma di stringa del valore null. <valore Null>
stringa vuota (impostazione predefinita)
No valore nullo
Modalità di convalida Indica se convalidare lo schema XML. Nessuno
xsd
dtd
No validationMode:

xsd
dtd
Namespaces Stabilire se abilitare lo spazio dei nomi quando si analizzano i file XML. Sselezionato (impostazione predefinita) o non selezionato No namespace:
true (valore predefinito) o false
Coppie di prefissi di spazio dei nomi L'URI dello spazio dei nomi per l'associazione dei prefissi, che viene usato per nominare i campi durante l'analisi del file XML.
Se un file XML ha uno spazio dei nomi ed è abilitato, da predefinito, il nome del campo è lo stesso di quello nel documento XML.
Se nella mappa è definito un elemento per l'URI dello spazio dei nomi, il nome del campo è prefix:fieldName.
< url >:< prefisso > No namespacePrefixes:
< url >:< prefisso >
Rileva tipo di dati Specificare se rilevare i tipi di dati interi, doppi e booleani. Sselezionato (impostazione predefinita) o non selezionato No rilevaTipoDato:
true (valore predefinito) o false