Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questo articolo illustra come configurare il formato ORC nella pipeline di Data Factory in Microsoft Fabric.
Funzionalità supportate
Il formato ORC è supportato per le attività e i connettori seguenti come origine e destinazione.
| Categoria | Connettore/attività |
|---|---|
| Connettori supportati | Amazon S3 |
| Amazon S3 Compatibile | |
| Azure Blob Storage | |
| Azure Data Lake Storage Gen2 | |
| File di Azure | |
| Sistema di file | |
| FTP | |
| Google Cloud Storage | |
| HTTP | |
| Lakehouse File | |
| Archiviazione in Oracle Cloud | |
| SFTP | |
| Attività supportata | Attività di copia (origine/destinazione) |
| Attività di Ricerca | |
| Attività di GetMetadata | |
| Elimina attività dati |
Formato ORC nell’attività di copia
Per configurare il formato ORC, scegliere la connessione nell'origine o nella destinazione di un'attività di copia della pipeline e quindi selezionare ORC nell'elenco a discesa Formato file. Selezionare Impostazioni per configurare ulteriormente questo formato.
Formato ORC come origine
Dopo aver selezionato Impostazioni nella sezione Formato file, nella finestra di dialogo Impostazioni formato file vengono visualizzate le seguenti proprietà.
- Tipo di compressione: scegliere il codec di compressione usato per leggere i file ORC nell’elenco a discesa. È possibile scegliere tra Nessuno, zlib o snappy.
Formato ORC come destinazione
Dopo aver selezionato Impostazioni, vengono visualizzate le proprietà seguenti nella finestra di dialogo Impostazioni formato file popup.
- Tipo di compressione: scegliere il codec di compressione usato per scrivere file ORC nell'elenco a discesa. È possibile scegliere tra Nessuno, zlib o snappy.
In Impostazioni avanzate nella scheda Destinazione vengono visualizzate le proprietà correlate al formato ORC seguenti.
- Numero massimo di righe per file: quando si scrivono dati in una cartella, è possibile scegliere di scrivere su più file e specificare il numero massimo di righe per file. Specificare il numero massimo di righe da scrivere per ogni file.
-
Prefisso del nome file: Applicabile quando è configurato il numero massimo di righe per file. Specificare il prefisso del nome file durante la scrittura di dati in più file, risultando in questo schema:
<fileNamePrefix>_00000.<fileExtension>. Se non specificato, il prefisso del nome file è generato automaticamente. Questa proprietà non si applica quando l'origine è l'archivio basato su file o archivio dati abilitato per l'opzione di partizione.
Tabella riepilogativa
ORC come origine
Le seguenti proprietà sono supportate nella sezione Origine dell'attività Copy quando si utilizza il formato OCR.
| Nome | Descrizione | valore | Richiesto | Proprietà script JSON |
|---|---|---|---|---|
| Formato di file | Formato che si desidera usare. | ORC | Sì | type (sotto datasetSettings):orco |
| Tipo di compressione | Codec di compressione usato per leggere il file ORC. |
Nessuno zlib snappy |
No | orcCompressionCodec (Codec di Compressione ORC) Nessuno zlib scattante |
ORC come destinazione
Le seguenti proprietà sono supportate nella sezione Destinazione dell'attività Copy quando si utilizza il formato ORC.
| Nome | Descrizione | valore | Richiesto | Proprietà script JSON |
|---|---|---|---|---|
| Formato di file | Formato che si desidera usare. | ORC | Sì | type (sotto datasetSettings):ORC |
| Tipo di compressione | Codec di compressione usato per scrivere il file ORC. |
Nessuno zlib snappy |
No | orcCompressionCodec: Nessuno zlib reattivo |
| Numero massimo di righe per file | Quando si scrivono dati in una cartella, è possibile scegliere di scrivere su più file e specificare il numero massimo di righe per file. Specificare il numero massimo di righe da scrivere per ogni file. | <numero massimo di righe per file> | No | maxRowsPerFile |
| Prefisso del nome file | Applicabile quando è configurato il numero massimo di righe per file. Specificare il prefisso del nome file durante la scrittura di dati in più file, risultando in questo schema: <fileNamePrefix>_00000.<fileExtension>. Se non specificato, il prefisso del nome file è generato automaticamente. Questa proprietà non si applica quando l'origine è l'archivio basato su file o archivio dati abilitato per l'opzione di partizione. |
<prefisso del nome del file> | No | fileNamePrefix |