Avro-muoto Data Factoryssa Microsoft Fabricissa

Avro on rivipohjainen datan sarjoittamismuoto, jota käytetään yleisesti Apache Hadoop -työkuormissa. Tässä artikkelissa kuvataan, miten Avro-muoto konfiguroidaan kopiointitoimintaputkessa Data Factoryssa Microsoft Fabric -tilassa.

Tuetut ominaisuudet

Avro-muotoa tuetaan seuraavissa toiminnoissa ja liittimillä lähteenä ja kohdesijaintina.

Luokka Liitin/toiminta
Tuettu liitin Amazon S3
Amazon S3 -yhteensopiva
Azure Blob -säilö
Azure Data Lake Storage Gen2
Azure-tiedostot
Tiedostojärjestelmä
FTP
Google-pilvitallennus
HTTP
Lakehouse-tiedostot
Oracle Cloud Storage
SFTP
Tuettu toiminta Aktiviteetin kopioiminen (lähde/kohde)
Hakutoiminta
GetMetadata-toiminta
Aktiviteetin poistaminen

Kopioi aktiviteetti -toiminnon Avro-muoto

Jos haluat määrittää Avro-muodon, valitse yhteys putken kopiointitoiminnon lähteestä tai kohteesta ja valitse sitten Avro avattavasta Tiedostomuoto-luettelosta. Valitse Asetukset , jos haluat muuttaa tämän muodon määritystä.

Näyttökuva, jossa näkyvät tiedostomuotoasetukset.

Avro-muoto lähteenä

Kun valitset Tiedostomuoto-osiossaAsetukset, seuraavat ominaisuudet näkyvät Ponnahdusikkunassa Tiedostomuotoasetukset-valintaikkunassa.

Näyttökuva, jossa näkyy Avro-tiedostomuodon lähde.

  • Pakkaustyyppi: Valitse avattavasta luettelosta Avro-tiedostojen lukuun käytettävä pakkauspakkauksenhallinta. Voit valita vaihtoehdon Ei mitään tai tyhjentää. Voit myös määrittää tyypin lausekkeen muodostimessa valitsemalla Lisää dynaaminen sisältö .

  • Pakkaustaso: Määritä pakkaussuhde. Valitse vaihtoehdoista 17. Voit myös määrittää tason lausekkeen muodostimessa valitsemalla Lisää dynaaminen sisältö .

Avro-muoto kohteena

Kun olet valinnut Asetukset, seuraavat ominaisuudet näkyvät Ponnahdusikkunassa Tiedostomuotoasetukset-valintaikkunassa.

Näyttökuva, jossa näkyy Avro-tiedostomuodon kohde.

  • Pakkaustyyppi: Valitse avattavasta luettelosta Avro-tiedostojen kirjoittamiseen käytettävä pakkauspakkauksenhallinta. Voit valita vaihtoehdon Ei mitään tai tyhjentää. Voit myös määrittää tyypin lausekkeen muodostimessa valitsemalla Lisää dynaaminen sisältö .

  • Pakkaustaso: Määritä pakkaussuhde. Valitse vaihtoehdoista 17. Voit myös määrittää tason lausekkeen muodostimessa valitsemalla Lisää dynaaminen sisältö .

Kohde-välilehden Lisäasetukset-kohdassa näkyvät seuraavat Avro-muotoiluun liittyvät ominaisuudet.

  • Rivien enimmäismäärä tiedostoa kohden: Kun kirjoitat tietoja kansioon, voit kirjoittaa useisiin tiedostoihin ja määrittää tiedostokohtaisen rivien enimmäismäärän.
  • Tiedostonimen etuliite: Käytettävissä, kun määritetään rivien enimmäismäärä tiedostoa kohden. Määritä tiedostonimen etuliite, kun kirjoitat tietoja useisiin tiedostoihin. Tuloksena on tämä malli: <fileNamePrefix>_00000.<fileExtension>. Jos tätä ei määritetä, tiedostonimen etuliite luodaan automaattisesti. Tämä ominaisuus ei päde, kun lähde on tiedostopohjainen säilö tai osioasetus käytössä oleva tietosäilö.

Avro-kopiointiaktiivisuusominaisuudet

Avro lähteenä

Seuraavia ominaisuuksia tuetaan Kopioi toiminnon lähde - osassa, kun käytetään Avro-muotoa.

Name Kuvaus Arvo Pakollinen JSON-komentosarjaominaisuus
Tiedostomuoto Käytettävä tiedostomuoto. Avro Kyllä tyyppi (alle datasetSettings):
Avro
Pakkaustyyppi Avro-tiedostojen lukemiseen käytettävä pakkauspakkauksenhallinta. Ei ole
tyhjentää
En avroCompressionCodec:

tyhjentää
Pakkaustaso Pakkaussuhde. 17 En avroCompressionLevel:
1–7

Avro kohteena

Seuraavia ominaisuuksia tuetaan Avro-muotoa käytettäessä Kopioi toiminnon kohde -osassa.

Name Kuvaus Arvo Pakollinen JSON-komentosarjaominaisuus
Tiedostomuoto Käytettävä tiedostomuoto. Avro Kyllä tyyppi (alle datasetSettings):
Avro
Pakkaustyyppi Avro-tiedostojen kirjoittamiseen käytettävä pakkauspakkauksenhallinta. Ei ole
tyhjentää
En avroCompressionCodec:

tyhjentää
Pakkaustaso Pakkaussuhde. 17 En avroCompressionLevel:
1–7
Rivien enimmäismäärä tiedostoa kohden Kun kirjoitat tietoja kansioon, voit kirjoittaa useisiin tiedostoihin ja määrittää tiedostokohtaisen rivien enimmäismäärän. < rivien enimmäismäärä tiedostoa kohden > En maxRowsPerFile
Tiedostonimen etuliite Käytettävissä, kun tiedostoa kohden on määritetty enintään riviä. Määritä tiedostonimen etuliite, kun kirjoitat tietoja useisiin tiedostoihin. Tuloksena on tämä malli: <fileNamePrefix>_00000.<fileExtension>. Jos tätä ei määritetä, tiedostonimen etuliite luodaan automaattisesti. Tämä ominaisuus ei päde, kun lähde on tiedostopohjainen säilö tai osioasetus käytössä oleva tietosäilö. < tiedostonimen etuliite > En fileNamePrefix