Suorita Delta-pöydän huoltoa Lakehousessa

Suorita taulujen ylläpito Delta-tauluissa, jotta ne pysyvät terveinä ajan myötä tiivistämällä pieniä tiedostoja, soveltamalla lukuoptimaaleja ja poistamalla vanhentuneet tiedostot, joita ei enää viitata.

Voit suorittaa ylläpidon joko ad hoc -operaationa Fabric-portaalissa (Lakehouse-taulukko Maintenance toiminto) tai aikataulutettuna ja orkestroituna prosessina käyttämällä muistikirjoja, pipelines tai REST API:a. Fabric Data Factory -putkistot sisältävät omistetun Lakehouse Maintenance -toiminnon (Preview), joka voi suorittaa OPTIMotiota (valinnaisella V-Orderilla) ja VACUumia Lakehouse Delta -tauluilla osana aikataulutettuja putkistojen työnkulkuja. Tämä artikkeli keskittyy ad hoc -portaalin työnkulkuun.

Ohjeistusta työkuormien välisen ylläpidon osalta, mukaan lukien suositukset SQL-analytiikan päätepisteille, Power BI Direct Lakelle ja Data Warehouse kuluttajille, löytyy kohdasta Cross-workload table maintenance and optimization. Koodilähtöisiä ylläpitomalleja varten katso Delta Lake -taulun optimointi ja V-Order sekä Manage the Lakehouse with Microsoft Fabric REST API.

Suorita pöydän huolto Lakehousesta

Pöytien ylläpito Lakehousessa koskee vain Delta-pöytiä. Legacy Hive -taulukoita, jotka käyttävät formaatteja kuten Parquet, ORC, AVRO tai CSV, eivät ole tuettuja.

Suorita ylläpitokomennot -valintaikkunassa valitse asetukset tavoitteesi mukaan.

Yleisenä käytäntönä suorita ylläpito suuren syöttö- tai päivitystoiminnan jälkeen tai kun huomaat paljon pieniä tiedostoja ja hitaampaa lukusuoritusta.

Muistiinpano

Järjestä putkistoja: Toistuviin huoltotöihin käytä Lakehouse Maintenance -toimintoa (Preview) Fabric Data Factory -putkistoissa. Se avaa samat vaihtoehdot (OPTIMOI valinnaisella V-Orderilla, VACUUM) ja integroituu muihin putkiston vaiheisiin riippuvuuksien, laukaisujen ja parametrien kautta – joten voit ketjuttaa ylläpidon datalatauksiin ja seurata Refresh SQL Endpoint -toimintoa samassa putkessa.

  1. Siirry Microsoft Fabric -tililtäsi haluamaansa Lakehouseen.

  2. Lakehouse Explorerissa, taulukoiden kohdalla, napsauta kohdetaulukkoa oikealla (tai käytä ellipsiä).

  3. Valitse Ylläpito-valikkomerkintä.

    Kuvakaappaus, jossa näkyy Suorita ylläpitokomennot -valinta.

  4. Suorita ylläpitokomennot -valintaikkunassa valitse ylläpitoasetukset:

    • Valitse On-vaihtoehto tiivistääksesi pienet Parquet-tiedostot suuremmiksi tiedostoiksi tehokkaampaa lukemista varten.

    • Jos On valittuna, voit myös valita Apply V-Order -valintaruudun. Kun valitset tämän vaihtoehdon, Fabric käyttää V-Orderia (optimoitu lajittelu, koodaus ja pakkaus) osana optimointia.

      Muistiinpano

      V-Orderilla on noin 15% vaikutus keskimääräisiin kirjoitusaikoihin. Se voi myös tarjota jopa 50% enemmän puristusta.

    • Valitse On-asetus suorittaaksesi Delta Lake -komennon ja poistaaksesi VACUUM viitamattomat tiedostot, jotka ovat vanhempia kuin säilytysrajasi. Pidätyskäyttäytymisen ja turvallisuustietojen osalta katso Tyhjiön pidätysasetukset.

    • Valitse On-vaihtoehto yhdistääksesi tapahtumat parquet-tiedostoiksi ja poistaaksesi lisäpoistovektoritiedostot, jolloin tilaa tyhjennetään, ja taulukon lukeminen optimoidaan.

  5. Suorita taulukon ylläpitotyö valitsemalla Suorita nyt .

  6. Seuraa työn suorittamista jommassakummassa näistä paikoista:

    • Ilmoituspaneeli (kellokuvake Fabric-portaalin otsikossa) välittömän suoritustilan saamiseksi.
    • Seurantakeskus (valitse Monitori vasemmasta navigoinnista) saadaksesi täydelliset työtiedot. Etsi toimintoja, jotka sisältyvät TableMaintenance portaalin aloittamiin suorituksiin aktiviteettinimessä. Fabric Data Factory -putkistoissa suoritettaessa etsi putki Monitoring hub > Pipelines -näkymästä ja suodata Lakehouse Maintenance -toiminnon nimellä.

Kun olet suorittanut ylläpidon, onnistuminen näkyy suoritettuna taulukon ylläpitotoimintona Ilmoituksissa ja TableMaintenance onnistuneena merkintänä Valvontahubissa.

Lisätietoja Monitoring hubin navigoinnista ja suodattimista löytyy osoitteesta Käytä valvontahubia.

Tyhjiön pidätysasetukset

Komento VACUUM poistaa tiedostoja, joita Delta-loki ei enää viittaa ja jotka ovat vanhempia kuin säilytysrajasi. Oletuspysyvyyskynnys on seitsemän päivää.

Lyhyempi muistamisväli voi vähentää Deltan aikamatkustushistoriaa ja vaikuttaa samanaikaisiin lukijoihin tai kirjoittajiin. Fabric-portaalin ja API:n ylläpitopyynnöt epäonnistuvat oletuksena alle seitsemän päivän säilytysjaksoilla.

Jos sinun täytyy käyttää säilytysväliä alle seitsemän päivää, aseta spark.databricks.delta.retentionDurationCheck.enabledfalse se Fabric-ympäristön Spark-ominaisuuksiin, joita työtilasi Spark-työkuormat käyttävät. Jos haluat oppia, missä ympäristöt konfiguroidaan ja liitetään, katso Create, configure, and use an environment in Fabric- ja Spark Compute configuration settings in Fabric.