Muistiinpano
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää kirjautua sisään tai vaihtaa hakemistoa.
Tämän sivun käyttö edellyttää valtuutusta. Voit yrittää vaihtaa hakemistoa.
Suorituskyvyn ja luotettavuuden parantamiseksi Tietovuo Gen2 käyttää valmistelukohteita keskitason tietojen tallentamiseen tietojen muunnoksen aikana. Tässä artikkelissa on tietoja siitä, mitä valmistelukohteet ovat ja miten niiden sisältämiä tietoja käsitellään.
Mitä ovat lavastuskohteet?
Valmistelukohteet ovat tietojen välitallennuspaikkoja, joita Dataflow Gen2 käyttää tietojen tallentamiseen tietojen muuntamisen aikana. Näillä nimikkeillä on "DataflowsStagingLakehouse"- ja "DataflowsStagingWarehouse"-nimiä. Valmistelukohteita käytetään välitietojen tallentamiseen tietojen muuntamisen aikana suorituskyvyn parantamiseksi. Nämä kohteet luodaan automaattisesti, kun luot ensimmäisen tietovuon, ja Dataflow Gen2 hallitsee niitä. Nämä kohteet piilotetaan käyttäjältä työtilassa, mutta ne voivat näkyä muissa kokemuksissa, kuten Nouda tiedot tai Lakehouse-resurssienhallinnassa. Suosittelemme vahvasti, ettet pääse suoraan käyttöön tai muokkaa vaiheituskohteiden tietoja, sillä se voi johtaa odottamattomaan käyttäytymiseen. Myöskään tietojen tallentamista valmistelukohteisiin ei tueta, ja se voi johtaa tietojen menetykseen.
Vaiheittaisten nimikkeiden tiedot
Valmistelukohteita ei ole suunniteltu käyttäjien suoraa käyttöä varten. Dataflow Gen2 hallitsee valmistelukohteiden tietoja ja varmistaa, että tiedot ovat yhdenmukaisessa tilassa. Valmistelukohteiden tietojen käyttämistä suoraan ei tueta, koska ei voida taata, että tiedot ovat yhdenmukaisessa tilassa. Jos tarvitset pääsyn dataan staging-elementeissä, voit käyttää dataflow-liitintä Power BI:ssä, Excelissä tai muissa datavirroissa.
Tärkeää
Sisäinen API, joka palvelee vaiheiteltua dataa alavirran käyttäjille (kuten semanttiset mallit tai muut datavirrat Dataflows-liittimen avulla), voi kokea ajoittaisia aikakatkaisuja. Nämä aikakatkaisut voivat aiheuttaa päivitysvirheitä kulutuskohteissa, usein virheenä "Avain ei täsmännyt yhtään riviä taulukossa." Tämä virhe ei viittaa dataongelmaan. Se tarkoittaa, että taustajärjestelmä ei ehtinyt palauttaa vaiheittaisia tuloksia ajoissa.
Suositeltu kiertotie: Määritä datan kohde (Lakehouse tai Warehouse) datavirtallesi ja päivitä alavirran kohteet lukemaan suoraan kyseisestä kohteesta Lakehouse- tai Warehouse-liittimellä. Tämä ohittaa sisäisen staging-API:n ja parantaa päivityksen luotettavuutta.
Lisätietoja löytyy Data Factoryn rajoituksista.
Tietojen poistaminen valmistelukohteista voidaan pakottaa jollakin seuraavista toimista:
- Poista valmistelu käytöstä tietovuossa ja päivitä (30 päivän kuluttua poistamme tietojen keräämisen käytöstä).
- Poista tietovuo (poistaa tiedot suoraan).
- Poista työtila (poistaa suoraan StagingLakehousen ja StagingWarehousen).
Vaiheen kustannusvaikutukset
Lakehousen ja Varaston stagointi tallentavat välidataa osana datavirran käsittelyä. Näiden staging-esineiden kuluttama varastointi laskutetaan osana OneLake-varastoasi. Tämä tarkoittaa, että staging-kohteisiin tallennettu data lasketaan kokonaisvaltaiseen OneLake-tallennuskulutukseesi ja siihen liittyviin kustannuksiin.
Säilytyskustannusten tehokas hallinta:
- Seuraa staging-tallennustilan käyttöä: Ole tietoinen, että staging-data kertyy jokaisen datavirran päivityksen myötä, kunnes roskat kerätään tai poistetaan nimenomaisesti.
- Poista staging käytöstä, kun sitä ei tarvita: Jos muunnokset taittuvat lähdejärjestelmään, stagingia ei välttämättä tarvita. Vaiheen poistaminen käytöstä vähentää tallennustilan kulutusta.
- Siivoa käyttämättömät tietovirrat: Poistamalla tarpeettomat tietovirrat poistetaan välittömästi niihin liittyvän vaiheistuksen datan.
- Ota huomioon päivitystiheys: Säännölliset päivitykset, joissa vaiheistus on päällä, voivat johtaa suurempaan tallennustilan kulutukseen. Tasapainottele suorituskykyedut tallennuskustannusten kanssa.
Lisätietoja OneLake-tallennustilan hinnoittelusta löytyy Microsoft Fabricin hinnoittelusta.