Jaa


Tietojen muuntaminen suorittamalla muistikirja

Käytä Notebook-toimintoa ajaaksesi notebooks jotka luot Microsoft Fabric:ssa osana Data Factory -putkistoa. Muistikirjojen avulla voit tuoda, puhdistaa tai muuntaa tietojasi osana tietojen työnkulkuja suorittamalla Apache Spark -töitä. On helppo lisätä Notebook-aktiviteetti Fabric-putkistoon, ja tämä opas opastaa sinua jokaisen vaiheen läpi.

Edellytykset

Jotta voit aloittaa, sinun on täytettävä seuraavat edellytykset:

Muistikirja-aktiviteetin luominen

  1. Luo uusi putki työtilaasi.

  2. Etsi Muistikirja Putken aktiviteetit -ruudusta ja valitse se lisätäksesi sen putken pohjaan.

    Kuvakaappaus Fabric käyttöliittymästä, jossa Toiminnot-paneeli ja muistikirja-aktiviteetti korostettuina.

  3. Valitse pohjalle uusi Muistikirja-aktiviteetti, jos se ei jo ole valittuna.

    Näyttökuva, jossa näkyy Muistikirja-aktiviteetin Yleiset asetukset -välilehti.

    Yleiset asetukset -välilehden määrittäminen on yleisissä asetuksissa.

Muistikirjan asetusten määrittäminen

Valitse Asetukset-välilehti.

Connection-kohdasta valitse kannettavan suoritettavaksi todennusmenetelmä ja anna tarvittavat tunnistetiedot.

Valitse olemassa oleva muistikirja Muistikirja-pudotusvalikosta ja halutessasi määritä parametrit, jotka välitetään muistikirjalle.

Näyttökuva, jossa Muistikirjan asetukset -välilehti näkyy korostettuna välilehdessä, missä muistikirja valitaan ja mihin parametreja lisätään.

Fabric Workspace Identityn (WI) käyttö Notebook-toiminnossa

  1. Luo työtilan identiteetti

    Sinun täytyy ottaa WI käyttöön työtilassasi (tämän lataaminen voi kestää hetken). Luo työtilan identiteetti Fabric-työtilassasi. Huomaa, että WI tulisi luoda samassa työtilassa kuin Pipeline.

    Katso Workspace Identityn dokumentaatiot.

  2. Ota käyttöön vuokralaistason asetukset

    Ota seuraava vuokralaisen asetus käyttöön (se on oletuksena pois päältä): Palvelupäämiehet voivat kutsua Fabric julkisia rajapintoja.

    Voit ottaa tämän asetuksen käyttöön Fabric ylläpitäjäportaalissa. Lisätietoja tästä asetuksesta löytyy artikkelista Service Principal Authentication for Admin APIs -artikkeli.

  3. Myönnä työtilan käyttöoikeudet Workspace Identitylle

    Avaa työtila, valitse Hallinnoi käyttöoikeuksia ja määritä käyttöoikeudet Workspace Identitylle. Osallistujien pääsy riittää useimmissa tilanteissa. Jos muistikirjasi ei ole samassa työtilassa kuin Pipeline, sinun täytyy liittää Pipelinesi työtilassa luomallesi WI:lle vähintään Contributor-pääsy Notebookin työtilaan.

    Katso ohjeet Anna käyttäjille pääsy työtiloihin.

Määritä istuntotunniste

Jotta muistikirjatyön suorittamiseen kuluva aika olisi mahdollisimman pieni, voit halutessasi määrittää istuntotunnisteen. Istuntotunnisteen määrittäminen ohjaa Sparkin käyttämään olemassa olevaa Spark-istuntoa uudelleen minimoiden käynnistysajan. Mitä tahansa satunnaisia merkkijonoarvoja voi käyttää istuntotunnisteessa. Jos istuntoa ei ole, uusi luodaan käyttäen tunnistearvoa.

Näyttökuva, jossa Muistikirjan asetukset -välilehti näkyy korostettuna välilehdessä, johon istuntotunniste lisätään.

Muistiinpano

Jotta istuntotunnistetta voidaan käyttää, Suuren samanaikaisuuden tila useita muistikirjoja suorittavalle putkelle -asetus on otettava käyttöön. Tämä vaihtoehto löytyy Sparkin Suuren samanaikaisuuden tila -kohdasta Työtilan asetukset -kohdassa.

Näyttökuva, jossa näkyy Työtilan asetukset -välilehti korostamassa välilehteä, jossa voidaan ottaa käyttöön suuren samanaikaisuuden tila useita muistikirjoja suorittaville jaksoille.

Putken tallentaminen ja suorittaminen tai ajoittaminen

Vaihda putken editorin yläreunassa olevaan Home-välilehdelle ja valitse tallennuspainike tallentaaksesi putkesi. Valitse Run ajaaksesi sen suoraan tai Ajasta ajoittamaan ajot tiettyihin aikoihin tai välein. Lisätietoja putkistojen ajoista löytyy kohdasta: aikatauluta pipeline runs.

Näyttökuva, jossa näkyy putkieditorin Aloitus-välilehti ja välilehden nimi sekä Tallenna-, Suorita- ja Aikataulu-painikkeet korostettuina.

Suorituksen jälkeen voit seurata putkiston suoritusta ja katsoa suoritushistoriaa Output-välilehdeltä kankaan alapuolella.

Tunnetut ongelmat