Del via


Transformere data ved å kjøre en notatblokk

Bruk Notebook-aktiviteten til å kjøre notebooks du lager i Microsoft Fabric som en del av Data Factory-pipelinene dine. Med notatblokker kan du kjøre Apache Spark-jobber for å hente inn, rydde opp eller transformere dataene som en del av dataarbeidsflytene. Det er enkelt å legge til en Notebook-aktivitet i pipelinene dine i Fabric, og denne guiden guider deg gjennom hvert steg.

Forutsetning

Du må fullføre følgende forutsetninger for å komme i gang:

Opprette en notatblokkaktivitet

  1. Opprett et nytt datasamlebånd i arbeidsområdet.

  2. Søk etter notatblokk i ruten Forløpsaktiviteter, og velg den for å legge den til i datasamlebåndlerretet.

    Skjermbilde av Fabric UI med Aktiviteter-panelet og notatblokkaktivitet markert.

  3. Velg den nye notatblokkaktiviteten på lerretet hvis den ikke allerede er valgt.

    Skjermbilde som viser fanen Generelle innstillinger i notatblokkaktiviteten.

    Se veiledningen for generelle innstillinger for å konfigurere fanen Generelle innstillinger.

Konfigurer notatblokkinnstillinger

Velg fanen Innstillinger.

Under Tilkobling velger du autentiseringsmetoden for notatblokkens kjøring og oppgir nødvendige legitimasjoner.

Velg en eksisterende notatbok fra nedtrekksmenyen Notatbok , og spesifiser eventuelt eventuelle parametere som skal sendes til notatboken.

Skjermbilde som viser notatblokkinnstillinger-fanen som uthever fanen, hvor du velger en notatblokk og hvor du legger til parametere.

Bruk av Fabric Workspace Identity (WI) i Notatbok-aktiviteten

  1. Opprett Workspace-identiteten

    Du må aktivere WI i arbeidsområdet ditt (dette kan ta litt tid å laste). Lag en arbeidsplassidentitet i din Fabric-arbeidsplass. Merk at WI skal opprettes i samme arbeidsområde som pipelinen din.

    Sjekk ut dokumentasjonen om Workspace Identity.

  2. Aktiver innstillinger på leietakernivå

    Aktiver følgende leietakerinnstilling (den er deaktivert som standard): tjenesteledere kan kalle Fabric offentlige API-er.

    Du kan aktivere denne innstillingen i Fabric admin-portalen. For mer informasjon om denne innstillingen, se artikkelen om enable service principal authentication for admin APIs.

  3. Gi arbeidsområdetillatelser til arbeidsområdets identitet

    Åpne arbeidsområdet, velg Administrer tilgang, og tildel tillatelser til arbeidsområdets identitet. Bidragsytertilgang er tilstrekkelig for de fleste scenarioer. Hvis notatboken din ikke er i samme arbeidsområde som pipelinen din, må du tildele WI du opprettet i pipelinens arbeidsområde minst bidragsytertilgang til notatbokens arbeidsområde.

    Sjekk dokumentasjonen om Gi brukere tilgang til arbeidsområder.

Angi øktkode

Hvis du vil minimere tiden det tar å utføre notatblokkjobben, kan du eventuelt angi en øktkode. Når du angir øktkoden, blir Spark bedt om å bruke eventuelle eksisterende Spark-økter på nytt, noe som minimerer oppstartstiden. Alle tilfeldige strengverdier kan brukes for øktkoden. Hvis det ikke finnes noen økt, opprettes en ny ved hjelp av kodeverdien.

Skjermbilde som viser notatblokkinnstillinger-fanen som uthever fanen, der du kan legge til øktkode.

Merk

Hvis du vil kunne bruke øktkoden, må modus for høy samtidighet for datasamlebånd som kjører flere notatblokker, være aktivert. Du finner dette alternativet under høy samtidighetsmodus for Spark-innstillinger under innstillingene for arbeidsområde

Skjermbilde som viser fanen Innstillinger for arbeidsområde som uthever fanen, der du kan aktivere modus for høy samtidighet for datasamlebånd som kjører flere notatblokker.

Lagre og kjøre eller planlegge datasamlebåndet

Bytt til Hjem-fanen øverst i pipeline-editoren og velg lagre-knappen for å lagre pipelinen din. Velg Kjør for å kjøre det direkte eller Planlegg for å planlegge løp til bestemte tider eller intervaller. For mer informasjon om rørledningskjøringer, se: planlegg rørledningskjøringer.

Skjermbilde som viser Hjem-fanen i redigeringsprogrammet for datasamlebånd med knappene Lagre, Kjør og Planlegg uthevet.

Etter kjøring kan du overvåke pipeline-kjøringen og se kjørehistorikk fra Output-fanen under lerretet.

Kjente problemer