Del via


Dataflyt gen2 med CI/CD og Git-integrasjon

Dataflow Gen2 støtter kontinuerlig integrering/kontinuerlig distribusjon (CI/CD) og Git-integrasjon. Du kan opprette, redigere og administrere dataflyter i et Git-repositorium koblet til Fabric-arbeidsområdet ditt. Bruk utrullingssamlebånd til å automatisere flytting av dataflyter mellom arbeidsområder. Denne artikkelen forklarer hvordan du bruker disse funksjonene i Fabric Data Factory.

Funksjoner

Dataflow Gen2 med CI/CD- og Git-integrasjon tilbyr en rekke funksjoner for å effektivisere arbeidsflyten. Dette kan du gjøre med disse funksjonene:

  • Integrer Git med Dataflow Gen2.
  • Automatiser dataflytdistribusjon mellom arbeidsområder ved hjelp av utrullingssamlebånd.
  • Oppdater og rediger Dataflow Gen2-innstillinger med Fabric-verktøy.
  • Opprett Dataflow Gen2 direkte i en arbeidsområdemappe.
  • Bruk offentlige API-er (forhåndsversjon) til å administrere Dataflow Gen2 med CI/CD- og Git-integrasjon.

Prerequisites

Før du begynner, må du sørge for at du:

Opprett en dataflyt Gen2 med CI/CD- og Git-integrasjon

Alle nye Dataflow Gen2-elementer opprettes som standard med støtte for CI/CD og Git-integrasjon. Følg disse trinnene for å komme i gang:

  1. I Fabric-arbeidsområdet velger du Opprett nytt element, og velg deretter Dataflow Gen2.

    Skjermbilde av Nytt element-vinduet med Dataflyt gen2-elementet fremhevet.

  2. Navngi dataflyten din og velg Opprett. Git-integrasjon er aktivert som standard for alle nye Dataflow Gen2-elementer.

    Skjermbilde av New Dataflow Gen2 (CI/CD)-dialogen med Navn-feltet og Opprett-knappen.

    Dataflyten åpnes på redigeringslerretet, der du kan begynne å opprette dataflyten.

  3. Når du er ferdig, velger du Lagre og kjør.

  4. Etter publisering viser dataflyten statusen «uforpliktet».

    Skjermbilde av den lagrede dataflyten Gen2 med statusen vist som uforpliktende.

  5. Hvis du vil utføre dataflyten til Git, velger du kildekontrollikonet øverst til høyre.

    Skjermbilde av kildekontrollknappen.

  6. Velg endringene som skal utføres, og velg deretter Utfør.

    Skjermbilde av kildekontrollvinduet med dataflyten valgt og Utfør-knappen fremhevet.

Dataflow Gen2 med CI/CD- og Git-integrasjon er klar. Hvis du vil ha anbefalte fremgangsmåter, kan du se opplæringen Scenario 2 – Utvikle ved hjelp av et annet arbeidsområde .

Oppdater en dataflyt Gen2

Oppdatering av en Dataflow Gen2 sikrer at dataene dine er up-to-dato. Du kan oppdatere manuelt eller sette opp en tidsplan for å automatisere prosessen.

Oppdater nå

  1. I Fabric-arbeidsområdet velger du ellipsen ved siden av dataflyten.

  2. Velg Oppdater nå.

    Skjermbilde av rullegardinmenyen flere alternativer med oppdater nå-alternativene fremhevet.

Planlegge en oppdatering

  1. I Fabric-arbeidsområdet velger du ellipsen ved siden av dataflyten.

  2. Velg Planlegg.

    Skjermbilde av rullegardinmenyen flere alternativer med alternativet Tidsplan fremhevet.

  3. På tidsplansiden angir du oppdateringsfrekvens, starttidspunkt og sluttidspunkt. Bruk endringer.

    Skjermbilde av dataflytens innstillingsskjerm med Tidsplan-fanen valgt, og Oppdater-knappen fremhevet.

  4. Hvis du vil oppdatere umiddelbart, velger du Oppdater.

Vise oppdateringslogg og innstillinger

Å forstå oppdateringsloggen og administrere innstillinger hjelper deg med å overvåke og kontrollere Dataflow Gen2. Slik får du tilgang til disse alternativene.

Hvis du vil vise oppdateringsloggen, velger du fanen nylige kjøringer i rullegardinmenyen eller går til skjermhuben og velger dataflyten.

Få tilgang til dataflytinnstillinger ved å velge ellipsen ved siden av dataflyten og velge Innstillinger.

Lagre erstatter publisering

Lagringsoperasjonen i Dataflow Gen2 med CI/CD- og Git-integrasjon publiserer automatisk endringer, noe som forenkler arbeidsflyten.

Når du lagrer en dataflyt Gen2, publiseres endringer automatisk. Hvis du vil forkaste endringer, velger du Forkast endringer når du lukker redigeringsprogrammet.

Validation

Når du lagrer, sjekker systemet om dataflyten er gyldig. Hvis ikke, vises det en feil i arbeidsområdevisningen. Validering kjører en «null rad»-evaluering, som kontrollerer spørringsskjemaer uten å returnere rader. Hvis skjemaet for en spørring ikke kan fastslås innen 10 minutter, mislykkes evalueringen. Hvis valideringen mislykkes, bruker systemet den sist lagrede versjonen for oppdateringer.

Just-in-time-publisering

Just-in-time-publisering sikrer at endringene dine er tilgjengelige når det er nødvendig. Denne delen forklarer hvordan systemet håndterer publisering under oppdateringer og andre operasjoner.

Dataflow Gen2 bruker en automatisert «just-in-time»-publiseringsmodell. Når du lagrer en dataflyt, er endringene umiddelbart tilgjengelige for neste oppdatering eller kjøring. Synkronisering av endringer fra Git eller bruk av utrullingssamlebånd lagrer den oppdaterte dataflyten i arbeidsområdet. Den neste oppdateringen prøver å publisere den siste lagrede versjonen. Hvis publiseringen mislykkes, vises feilen i oppdateringsloggen.

Når du oppdaterer en dataflyt, finnes det et alternativ (Run On Demand Execute i Background Jobs REST API) som styrer om publisering forsøkes. Standardinnstillingen for dette alternativet ApplyChangesIfNeeded er true, noe som utløser publisering kun hvis kilden har endret seg siden forrige publisering. Dette adresserer situasjoner der brukere måtte manuelt utløse en publisering når de gjorde endringer via CI/CD eller API.

I noen tilfeller publiserer serverdelen automatisk dataflyter på nytt under oppdateringer for å sikre kompatibilitet med oppdateringer.

Tidligere, hvis publiseringen mislykkes, kjøres oppdateringen med den siste vellykkede versjonen av dataflyten. Med just-in-time-publisering vil oppdateringen feile hvis:

  • Dataflyten ble sist lagret etter 1. februar 2026, og
  • Publiseringen mislykkes (selv om det tidligere har vært en vellykket publisering).

Dette forhindrer situasjoner der kunder uvitende kjører utdaterte versjoner av en dataflyt. Det sikrer at det som vises i editoren stemmer overens med det som kjøres.

API-er er også tilgjengelige for å oppdatere en dataflyt uten publisering eller for å utløse publisering manuelt.

Begrensninger og kjente problemer

Selv om Dataflow Gen2 med CI/CD- og Git-integrasjon er kraftig, er det noen begrensninger og kjente problemer å være oppmerksom på. Her er det du trenger å vite.

  • Når du sletter den siste Dataflow Gen2 med CI/CD- og Git-støtte, blir oppsamlingselementene synlige i arbeidsområdet og kan trygt slettes av brukeren.
  • Når du forgrener til et annet arbeidsområde, kan det hende at en dataflytoppdatering av Gen2 mislykkes med meldingen om at oppsamlingshuset ikke ble funnet. Når dette skjer, oppretter du en ny Dataflyt Gen2 med CI/CD- og Git-støtte i arbeidsområdet for å utløse oppretting av oppsamlingssjøen. Etter dette skal alle andre dataflyter i arbeidsområdet begynne å fungere på nytt.
  • Når du synkroniserer endringer fra GIT til arbeidsområdet eller bruker utrullingssamlebånd, må du åpne den nye eller oppdaterte dataflyten og lagre endringer manuelt med redigeringsprogrammet. Dette utløser en publiseringshandling i bakgrunnen slik at endringene kan brukes under oppdatering av dataflyten. Du kan også bruke API-kallet for publiseringsjobb ved behov for dataflyt til å automatisere publiseringsoperasjonen.
  • Power Automate-kontakten for dataflows fungerer ikke med den nye Dataflow Gen2 med støtte for CI/CD og Git.