Overzicht van activiteit

Activiteiten zijn de bouwstenen waarmee u end-to-end gegevenswerkstromen in Microsoft Fabric kunt maken. U kunt ze beschouwen als de taken die uw gegevens verplaatsen en transformeren om te voldoen aan de behoeften van uw bedrijf. U kunt een kopieeractiviteit gebruiken om gegevens van SQL Server naar Azure Blob Storage te verplaatsen. Vervolgens kunt u een gegevensstroomactiviteit of Notebook-activiteit toevoegen om die gegevens te verwerken en te transformeren voordat u deze in Azure Synapse Analytics laadt voor rapportage.

Activiteiten worden gegroepeerd in pijplijnen om specifieke doelen te bereiken. U kunt bijvoorbeeld een pijplijn maken die:

  • Haalt logboekgegevens op uit verschillende bronnen
  • Deze gegevens opschonen en organiseren
  • Voert analyses uit om inzichten te vinden

Als u uw activiteiten in een pijplijn groepeert, kunt u al deze stappen als één eenheid beheren in plaats van elke activiteit afzonderlijk te verwerken. U kunt de hele pijplijn in één keer implementeren en plannen om uit te voeren wanneer u deze nodig hebt.

Microsoft Fabric biedt drie soorten activiteiten:

Activiteiten voor gegevensverplaatsing

Met deze activiteiten kunt u gegevens verplaatsen van de ene plaats naar de andere in uw pijplijn.

Verplaatsingsactiviteit Description
Gegevens kopiëren U kunt gegevens van elke ondersteunde bron naar elke ondersteunde bestemming kopiëren. Zie het overzicht van de connector om te zien wat er beschikbaar is.
Taak kopiëren Kopieertaken zijn een vereenvoudigde methode voor het snel verplaatsen van gegevens.

Als u wilt kiezen tussen verschillende opties voor gegevensverplaatsing, raadpleegt u het artikel over de beslissingshandleiding voor gegevensverplaatsing .

Activiteiten voor gegevenstransformatie

Met deze activiteiten kunt u uw gegevens verwerken en transformeren. U kunt ze afzonderlijk gebruiken of ze koppelen aan andere activiteiten.

Zie het artikel Activiteiten voor gegevenstransformatie voor meer informatie.

Activiteiten voor gegevenstransformatie Compute-omgeving
Gegevens kopiëren Beheerder van Microsoft Fabric
Gegevensstroom Gen2 Beheerder van Microsoft Fabric
Gegevens verwijderen Beheerder van Microsoft Fabric
Fabric-notitieboek Apache Spark-clusters die worden beheerd door Microsoft Fabric
HDInsight-activiteit Apache Spark-clusters die worden beheerd door Microsoft Fabric
Spark-taakdefinitie Apache Spark-clusters die worden beheerd door Microsoft Fabric
Opgeslagen procedure Azure SQL, Azure Synapse Analytics of SQL Server
SQL-script Azure SQL, Azure Synapse Analytics of SQL Server

Besturingstroomactiviteiten

Met deze activiteiten kunt u controleren hoe uw pijplijn draait.

Controleactiviteit Description
Variabele toevoegen Voeg een waarde toe aan een bestaande matrixvariabele.
Azure Batch-activiteit Voert een Azure Batch-script uit.
Azure Databricks-activiteit Voert een Azure Databricks-taak uit (Notebook, Jar, Python).
Azure Machine Learning-activiteit Voert een Azure Machine Learning-taak uit.
Activiteit deactiveren Schakelt een andere activiteit uit.
Fail Ervoor zorgen dat de uitvoering van pijplijnen mislukt met een aangepast foutbericht en foutcode.
Filter Een filterexpressie toepassen op een invoermatrix.
ForEach De ForEach-activiteit definieert een herhalende controleflow in de pijplijn. Deze activiteit wordt gebruikt om een verzameling te herhalen en voert opgegeven activiteiten uit in een lus. De lusimplementatie van deze activiteit is vergelijkbaar met Foreach-lusstructuur in computertalen.
Functieactiviteit Hiermee wordt een Azure-functie uitgevoerd.
Metagegevens ophalen GetMetadata-activiteit kan worden gebruikt om metagegevens van alle gegevens in een Data Factory- of Synapse-pijplijn op te halen.
If-voorwaarde De If-voorwaarde kan worden gebruikt om te vertakken op basis van een voorwaarde die resulteert in waar of onwaar. De If Condition Activity biedt dezelfde functionaliteit als een If-instructie in een programmeertaal. Er wordt een reeks activiteiten mee geëvalueerd als de voorwaarde resulteert in true en een andere reeks activiteiten als de voorwaarde resulteert in false.
Pijplijn aanroepen Met de activiteit Pijplijn uitvoeren kan een Data Factory- of Synapse-pijplijn een andere pijplijn aanroepen.
KQL-activiteit Voert een KQL-script uit op een Kusto-exemplaar.
Lakehouse-onderhoudsactiviteit Voer routine tabelonderhoud uit op een Lakehouse vanuit een Microsoft Fabric-pijplijn.
Opzoekactiviteit De Lookup Activity kan worden gebruikt om een record/tabelnaam/waarde van een externe bron te lezen of op te zoeken. Er kan naar deze uitvoer worden verwezen door opvolgende activiteiten.
Sql-eindpuntactiviteit vernieuwen Hiermee vernieuwt u een Lakehouse SQL-eindpunt om de meest recente gegevens weer te geven.
Variabele instellen Stel de waarde van een bestaande variabele in.
Schakelen tussen activiteiten Hiermee wordt een switchexpressie geïmplementeerd die meerdere volgende activiteiten toestaat voor elk potentieel resultaat van de expressie.
Teams-activiteit Een bericht posten in een Teams-kanaal of groepschat.
Zolang tot activiteit Hiermee implementeert u een Do-Until-lus die vergelijkbaar is met een Do-Until-lusstructuur in programmeertalen. Een reeks activiteiten wordt in een lus uitgevoerd totdat de voorwaarde die aan de activiteit is gekoppeld, waar wordt. U kunt een time-outwaarde opgeven voor de activiteit "until."
Wachtactiviteit Wanneer u een wachtactiviteit in een pijplijn gebruikt, wacht de pijplijn op de opgegeven tijd voordat u verdergaat met de uitvoering van volgende activiteiten.
Webactiviteit Webactiviteit kan worden gebruikt om een aangepast REST-eindpunt aan te roepen vanuit een pijplijn.
Webhook-activiteit Roep met behulp van de webhookactiviteit een eindpunt aan en geef een callback-URL door. De pijplijnuitvoering wacht totdat de callback is aangeroepen voordat u doorgaat met de volgende activiteit.

Activiteiten toevoegen aan een pijplijn met de gebruikersinterface van Microsoft Fabric

U kunt als volgt activiteiten toevoegen en configureren in uw pijplijn:

  1. Maak een nieuwe pijplijn in uw werkruimte.
  2. Ga naar het tabblad Activiteiten en blader door de beschikbare activiteiten. Schuif naar rechts om alle opties weer te geven en selecteer vervolgens een activiteit om deze toe te voegen aan de pijplijneditor.
  3. Wanneer u een activiteit toevoegt en deze selecteert op het canvas, ziet u de algemene instellingen in het eigenschappenvenster hieronder.
  4. Elke activiteit heeft andere configuratieopties op andere tabbladen in het deelvenster Eigenschappen.

Schermopname van de pijplijneditor met het tabblad Activiteiten, werkbalk, een kopieeractiviteit en het tabblad Algemeen van de eigenschappen, allemaal gemarkeerd.

Algemene instellingen

Wanneer u een nieuwe activiteit aan een pijplijn toevoegt en deze selecteert, ziet u de eigenschappen onder aan het scherm. Dit zijn onder andere Algemeen, Instellingen en soms andere tabbladen.

Schermopname van het tabblad Algemene instellingen van een activiteit.

Elke activiteit bevat de velden Naam en Beschrijving in de algemene instellingen. Sommige activiteiten hebben ook de volgende opties:

Setting Description
Timeout Hoe lang een activiteit kan worden uitgevoerd voordat er een time-out optreedt. De standaardwaarde is 12 uur en het maximum is zeven dagen. Gebruik de indeling D.HH:MM:SS.
Retry Hoe vaak u het opnieuw moet proberen als de activiteit mislukt.
(Geavanceerde eigenschappen) Interval voor opnieuw proberen (sec) Hoeveel seconden er moet worden gewacht tussen nieuwe pogingen.
(Geavanceerde eigenschappen) Beveiligde uitvoer Wanneer deze optie is geselecteerd, wordt de uitvoer van de activiteit niet weergegeven in logboeken.
(Geavanceerde eigenschappen) Beveiligde invoer Wanneer deze optie is geselecteerd, wordt activiteitsinvoer niet weergegeven in logboeken.

Note

Standaard kunt u maximaal 120 activiteiten per pijplijn hebben. Dit omvat interne activiteiten voor containers.

Een activiteit deactiveren

U kunt een of meer activiteiten uit een pijplijn deactiveren om deze over te slaan tijdens validatie- en pijplijnuitvoeringen. Deze functie verbetert de efficiëntie van pijplijnontwikkelaars, zodat u een deel van de pijplijn kunt uitcommentariëren zonder deze uit het canvas te verwijderen. U kunt activiteiten op een later tijdstip opnieuw activeren.

Activiteiten deactiveren

Er zijn twee manieren om een activiteit te deactiveren: één activiteit deactiveren vanaf het tabblad Algemeen of meerdere activiteiten deactiveren met de rechtermuisknop.

Sla de wijzigingen op om de activiteiten te deactiveren tijdens de volgende geplande pijplijnuitvoering.

Eén activiteit deactiveren

  1. Selecteer de activiteit die u wilt deactiveren
  2. Selecteer onder Het tabblad Algemeen de optie Gedeactiveerd voor activiteitsstatus
  3. Kies een toestand voor Activiteit markeren als. Kies uit Geslaagd, Mislukt of Overgeslagen

Schermopname van de Fabric Data Factory-pijplijneditor met ActivityDeactivated-webactiviteit ingesteld op Inactief in het deelvenster Algemene instellingen.

Meerdere activiteiten deactiveren

  1. Druk op Ctrl-toets om meerdere opties te selecteren. Klik met de muis op alle activiteiten die u wilt deactiveren
  2. Klik met de rechtermuisknop om de vervolgkeuzelijst weer te geven
  3. Selecteer Deactiveren om ze allemaal te deactiveren
  4. Als u de instellingen voor Mark-activiteit wilt aanpassen, gaat u naar het tabblad Algemeen van de activiteit en voert u de juiste wijzigingen aan

Schermopname van het deactiveren van meerdere activiteiten tegelijk.

Activiteiten opnieuw activeren

Als u de activiteiten opnieuw wilt activeren, kiest u Geactiveerd voor de activiteitsstatus en gaat u terug naar het vorige gedrag, zoals verwacht.

Inactieve activiteitsgedrag

Een inactieve activiteit gedraagt zich anders in een pijplijn.

  • Op het canvas wordt de inactieve activiteit grijs weergegeven, waarbij inactief teken naast het activiteitstype wordt geplaatst

  • Op het canvas wordt een statusteken (Geslaagd, Mislukt of Overgeslagen) in het vak geplaatst om de activiteit Markeren als instelling te visualiseren

  • De activiteit wordt uitgesloten van pijplijnvalidatie. Daarom hoeft u niet alle vereiste velden op te geven voor een inactieve activiteit.

  • Tijdens het debuggen en het runnen van de pijplijn wordt deze activiteit niet echt uitgevoerd. In plaats daarvan wordt een tijdelijke regelitem uitgevoerd, met de gereserveerde status Inactief

  • De vertakkingsoptie wordt bepaald door de optie Markeer de activiteit als. Met andere woorden:

    • Als u de activiteit als Geslaagd markeert, wordt de UponSuccess of UponCompletion uitgevoerd.
    • Als u de activiteit markeert als Mislukt, wordt de tak BijMislukking of BijVoltooiing uitgevoerd
    • Als u de activiteit markeert als Overgeslagen, wordt de UponSkip-vertakking uitgevoerd

    Schermopname van de uitvoeringsstatus van een inactieve activiteit.

Aanbevolen procedures voor deactivering

Deactivering is een krachtig hulpprogramma voor pijplijnontwikkelaars. Hiermee kunnen ontwikkelaars een deel van de code uitcommentariëren, zonder dat ze de activiteiten permanent hoeven te verwijderen. Het excelleert in de volgende scenario's:

  • Bij het ontwikkelen van een pijplijn kan de ontwikkelaar tijdelijke inactieve activiteiten toevoegen voordat alle vereiste velden worden ingevuld. Ik heb bijvoorbeeld een Copy-activiteit nodig van SQL Server naar Data Warehouse, maar ik heb nog niet alle verbindingen ingesteld. Dus gebruik ik een inactieve kopieeractiviteit als tijdelijke aanduiding voor iteratief ontwikkelingsproces.
  • Na de implementatie kan de ontwikkelaar bepaalde activiteiten uitcommentariëren die voortdurend problemen veroorzaken om dure nieuwe pogingen te voorkomen. Mijn on-premises SQL-server ondervindt bijvoorbeeld problemen met de netwerkverbinding en ik weet dat mijn kopieeractiviteiten voor bepaalde zaken mislukken. Ik wil de kopieeractiviteit deactiveren om te voorkomen dat aanvragen voor nieuwe pogingen het broos systeem overspoelen.

Note

Een inactieve activiteit wordt nooit daadwerkelijk uitgevoerd. Dit betekent dat de activiteit geen foutveld of de typische uitvoervelden bevat. Verwijzingen naar ontbrekende velden kunnen downstreamfouten veroorzaken.