Vue d’ensemble des activités

Les activités sont les blocs de construction qui vous aident à créer des flux de travail de données de bout en bout dans Microsoft Fabric. Considérez-les comme les tâches qui déplacent et transforment vos données pour répondre à vos besoins métier. Vous pouvez utiliser une activité de copie pour déplacer des données de SQL Server vers stockage Blob Azure. Vous pouvez ensuite ajouter une activité dataflow ou une activité Notebook pour traiter et transformer ces données avant de les charger dans Azure Synapse Analytics pour la création de rapports.

Les activités sont regroupées dans des pipelines pour atteindre des objectifs spécifiques. Par exemple, vous pouvez créer un pipeline qui :

  • Extrait les données de journal à partir de différentes sources
  • Nettoie et organise ces données
  • Exécute l’analytique pour rechercher des insights

Le regroupement de vos activités dans un pipeline vous permet de gérer toutes ces étapes en tant qu’unité au lieu de gérer chaque activité séparément. Vous pouvez déployer et planifier l’intégralité du pipeline à la fois pour qu’il s’exécute chaque fois que vous en avez besoin.

Microsoft Fabric propose trois types d’activités :

Activités de déplacement des données

Ces activités vous aident à déplacer des données d’un emplacement à un autre dans votre pipeline.

Activité de déplacement Description
Copier des données Vous pouvez copier des données de n’importe quelle source prise en charge vers n’importe quelle destination prise en charge. Consultez la vue d’ensemble du connecteur pour voir ce qui est disponible.
Tâche de copie Les travaux de copie sont une méthode simplifiée pour déplacer rapidement des données.

Si vous devez choisir entre différentes options de déplacement des données, consultez l’article du guide de décision sur le déplacement des données.

Activités de transformation des données

Ces activités vous aident à traiter et à transformer vos données. Vous pouvez les utiliser individuellement ou les chaîner avec d’autres activités.

Pour plus d’informations, consultez l’article Activités de transformation des données.

Activités de transformation des données Environnement de calcul
Copier des données Gestionnaire de calcul par Microsoft Fabric
Dataflow Gen2 Gestionnaire de calcul par Microsoft Fabric
Supprimer des données Gestionnaire de calcul par Microsoft Fabric
Bloc-notes en tissu Clusters Apache Spark gérés par Microsoft Fabric
Activité HDInsight Clusters Apache Spark gérés par Microsoft Fabric
Définition de la tâche Spark Clusters Apache Spark gérés par Microsoft Fabric
Procédure stockée Azure SQL, Azure Synapse Analytics ou SQL Server
Script SQL Azure SQL, Azure Synapse Analytics ou SQL Server

Activités de flux de contrôle

Ces activités vous aident à contrôler le fonctionnement de votre pipeline :

Activité de contrôle Description
Ajouter une variable Ajoutez une valeur à une variable de tableau existante.
Activité Azure Batch Exécute un script Azure Batch.
Activité Azure Databricks Exécute un travail Azure Databricks (Notebook, Jar, Python).
Activité Azure Machine Learning Exécute un travail Azure Machine Learning.
Désactiver l’activité Désactive une autre activité.
Fail Provoquez l'échec de l'exécution du pipeline avec un message d'erreur personnalisé et un code d'erreur.
Filter Appliquez une expression de filtre à un tableau d'entrée.
ForEach L’activité ForEach définit un flux de contrôle répétitif dans votre pipeline. Elle permet d’effectuer une itération sur une collection, et exécute des activités spécifiées dans une boucle. L’implémentation en boucle de cette activité est semblable à la structure d’exécution en boucle de Foreach dans les langages de programmation.
Activité des fonctions Exécute une fonction Azure.
Obtenir les métadonnées L’activité GetMetadata peut être utilisée pour récupérer les métadonnées de n’importe quelle donnée dans un pipeline Data Factory ou Synapse.
Si condition La condition If peut être utilisée pour créer une branche basée sur la condition évaluée comme vraie ou fausse. L’activité IfCondition fournit les mêmes fonctionnalités qu’une instruction «if » dans les langages de programmation. Un ensemble d'activités est évalué lorsque la condition retourne true, et un autre ensemble d'activités est évalué lorsque la condition retourne false.
Appeler le pipeline L’activité Execute Pipeline permet à un pipeline Data Factory ou Synapse d’appeler un autre pipeline.
Activité KQL Exécute un script KQL sur une instance Kusto.
Activité de maintenance de lakehouse Effectuez une maintenance de table de routine sur un Lakehouse à partir d’un pipeline Microsoft Fabric.
Activité de recherche L’activité de recherche peut être utilisée pour lire ou rechercher un enregistrement, un nom de table ou une valeur à partir de n’importe quelle source externe. Ce résultat peut être utilisé par des activités suivantes.
Actualiser l’activité du point de terminaison SQL Actualise un point de terminaison SQL Lakehouse pour refléter les données les plus récentes.
Définir une variable Définissez la valeur d'une variable existante.
Changer d’activité Implémente une expression switch qui autorise plusieurs activités suivantes pour chaque résultat potentiel de l’expression.
Activité sur Teams Publie un message dans un canal ou une conversation de groupe Teams.
Jusqu’à l’activité Implémente une boucle Exécuter jusqu’à semblable à la structure Do-Until des langages de programmation. Elle exécute un ensemble d’activités dans une boucle jusqu’à ce que la condition associée à l’activité retourne la valeur true. Vous pouvez spécifier une valeur de délai d’attente pour l’activité Until.
Activité d’attente Lorsque vous utilisez une activité Wait dans un pipeline, celui-ci attend pendant la période spécifiée avant de poursuivre l'exécution des activités suivantes.
Activité web L’activité Web peut être utilisée pour appeler un point de terminaison REST personnalisé à partir d’un pipeline.
Activité webhook À l'aide de l'activité de Webhook, appelez un point de terminaison et transmettez une URL de rappel. L’exécution du pipeline attend que le rappel soit activé avant de passer à l’activité suivante.

Ajout d'activités à un pipeline avec l'interface utilisateur Microsoft Fabric

Voici comment ajouter et configurer des activités dans votre pipeline :

  1. Créez un nouveau pipeline dans votre espace de travail.
  2. Accédez à l’onglet Activités et parcourez les activités disponibles. Faites défiler vers la droite pour afficher toutes les options, puis sélectionnez une activité à ajouter à l’éditeur de pipeline.
  3. Lorsque vous ajoutez une activité et que vous la sélectionnez dans le canevas, vous verrez ses paramètres généraux dans le volet des propriétés ci-dessous.
  4. Chaque activité a d’autres options de configuration sous d’autres onglets dans le volet des propriétés.

Capture d'écran montrant l'éditeur de pipeline avec l'onglet Activités, la barre d'outils, une activité de copie et l'onglet Général de ses propriétés, tous mis en surbrillance.

Paramètres généraux

Lorsque vous ajoutez une nouvelle activité à un pipeline et que vous la sélectionnez, ses propriétés s’affichent en bas de l’écran. Ceux-ci incluent Général, Paramètres et parfois d’autres onglets.

Capture d'écran montrant l'onglet Paramètres généraux d'une activité.

Chaque activité inclut les champs Nom et Description dans les paramètres généraux. Certaines activités ont également les options suivantes :

Setting Description
Timeout Durée pendant laquelle une activité peut s’exécuter avant l’expiration du délai d’attente. La valeur par défaut est de 12 heures et la valeur maximale est de sept jours. Utilisez le format D.HH :MM :SS.
Retry Nombre de nouvelles tentatives en cas d’échec de l’activité.
(Propriétés avancées) Intervalle entre les tentatives (sec) Nombre de secondes à attendre entre les nouvelles tentatives.
(Propriétés avancées) Sortie sécurisée Lorsque cette option est sélectionnée, la sortie de l'activité n'apparaît pas dans les journaux.
(Propriétés avancées) Saisie sécurisée Lorsque cette option est sélectionnée, l’entrée d’activité n’apparaît pas dans les journaux.

Note

Par défaut, vous pouvez avoir jusqu’à 120 activités par pipeline. Cela inclut les activités internes pour les conteneurs.

Désactiver une activité

Vous pouvez désactiver une ou plusieurs activités d’un pipeline pour les ignorer pendant la validation et les exécutions du pipeline. Cette fonctionnalité améliore l’efficacité du développeur de pipelines, ce qui vous permet de commenter une partie du pipeline sans la supprimer du canevas. Vous pouvez réactiver les activités ultérieurement.

Désactiver les activités

Il existe deux façons de désactiver une activité : désactiver une activité unique à partir de son onglet Général ou désactiver plusieurs activités en cliquant avec le bouton droit.

Enregistrez les modifications pour désactiver les activités lors de la prochaine exécution planifiée du pipeline.

Désactiver une seule activité

  1. Sélectionnez l’activité que vous souhaitez désactiver
  2. Sous l’onglet Général , sélectionnez Désactivé pour l’état d’activité
  3. Choisissez un état pour Marquer l’activité comme. Sélectionnez parmi Réussie, Échouée ou Ignorée

Capture d’écran de l’éditeur de pipeline Fabric Data Factory avec l’activité web ActivityDeactivated définie sur Inactive dans le volet Paramètres généraux.

Désactiver plusieurs activités

  1. Appuyez sur la touche Ctrl pour effectuer une sélection multiple. À l’aide de votre souris, cliquez avec le bouton gauche sur toutes les activités que vous souhaitez désactiver
  2. Cliquez avec le bouton droit pour afficher le menu déroulant
  3. Sélectionnez Désactiver pour les désactiver toutes
  4. Pour affiner les paramètres de Marquer l'activité comme, allez à l’onglet Général de l’activité et apportez les modifications appropriées.

Capture d’écran montrant comment désactiver plusieurs activités en même temps.

Réactiver les activités

Pour réactiver les activités, choisissez Activé pour l’état de l’activité, puis revenez à leurs comportements précédents, comme prévu.

Comportements d’activité inactifs

Une activité inactive se comporte différemment dans un pipeline.

  • Sur le canevas, l’activité inactive est grisée, avec le Signe inactif placé en face du type d’activité

  • Sur le canvas, un indicateur de statut (Réussi, Échoué ou Ignoré) est placé sur la boîte, pour visualiser le paramètre Marquer l'activité comme

  • L’activité est exclue de la validation du pipeline. Par conséquent, vous n’avez pas besoin de fournir tous les champs obligatoires pour une activité inactive.

  • Lors de l’exécution en mode débogage ou du pipeline, l’activité ne s'exécute pas réellement. Au lieu de cela, il exécute un élément de ligne de type place holder, avec le statut réservé Inactif

  • L’option de branchement est contrôlée par l’option Marquer l'activité comme. En d’autres termes :

    • Si vous marquez l’activité comme Réussi, la branche UponSuccess ou UponCompletion s’exécute.
    • Si vous marquez l’activité comme ayant échoué, la branche UponFailure ou UponCompletion s’exécute
    • Si vous marquez l’activité comme ignorée, la branche UponSkip s’exécute

    Capture d’écran montrant l’état d’exécution d’une activité inactive.

Meilleures pratiques pour la désactivation

La désactivation est un outil puissant pour les développeurs de pipelines. Il permet aux développeurs de « commenter » une partie du code, sans supprimer définitivement les activités. Elle est particulièrement utile dans les cas suivants :

  • Lors du développement d’un pipeline, un développeur peut ajouter des activités inactives de type espace réservé avant de remplir tous les champs requis. Par exemple, j’ai besoin d’une activité de copie de SQL Server vers l’entrepôt de données, mais je n’ai pas encore configuré toutes les connexions. J’utilise donc une activité de copie inactive comme espace réservé pour le processus de développement itératif.
  • Après le déploiement, le développeur peut commenter certaines activités qui sont constamment à l’origine de problèmes afin d’éviter les nouvelles tentatives coûteuses. Par exemple, mon serveur SQL local rencontre des problèmes de connexion réseau, et je sais que mes activités de copie échouent à coup sûr. Je souhaite peut-être désactiver l’activité de copie pour éviter que les demandes de nouvelles tentatives n’inondent le système fragile.

Note

Une activité inactive ne s’exécute jamais réellement. Cela signifie que l’activité n’aura pas de champ d’erreur, ni ses champs de sortie classiques. Toutes les références aux champs manquants peuvent générer des erreurs en aval.