Références relatives avec des connecteurs Fabric dans Dataflow Gen2

Note

Le contenu de cet article s’applique à Dataflow Gen2 avec prise en charge CI/CD.

Dataflow Gen2 est conçu pour prendre en charge les solutions qui peuvent être développées, validées et déployées dans des environnements sans nécessiter de modifications de script manuelles. Pour prendre en charge cet objectif, les connecteurs Fabric dans Dataflow Gen2 utilisent des références relatives pour résoudre les artefacts d’espace de travail au moment de l’exécution.

Les références relatives permettent aux requêtes Dataflow de se lier à des éléments Fabric en fonction de leurs noms dans l’espace de travail actuel, plutôt que de s’appuyer sur des identificateurs spécifiques à l’environnement tels que les ID d’espace de travail ou les ID d’élément.

Connecteurs fabric et contexte d’espace de travail

Les connecteurs fabric, tels que Lakehouse, Warehouse et SQL Database, exposent une expérience de navigation qui permet aux utilisateurs de parcourir et de sélectionner des éléments auxquels ils ont accès. Lorsqu’un Dataflow Gen2 est créé, il s’exécute toujours dans le contexte d’un espace de travail spécifique.

Les références relatives exploitent le contexte de l’espace de travail en résolvant les chemins d’accès aux artefacts de données par rapport à l’espace de travail où se trouve le Dataflow.

Dans la boîte de dialogue de navigation du connecteur, ce contexte est représenté par un !(Espace de travail actuel). La sélection d’éléments sous ce nœud indique que le Dataflow doit résoudre ces éléments depuis l’espace de travail dans lequel il est exécuté.

Capture d’écran du nœud !(Espace de travail actuel) dans le connecteur Lakehouse

Représentation des références relatives dans les requêtes

Lorsqu’un connecteur Fabric utilise des références relatives, le script Power Query (M) généré n’inclut pas d’identificateurs absolus tels que :

  • ID d’espace de travail
  • ID Lakehouse
  • ID d’entrepôt

Au lieu de cela, le script référence des artefacts par leurs noms d’éléments, qui sont uniques dans un espace de travail.

Par conséquent, la logique de requête décrit l’élément à accéder plutôt que l’emplacement où cet élément existe dans un environnement spécifique.

Comportement entre les environnements

Étant donné que les références relatives sont résolues au moment de l’exécution à l’aide du contexte d’espace de travail actuel, la même définition Dataflow Gen2 peut être utilisée dans plusieurs environnements, comme :

  • Développement
  • Test
  • Production

Tant que l’espace de travail cible contient des éléments avec des noms correspondants, le dataflow continue de fonctionner sans modification. Aucune modification du script Power Query n’est nécessaire lors du déploiement via des pipelines de déploiement Fabric.

Ce comportement rend les références relatives adaptées aux flux de travail ALM et CI/CD d’entreprise.

Relation avec d’autres fonctionnalités CI/CD

Les références relatives complètent les fonctionnalités Dataflow Gen2 existantes qui prennent en charge les solutions indépendantes de l’environnement, notamment :

Ensemble, ces fonctionnalités permettent aux solutions Dataflow Gen2 de rester portables, prévisibles et alignées sur les pratiques de pipeline de déploiement.

Quand utiliser des références relatives

Les références relatives sont appropriées lorsque :

  • Un flux de données est censé se déplacer entre plusieurs espaces de travail
  • Les éléments de structure (tels que les Lakehouses ou les entrepôts) sont recréés pour chaque environnement.
  • Les modifications au niveau du script pendant le déploiement doivent être évitées

Si un dataflow doit cibler un artefact spécifique dans un espace de travail fixe, des références absolues peuvent toujours être utilisées. Le choix dépend du cycle de vie et du modèle de déploiement prévus de la solution.

Résumé

Les références relatives permettent aux connecteurs Fabric dans Dataflow Gen2 de résoudre les artefacts d’espace de travail en fonction du contexte plutôt que des identificateurs fixes. En s’appuyant sur des noms d’éléments dans l’espace de travail actuel, les flux de données peuvent être déployés dans des environnements sans modification de script, prenant en charge les flux de travail CI/CD cohérents et gérables.