Transformation du classement dans le flux de données de mappage

S'APPLIQUE À : Azure Data Factory Azure Synapse Analytics

Conseil

Data Factory dans Microsoft Fabric est la prochaine génération de Azure Data Factory, avec une architecture plus simple, une IA intégrée et de nouvelles fonctionnalités. Si vous débutez avec l'intégration des données, commencez par Fabric Data Factory. Les charges de travail ADF existantes peuvent être mises à niveau vers Fabric pour accéder à de nouvelles fonctionnalités dans la science des données, l’analytique en temps réel et la création de rapports.

Les flux de données sont disponibles dans les pipelines Azure Data Factory et les pipelines Azure Synapse Analytics. Cet article s’applique aux flux de données de mappage. Si vous débutez avec les transformations, reportez-vous à l’article d’introduction Transformer des données à l’aide de flux de données de mappage.

Conseil

Pour connaître la transformation équivalente (colonne Rank) dans Dataflow Gen2, consultez un guide de Dataflow Gen2 pour le mappage des utilisateurs du flux de données.

Utilisez la transformation de classement pour générer un classement ordonné en fonction des conditions de tri spécifiées par l’utilisateur.

Configuration

Paramètres de classement

Insensible à la casse : Si une colonne de tri est de type chaîne, la casse est factorisée dans le classement.

Dense: Si elle est activée, la colonne de classement est dense. Chaque classement sera un nombre consécutif et les valeurs de classement ne seront pas ignorées en cas d’égalité.

Colonne de classement : Nom de la colonne de classement générée. Cette colonne est de type long.

Conditions de tri : Choisissez les colonnes sur lesquelles porte le tri et l’ordre dans lequel il se produit. L’ordre détermine la priorité de tri.

La configuration prend les données de basket entrantes et crée une colonne de classement appelée « pointsRanking ». La ligne avec la valeur la plus élevée de la colonne PTS a une valeur de pointRanking de 1.

Script de flux de données

Syntaxe

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

Exemple

Paramètres de classement

Le script de flux de données pour la configuration de classement se trouve dans l’extrait de code suivant.

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

Filtrez les lignes en fonction des valeurs de classement à l’aide de la transformation de filtre.