Transformación de clasificación en el flujo de datos de mapeo

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Data Factory en Microsoft Fabric es la próxima generación de Azure Data Factory, con una arquitectura más sencilla, inteligencia artificial integrada y nuevas características. Si no está familiarizado con la integración de datos, comience con Fabric Data Factory. Las cargas de trabajo de ADF existentes pueden actualizarse a Fabric para acceder a nuevas funcionalidades en ciencia de datos, análisis en tiempo real e informes.

Los flujos de datos están disponibles tanto en canalizaciones de Azure Data Factory como en canalizaciones de Azure Synapse Analytics. Este artículo se aplica a los flujos de datos de mapeo. Si no está familiarizado con las transformaciones, consulte el artículo introductorio Transformación de datos mediante flujos de datos de asignación.

Sugerencia

Para ver la transformación equivalente (columna Rank) en Dataflow Gen2, consulte Una guía de Dataflow Gen2 para el mapeo de usuarios de flujo de datos.

Use la transformación de clasificación para generar una clasificación ordenada en función de las condiciones de ordenación especificadas por el usuario.

Configuración

Configuración de clasificación

No hay distinción entre mayúsculas y minúsculas: si una columna de ordenación es de tipo cadena, las mayúsculas o minúsculas se factorizarán en la clasificación.

Denso: Si está habilitada, la columna de rango tiene un rango densamente asignado. Cada recuento de clasificación será un número consecutivo y los valores de clasificación no se omitirán después de una vinculación.

Rank column (Columna de clasificación): nombre de la columna de clasificación generada. Esta columna es de tipo "long".

Condiciones de ordenación: elija las columnas por las que va a ordenar y en qué orden se realiza la ordenación. El orden determina la prioridad de ordenación.

La configuración toma los datos de baloncesto entrantes y crea una columna de clasificación denominada "pointsRanking". La fila con el valor más alto de la columna PTS tiene un valor pointsRanking de 1.

Script de flujo de datos

Sintaxis

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

Ejemplo

Configuración de clasificación

El script de flujo de datos para la configuración de clasificación se encuentra en el siguiente fragmento de código.

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

Filtre las filas en función de los valores de clasificación mediante la transformación de filtro.