Transformación Ordenar en el flujo de datos de asignación

Se aplica a: Azure Data Factory Azure Synapse Analytics

Sugerencia

Data Factory en Microsoft Fabric es la próxima generación de Azure Data Factory, con una arquitectura más sencilla, inteligencia artificial integrada y nuevas características. Si no está familiarizado con la integración de datos, comience con Fabric Data Factory. Las cargas de trabajo de ADF existentes pueden actualizarse a Fabric para acceder a nuevas funcionalidades en ciencia de datos, análisis en tiempo real e informes.

Los flujos de datos están disponibles tanto en canalizaciones de Azure Data Factory como en canalizaciones de Azure Synapse Analytics. Este artículo se aplica a los flujos de datos de asignación. Si no está familiarizado con las transformaciones, consulte el artículo introductorio Transformar datos mediante flujos de datos de asignación.

Sugerencia

Para obtener la transformación equivalente (Ordenar) en Dataflow Gen2, consulte Una guía de Dataflow Gen2 para asignar usuarios de flujo de datos.

La transformación Ordenar permite ordenar las filas entrantes de la secuencia de datos actual. Puede elegir columnas individuales y ordenarlas en orden ascendente o descendente.

Nota

Los flujos de datos de asignación se ejecutan en clústeres de Spark que distribuyen datos entre varios nodos y particiones. Si decide volver a particionar los datos en una transformación posterior, podría perder la ordenación debido a la reorganización de los datos. La mejor manera de mantener el criterio de ordenación en el flujo de datos es establecer una sola partición en la pestaña Optimizar de la transformación y mantener la transformación Ordenar lo más parecida posible al receptor.

Configuración

Configuración de ordenación

No distinguir entre mayúsculas y minúsculas: si desea tener en cuenta la distinción entre mayúsculas y minúsculas al ordenar campos de cadena o texto.

Ordenar solo dentro de las particiones: a medida que los flujos de datos se ejecutan en Spark, cada flujo de datos se divide en particiones. Esta configuración ordena datos solo dentro de particiones entrantes, en lugar de ordenar todo el flujo de datos.

Condiciones de ordenación: elija las columnas por las que va a ordenar y en qué orden se realiza la ordenación. El orden determina la prioridad de ordenación. Elija si los valores NULL aparecen al principio o al final del flujo de datos.

Columnas calculadas

Para modificar o extraer un valor de columna antes de aplicar la ordenación, mantenga el ratón sobre la columna y seleccione "Columna calculada". En el generador de expresiones, cree una expresión para la operación de ordenación en lugar de usar un valor de columna.

Script de flujo de datos

Sintaxis

<incomingStream>
    sort(
        desc(<sortColumn1>, { true | false }),
        asc(<sortColumn2>, { true | false }),
        ...
    ) ~> <sortTransformationName<>

Ejemplo

Configuración de ordenación

El script de flujo de datos para la configuración de ordenación anterior se encuentra en el siguiente fragmento de código.

BasketballStats sort(desc(PTS, true),
    asc(Age, true)) ~> Sort1

Después de ordenar, es posible que quiera usar la transformación Agregado.

Comentarios

¿Le resultó útil esta página?

Last updated on 2026-04-28