Sorteertransformatie in mappings-gegevensstroom

Van toepassing op: Azure Data Factory Azure Synapse Analytics

Tip

Data Factory in Microsoft Fabric is de volgende generatie van Azure Data Factory, met een eenvoudigere architectuur, ingebouwde AI en nieuwe functies. Als u geen gegevensintegratie hebt, begint u met Fabric Data Factory. Bestaande ADF-workloads kunnen upgraden naar Fabric om toegang te krijgen tot nieuwe mogelijkheden voor gegevenswetenschap, realtime analyses en rapportage.

Gegevensstromen zijn beschikbaar in zowel Azure Data Factory pijplijnen als Azure Synapse Analytics pijplijnen. Dit artikel is van toepassing op het in kaart brengen van gegevensstromen. Als u geen ervaring hebt met transformaties, raadpleegt u het inleidende artikel Gegevens transformeren met behulp van toewijzingsgegevensstromen.

Tip

Zie voor de equivalente transformatie (Sorteren) in Gegevensstroom Gen2 een handleiding voor Gegevensstroom Gen2 voor gebruikers van toewijzingsgegevensstromen.

Met de sorteertransformatie kunt u de binnenkomende rijen in de huidige gegevensstroom sorteren. U kunt afzonderlijke kolommen kiezen en in oplopende of aflopende volgorde sorteren.

Notitie

Toewijzingsgegevensstromen worden uitgevoerd op Spark-clusters die gegevens verdelen over meerdere knooppunten en partities. Als u ervoor kiest om uw gegevens opnieuw te partitioneren in een volgende transformatie, kunt u de sortering verliezen als gevolg van het opnieuw toewijzen van gegevens. De beste manier om de sorteervolgorde in uw gegevensstroom te behouden, is door één partitie in te stellen op het tabblad Optimaliseren in de transformatie en de sorteertransformatie zo dicht mogelijk bij de Sink te houden.

Configuratie

Sorteerinstellingen

Niet hoofdlettergevoelig: of u de hoofdletters wilt negeren bij het sorteren van tekenreeks- of tekstvelden

Alleen sorteren binnen partities: als gegevensstromen worden uitgevoerd op spark, wordt elke gegevensstroom onderverdeeld in partities. Met deze instelling worden gegevens alleen binnen de binnenkomende partities gesorteerd in plaats van de hele gegevensstroom te sorteren.

Sorteervoorwaarden: Kies op welke kolommen u sorteert en in welke volgorde de sortering plaatsvindt. De volgorde bepaalt de sorteerprioriteit. Kies of null-waarden al dan niet worden weergegeven aan het begin of einde van de gegevensstroom.

Berekende kolommen

Als u een kolomwaarde wilt wijzigen of extraheren voordat u de sortering toepast, beweegt u de muisaanwijzer over de kolom en selecteert u Berekende kolom. Maak in de opbouwfunctie voor expressies een expressie voor de sorteerbewerking in plaats van een kolomwaarde te gebruiken.

Script voor gegevensstroom

Syntaxis

<incomingStream>
    sort(
        desc(<sortColumn1>, { true | false }),
        asc(<sortColumn2>, { true | false }),
        ...
    ) ~> <sortTransformationName<>

Voorbeeld

Sorteerinstellingen

Het gegevensstroomscript voor de bovenstaande sorteerconfiguratie bevindt zich in het onderstaande codefragment.

BasketballStats sort(desc(PTS, true),
    asc(Age, true)) ~> Sort1

Na het sorteren wilt u mogelijk de samengevoegde transformatie gebruiken

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-28