Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Van toepassing op:
Azure Data Factory
Azure Synapse Analytics
Tip
Data Factory in Microsoft Fabric is de volgende generatie van Azure Data Factory, met een eenvoudigere architectuur, ingebouwde AI en nieuwe functies. Als u geen gegevensintegratie hebt, begint u met Fabric Data Factory. Bestaande ADF-workloads kunnen upgraden naar Fabric om toegang te krijgen tot nieuwe mogelijkheden voor gegevenswetenschap, realtime analyses en rapportage.
Gegevensstromen zijn beschikbaar in zowel Azure Data Factory pijplijnen als Azure Synapse Analytics pijplijnen. Dit artikel is van toepassing op het in kaart brengen van gegevensstromen. Als u geen ervaring hebt met transformaties, raadpleegt u het inleidende artikel Gegevens transformeren met behulp van toewijzingsgegevensstromen.
Tip
Zie voor de equivalente transformatie (Sorteren) in Gegevensstroom Gen2 een handleiding voor Gegevensstroom Gen2 voor gebruikers van toewijzingsgegevensstromen.
Met de sorteertransformatie kunt u de binnenkomende rijen in de huidige gegevensstroom sorteren. U kunt afzonderlijke kolommen kiezen en in oplopende of aflopende volgorde sorteren.
Notitie
Toewijzingsgegevensstromen worden uitgevoerd op Spark-clusters die gegevens verdelen over meerdere knooppunten en partities. Als u ervoor kiest om uw gegevens opnieuw te partitioneren in een volgende transformatie, kunt u de sortering verliezen als gevolg van het opnieuw toewijzen van gegevens. De beste manier om de sorteervolgorde in uw gegevensstroom te behouden, is door één partitie in te stellen op het tabblad Optimaliseren in de transformatie en de sorteertransformatie zo dicht mogelijk bij de Sink te houden.
Configuratie
Niet hoofdlettergevoelig: of u de hoofdletters wilt negeren bij het sorteren van tekenreeks- of tekstvelden
Alleen sorteren binnen partities: als gegevensstromen worden uitgevoerd op spark, wordt elke gegevensstroom onderverdeeld in partities. Met deze instelling worden gegevens alleen binnen de binnenkomende partities gesorteerd in plaats van de hele gegevensstroom te sorteren.
Sorteervoorwaarden: Kies op welke kolommen u sorteert en in welke volgorde de sortering plaatsvindt. De volgorde bepaalt de sorteerprioriteit. Kies of null-waarden al dan niet worden weergegeven aan het begin of einde van de gegevensstroom.
Berekende kolommen
Als u een kolomwaarde wilt wijzigen of extraheren voordat u de sortering toepast, beweegt u de muisaanwijzer over de kolom en selecteert u Berekende kolom. Maak in de opbouwfunctie voor expressies een expressie voor de sorteerbewerking in plaats van een kolomwaarde te gebruiken.
Script voor gegevensstroom
Syntaxis
<incomingStream>
sort(
desc(<sortColumn1>, { true | false }),
asc(<sortColumn2>, { true | false }),
...
) ~> <sortTransformationName<>
Voorbeeld
Het gegevensstroomscript voor de bovenstaande sorteerconfiguratie bevindt zich in het onderstaande codefragment.
BasketballStats sort(desc(PTS, true),
asc(Age, true)) ~> Sort1
Gerelateerde inhoud
Na het sorteren wilt u mogelijk de samengevoegde transformatie gebruiken