Draaitransformatie in mappinggegevensstroom

Van toepassing op: Azure Data Factory Azure Synapse Analytics

Tip

Data Factory in Microsoft Fabric is de volgende generatie van Azure Data Factory, met een eenvoudigere architectuur, ingebouwde AI en nieuwe functies. Als u nieuw bent in gegevensintegratie, begint u met Fabric Data Factory. Bestaande ADF-workloads kunnen upgraden naar Fabric om toegang te krijgen tot nieuwe mogelijkheden voor gegevenswetenschap, realtime analyses en rapportage.

Gegevensstromen zijn beschikbaar in zowel Azure Data Factory pijplijnen als Azure Synapse Analytics pijplijnen. Dit artikel is van toepassing op gegevensverwerkingsstromen. Als u nieuw bent met transformaties, raadpleegt u het inleidende artikel Gegevens transformeren met behulp van mapping-dataflows.

Tip

Voor de equivalente transformatie (Pivot-kolom) in Dataflow Gen2 raadpleegt u een handleiding voor Dataflow Gen2 voor het toewijzen van gegevensstroomgebruikers.

Gebruik de draaitransformatie om meerdere kolommen te maken op basis van de unieke rijwaarden van één kolom. Pivot is een aggregatietransformatie waarbij u groepeert op kolommen en draaikolommen genereert met behulp van statistische functies.

Configuratie

Voor de draaitransformatie zijn drie verschillende invoer vereist: groeperen op kolommen, de draaitoets en het genereren van de gedraaide kolommen

Groeperen op

Groeperen op opties

Selecteer over welke kolommen de gedraaide kolommen geaggregeerd moeten worden. De uitvoergegevens groeperen alle rijen met dezelfde groep op waarden in één rij. De aggregatie die wordt uitgevoerd in de gepivotte kolom vindt plaats voor elke groep.

Deze sectie is optioneel. Als er geen groeperen op kolommen is geselecteerd, wordt de hele gegevensstroom samengevoegd en wordt slechts één rij uitgevoerd.

Draaipuntsleutel

Draaiknop

De draaitoets is de kolom waarvan de rijwaarden worden ingevoerd in nieuwe kolommen. Standaard maakt de draaitransformatie een nieuwe kolom voor elke unieke rijwaarde.

In de sectie met de label Value kunt u specifieke rijwaarden invoeren die moeten worden gedraaid. Alleen de rijwaarden die in deze sectie zijn ingevoerd, worden gedraaid. Als u Null-waarde inschakelt, wordt er een gepivotte kolom gemaakt voor de null-waarden in de kolom.

Gepivoteerde kolommen

Gepivotte kolommen

Genereer een geaggregeerde rijwaarde voor elke groep voor elke unieke draaitpuntwaarde die een kolom wordt. U kunt meerdere kolommen per draaitabelsleutel maken. Elke draaikolom moet ten minste één statistische functie bevatten.

Kolomnaampatroon: Selecteer hoe u de kolomnaam van elke pivotkolom op te maken. De naam van de uitvoerkolom is een combinatie van de draaitabelsleutelwaarde, kolomvoorvoegsel en optioneel voorvoegsel of achtervoegsel, waarbij middelste tekens ook kunnen worden toegevoegd.

Kolomopstelling: Als u meer dan één draaitabelkolom per draaitabelsleutel genereert, kiest u hoe u de kolommen wilt rangschikken.

Kolomvoorvoegsel: Als u meer dan één draaikolom per draaisleutel genereert, voert u een kolomvoorvoegsel voor elke kolom in. Deze instelling is optioneel als u slechts één gedraaide kolom hebt.

Help-afbeelding

In de helpgrafiek ziet u hoe de verschillende draaitabelonderdelen samenwerken.

Pivot-helpafbeeldingen

Pivot-metadata

Als er geen waarden zijn opgegeven in de configuratie van de draaisleutel, worden de kolommen dynamisch gegenereerd tijdens runtime. Het aantal gedraaide kolommen is gelijk aan het aantal unieke draaitabelwaarden vermenigvuldigd met het aantal draaikolommen. Omdat dit een veranderend getal kan zijn, geeft de UX de kolommetagegevens niet weer op het tabblad Inspecteren en is er geen kolomdoorgifte. Als u deze kolommen wilt transformeren, gebruikt u de mogelijkheden van het kolompatroon van de toewijzingsgegevensstroom.

Als er specifieke pivot-sleutelwaarden zijn ingesteld, verschijnen de gepivotte kolommen binnen de metagegevens. De kolomnamen zijn beschikbaar in de Inspect en de Sink-mapping.

Metagegevens genereren op basis van afgedreven kolommen

Pivot genereert dynamisch nieuwe kolomnamen op basis van rijwaarden. U kunt deze nieuwe kolommen toevoegen aan de metagegevens waarnaar later in uw gegevensstroom kan worden verwezen. Hiervoor gebruikt u de map drifted snelle actie in de gegevensvoorbeeldweergave.

Draaikolommen

Zinkende zwenkkolommen

Hoewel gedraaide kolommen dynamisch zijn, kunnen ze nog steeds worden weggeschreven naar uw doeldatastore. Schakel schemadrift toestaan in uw sink-instellingen in. Hiermee kunt u kolommen schrijven die niet zijn opgenomen in metagegevens. U ziet de nieuwe dynamische namen niet in de metagegevens van uw kolom, maar met de schemadriftoptie kunt u de gegevens landen.

Oorspronkelijke velden opnieuw toevoegen

De draaitransformatie projecteert alleen de group-by en gepivotte kolommen. Als u wilt dat uw uitvoergegevens andere invoerkolommen bevatten, gebruikt u een self join-patroon .

Script voor gegevensstroom

Syntaxis

<incomingStreamName>
    pivot(groupBy(Tm),
        pivotBy(<pivotKeyColumn, [<specifiedColumnName1>,...,<specifiedColumnNameN>]),
        <pivotColumnPrefix> = <pivotedColumnValue>,
        columnNaming: '< prefix >< $N | $V ><middle >< $N | $V >< suffix >',
        lateral: { 'true' | 'false'}
    ) ~> <pivotTransformationName

Voorbeeld

De schermen die worden weergegeven in de configuratiesectie, hebben het volgende gegevensstroomscript:

BasketballPlayerStats pivot(groupBy(Tm),
    pivotBy(Pos),
    {} = count(),
    columnNaming: '$V$N count',
    lateral: true) ~> PivotExample

Probeer de unpivot-transformatie uit te voeren om kolomwaarden om te zetten in rijwaarden.