Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Skapa en flerdimensionell sammanslagning för den aktuella dataramen med hjälp av de angivna kolumnerna, så att de kan aggregeras.
Syntax
rollup(*cols: "ColumnOrNameOrOrdinal")
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
cols |
list, str, int eller Column | Kolumnerna som ska summeras av. Varje element ska vara ett kolumnnamn (sträng) eller ett uttryck (kolumn) eller en kolumnordinal (int, 1-baserad) eller en lista över dem. |
Retur
GroupedData: Samlade data baserat på de angivna kolumnerna.
Notes
En kolumnordning startar från 1, vilket skiljer sig från 0-baserade __getitem__.
Exempel
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])
df.rollup("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL| 2|
# |Alice| 1|
# | Bob| 1|
# +-----+-----+
df.rollup("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL| 2|
# |Alice|NULL| 1|
# |Alice| 2| 1|
# | Bob|NULL| 1|
# | Bob| 5| 1|
# +-----+----+-----+