Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Skapa en flerdimensionell kub för den aktuella DataFrame med hjälp av de angivna kolumnerna, så att sammansättningar kan utföras på dem.
Syntax
cube(*cols: "ColumnOrName")
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
cols |
list, str, int eller Column | Kolumnerna som ska kuberas efter. Varje element ska vara ett kolumnnamn (sträng) eller ett uttryck (kolumn) eller en kolumnordinal (int, 1-baserad) eller en lista över dem. |
Retur
GroupedData: Kub av data baserat på de angivna kolumnerna.
Notes
En kolumnordning startar från 1, vilket skiljer sig från 0-baserade __getitem__.
Exempel
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])
df.cube("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL| 2|
# |Alice| 1|
# | Bob| 1|
# +-----+-----+
df.cube("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL| 2|
# | NULL| 2| 1|
# | NULL| 5| 1|
# |Alice|NULL| 1|
# |Alice| 2| 1|
# | Bob|NULL| 1|
# | Bob| 5| 1|
# +-----+----+-----+