kubus

Maak een multidimensionale kubus voor het huidige DataFrame met behulp van de opgegeven kolommen, zodat aggregaties erop kunnen worden uitgevoerd.

Syntaxis

cube(*cols: "ColumnOrName")

Parameterwaarden

Kenmerk	Typ	Beschrijving
`cols`	lijst, str, int of kolom	De kolommen om op te kubusen. Elk element moet een kolomnaam (tekenreeks) of een expressie (kolom) of een kolomordinaal (op basis van 1) of een lijst met elementen zijn.

Retouren

GroupedData: Kubus van de gegevens op basis van de opgegeven kolommen.

Aantekeningen

Een kolomordinaal begint vanaf 1, wat verschilt van de op 0 gebaseerde __getitem__tabel.

Examples

df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])

df.cube("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL|    2|
# |Alice|    1|
# |  Bob|    1|
# +-----+-----+

df.cube("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL|    2|
# | NULL|   2|    1|
# | NULL|   5|    1|
# |Alice|NULL|    1|
# |Alice|   2|    1|
# |  Bob|NULL|    1|
# |  Bob|   5|    1|
# +-----+----+-----+

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-19