kubus

Maak een multidimensionale kubus voor het huidige DataFrame met behulp van de opgegeven kolommen, zodat aggregaties erop kunnen worden uitgevoerd.

Syntaxis

cube(*cols: "ColumnOrName")

Parameterwaarden

Kenmerk Typ Beschrijving
cols lijst, str, int of kolom De kolommen om op te kubusen. Elk element moet een kolomnaam (tekenreeks) of een expressie (kolom) of een kolomordinaal (op basis van 1) of een lijst met elementen zijn.

Retouren

GroupedData: Kubus van de gegevens op basis van de opgegeven kolommen.

Aantekeningen

Een kolomordinaal begint vanaf 1, wat verschilt van de op 0 gebaseerde __getitem__tabel.

Examples

df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])

df.cube("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL|    2|
# |Alice|    1|
# |  Bob|    1|
# +-----+-----+

df.cube("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL|    2|
# | NULL|   2|    1|
# | NULL|   5|    1|
# |Alice|NULL|    1|
# |Alice|   2|    1|
# |  Bob|NULL|    1|
# |  Bob|   5|    1|
# +-----+----+-----+