Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Créez un cube multidimensionnel pour le DataFrame actuel à l’aide des colonnes spécifiées, ce qui permet d’effectuer des agrégations sur celles-ci.
Syntaxe
cube(*cols: "ColumnOrName")
Paramètres
| Paramètre | Type | Description |
|---|---|---|
cols |
list, str, int ou Column | Colonnes à cube par. Chaque élément doit être un nom de colonne (chaîne) ou une expression (Column) ou un ordinal de colonne (int, 1) ou une liste d’entre eux. |
Retours
GroupedData: Cube des données basées sur les colonnes spécifiées.
Remarques
Un ordinal de colonne commence à partir de 1, qui est différent de celui basé sur __getitem__0.
Exemples
df = spark.createDataFrame([("Alice", 2), ("Bob", 5)], schema=["name", "age"])
df.cube("name").count().orderBy("name").show()
# +-----+-----+
# | name|count|
# +-----+-----+
# | NULL| 2|
# |Alice| 1|
# | Bob| 1|
# +-----+-----+
df.cube("name", df.age).count().orderBy("name", "age").show()
# +-----+----+-----+
# | name| age|count|
# +-----+----+-----+
# | NULL|NULL| 2|
# | NULL| 2| 1|
# | NULL| 5| 1|
# |Alice|NULL| 1|
# |Alice| 2| 1|
# | Bob|NULL| 1|
# | Bob| 5| 1|
# +-----+----+-----+