Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Calcule la somme de chaque colonne numérique pour chaque groupe.
Syntaxe
sum(*cols)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
cols |
str | Noms de colonnes. Les colonnes non numériques sont ignorées. |
Retours
DataFrame
Exemples
df = spark.createDataFrame([
(2, "Alice", 80), (3, "Alice", 100),
(5, "Bob", 120), (10, "Bob", 140)], ["age", "name", "height"])
# Group-by name, and calculate the sum of the age in each group.
df.groupBy("name").sum("age").sort("name").show()
# +-----+--------+
# | name|sum(age)|
# +-----+--------+
# |Alice| 5|
# | Bob| 15|
# +-----+--------+
# Calculate the sum of the age and height in all data.
df.groupBy().sum("age", "height").show()
# +--------+-----------+
# |sum(age)|sum(height)|
# +--------+-----------+
# | 20| 440|
# +--------+-----------+