Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Calcule les valeurs moyennes pour chaque colonne numérique pour chaque groupe.
mean est un alias pour avg.
Syntaxe
avg(*cols)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
cols |
str | Noms de colonnes. Les colonnes non numériques sont ignorées. |
Retours
DataFrame
Exemples
df = spark.createDataFrame([
(2, "Alice", 80), (3, "Alice", 100),
(5, "Bob", 120), (10, "Bob", 140)], ["age", "name", "height"])
# Group-by name, and calculate the mean of the age in each group.
df.groupBy("name").avg('age').sort("name").show()
# +-----+--------+
# | name|avg(age)|
# +-----+--------+
# |Alice| 2.5|
# | Bob| 7.5|
# +-----+--------+
# Calculate the mean of the age and height in all data.
df.groupBy().avg('age', 'height').show()
# +--------+-----------+
# |avg(age)|avg(height)|
# +--------+-----------+
# | 5.0| 110.0|
# +--------+-----------+