agg (DataFrame)

Agréger sur l’ensemble du DataFrame sans groupes (raccourci pour df.groupBy().agg()).

Syntaxe

agg(*exprs: Union[Column, Dict[str, str]])

Paramètres

Paramètre Type Description
exprs Colonne ou dictée de chaînes de clé et de valeur Colonnes ou expressions par lesquelles agréger le DataFrame.

Retours

DataFrame: DataFrame agrégé.

Exemples

from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.agg({"age": "max"}).show()
# +--------+
# |max(age)|
# +--------+
# |       5|
# +--------+
df.agg(sf.min(df.age)).show()
# +--------+
# |min(age)|
# +--------+
# |       2|
# +--------+