Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Aggregera på hela DataFrame utan grupper (förkortning för df.groupBy().agg()).
Syntax
agg(*exprs: Union[Column, Dict[str, str]])
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
exprs |
Kolumn eller diktering av nyckel- och värdesträngar | Kolumner eller uttryck att aggregera DataFrame efter. |
Retur
DataFrame: Aggregerad dataram.
Exempel
from pyspark.sql import functions as sf
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.agg({"age": "max"}).show()
# +--------+
# |max(age)|
# +--------+
# | 5|
# +--------+
df.agg(sf.min(df.age)).show()
# +--------+
# |min(age)|
# +--------+
# | 2|
# +--------+