Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Beräknar maxvärdet för varje numerisk kolumn för varje grupp.
Syntax
max(*cols)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
cols |
str | Kolumnnamn. Icke-numeriska kolumner ignoreras. |
Retur
DataFrame
Exempel
df = spark.createDataFrame([
(2, "Alice", 80), (3, "Alice", 100),
(5, "Bob", 120), (10, "Bob", 140)], ["age", "name", "height"])
# Group-by name, and calculate the max of the age in each group.
df.groupBy("name").max("age").sort("name").show()
# +-----+--------+
# | name|max(age)|
# +-----+--------+
# |Alice| 3|
# | Bob| 10|
# +-----+--------+
# Calculate the max of the age and height in all data.
df.groupBy().max("age", "height").show()
# +--------+-----------+
# |max(age)|max(height)|
# +--------+-----------+
# | 10| 140|
# +--------+-----------+