sort

Returnerar en ny DataFrame sorterad efter de angivna kolumnerna.

Syntax

sort(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Parameters

Parameter Type Beskrivning
cols int, str, list eller Column, valfritt lista över kolumn- eller kolumnnamn eller kolumnordinaler som ska sorteras efter.
ascending bool eller lista, valfritt, standard sant boolesk eller lista över booleska. Sortera stigande jämfört med fallande. Ange lista för flera sorteringsbeställningar. Om en lista anges måste längden på listan vara lika med längden på cols.

Retur

DataFrame: Sorterad dataram.

Notes

En kolumnordning startar från 1, vilket skiljer sig från 0-baserade __getitem__. Om en kolumnordning är negativ innebär det att sortera fallande.

Exempel

from pyspark.sql import functions as sf
df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.sort(sf.asc("age")).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.sort(df.age.desc()).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df.sort("age", ascending=False).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df = spark.createDataFrame([
    (2, "Alice"), (2, "Bob"), (5, "Bob")], schema=["age", "name"])
df.orderBy(sf.desc("age"), "name").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# |  2|  Bob|
# +---+-----+