sort

Retourneert een nieuw DataFrame gesorteerd op de opgegeven kolom(en).

Syntaxis

sort(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Parameterwaarden

Kenmerk Typ Beschrijving
cols int, str, list of Column, optional lijst met kolom- of kolomnamen of kolomdinals waarop u wilt sorteren.
ascending bool of lijst, optioneel, standaard Waar Booleaanse waarde of lijst met booleaanse waarden. Sorteer oplopend versus aflopend. Geef een lijst op voor meerdere sorteervolgordes. Als er een lijst is opgegeven, moet de lengte van de lijst gelijk zijn aan de lengte van de colslijst.

Retouren

DataFrame: Gesorteerd DataFrame.

Aantekeningen

Een kolomordinaal begint vanaf 1, wat verschilt van de op 0 gebaseerde __getitem__tabel. Als een kolomordinaal negatief is, betekent dit aflopend sorteren.

Examples

from pyspark.sql import functions as sf
df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.sort(sf.asc("age")).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.sort(df.age.desc()).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df.sort("age", ascending=False).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df = spark.createDataFrame([
    (2, "Alice"), (2, "Bob"), (5, "Bob")], schema=["age", "name"])
df.orderBy(sf.desc("age"), "name").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# |  2|  Bob|
# +---+-----+