Compartilhar via


classificar

Retorna um novo DataFrame classificado pelas colunas especificadas.

Sintaxe

sort(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Parâmetros

Parâmetro Tipo Descrição
cols int, str, list ou Column, opcional lista de nomes de colunas ou colunas ou ordinais de coluna para classificar.
ascending bool ou lista, opcional, true padrão booliano ou lista de boolianos. Classificação crescente versus decrescente. Especifique a lista para vários pedidos de classificação. Se uma lista for especificada, o comprimento da lista deverá ser igual ao tamanho da cols.

Devoluções

DataFrame: DataFrame classificado.

Observações

Um ordinal de coluna começa a partir de 1, que é diferente do baseado em __getitem__0. Se um ordinal de coluna for negativo, isso significa classificar decrescente.

Exemplos

from pyspark.sql import functions as sf
df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.sort(sf.asc("age")).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.sort(df.age.desc()).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df.sort("age", ascending=False).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df = spark.createDataFrame([
    (2, "Alice"), (2, "Bob"), (5, "Bob")], schema=["age", "name"])
df.orderBy(sf.desc("age"), "name").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# |  2|  Bob|
# +---+-----+