classificar

Retorna um novo DataFrame classificado pelas colunas especificadas.

Sintaxe

sort(*cols: Union[int, str, Column, List[Union[int, str, Column]]], **kwargs: Any)

Parâmetros

Parâmetro	Tipo	Descrição
`cols`	int, str, list ou Column, opcional	lista de nomes de colunas ou colunas ou ordinais de coluna para classificar.
`ascending`	bool ou lista, opcional, true padrão	booliano ou lista de boolianos. Classificação crescente versus decrescente. Especifique a lista para vários pedidos de classificação. Se uma lista for especificada, o comprimento da lista deverá ser igual ao tamanho da `cols`.

Devoluções

DataFrame: DataFrame classificado.

Observações

Um ordinal de coluna começa a partir de 1, que é diferente do baseado em __getitem__0. Se um ordinal de coluna for negativo, isso significa classificar decrescente.

Exemplos

from pyspark.sql import functions as sf
df = spark.createDataFrame([
    (2, "Alice"), (5, "Bob")], schema=["age", "name"])

df.sort(sf.asc("age")).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  2|Alice|
# |  5|  Bob|
# +---+-----+

df.sort(df.age.desc()).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df.sort("age", ascending=False).show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# +---+-----+

df = spark.createDataFrame([
    (2, "Alice"), (2, "Bob"), (5, "Bob")], schema=["age", "name"])
df.orderBy(sf.desc("age"), "name").show()
# +---+-----+
# |age| name|
# +---+-----+
# |  5|  Bob|
# |  2|Alice|
# |  2|  Bob|
# +---+-----+

Comentários

Esta página foi útil?

Last updated on 2026-04-19