Compartilhar via


drop (DataFrame)

Retorna um novo DataFrame sem colunas especificadas. Esse é um no-op se o esquema não contiver os nomes de coluna fornecidos.

Sintaxe

drop(*cols: "ColumnOrName")

Parâmetros

Parâmetro Tipo Descrição
cols str ou Column Um nome da coluna ou a Coluna a ser descartada.

Devoluções

DataFrame: um novo DataFrame sem as colunas especificadas.

Observações

Quando uma entrada é um nome de coluna, ela é tratada literalmente sem interpretação adicional. Caso contrário, ele tentará corresponder à expressão equivalente. Portanto, remover uma coluna pelo nome drop(colName) tem uma semântica diferente com a remoção direta da coluna drop(col(colName)).

Exemplos

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14|    80|
# | 16|    85|
# +---+------+