Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Retorna um novo DataFrame sem colunas especificadas. Esse é um no-op se o esquema não contiver os nomes de coluna fornecidos.
Sintaxe
drop(*cols: "ColumnOrName")
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
cols |
str ou Column | Um nome da coluna ou a Coluna a ser descartada. |
Devoluções
DataFrame: um novo DataFrame sem as colunas especificadas.
Observações
Quando uma entrada é um nome de coluna, ela é tratada literalmente sem interpretação adicional. Caso contrário, ele tentará corresponder à expressão equivalente. Portanto, remover uma coluna pelo nome drop(colName) tem uma semântica diferente com a remoção direta da coluna drop(col(colName)).
Exemplos
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+