Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Retourneert een nieuw DataFrame zonder opgegeven kolommen. Dit is een no-op als het schema de opgegeven kolomnaam(en) niet bevat.
Syntaxis
drop(*cols: "ColumnOrName")
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
cols |
str of Column | Een naam van de kolom of de kolom die moet worden verwijderd. |
Retouren
DataFrame: Een nieuw DataFrame zonder de opgegeven kolommen.
Aantekeningen
Wanneer een invoer een kolomnaam is, wordt deze letterlijk behandeld zonder verdere interpretatie. Anders wordt geprobeerd de equivalente expressie te vinden. Het verwijderen van een kolom op basis van de naam drop(colName) heeft dus een andere semantische weergave waarbij de kolom direct wordt neergestreken drop(col(colName)).
Examples
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+