drop (DataFrame)

Retourneert een nieuw DataFrame zonder opgegeven kolommen. Dit is een no-op als het schema de opgegeven kolomnaam(en) niet bevat.

Syntaxis

drop(*cols: "ColumnOrName")

Parameterwaarden

Kenmerk Typ Beschrijving
cols str of Column Een naam van de kolom of de kolom die moet worden verwijderd.

Retouren

DataFrame: Een nieuw DataFrame zonder de opgegeven kolommen.

Aantekeningen

Wanneer een invoer een kolomnaam is, wordt deze letterlijk behandeld zonder verdere interpretatie. Anders wordt geprobeerd de equivalente expressie te vinden. Het verwijderen van een kolom op basis van de naam drop(colName) heeft dus een andere semantische weergave waarbij de kolom direct wordt neergestreken drop(col(colName)).

Examples

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14|    80|
# | 16|    85|
# +---+------+