drop (DataFrame)

Returnerar en ny DataFrame utan angivna kolumner. Det här är en no-op om schemat inte innehåller de angivna kolumnnamnen.

Syntax

drop(*cols: "ColumnOrName")

Parameters

Parameter Type Beskrivning
cols str eller kolumn Ett namn på kolumnen eller kolumnen som ska tas bort.

Retur

DataFrame: En ny DataFrame utan de angivna kolumnerna.

Notes

När en indata är ett kolumnnamn behandlas den bokstavligen utan ytterligare tolkning. Annars försöker den matcha motsvarande uttryck. Så att släppa en kolumn med dess namn drop(colName) har en annan semantisk med att direkt släppa kolumnen drop(col(colName)).

Exempel

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14|    80|
# | 16|    85|
# +---+------+