drop (DataFrame)

Returnerar en ny DataFrame utan angivna kolumner. Det här är en no-op om schemat inte innehåller de angivna kolumnnamnen.

Syntax

drop(*cols: "ColumnOrName")

Parameters

Parameter	Type	Beskrivning
`cols`	str eller kolumn	Ett namn på kolumnen eller kolumnen som ska tas bort.

Retur

DataFrame: En ny DataFrame utan de angivna kolumnerna.

Notes

När en indata är ett kolumnnamn behandlas den bokstavligen utan ytterligare tolkning. Annars försöker den matcha motsvarande uttryck. Så att släppa en kolumn med dess namn drop(colName) har en annan semantisk med att direkt släppa kolumnen drop(col(colName)).

Exempel

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14|    80|
# | 16|    85|
# +---+------+

Feedback

Var den här sidan till hjälp?

Last updated on 2026-04-19