Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnerar en ny DataFrame utan angivna kolumner. Det här är en no-op om schemat inte innehåller de angivna kolumnnamnen.
Syntax
drop(*cols: "ColumnOrName")
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
cols |
str eller kolumn | Ett namn på kolumnen eller kolumnen som ska tas bort. |
Retur
DataFrame: En ny DataFrame utan de angivna kolumnerna.
Notes
När en indata är ett kolumnnamn behandlas den bokstavligen utan ytterligare tolkning. Annars försöker den matcha motsvarande uttryck. Så att släppa en kolumn med dess namn drop(colName) har en annan semantisk med att direkt släppa kolumnen drop(col(colName)).
Exempel
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+