Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Retourne un nouveau DataFrame sans colonnes spécifiées. Il s’agit d’une no-op si le schéma ne contient pas le ou les noms de colonne donnés.
Syntaxe
drop(*cols: "ColumnOrName")
Paramètres
| Paramètre | Type | Description |
|---|---|---|
cols |
str ou colonne | Nom de la colonne ou colonne à supprimer. |
Retours
DataFrame: nouveau DataFrame sans les colonnes spécifiées.
Remarques
Lorsqu’une entrée est un nom de colonne, elle est traitée littéralement sans interprétation supplémentaire. Sinon, il essaiera de correspondre à l’expression équivalente. Par conséquent, la suppression d’une colonne par son nom drop(colName) a une sémantique différente avec la suppression directe de la colonne drop(col(colName)).
Exemples
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+