Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Devuelve un nuevo DataFrame sin columnas especificadas. Se trata de un no-op si el esquema no contiene los nombres de columna especificados.
Sintaxis
drop(*cols: "ColumnOrName")
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
cols |
str o columna | Nombre de la columna o Columna que se va a quitar. |
Devoluciones
DataFrame: un nuevo DataFrame sin las columnas especificadas.
Notas
Cuando una entrada es un nombre de columna, se trata literalmente sin una interpretación adicional. De lo contrario, intentará coincidir con la expresión equivalente. Por lo tanto, quitar una columna por su nombre drop(colName) tiene una semántica diferente con quitar directamente la columna drop(col(colName)).
Ejemplos
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# | Tom|
# |Alice|
# | Bob|
# +-----+
df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14| 80|
# | 16| 85|
# +---+------+