drop (DataFrame)

Devuelve un nuevo DataFrame sin columnas especificadas. Se trata de un no-op si el esquema no contiene los nombres de columna especificados.

Sintaxis

drop(*cols: "ColumnOrName")

Parámetros

Parámetro Tipo Descripción
cols str o columna Nombre de la columna o Columna que se va a quitar.

Devoluciones

DataFrame: un nuevo DataFrame sin las columnas especificadas.

Notas

Cuando una entrada es un nombre de columna, se trata literalmente sin una interpretación adicional. De lo contrario, intentará coincidir con la expresión equivalente. Por lo tanto, quitar una columna por su nombre drop(colName) tiene una semántica diferente con quitar directamente la columna drop(col(colName)).

Ejemplos

df = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["age", "name"])
df.drop('age').show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df.drop(df.age).show()
# +-----+
# | name|
# +-----+
# |  Tom|
# |Alice|
# |  Bob|
# +-----+

df2 = spark.createDataFrame([(80, "Tom"), (85, "Bob")], ["height", "name"])
df.join(df2, df.name == df2.name).drop('name').sort('age').show()
# +---+------+
# |age|height|
# +---+------+
# | 14|    80|
# | 16|    85|
# +---+------+