columns

Recupera los nombres de todas las columnas de como DataFrame una lista. El orden de los nombres de columna de la lista refleja su orden en el DataFrame.

Devoluciones

list

Ejemplos

Recupere los nombres de columna de un dataframe.

df = spark.createDataFrame(
    [(14, "Tom", "CA"), (23, "Alice", "NY"), (16, "Bob", "TX")],
    ["age", "name", "state"]
)
df.columns
# ['age', 'name', 'state']

Use nombres de columna para proyectar columnas específicas.

selected_cols = [col for col in df.columns if col != "age"]
df.select(selected_cols).show()
# +-----+-----+
# | name|state|
# +-----+-----+
# |  Tom|   CA|
# |Alice|   NY|
# |  Bob|   TX|
# +-----+-----+

Compruebe si existe una columna específica en un dataframe.

"state" in df.columns
# True
"salary" in df.columns
# False