colonnes

Récupère les noms de toutes les colonnes de la liste sous forme DataFrame de liste. L’ordre des noms de colonnes de la liste reflète leur ordre dans le DataFrame.

Retours

list

Exemples

Récupérez les noms de colonnes d’un DataFrame.

df = spark.createDataFrame(
    [(14, "Tom", "CA"), (23, "Alice", "NY"), (16, "Bob", "TX")],
    ["age", "name", "state"]
)
df.columns
# ['age', 'name', 'state']

Utilisez des noms de colonnes pour projeter des colonnes spécifiques.

selected_cols = [col for col in df.columns if col != "age"]
df.select(selected_cols).show()
# +-----+-----+
# | name|state|
# +-----+-----+
# |  Tom|   CA|
# |Alice|   NY|
# |  Bob|   TX|
# +-----+-----+

Vérifiez si une colonne spécifique existe dans un DataFrame.

"state" in df.columns
# True
"salary" in df.columns
# False