columns

Hämtar namnen på alla kolumner i som DataFrame en lista. Ordningen på kolumnnamnen i listan visar deras ordning i DataFrame.

Retur

list

Exempel

Hämta kolumnnamn för en DataFrame.

df = spark.createDataFrame(
    [(14, "Tom", "CA"), (23, "Alice", "NY"), (16, "Bob", "TX")],
    ["age", "name", "state"]
)
df.columns
# ['age', 'name', 'state']

Använd kolumnnamn för att projicera specifika kolumner.

selected_cols = [col for col in df.columns if col != "age"]
df.select(selected_cols).show()
# +-----+-----+
# | name|state|
# +-----+-----+
# |  Tom|   CA|
# |Alice|   NY|
# |  Bob|   TX|
# +-----+-----+

Kontrollera om det finns en specifik kolumn i en dataram.

"state" in df.columns
# True
"salary" in df.columns
# False