columns

Haalt de namen van alle kolommen in de DataFrame lijst op. De volgorde van de kolomnamen in de lijst weerspiegelt hun volgorde in het DataFrame.

Retouren

list

Examples

Kolomnamen van een DataFrame ophalen.

df = spark.createDataFrame(
    [(14, "Tom", "CA"), (23, "Alice", "NY"), (16, "Bob", "TX")],
    ["age", "name", "state"]
)
df.columns
# ['age', 'name', 'state']

Gebruik kolomnamen om specifieke kolommen te projecteren.

selected_cols = [col for col in df.columns if col != "age"]
df.select(selected_cols).show()
# +-----+-----+
# | name|state|
# +-----+-----+
# |  Tom|   CA|
# |Alice|   NY|
# |  Bob|   TX|
# +-----+-----+

Controleer of er een specifieke kolom in een DataFrame bestaat.

"state" in df.columns
# True
"salary" in df.columns
# False