Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Hämtar namnen på alla kolumner i som DataFrame en lista. Ordningen på kolumnnamnen i listan visar deras ordning i DataFrame.
Retur
list
Exempel
Hämta kolumnnamn för en DataFrame.
df = spark.createDataFrame(
[(14, "Tom", "CA"), (23, "Alice", "NY"), (16, "Bob", "TX")],
["age", "name", "state"]
)
df.columns
# ['age', 'name', 'state']
Använd kolumnnamn för att projicera specifika kolumner.
selected_cols = [col for col in df.columns if col != "age"]
df.select(selected_cols).show()
# +-----+-----+
# | name|state|
# +-----+-----+
# | Tom| CA|
# |Alice| NY|
# | Bob| TX|
# +-----+-----+
Kontrollera om det finns en specifik kolumn i en dataram.
"state" in df.columns
# True
"salary" in df.columns
# False