Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnerar en ny DataFrame genom att lägga till en kolumn eller ersätta den befintliga kolumnen med samma namn.
Syntax
withColumn(colName: str, col: Column)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
colName |
str | sträng, namnet på den nya kolumnen. |
col |
Kolumn | ett kolumnuttryck för den nya kolumnen. |
Retur
DataFrame: DataFrame med ny eller ersatt kolumn.
Notes
Den här metoden introducerar en projektion internt. Att anropa det flera gånger, till exempel via loopar för att lägga till flera kolumner, kan därför generera stora planer som kan orsaka prestandaproblem och till och med StackOverflowException. Undvik detta genom att använda select med flera kolumner samtidigt.
Exempel
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+