withColumn

Returnerar en ny DataFrame genom att lägga till en kolumn eller ersätta den befintliga kolumnen med samma namn.

Syntax

withColumn(colName: str, col: Column)

Parameters

Parameter Type Beskrivning
colName str sträng, namnet på den nya kolumnen.
col Kolumn ett kolumnuttryck för den nya kolumnen.

Retur

DataFrame: DataFrame med ny eller ersatt kolumn.

Notes

Den här metoden introducerar en projektion internt. Att anropa det flera gånger, till exempel via loopar för att lägga till flera kolumner, kan därför generera stora planer som kan orsaka prestandaproblem och till och med StackOverflowException. Undvik detta genom att använda select med flera kolumner samtidigt.

Exempel

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# |  2|Alice|   4|
# |  5|  Bob|   7|
# +---+-----+----+