withColumn

Retourneert een nieuw DataFrame door een kolom toe te voegen of de bestaande kolom met dezelfde naam te vervangen.

Syntaxis

withColumn(colName: str, col: Column)

Parameterwaarden

Kenmerk Typ Beschrijving
colName str tekenreeks, naam van de nieuwe kolom.
col Rubriek een kolomexpressie voor de nieuwe kolom.

Retouren

DataFrame: DataFrame met nieuwe of vervangen kolom.

Aantekeningen

Met deze methode wordt intern een projectie geïntroduceerd. Daarom kan het meerdere keren worden aangeroepen, bijvoorbeeld via lussen om meerdere kolommen toe te voegen, grote plannen kunnen genereren die prestatieproblemen en zelfs StackOverflowExceptionkunnen veroorzaken. U kunt dit voorkomen door meerdere kolommen tegelijk te gebruiken select .

Examples

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# |  2|Alice|   4|
# |  5|  Bob|   7|
# +---+-----+----+