Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Retourneert een nieuw DataFrame door een kolom toe te voegen of de bestaande kolom met dezelfde naam te vervangen.
Syntaxis
withColumn(colName: str, col: Column)
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
colName |
str | tekenreeks, naam van de nieuwe kolom. |
col |
Rubriek | een kolomexpressie voor de nieuwe kolom. |
Retouren
DataFrame: DataFrame met nieuwe of vervangen kolom.
Aantekeningen
Met deze methode wordt intern een projectie geïntroduceerd. Daarom kan het meerdere keren worden aangeroepen, bijvoorbeeld via lussen om meerdere kolommen toe te voegen, grote plannen kunnen genereren die prestatieproblemen en zelfs StackOverflowExceptionkunnen veroorzaken. U kunt dit voorkomen door meerdere kolommen tegelijk te gebruiken select .
Examples
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+