Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Retorna um novo DataFrame adicionando uma coluna ou substituindo a coluna existente que tem o mesmo nome.
Sintaxe
withColumn(colName: str, col: Column)
Parâmetros
| Parâmetro | Tipo | Descrição |
|---|---|---|
colName |
str | cadeia de caracteres, nome da nova coluna. |
col |
Coluna | uma expressão Column para a nova coluna. |
Devoluções
DataFrame: DataFrame com coluna nova ou substituída.
Observações
Esse método introduz uma projeção internamente. Portanto, chamá-lo várias vezes, por exemplo, por meio de loops para adicionar várias colunas pode gerar grandes planos que podem causar problemas de desempenho e até mesmo StackOverflowException. Para evitar isso, use select com várias colunas ao mesmo tempo.
Exemplos
df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.withColumn('age2', df.age + 2).show()
# +---+-----+----+
# |age| name|age2|
# +---+-----+----+
# | 2|Alice| 4|
# | 5| Bob| 7|
# +---+-----+----+