Compartilhar via


unionByName

Retorna um novo DataFrame que contém a união de linhas neste e em outro DataFrame.

Sintaxe

unionByName(other: "DataFrame", allowMissingColumns: bool = False)

Parâmetros

Parâmetro Tipo Descrição
other DataFrame Outro DataFrame que precisa ser combinado.
allowMissingColumns bool, opcional, false padrão Especifique se as colunas ausentes devem ser permitidos.

Devoluções

DataFrame: um novo DataFrame que contém as linhas combinadas com colunas correspondentes dos dois DataFrames determinados.

Observações

Esse método executa uma operação de união em DataFrames de entrada, resolvendo colunas por nome (em vez de posição). Quando allowMissingColumns for True, as colunas ausentes serão preenchidas com nulo.

Exemplos

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col0"])
df1.unionByName(df2).show()
# +----+----+----+
# |col0|col1|col2|
# +----+----+----+
# |   1|   2|   3|
# |   6|   4|   5|
# +----+----+----+

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col3"])
df1.unionByName(df2, allowMissingColumns=True).show()
# +----+----+----+----+
# |col0|col1|col2|col3|
# +----+----+----+----+
# |   1|   2|   3|NULL|
# |NULL|   4|   5|   6|
# +----+----+----+----+