unionByName

Devuelve un nuevo DataFrame que contiene la unión de filas en este y otro DataFrame.

Sintaxis

unionByName(other: "DataFrame", allowMissingColumns: bool = False)

Parámetros

Parámetro Tipo Descripción
other DataFrame Otro DataFrame que debe combinarse.
allowMissingColumns bool, opcional, false predeterminado Especifique si se van a permitir las columnas que faltan.

Devoluciones

DataFrame: nuevo DataFrame que contiene las filas combinadas con las columnas correspondientes de los dos dataframes especificados.

Notas

Este método realiza una operación de unión en ambos DataFrames de entrada, resolviendo columnas por nombre (en lugar de por posición). Cuando allowMissingColumns es True, las columnas que faltan se rellenarán con null.

Ejemplos

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col0"])
df1.unionByName(df2).show()
# +----+----+----+
# |col0|col1|col2|
# +----+----+----+
# |   1|   2|   3|
# |   6|   4|   5|
# +----+----+----+

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col3"])
df1.unionByName(df2, allowMissingColumns=True).show()
# +----+----+----+----+
# |col0|col1|col2|col3|
# +----+----+----+----+
# |   1|   2|   3|NULL|
# |NULL|   4|   5|   6|
# +----+----+----+----+