unionByName

Retourneert een nieuw DataFrame met een samenvoeging van rijen in dit en een ander DataFrame.

Syntaxis

unionByName(other: "DataFrame", allowMissingColumns: bool = False)

Parameterwaarden

Kenmerk Typ Beschrijving
other DataFrame Een ander DataFrame dat moet worden gecombineerd.
allowMissingColumns bool, optioneel, standaard false Geef op of ontbrekende kolommen moeten worden toegestaan.

Retouren

DataFrame: Een nieuw DataFrame met de gecombineerde rijen met bijbehorende kolommen van de twee gegeven DataFrames.

Aantekeningen

Met deze methode wordt een samenvoegbewerking uitgevoerd op beide dataframes, waarbij kolommen worden omgezet op naam (in plaats van positie). Wanneer allowMissingColumns is waar, worden ontbrekende kolommen gevuld met null.

Examples

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col0"])
df1.unionByName(df2).show()
# +----+----+----+
# |col0|col1|col2|
# +----+----+----+
# |   1|   2|   3|
# |   6|   4|   5|
# +----+----+----+

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col3"])
df1.unionByName(df2, allowMissingColumns=True).show()
# +----+----+----+----+
# |col0|col1|col2|col3|
# +----+----+----+----+
# |   1|   2|   3|NULL|
# |NULL|   4|   5|   6|
# +----+----+----+----+