unionByName

Retourne un nouveau DataFrame contenant l’union de lignes dans ce dataFrame et un autre DataFrame.

Syntaxe

unionByName(other: "DataFrame", allowMissingColumns: bool = False)

Paramètres

Paramètre Type Description
other DataFrame Un autre DataFrame qui doit être combiné.
allowMissingColumns bool, facultatif, false par défaut Spécifiez s’il faut autoriser les colonnes manquantes.

Retours

DataFrame: nouveau DataFrame contenant les lignes combinées avec les colonnes correspondantes des deux DataFrames donnés.

Remarques

Cette méthode effectue une opération d’union sur les deux DataFrames d’entrée, en résolvant les colonnes par nom (plutôt qu’en position). Quand allowMissingColumns la valeur est True, les colonnes manquantes sont remplies de valeurs Null.

Exemples

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col0"])
df1.unionByName(df2).show()
# +----+----+----+
# |col0|col1|col2|
# +----+----+----+
# |   1|   2|   3|
# |   6|   4|   5|
# +----+----+----+

df1 = spark.createDataFrame([[1, 2, 3]], ["col0", "col1", "col2"])
df2 = spark.createDataFrame([[4, 5, 6]], ["col1", "col2", "col3"])
df1.unionByName(df2, allowMissingColumns=True).show()
# +----+----+----+----+
# |col0|col1|col2|col3|
# +----+----+----+----+
# |   1|   2|   3|NULL|
# |NULL|   4|   5|   6|
# +----+----+----+----+