union

Returnera en ny DataFrame som innehåller en union av rader i den här och en annan DataFrame.

Syntax

union(other: "DataFrame")

Parameters

Parameter	Type	Beskrivning
`other`	DataFrame	En annan dataram som måste vara unionerad.

Retur

DataFrame: En ny DataFrame som innehåller de kombinerade raderna med motsvarande kolumner.

Notes

Den här metoden utför en SQL-typuppsättningsunion av raderna från båda DataFrame objekten, utan automatisk deduplicering av element.

Använd metoden distinct() för att utföra deduplicering av rader.

Metoden löser kolumner efter position (inte efter namn), enligt standardbeteendet i SQL.

Exempel

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

Feedback

Var den här sidan till hjälp?

Last updated on 2026-04-19