Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnera en ny DataFrame som innehåller en union av rader i den här och en annan DataFrame.
Syntax
union(other: "DataFrame")
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
other |
DataFrame | En annan dataram som måste vara unionerad. |
Retur
DataFrame: En ny DataFrame som innehåller de kombinerade raderna med motsvarande kolumner.
Notes
Den här metoden utför en SQL-typuppsättningsunion av raderna från båda DataFrame objekten, utan automatisk deduplicering av element.
Använd metoden distinct() för att utföra deduplicering av rader.
Metoden löser kolumner efter position (inte efter namn), enligt standardbeteendet i SQL.
Exempel
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+
df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+