Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnera en ny DataFrame som innehåller rader i den här dataramen men inte i en annan DataFrame samtidigt som dubbletter bevaras.
Syntax
exceptAll(other: "DataFrame")
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
other |
DataFrame | Den andra DataFrame att jämföra med. |
Retur
DataFrame
Notes
Detta motsvarar EXCEPT ALL i SQL. Som standard i SQL löser den här funktionen kolumner efter position (inte efter namn).
Exempel
df1 = spark.createDataFrame(
[("a", 1), ("a", 1), ("a", 1), ("a", 2), ("b", 3), ("c", 4)], ["C1", "C2"])
df2 = spark.createDataFrame([("a", 1), ("b", 3)], ["C1", "C2"])
df1.exceptAll(df2).show()
# +---+---+
# | C1| C2|
# +---+---+
# | a| 1|
# | a| 1|
# | a| 2|
# | c| 4|
# +---+---+