Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Returnera en ny DataFrame som innehåller rader i den här dataramen men inte i en annan DataFrame.
Syntax
subtract(other: "DataFrame")
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
other |
DataFrame | En annan dataram som måste subtraheras. |
Retur
DataFrame: Subtraherad dataram.
Notes
Detta motsvarar EXCEPT DISTINCT i SQL.
Exempel
df1 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3), ("c", 4)], ["C1", "C2"])
df2 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3)], ["C1", "C2"])
result_df = df1.subtract(df2)
result_df.show()
# +---+---+
# | C1| C2|
# +---+---+
# | c| 4|
# +---+---+
df1 = spark.createDataFrame([(1, "A"), (2, "B")], ["id", "value"])
df2 = spark.createDataFrame([(2, "B"), (3, "C")], ["id", "value"])
result_df = df1.subtract(df2)
result_df.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# +---+-----+