Snijden

Retourneert een nieuw DataFrame dat alleen rijen bevat in zowel dit DataFrame als een ander DataFrame. Houd er rekening mee dat eventuele duplicaten worden verwijderd. Gebruik duplicaten behouden om dubbele waarden intersectAllte behouden.

Syntaxis

intersect(other: "DataFrame")

Parameterwaarden

Kenmerk Typ Beschrijving
other DataFrame Een ander DataFrame dat moet worden gecombineerd.

Retouren

DataFrame: Gecombineerd DataFrame.

Aantekeningen

Dit komt overeen met INTERSECT in SQL.

Examples

df1 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3), ("c", 4)], ["C1", "C2"])
df2 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3)], ["C1", "C2"])
result_df = df1.intersect(df2).sort("C1", "C2")
result_df.show()
# +---+---+
# | C1| C2|
# +---+---+
# |  a|  1|
# |  b|  3|
# +---+---+

df1 = spark.createDataFrame([(1, "A"), (2, "B")], ["id", "value"])
df2 = spark.createDataFrame([(2, "B"), (3, "C")], ["id", "value"])
result_df = df1.intersect(df2).sort("id", "value")
result_df.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  2|    B|
# +---+-----+