Snijden

Retourneert een nieuw DataFrame dat alleen rijen bevat in zowel dit DataFrame als een ander DataFrame. Houd er rekening mee dat eventuele duplicaten worden verwijderd. Gebruik duplicaten behouden om dubbele waarden intersectAllte behouden.

Syntaxis

intersect(other: "DataFrame")

Parameterwaarden

Kenmerk	Typ	Beschrijving
`other`	DataFrame	Een ander DataFrame dat moet worden gecombineerd.

Retouren

DataFrame: Gecombineerd DataFrame.

Aantekeningen

Dit komt overeen met INTERSECT in SQL.

Examples

df1 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3), ("c", 4)], ["C1", "C2"])
df2 = spark.createDataFrame([("a", 1), ("a", 1), ("b", 3)], ["C1", "C2"])
result_df = df1.intersect(df2).sort("C1", "C2")
result_df.show()
# +---+---+
# | C1| C2|
# +---+---+
# |  a|  1|
# |  b|  3|
# +---+---+

df1 = spark.createDataFrame([(1, "A"), (2, "B")], ["id", "value"])
df2 = spark.createDataFrame([(2, "B"), (3, "C")], ["id", "value"])
result_df = df1.intersect(df2).sort("id", "value")
result_df.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  2|    B|
# +---+-----+

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-19