sameSemantics

Returnerar True när de logiska frågeplanerna i båda DataFrames är lika och därför returnerar samma resultat.

Syntax

sameSemantics(other: "DataFrame")

Parameters

Parameter Type Beskrivning
other DataFrame Den andra DataFrame att jämföra med.

Retur

bool: Om dessa två DataFrames är liknande.

Notes

Likhetsjämförelsen här förenklas genom att tolerera de kosmetiska skillnaderna, till exempel attributnamn.

Det här API:et kan jämföra båda DataFrames mycket snabbt men kan fortfarande returneras False på dataramar som returnerar samma resultat, till exempel från olika planer. Sådan falsk negativ semantik kan vara användbar vid cachelagring som exempel.

Det här API:et är ett utvecklar-API.

Exempel

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True