sameSemantiek

Retourneert True wanneer de logische queryplannen in beide DataFrames gelijk zijn en daarom dezelfde resultaten retourneren.

Syntaxis

sameSemantics(other: "DataFrame")

Parameterwaarden

Kenmerk Typ Beschrijving
other DataFrame Het andere DataFrame om mee te vergelijken.

Retouren

bool: Of deze twee DataFrames vergelijkbaar zijn.

Aantekeningen

De gelijkheidsvergelijking hier wordt vereenvoudigd door de cosmetische verschillen zoals kenmerknamen te verdragen.

Deze API kan beide DataFrames zeer snel vergelijken, maar kan nog steeds terugkeren False op de DataFrames die dezelfde resultaten retourneren, bijvoorbeeld uit verschillende plannen. Een dergelijke fout-negatieve semantische waarde kan handig zijn bij het opslaan in cache als voorbeeld.

Deze API is een ontwikkelaars-API.

Examples

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True