Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Retourneert True wanneer de logische queryplannen in beide DataFrames gelijk zijn en daarom dezelfde resultaten retourneren.
Syntaxis
sameSemantics(other: "DataFrame")
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
other |
DataFrame | Het andere DataFrame om mee te vergelijken. |
Retouren
bool: Of deze twee DataFrames vergelijkbaar zijn.
Aantekeningen
De gelijkheidsvergelijking hier wordt vereenvoudigd door de cosmetische verschillen zoals kenmerknamen te verdragen.
Deze API kan beide DataFrames zeer snel vergelijken, maar kan nog steeds terugkeren False op de DataFrames die dezelfde resultaten retourneren, bijvoorbeeld uit verschillende plannen. Een dergelijke fout-negatieve semantische waarde kan handig zijn bij het opslaan in cache als voorbeeld.
Deze API is een ontwikkelaars-API.
Examples
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True