sameSemantics

Retourne True lorsque les plans de requête logiques à l’intérieur des deux DataFrames sont égaux et retournent donc les mêmes résultats.

Syntaxe

sameSemantics(other: "DataFrame")

Paramètres

Paramètre Type Description
other DataFrame Autre DataFrame à comparer.

Retours

bool : indique si ces deux DataFrames sont similaires.

Remarques

La comparaison d’égalité ici est simplifiée en tolerant les différences cosmétiques telles que les noms d’attributs.

Cette API peut comparer les deux DataFrames très rapidement, mais peut toujours retourner False sur les DataFrames qui retournent les mêmes résultats, par exemple, à partir de différents plans. Cette sémantique négative fausse peut être utile lors de la mise en cache en tant qu’exemple.

Cette API est une API de développeur.

Exemples

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True