Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Retourne True lorsque les plans de requête logiques à l’intérieur des deux DataFrames sont égaux et retournent donc les mêmes résultats.
Syntaxe
sameSemantics(other: "DataFrame")
Paramètres
| Paramètre | Type | Description |
|---|---|---|
other |
DataFrame | Autre DataFrame à comparer. |
Retours
bool : indique si ces deux DataFrames sont similaires.
Remarques
La comparaison d’égalité ici est simplifiée en tolerant les différences cosmétiques telles que les noms d’attributs.
Cette API peut comparer les deux DataFrames très rapidement, mais peut toujours retourner False sur les DataFrames qui retournent les mêmes résultats, par exemple, à partir de différents plans. Cette sémantique négative fausse peut être utile lors de la mise en cache en tant qu’exemple.
Cette API est une API de développeur.
Exemples
df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True