Compartilhar via


sameSemantics

Retorna True quando os planos de consulta lógica dentro de ambos os DataFrames são iguais e, portanto, retornam os mesmos resultados.

Sintaxe

sameSemantics(other: "DataFrame")

Parâmetros

Parâmetro Tipo Descrição
other DataFrame O outro DataFrame com o qual comparar.

Devoluções

bool: se esses dois DataFrames são semelhantes.

Observações

A comparação de igualdade aqui é simplificada tolerando as diferenças cosméticas, como nomes de atributo.

Essa API pode comparar ambos os DataFrames muito rapidamente, mas ainda pode retornar False nos DataFrames que retornam os mesmos resultados, por exemplo, de planos diferentes. Essa semântica negativa falsa pode ser útil ao armazenar em cache como exemplo.

Essa API é uma API de desenvolvedor.

Exemplos

df1 = spark.range(10)
df2 = spark.range(10)
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id * 2))
# True
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col1", df2.id + 2))
# False
df1.withColumn("col1", df1.id * 2).sameSemantics(df2.withColumn("col0", df2.id * 2))
# True