mergeInto

Combina un conjunto de actualizaciones, inserciones y eliminaciones basadas en una tabla de origen en una tabla de destino.

Sintaxis

mergeInto(table: str, condition: Column)

Parámetros

Parámetro Tipo Descripción
table str Nombre de tabla de destino en el que se va a combinar.
condition Columna Condición que determina si una fila de la tabla de destino coincide con una en el dataframe de origen.

Devoluciones

MergeIntoWriter: MergeIntoWriter para usar más para especificar cómo combinar el dataframe de origen en la tabla de destino.

Ejemplos

from pyspark.sql.functions import expr
source = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["id", "name"])
(source.mergeInto("target", "id")
    .whenMatched().update({ "name": source.name })
    .whenNotMatched().insertAll()
    .whenNotMatchedBySource().delete()
    .merge())