mergeInto

Fusionne un ensemble de mises à jour, d’insertions et de suppressions basées sur une table source dans une table cible.

Syntaxe

mergeInto(table: str, condition: Column)

Paramètres

Paramètre Type Description
table str Nom de la table cible à fusionner.
condition Colonne Condition qui détermine si une ligne de la table cible correspond à une ligne dans le DataFrame source.

Retours

MergeIntoWriter: MergeIntoWriter à utiliser pour spécifier comment fusionner le DataFrame source dans la table cible.

Exemples

from pyspark.sql.functions import expr
source = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["id", "name"])
(source.mergeInto("target", "id")
    .whenMatched().update({ "name": source.name })
    .whenNotMatched().insertAll()
    .whenNotMatchedBySource().delete()
    .merge())