opslaan

Hiermee wordt de inhoud van de DataFrame gegevensbron opgeslagen. De gegevensbron wordt opgegeven door format en een set options. Als format dit niet is opgegeven, wordt de standaardgegevensbron gebruikt die is geconfigureerd door spark.sql.sources.default .

Syntaxis

save(path=None, format=None, mode=None, partitionBy=None, **options)

Parameterwaarden

Kenmerk Typ Beschrijving
path str, optioneel Het pad in een door Hadoop ondersteund bestandssysteem.
format str, optioneel De indeling die wordt gebruikt om op te slaan.
mode str, optioneel Het gedrag wanneer gegevens al bestaan. Geaccepteerde waarden zijn'append', 'overwrite', 'ignore'en of 'error''errorifexists' (standaard).
partitionBy lijst, optioneel Namen van partitioneringskolommen.
**options Woordenboek Aanvullende tekenreeksopties.

Retouren

Geen

Examples

Schrijf een DataFrame naar een JSON-bestand en lees het terug.

import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").format("json").save(d)

    spark.read.format('json').load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+