Compartilhar via


Salvar

Salva o conteúdo de uma fonte de DataFrame dados. A fonte de dados é especificada por format um conjunto de options. Se format não for especificado, a fonte de dados padrão configurada por spark.sql.sources.default ela será usada.

Sintaxe

save(path=None, format=None, mode=None, partitionBy=None, **options)

Parâmetros

Parâmetro Tipo Descrição
path str, opcional O caminho em um sistema de arquivos com suporte do Hadoop.
format str, opcional O formato usado para salvar.
mode str, opcional O comportamento quando os dados já existem. Os valores aceitos são'append', , 'overwrite''ignore'e 'error' ou 'errorifexists' (padrão).
partitionBy lista, opcional Nomes de colunas de particionamento.
**options dicionário Opções de cadeia de caracteres adicionais.

Devoluções

Nenhum

Exemplos

Escreva um DataFrame em um arquivo JSON e leia-o novamente.

import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").format("json").save(d)

    spark.read.format('json').load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+