save

Guarda el contenido de en DataFrame un origen de datos. El origen de datos se especifica mediante format y un conjunto de options. Si format no se especifica, se usa el origen de datos predeterminado configurado por spark.sql.sources.default .

Sintaxis

save(path=None, format=None, mode=None, partitionBy=None, **options)

Parámetros

Parámetro Tipo Descripción
path str, opcional Ruta de acceso en un sistema de archivos compatible con Hadoop.
format str, opcional Formato que se usa para guardar.
mode str, opcional Comportamiento cuando ya existen datos. Los valores aceptados son 'append', 'overwrite', 'ignore'y 'error' o 'errorifexists' (valor predeterminado).
partitionBy list, opcional Nombres de columnas de creación de particiones.
**options diccionario Opciones de cadena adicionales.

Devoluciones

Ninguno

Ejemplos

Escriba un DataFrame en un archivo JSON y vuelva a leerlo.

import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").format("json").save(d)

    spark.read.format('json').load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+