save

Guarda el contenido de en DataFrame un origen de datos. El origen de datos se especifica mediante format y un conjunto de options. Si format no se especifica, se usa el origen de datos predeterminado configurado por spark.sql.sources.default .

Sintaxis

save(path=None, format=None, mode=None, partitionBy=None, **options)

Parámetros

Parámetro	Tipo	Descripción
`path`	str, opcional	Ruta de acceso en un sistema de archivos compatible con Hadoop.
`format`	str, opcional	Formato que se usa para guardar.
`mode`	str, opcional	Comportamiento cuando ya existen datos. Los valores aceptados son `'append'`, `'overwrite'`, `'ignore'`y `'error'` o `'errorifexists'` (valor predeterminado).
`partitionBy`	list, opcional	Nombres de columnas de creación de particiones.
`**options`	diccionario	Opciones de cadena adicionales.

Devoluciones

Ninguno

Ejemplos

Escriba un DataFrame en un archivo JSON y vuelva a leerlo.

import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").format("json").save(d)

    spark.read.format('json').load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-19