Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Guarda el contenido de en DataFrame un origen de datos. El origen de datos se especifica mediante format y un conjunto de options. Si format no se especifica, se usa el origen de datos predeterminado configurado por spark.sql.sources.default .
Sintaxis
save(path=None, format=None, mode=None, partitionBy=None, **options)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
path |
str, opcional | Ruta de acceso en un sistema de archivos compatible con Hadoop. |
format |
str, opcional | Formato que se usa para guardar. |
mode |
str, opcional | Comportamiento cuando ya existen datos. Los valores aceptados son 'append', 'overwrite', 'ignore'y 'error' o 'errorifexists' (valor predeterminado). |
partitionBy |
list, opcional | Nombres de columnas de creación de particiones. |
**options |
diccionario | Opciones de cadena adicionales. |
Devoluciones
Ninguno
Ejemplos
Escriba un DataFrame en un archivo JSON y vuelva a leerlo.
import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).write.mode("overwrite").format("json").save(d)
spark.read.format('json').load(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+