Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Guarda el contenido del DataFrame en formato ORC en la ruta de acceso especificada.
Sintaxis
orc(path, mode=None, partitionBy=None, compression=None)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
path |
str | Ruta de acceso en cualquier sistema de archivos compatible con Hadoop. |
mode |
str, opcional | Comportamiento cuando ya existen datos. Los valores aceptados son 'append', 'overwrite', 'ignore'y 'error' o 'errorifexists' (valor predeterminado). |
partitionBy |
str o list, opcional | Nombres de columnas de creación de particiones. |
compression |
str, opcional | Códec de compresión que se va a usar. |
Devoluciones
Ninguno
Ejemplos
Escriba un DataFrame en un archivo ORC y vuelva a leerlo.
import tempfile
with tempfile.TemporaryDirectory(prefix="orc") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).write.orc(d, mode="overwrite")
spark.read.format("orc").load(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+