orc (DataFrameWriter)

Guarda el contenido del DataFrame en formato ORC en la ruta de acceso especificada.

Sintaxis

orc(path, mode=None, partitionBy=None, compression=None)

Parámetros

Parámetro Tipo Descripción
path str Ruta de acceso en cualquier sistema de archivos compatible con Hadoop.
mode str, opcional Comportamiento cuando ya existen datos. Los valores aceptados son 'append', 'overwrite', 'ignore'y 'error' o 'errorifexists' (valor predeterminado).
partitionBy str o list, opcional Nombres de columnas de creación de particiones.
compression str, opcional Códec de compresión que se va a usar.

Devoluciones

Ninguno

Ejemplos

Escriba un DataFrame en un archivo ORC y vuelva a leerlo.

import tempfile
with tempfile.TemporaryDirectory(prefix="orc") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.orc(d, mode="overwrite")

    spark.read.format("orc").load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+