Compartilhar via


orc (DataFrameWriter)

Salva o conteúdo do DataFrame formato ORC no caminho especificado.

Sintaxe

orc(path, mode=None, partitionBy=None, compression=None)

Parâmetros

Parâmetro Tipo Descrição
path str O caminho em qualquer sistema de arquivos com suporte do Hadoop.
mode str, opcional O comportamento quando os dados já existem. Os valores aceitos são'append', , 'overwrite''ignore'e 'error' ou 'errorifexists' (padrão).
partitionBy str ou list, opcional Nomes de colunas de particionamento.
compression str, opcional O codec de compactação a ser usado.

Devoluções

Nenhum

Exemplos

Escreva um DataFrame em um arquivo ORC e leia-o novamente.

import tempfile
with tempfile.TemporaryDirectory(prefix="orc") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.orc(d, mode="overwrite")

    spark.read.format("orc").load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+