Compartilhar via


xml (DataFrameReader)

Carrega um arquivo XML e retorna o resultado como um DataFrame. Se schema não for especificado, essa função lerá a entrada uma vez para determinar o esquema de entrada.

Sintaxe

xml(path, schema=None, **options)

Parâmetros

Parâmetro Tipo Descrição
path str, list ou RDD Um ou mais caminhos de entrada ou um RDD de cadeias de caracteres armazenando linhas XML.
schema StructType ou str, opcional Um esquema de entrada opcional como um StructType objeto ou uma cadeia de caracteres formatada em DDL (por exemplo, 'col0 INT, col1 DOUBLE').

Devoluções

DataFrame

Exemplos

Escreva um DataFrame em um arquivo XML e leia-o novamente.

import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

    spark.read.option("rowTag", "person").xml(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+