Compartilhar via


xml (DataStreamReader)

Carrega um fluxo de arquivo XML e retorna o resultado como um DataFrame. Se schema não for especificado, o esquema de entrada será inferido dos dados.

Sintaxe

xml(path, schema=None, **options)

Parâmetros

Parâmetro Tipo Descrição
path str Caminho para a entrada XML.
schema StructType ou str, opcional Esquema como uma cadeia de caracteres formatada em StructType ou DDL (por exemplo, col0 INT, col1 DOUBLE).

Devoluções

DataFrame

Exemplos

Escreva um DataFrame em XML e leia-o novamente como um fluxo:

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Hyukjin Kwon"}]
    ).write.mode("overwrite").option("rowTag", "person").xml(d)
    q = spark.readStream.schema(
        "age INT, name STRING"
    ).xml(d, rowTag="person").writeStream.format("console").start()
    time.sleep(3)
    q.stop()