xml (DataFrameReader)

Carga un archivo XML y devuelve el resultado como .DataFrame Si schema no se especifica, esta función lee la entrada una vez para determinar el esquema de entrada.

Sintaxis

xml(path, schema=None, **options)

Parámetros

Parámetro Tipo Descripción
path str, list o RDD Una o varias rutas de acceso de entrada o un RDD de cadenas que almacenan filas XML.
schema StructType o str, opcional Un esquema de entrada opcional como un StructType objeto o una cadena con formato DDL (por ejemplo, 'col0 INT, col1 DOUBLE').

Devoluciones

DataFrame

Ejemplos

Escriba un DataFrame en un archivo XML y vuelva a leerlo.

import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

    spark.read.option("rowTag", "person").xml(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+