xml (DataFrameReader)

Charge un fichier XML et retourne le résultat sous la forme d’un DataFramefichier . Si schema elle n’est pas spécifiée, cette fonction lit une fois l’entrée pour déterminer le schéma d’entrée.

Syntaxe

xml(path, schema=None, **options)

Paramètres

Paramètre Type Description
path str, list ou RDD Un ou plusieurs chemins d’entrée, ou un RDD de chaînes stockant des lignes XML.
schema StructType ou str, facultatif Schéma d’entrée facultatif en tant qu’objet StructType ou chaîne au format DDL (par exemple). 'col0 INT, col1 DOUBLE'

Retours

DataFrame

Exemples

Écrivez un DataFrame dans un fichier XML et lisez-le.

import tempfile
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").option("rowTag", "person").format("xml").save(d)

    spark.read.option("rowTag", "person").xml(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+