xml (DataStreamReader)

Charge un flux de fichiers XML et retourne le résultat sous forme de DataFrame. Si schema ce n’est pas spécifié, le schéma d’entrée est déduit des données.

Syntaxe

xml(path, schema=None, **options)

Paramètres

Paramètre Type Description
path str Chemin d’accès de l’entrée XML.
schema StructType ou str, facultatif Schéma sous la forme d’une chaîne au format StructType ou DDL (par exemple). col0 INT, col1 DOUBLE

Retours

DataFrame

Exemples

Écrivez un DataFrame dans XML et lisez-le en tant que flux :

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="xml") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Hyukjin Kwon"}]
    ).write.mode("overwrite").option("rowTag", "person").xml(d)
    q = spark.readStream.schema(
        "age INT, name STRING"
    ).xml(d, rowTag="person").writeStream.format("console").start()
    time.sleep(3)
    q.stop()