Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Charge un flux de données à partir d’une source de données et le retourne en tant que DataFrame.
Syntaxe
load(path=None, format=None, schema=None, **options)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
path |
str, facultatif | Chemin d’accès aux sources de données sauvegardées par le système de fichiers. |
format |
str, facultatif | Format de la source de données. La valeur par défaut est 'parquet'. |
schema |
StructType ou str, facultatif | Schéma pour les données d’entrée sous forme de chaîne au format StructType ou DDL (par exemple). col0 INT, col1 DOUBLE |
**options |
Toutes les autres options de chaîne. |
Retours
DataFrame
Exemples
Chargez un flux à partir d’un fichier JSON temporaire :
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="load") as d:
spark.createDataFrame(
[(100, "Hyukjin Kwon"),], ["age", "name"]
).write.mode("overwrite").format("json").save(d)
q = spark.readStream.schema(
"age INT, name STRING"
).format("json").load(d).writeStream.format("console").start()
time.sleep(3)
q.stop()