Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Läser in en dataström från en datakälla och returnerar den som en DataFrame.
Syntax
load(path=None, format=None, schema=None, **options)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
path |
str, valfritt | Sökväg för filsystembaserade datakällor. |
format |
str, valfritt | Datakällans format. Standardinställningen är 'parquet'. |
schema |
StructType eller str, valfritt | Schema för indata som en StructType- eller DDL-formaterad sträng (till exempel col0 INT, col1 DOUBLE). |
**options |
Alla andra strängalternativ. |
Retur
DataFrame
Exempel
Läs in en dataström från en tillfällig JSON-fil:
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="load") as d:
spark.createDataFrame(
[(100, "Hyukjin Kwon"),], ["age", "name"]
).write.mode("overwrite").format("json").save(d)
q = spark.readStream.schema(
"age INT, name STRING"
).format("json").load(d).writeStream.format("console").start()
time.sleep(3)
q.stop()