Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Läser in en JSON-filström och returnerar resultatet som en DataFrame. JSON-rader (nyradsavgränsad JSON) stöds som standard. För JSON med en post per fil anger du multiLine alternativet till true. Om schema inte anges härleds indataschemat från data.
Syntax
json(path, schema=None, **options)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
path |
str | Sökväg till JSON-datauppsättningen. |
schema |
StructType eller str, valfritt | Schema som en StructType- eller DDL-formaterad sträng (till exempel col0 INT, col1 DOUBLE). |
Retur
DataFrame
Exempel
Läs in en dataström från en tillfällig JSON-fil:
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="json") as d:
spark.createDataFrame(
[(100, "Hyukjin Kwon"),], ["age", "name"]
).write.mode("overwrite").format("json").save(d)
q = spark.readStream.schema(
"age INT, name STRING"
).json(d).writeStream.format("console").start()
time.sleep(3)
q.stop()