Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Läser in en Parquet-filström och returnerar resultatet som en DataFrame.
Syntax
parquet(path, **options)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
path |
str | Sökväg i ett Hadoop-filsystem som stöds. |
Retur
DataFrame
Exempel
Läs in en dataström från en tillfällig Parquet-fil:
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="parquet") as d:
spark.range(10).write.mode("overwrite").format("parquet").save(d)
q = spark.readStream.schema(
"id LONG").parquet(d).writeStream.format("console").start()
time.sleep(3)
q.stop()