Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Startar körningen av strömningsfrågan och matar kontinuerligt ut resultat till den angivna tabellen när nya data tas emot. Returnerar ett StreamingQuery-objekt.
Syntax
toTable(tableName, format=None, outputMode=None, partitionBy=None, queryName=None, **options)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
tableName |
str | Tabellens namn. |
format |
str, valfritt | Det format som används för att spara. |
outputMode |
str, valfritt | Hur data skrivs till mottagaren: append, completeeller update. |
partitionBy |
str eller lista, valfritt | Namn på partitioneringskolumner. Ignoreras för v2-tabeller som redan finns. |
queryName |
str, valfritt | Unikt namn för frågan. |
**options |
Alla andra strängalternativ. Ange en checkpointLocation för de flesta strömmar. |
Retur
StreamingQuery
Notes
För v1-tabeller partitionBy respekteras alltid kolumner. För v2-tabeller partitionBy respekteras endast om tabellen ännu inte finns.
Exempel
Spara en dataström i en tabell:
import tempfile
import time
_ = spark.sql("DROP TABLE IF EXISTS my_table2")
with tempfile.TemporaryDirectory(prefix="toTable") as d:
q = spark.readStream.format("rate").option(
"rowsPerSecond", 10).load().writeStream.toTable(
"my_table2",
queryName='that_query',
outputMode="append",
format='parquet',
checkpointLocation=d)
time.sleep(3)
q.stop()
spark.read.table("my_table2").show()
_ = spark.sql("DROP TABLE my_table2")