toTable (DataStreamWriter)

Startar körningen av strömningsfrågan och matar kontinuerligt ut resultat till den angivna tabellen när nya data tas emot. Returnerar ett StreamingQuery-objekt.

Syntax

toTable(tableName, format=None, outputMode=None, partitionBy=None, queryName=None, **options)

Parameters

Parameter Type Beskrivning
tableName str Tabellens namn.
format str, valfritt Det format som används för att spara.
outputMode str, valfritt Hur data skrivs till mottagaren: append, completeeller update.
partitionBy str eller lista, valfritt Namn på partitioneringskolumner. Ignoreras för v2-tabeller som redan finns.
queryName str, valfritt Unikt namn för frågan.
**options
Alla andra strängalternativ. Ange en checkpointLocation för de flesta strömmar.

Retur

StreamingQuery

Notes

För v1-tabeller partitionBy respekteras alltid kolumner. För v2-tabeller partitionBy respekteras endast om tabellen ännu inte finns.

Exempel

Spara en dataström i en tabell:

import tempfile
import time
_ = spark.sql("DROP TABLE IF EXISTS my_table2")
with tempfile.TemporaryDirectory(prefix="toTable") as d:
    q = spark.readStream.format("rate").option(
        "rowsPerSecond", 10).load().writeStream.toTable(
            "my_table2",
            queryName='that_query',
            outputMode="append",
            format='parquet',
            checkpointLocation=d)
    time.sleep(3)
    q.stop()
    spark.read.table("my_table2").show()
    _ = spark.sql("DROP TABLE my_table2")