tekst (DataStreamReader)

Laadt een tekstbestandsstroom en retourneert een DataFrame waarvan het schema begint met een tekenreekskolom met de naam value, gevolgd door eventuele gepartitioneerde kolommen. Tekstbestanden moeten worden gecodeerd als UTF-8. Elke regel in het tekstbestand is standaard een nieuwe rij in het resulterende DataFrame.

Syntaxis

text(path, **options)

Parameterwaarden

Kenmerk Typ Beschrijving
path str Pad voor de tekstinvoer.

Retouren

DataFrame

Examples

Een stroom laden vanuit een tijdelijk tekstbestand:

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="text") as d:
    spark.createDataFrame(
        [("hello",), ("this",)]).write.mode("overwrite").format("text").save(d)
    q = spark.readStream.text(d).writeStream.format("console").start()
    time.sleep(3)
    q.stop()