start (DataStreamWriter)

Transmite el contenido del dataFrame a un origen de datos y devuelve un objeto StreamingQuery.

Sintaxis

start(path=None, format=None, outputMode=None, partitionBy=None, queryName=None, **options)

Parámetros

Parámetro	Tipo	Descripción
`path`	str, opcional	Ruta de acceso en un sistema de archivos compatible con Hadoop.
`format`	str, opcional	Formato que se usa para guardar.
`outputMode`	str, opcional	Cómo se escriben los datos en el receptor: `append`, `complete`o `update`.
`partitionBy`	str o list, opcional	Nombres de columnas de creación de particiones.
`queryName`	str, opcional	Nombre único de la consulta.
`**options`		Todas las demás opciones de cadena. Proporcione `checkpointLocation` la mayoría de los flujos; no es necesario para una `memory` secuencia.

Devoluciones

StreamingQuery

Ejemplos

df = spark.readStream.format("rate").load()

Ejemplo básico:

q = df.writeStream.format('memory').queryName('this_query').start()
q.isActive
# True
q.name
# 'this_query'
q.stop()
q.isActive
# False

Con un desencadenador y parámetros adicionales:

q = df.writeStream.trigger(processingTime='5 seconds').start(
    queryName='that_query', outputMode="append", format='memory')
q.name
# 'that_query'
q.isActive
# True
q.stop()

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-19