name (DataStreamReader)

Attribue un nom à la source de diffusion en continu pour l’évolution des points de contrôle. Cela permet aux requêtes de diffusion en continu d’évoluer en permettant aux sources d’être réorganisées ou ajoutées sans interrompre la compatibilité des points de contrôle. Lorsque l’évolution de la source est activée, toutes les sources d’une requête doivent être nommées.

Syntaxe

name(source_name)

Paramètres

Paramètre Type Description
source_name str Nom de cette source de diffusion en continu. Doit contenir uniquement des lettres ASCII (a-z, A-Z), des chiffres (0-9) et des traits de soulignement (_).

Retours

DataStreamReader

Remarques

Nécessite l’activation de l’évolution de la source de diffusion en continu via la spark.sql.streaming.enableSourceEvolution configuration.

Exemples

Nommez deux sources et unionez-les :

df1 = spark.readStream.format("rate").name("source1").load()
df2 = spark.readStream.format("rate").name("source2").load()
query = df1.union(df2).writeStream.format("console").start()

Noms sources valides et non valides :

# Valid names
spark.readStream.format("rate").name("mySource").load()
spark.readStream.format("rate").name("my_source_123").load()

# Invalid name — raises AnalysisException
spark.readStream.format("rate").name("my-source").load()