schema (DataStreamReader)

Especifica el esquema de entrada. Algunos orígenes de datos (por ejemplo, JSON) pueden deducir automáticamente el esquema de entrada de los datos. Especificar el esquema aquí permite al origen de datos omitir la inferencia de esquemas y acelerar la carga de datos.

Sintaxis

schema(schema)

Parámetros

Parámetro	Tipo	Descripción
`schema`	StructType o str	Un objeto StructType o una cadena con formato DDL (por ejemplo, `col0 INT, col1 DOUBLE`).

Devoluciones

DataStreamReader

Ejemplos

from pyspark.sql.types import StructField, StructType, StringType
spark.readStream.schema(StructType([StructField("data", StringType(), True)]))
# <...streaming.readwriter.DataStreamReader object ...>
spark.readStream.schema("col0 INT, col1 DOUBLE")
# <...streaming.readwriter.DataStreamReader object ...>

Especifique un esquema diferente para un archivo CSV:

import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
    spark.readStream.schema("col0 INT, col1 STRING").format("csv").load(d).printSchema()
    # root
    #  |-- col0: integer (nullable = true)
    #  |-- col1: string (nullable = true)

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-19