Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Especifica el esquema de entrada. Algunos orígenes de datos (por ejemplo, JSON) pueden deducir automáticamente el esquema de entrada de los datos. Especificar el esquema aquí permite al origen de datos omitir la inferencia de esquemas y acelerar la carga de datos.
Sintaxis
schema(schema)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
schema |
StructType o str | Un objeto StructType o una cadena con formato DDL (por ejemplo, col0 INT, col1 DOUBLE). |
Devoluciones
DataStreamReader
Ejemplos
from pyspark.sql.types import StructField, StructType, StringType
spark.readStream.schema(StructType([StructField("data", StringType(), True)]))
# <...streaming.readwriter.DataStreamReader object ...>
spark.readStream.schema("col0 INT, col1 DOUBLE")
# <...streaming.readwriter.DataStreamReader object ...>
Especifique un esquema diferente para un archivo CSV:
import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
spark.readStream.schema("col0 INT, col1 STRING").format("csv").load(d).printSchema()
# root
# |-- col0: integer (nullable = true)
# |-- col1: string (nullable = true)