schema

Especifica el esquema de entrada. Algunos orígenes de datos (como JSON) pueden deducir automáticamente el esquema de entrada de los datos. Al especificar el esquema aquí, el origen de datos subyacente puede omitir el paso de inferencia de esquema, lo que acelera la carga de datos.

Sintaxis

schema(schema)

Parámetros

Parámetro Tipo Descripción
schema StructType o str Un StructType objeto o una cadena con formato DDL (por ejemplo, 'col0 INT, col1 DOUBLE').

Devoluciones

DataFrameReader

Ejemplos

Especifique el esquema al leer un archivo CSV.

import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
    spark.read.schema("col0 INT, col1 DOUBLE").format("csv").load(d).printSchema()
    # root
    #  |-- col0: integer (nullable = true)
    #  |-- col1: double (nullable = true)