Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Spécifie le schéma d’entrée. Certaines sources de données (telles que JSON) peuvent déduire automatiquement le schéma d’entrée à partir de données. En spécifiant le schéma ici, la source de données sous-jacente peut ignorer l’étape d’inférence du schéma, ce qui accélère le chargement des données.
Syntaxe
schema(schema)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
schema |
StructType ou str | Objet StructType ou chaîne au format DDL (par exemple, 'col0 INT, col1 DOUBLE'). |
Retours
DataFrameReader
Exemples
Spécifiez le schéma lors de la lecture d’un fichier CSV.
import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
spark.read.schema("col0 INT, col1 DOUBLE").format("csv").load(d).printSchema()
# root
# |-- col0: integer (nullable = true)
# |-- col1: double (nullable = true)