Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Charge les données à partir d’une source de données et les retourne sous forme DataFramede .
Syntaxe
load(path=None, format=None, schema=None, **options)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
path |
str ou list, facultatif | Un ou plusieurs chemins d’accès dans une source de données sauvegardée par le système de fichiers. |
format |
str, facultatif | Format de la source de données. La valeur par défaut est 'parquet'. |
schema |
StructType ou str, facultatif | Schéma d’entrée en tant qu’objet StructType ou chaîne au format DDL (par exemple). 'col0 INT, col1 DOUBLE' |
**options |
dictionnaire | Options de chaîne supplémentaires. |
Retours
DataFrame
Exemples
Chargez un fichier CSV avec le format, le schéma et les options spécifiés.
import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.option("header", True).mode("overwrite").format("csv").save(d)
df = spark.read.load(
d, schema=df.schema, format="csv", nullValue="Alice", header=True)
df.printSchema()
# root
# |-- age: long (nullable = true)
# |-- name: string (nullable = true)
df.show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+