Charge

Charge les données à partir d’une source de données et les retourne sous forme DataFramede .

Syntaxe

load(path=None, format=None, schema=None, **options)

Paramètres

Paramètre Type Description
path str ou list, facultatif Un ou plusieurs chemins d’accès dans une source de données sauvegardée par le système de fichiers.
format str, facultatif Format de la source de données. La valeur par défaut est 'parquet'.
schema StructType ou str, facultatif Schéma d’entrée en tant qu’objet StructType ou chaîne au format DDL (par exemple). 'col0 INT, col1 DOUBLE'
**options dictionnaire Options de chaîne supplémentaires.

Retours

DataFrame

Exemples

Chargez un fichier CSV avec le format, le schéma et les options spécifiés.

import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
    df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
    df.write.option("header", True).mode("overwrite").format("csv").save(d)

    df = spark.read.load(
        d, schema=df.schema, format="csv", nullValue="Alice", header=True)
    df.printSchema()
    # root
    #  |-- age: long (nullable = true)
    #  |-- name: string (nullable = true)
    df.show()
    # +---+----+
    # |age|name|
    # +---+----+
    # |100|NULL|
    # +---+----+