format (DataFrameWriter)

Spécifie la source de données de sortie sous-jacente.

Syntaxe

format(source)

Paramètres

Paramètre Type Description
source str Nom de la source de données, par exemple 'json' ou 'parquet'.

Retours

DataFrameWriter

Exemples

Écrivez un DataFrame dans un fichier Parquet et lisez-le.

import tempfile
with tempfile.TemporaryDirectory(prefix="format") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").format("parquet").save(d)

    spark.read.format('parquet').load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+