formato (DataFrameWriter)

Especifica el origen de datos de salida subyacente.

Sintaxis

format(source)

Parámetros

Parámetro Tipo Descripción
source str Nombre del origen de datos, por ejemplo 'json' o 'parquet'.

Devoluciones

DataFrameWriter

Ejemplos

Escriba un DataFrame en un archivo Parquet y vuelva a leerlo.

import tempfile
with tempfile.TemporaryDirectory(prefix="format") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.mode("overwrite").format("parquet").save(d)

    spark.read.format('parquet').load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+