csv (DataFrameReader)

Carga un archivo CSV y devuelve el resultado como .DataFrame Si inferSchema está habilitada, esta función lee la entrada una vez para determinar el esquema. Para evitar esto, deshabilite inferSchema o especifique explícitamente el esquema mediante schema.

Sintaxis

csv(path, schema=None, **options)

Parámetros

Parámetro Tipo Descripción
path str o list Una o varias rutas de acceso de entrada, o un RDD de cadenas que almacenan filas CSV.
schema StructType o str, opcional Un esquema de entrada opcional como un StructType objeto o una cadena con formato DDL (por ejemplo, 'col0 INT, col1 DOUBLE').

Devoluciones

DataFrame

Ejemplos

Escriba un DataFrame en un archivo CSV y vuelva a leerlo.

import tempfile
with tempfile.TemporaryDirectory(prefix="csv") as d:
    df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
    df.write.mode("overwrite").format("csv").save(d)

    spark.read.csv(d, schema=df.schema, nullValue="Alice").show()
    # +---+----+
    # |age|name|
    # +---+----+
    # |100|NULL|
    # +---+----+