Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Läser in en CSV-fil och returnerar resultatet som en DataFrame. Om inferSchema är aktiverat läser den här funktionen indata en gång för att fastställa schemat. Om du vill undvika detta inaktiverar inferSchema eller anger du schemat explicit med hjälp av schema.
Syntax
csv(path, schema=None, **options)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
path |
str eller lista | En eller flera indatasökvägar eller en RDD med strängar som lagrar CSV-rader. |
schema |
StructType eller str, valfritt | Ett valfritt indataschema som ett StructType objekt eller en DDL-formaterad sträng (till exempel 'col0 INT, col1 DOUBLE'). |
Retur
DataFrame
Exempel
Skriv en DataFrame till en CSV-fil och läs tillbaka den.
import tempfile
with tempfile.TemporaryDirectory(prefix="csv") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.mode("overwrite").format("csv").save(d)
spark.read.csv(d, schema=df.schema, nullValue="Alice").show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+