Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Läser in data från en datakälla och returnerar dem som en DataFrame.
Syntax
load(path=None, format=None, schema=None, **options)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
path |
str eller lista, valfritt | En eller flera sökvägar i en filsystembaserad datakälla. |
format |
str, valfritt | Datakällans format. Standardinställningen är 'parquet'. |
schema |
StructType eller str, valfritt | Indataschemat som ett StructType objekt eller en DDL-formaterad sträng (till exempel 'col0 INT, col1 DOUBLE'). |
**options |
Dict | Ytterligare strängalternativ. |
Retur
DataFrame
Exempel
Läs in en CSV-fil med angivet format, schema och alternativ.
import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.option("header", True).mode("overwrite").format("csv").save(d)
df = spark.read.load(
d, schema=df.schema, format="csv", nullValue="Alice", header=True)
df.printSchema()
# root
# |-- age: long (nullable = true)
# |-- name: string (nullable = true)
df.show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+