Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Carga datos de un origen de datos y los devuelve como .DataFrame
Sintaxis
load(path=None, format=None, schema=None, **options)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
path |
str o list, opcional | Una o varias rutas de acceso en un origen de datos respaldado por el sistema de archivos. |
format |
str, opcional | Formato del origen de datos. Tiene como valor predeterminado 'parquet'. |
schema |
StructType o str, opcional | El esquema de entrada como un StructType objeto o una cadena con formato DDL (por ejemplo, 'col0 INT, col1 DOUBLE'). |
**options |
diccionario | Opciones de cadena adicionales. |
Devoluciones
DataFrame
Ejemplos
Cargue un archivo CSV con el formato, el esquema y las opciones especificadas.
import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.option("header", True).mode("overwrite").format("csv").save(d)
df = spark.read.load(
d, schema=df.schema, format="csv", nullValue="Alice", header=True)
df.printSchema()
# root
# |-- age: long (nullable = true)
# |-- name: string (nullable = true)
df.show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+