cacheTable

Almacena en caché la tabla especificada en memoria o con un nivel de almacenamiento determinado. MEMORY_AND_DISK predeterminado.

Sintaxis

cacheTable(tableName: str, storageLevel: StorageLevel = None)

Parámetros

Parámetro Tipo Descripción
tableName str Nombre de la tabla que se va a obtener. Se puede calificar con el nombre del catálogo.
storageLevel StorageLevelopcional Nivel de almacenamiento que se va a establecer para la persistencia.

Notas

Los datos almacenados en caché se comparten en todas las sesiones de Spark del clúster.

Ejemplos

_ = spark.sql("DROP TABLE IF EXISTS tbl1")
_ = spark.sql("CREATE TABLE tbl1 (name STRING, age INT) USING parquet")
spark.catalog.cacheTable("tbl1")

# or

spark.catalog.cacheTable("tbl1", StorageLevel.OFF_HEAP)

# Throw an analysis exception when the table does not exist.
spark.catalog.cacheTable("not_existing_table")
# Traceback (most recent call last):
#     ...
# AnalysisException: ...

# Using the fully qualified name for the table.
spark.catalog.cacheTable("spark_catalog.default.tbl1")
spark.catalog.uncacheTable("tbl1")
_ = spark.sql("DROP TABLE tbl1")