Compartilhar via


armazenar em cache

Persiste o DataFrame com o nível de armazenamento padrão (MEMORY_AND_DISK_DESER).

Sintaxe

cache()

Devoluções

DataFrame: DataFrame armazenado em cache.

Observações

O nível de armazenamento padrão foi alterado para corresponder ao MEMORY_AND_DISK_DESER Scala em 3.0.

Os dados armazenados em cache são compartilhados em todas as sessões do Spark no cluster.

Exemplos

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...