cache

Het DataFrame blijft behouden met het standaardopslagniveau (MEMORY_AND_DISK_DESER).

Syntaxis

cache()

Retouren

DataFrame: DataFrame met cache.

Aantekeningen

Het standaardopslagniveau is gewijzigd zodat MEMORY_AND_DISK_DESER het overeenkomt met Scala in 3.0.

Gegevens in de cache worden gedeeld in alle Spark-sessies in het cluster.

Examples

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...