cache

Bevarar DataFrame med standardlagringsnivån (MEMORY_AND_DISK_DESER).

Syntax

cache()

Retur

DataFrame: Cachelagrad dataram.

Notes

Standardlagringsnivån har ändrats till MEMORY_AND_DISK_DESER att matcha Scala i 3.0.

Cachelagrade data delas över alla Spark-sessioner i klustret.

Exempel

df = spark.range(1)
df.cache()
# DataFrame[id: bigint]

df.explain()
# == Physical Plan ==
# InMemoryTableScan ...