Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Invalide et actualise toutes les données mises en cache (et les métadonnées associées) pour n’importe quel DataFrame qui contient le chemin de source de données donné.
Syntaxe
refreshByPath(path: str)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
path |
str | Chemin d’accès pour actualiser le cache. |
Exemples
# The example below caches a table, and then removes the data.
import tempfile
with tempfile.TemporaryDirectory(prefix="refreshByPath") as d:
_ = spark.sql("DROP TABLE IF EXISTS tbl1")
_ = spark.sql(
"CREATE TABLE tbl1 (col STRING) USING TEXT LOCATION '{}'".format(d))
_ = spark.sql("INSERT INTO tbl1 SELECT 'abc'")
spark.catalog.cacheTable("tbl1")
spark.table("tbl1").show()
# +---+
# |col|
# +---+
# |abc|
# +---+
# Because the table is cached, it computes from the cached data as below.
spark.table("tbl1").count()
# 1
# After refreshing the table by path, it shows 0 because the data does not exist anymore.
spark.catalog.refreshByPath(d)
spark.table("tbl1").count()
# 0
_ = spark.sql("DROP TABLE tbl1")