Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Crée une table basée sur le jeu de données dans une source de données.
Syntaxe
createTable(tableName: str, path: str = None, source: str = None, schema: StructType = None, description: str = None, **options: str)
Paramètres
| Paramètre | Type | Description |
|---|---|---|
tableName |
str | Nom de la table à créer. Peut être qualifié avec le nom du catalogue. |
path |
str, facultatif | Chemin d’accès dans lequel les données de cette table existent. Quand path elle est spécifiée, une table externe est créée à partir des données au niveau du chemin donné. Sinon, une table gérée est créée. |
source |
str, facultatif | Source de cette table telle que 'parquet', 'orc', etc. Si source elle n’est pas spécifiée, la source de données par défaut configurée est spark.sql.sources.default utilisée. |
schema |
StructTypeoptionnel |
Schéma de cette table. |
description |
str, facultatif | Description de ce tableau. |
**options |
dict, facultatif | Options supplémentaires à spécifier dans le tableau. |
Retours
DataFrame
DataFrame associé à la table.
Exemples
# Creating a managed table.
_ = spark.catalog.createTable("tbl1", schema=spark.range(1).schema, source='parquet')
_ = spark.sql("DROP TABLE tbl1")
# Creating an external table.
import tempfile
with tempfile.TemporaryDirectory(prefix="createTable") as d:
_ = spark.catalog.createTable(
"tbl2", schema=spark.range(1).schema, path=d, source='parquet')
_ = spark.sql("DROP TABLE tbl2")