Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Skapar en tabell baserat på datamängden i en datakälla.
Syntax
createTable(tableName: str, path: str = None, source: str = None, schema: StructType = None, description: str = None, **options: str)
Parameters
| Parameter | Type | Beskrivning |
|---|---|---|
tableName |
str | Namnet på tabellen som ska skapas. Kan kvalificeras med katalognamn. |
path |
str, valfritt | Sökvägen där data för den här tabellen finns. När path har angetts skapas en extern tabell från data på den angivna sökvägen. Annars skapas en hanterad tabell. |
source |
str, valfritt | Källan till den här tabellen, till exempel 'parquet', 'orc'osv. Om source inte anges används standarddatakällan som konfigurerats av spark.sql.sources.default . |
schema |
StructTypevalfri |
Schemat för den här tabellen. |
description |
str, valfritt | Beskrivningen av den här tabellen. |
**options |
diktering, valfritt | Extra alternativ att ange i tabellen. |
Retur
DataFrame
Den dataram som är associerad med tabellen.
Exempel
# Creating a managed table.
_ = spark.catalog.createTable("tbl1", schema=spark.range(1).schema, source='parquet')
_ = spark.sql("DROP TABLE tbl1")
# Creating an external table.
import tempfile
with tempfile.TemporaryDirectory(prefix="createTable") as d:
_ = spark.catalog.createTable(
"tbl2", schema=spark.range(1).schema, path=d, source='parquet')
_ = spark.sql("DROP TABLE tbl2")