Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Hiermee wordt de inhoud van de DataFrame ORC-indeling opgeslagen op het opgegeven pad.
Syntaxis
orc(path, mode=None, partitionBy=None, compression=None)
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
path |
str | Het pad in een door Hadoop ondersteund bestandssysteem. |
mode |
str, optioneel | Het gedrag wanneer gegevens al bestaan. Geaccepteerde waarden zijn'append', 'overwrite', 'ignore'en of 'error''errorifexists' (standaard). |
partitionBy |
str of list, optioneel | Namen van partitioneringskolommen. |
compression |
str, optioneel | De compressiecodec die moet worden gebruikt. |
Retouren
Geen
Examples
Schrijf een DataFrame naar een ORC-bestand en lees het terug.
import tempfile
with tempfile.TemporaryDirectory(prefix="orc") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).write.orc(d, mode="overwrite")
spark.read.format("orc").load(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+