optie (DataFrameWriterV2)

Hiermee voegt u een schrijfoptie toe voor de onderliggende gegevensbron. Zie Opties voor een aantal beschikbare opties.

Syntaxis

option(key, value)

Parameterwaarden

Kenmerk	Typ	Beschrijving
`key`	str	De optietoets.
`value`	str, int, float of bool	De optiewaarde.

Options

De volgende tabel bevat enkele schrijfopties:

Key	Formaten	Beschrijving
`arrayElementName`	XML	De elementnaam voor matrixelementen zonder expliciete naam. Standaard: `item`. Van toepassing op xml (DataFrameWriter).
`attributePrefix`	XML	Het voorvoegsel dat is voorafgegaan aan veldnamen die overeenkomen met XML-kenmerken. Standaard: `_`. Van toepassing op xml (DataFrameWriter).
`avroSchema`	Avro	Het volledige Avro-schema als een JSON-tekenreeks. Gebruik deze optie om Spark SQL-typen te converteren naar specifieke Avro-typen. Van toepassing op Avro-bestand.
`charToEscapeQuoteEscaping`	CSV	Het teken dat wordt gebruikt om het escape-teken te ontsnappen wanneer het afwijkt van het aanhalingsteken. Standaard: `\0` (niet ingeschakeld). Van toepassing op CSV (DataFrameWriter).
`clusterByAuto`	Delta Lake	Of automatische liquide clustering moet worden ingeschakeld, waarbij Azure Databricks clusteringkolommen selecteert op basis van querypatronen. Alleen geldig met `mode("overwrite")`. Kan niet worden gebruikt met `append` de modus. Standaard: `false`. Beschikbaar in Databricks Runtime 16.4 en hoger. Is van toepassing op Liquid Clustering gebruiken voor tabellen.
`compression`	CSV, JSON, ORC, Parquet, Text, XML	Compressiecodec die moet worden gebruikt bij het schrijven. Geldige waarden variëren per indeling. Van toepassing op csv (DataFrameWriter), json (DataFrameWriter), orc (DataFrameWriter), parquet (DataFrameWriter), tekst (DataFrameWriter), xml (DataFrameWriter).
`dateFormat`	CSV, JSON, XML	Tekenreeks opmaken voor datumkolomwaarden. Standaard: `yyyy-MM-dd`. Van toepassing op csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter).
`declaration`	XML	De XML-declaratietekenreeks die boven aan elk uitvoerbestand is geschreven. Ingesteld op een lege tekenreeks om de declaratie te onderdrukken. Standaard: `version="1.0" encoding="UTF-8" standalone="yes"`. Van toepassing op xml (DataFrameWriter).
`emptyValue`	CSV	De tekenreeks die is geschreven voor lege (niet-null) waarden. Standaard: `""`. Van toepassing op CSV (DataFrameWriter).
`encoding`	CSV, JSON, XML	De tekencodering voor de uitvoerbestanden. Standaard: `UTF-8`. Van toepassing op csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter).
`escape`	CSV	Het teken dat wordt gebruikt om waarden tussen aanhalingstekens te ontsnappen. Standaard: `\`. Van toepassing op CSV (DataFrameWriter).
`escapeQuotes`	CSV	Of u aanhalingstekens tussen aanhalingstekens in veldwaarden tussen aanhalingstekens wilt ontsnappen. Standaard: `true`. Van toepassing op CSV (DataFrameWriter).
`header`	CSV	Of u kolomnamen wilt schrijven als de eerste regel van de uitvoer. Standaard: `false`. Van toepassing op CSV (DataFrameWriter).
`ignoreLeadingWhiteSpace`	CSV	Of u voorloopspaties wilt knippen van waarden bij het schrijven. Standaard: `false`. Van toepassing op CSV (DataFrameWriter).
`ignoreNullFields`	JSON	Hiermee wordt aangegeven of velden met null-waarden uit de JSON-uitvoer moeten worden weggelaten. Standaardwaarde: waarde van `spark.sql.jsonGenerator.ignoreNullFields`. Van toepassing op json (DataFrameWriter).
`ignoreTrailingWhiteSpace`	CSV	Of u volgspaties van waarden wilt knippen tijdens het schrijven. Standaard: `false`. Van toepassing op CSV (DataFrameWriter).
`lineSep`	CSV, JSON, tekst	De tekenreeks voor regelscheidingstekens die tussen records wordt gebruikt. Standaard: `\n`. Van toepassing op csv (DataFrameWriter), json (DataFrameWriter), tekst (DataFrameWriter).
`mergeSchema`	Delta Lake	Of u de ontwikkeling van schema's voor de schrijfbewerking wilt inschakelen. Nieuwe kolommen in het dataframe van de bron worden toegevoegd aan het doeltabelschema. Van toepassing op batch- en streaming-toevoegbewerkingen. Is van toepassing op updatetabelschema.
`nullValue`	CSV	Tekenreeks die is geschreven voor null-waarden. Standaard: `""`. Van toepassing op CSV (DataFrameWriter).
`nullValue`	XML	De tekenreeks die is geschreven voor null-waarden. Standaard: `null`. Wanneer deze waarde is ingesteld `null`, worden kenmerken en onderliggende elementen voor null-velden weggelaten. Van toepassing op xml (DataFrameWriter).
`overwriteSchema`	Delta Lake	Of u het tabelschema en de partitionering wilt vervangen bij het overschrijven. Vereist `mode("overwrite")` zonder `replaceWhere`. Kan niet worden gebruikt met `partitionOverwriteMode`. Is van toepassing op updatetabelschema.
`partitionOverwriteMode`	Delta Lake	De partitie overschrijfmodus. Stel dit in om `dynamic` alleen partities met nieuwe gegevens te overschrijven, waardoor alle andere partities ongewijzigd blijven. Verouderde modus; niet ondersteund op serverloze berekeningen of Databricks SQL. Van toepassing op selectief overschrijven van gegevens met Delta Lake.
`quote`	CSV	Het teken dat wordt gebruikt voor het aanhalen van veldwaarden die het scheidingsteken bevatten. Standaard: `"`. Van toepassing op CSV (DataFrameWriter).
`quoteAll`	CSV	Of alle veldwaarden tussen aanhalingstekens moeten worden geplaatst, ongeacht de inhoud. Standaard: `false`. Van toepassing op CSV (DataFrameWriter).
`recordName`	Avro	De recordnaam op het hoogste niveau in het Avro-uitvoerschema. Standaard: `topLevelRecord`. Van toepassing op Avro-bestand.
`recordNamespace`	Avro	De naamruimte voor de record op het hoogste niveau in het Avro-uitvoerschema. Standaard: `""`. Van toepassing op Avro-bestand.
`replaceWhere`	Delta Lake	Een predicaatexpressie. Atomisch overschrijft alleen de records die overeenkomen met het predicaat. Van toepassing op selectief overschrijven van gegevens met Delta Lake.
`rootTag`	XML	De hoofdelementtag waarmee alle rijelementen in de uitvoer worden verpakt. Standaard: `ROWS`. Van toepassing op xml (DataFrameWriter).
`rowTag`	XML	De elementtag die een rij in de uitvoer vertegenwoordigt. Standaard: `ROW`. Van toepassing op xml (DataFrameWriter).
`sep`	CSV	Het veldscheidingsteken. Standaard: `,`. Van toepassing op CSV (DataFrameWriter).
`timestampFormat`	CSV, JSON, XML	De notatietekenreeks voor tijdstempelkolomwaarden. Standaard: `yyyy-MM-dd'T'HH:mm:ss[.SSS][XXX]`. Van toepassing op csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter).
`txnAppId`	Delta Lake	Een unieke tekenreeks die de toepassing identificeert voor idempotente schrijfbewerkingen.`foreachBatch` Gebruik dit samen om `txnVersion` precies één keer schrijfbewerkingen naar meerdere Delta Lake-tabellen te garanderen. Is van toepassing op Gebruik `foreachBatch` voor idempotente tabelschrijfbewerkingen.
`txnVersion`	Delta Lake	Een monotonisch toenemend aantal dat wordt gebruikt als transactieversie voor idempotente schrijfbewerkingen.`foreachBatch` Gebruik dit samen om `txnAppId` precies één keer schrijfbewerkingen naar meerdere Delta Lake-tabellen te garanderen. Is van toepassing op Gebruik `foreachBatch` voor idempotente tabelschrijfbewerkingen.
`userMetadata`	Delta Lake, Apache Iceberg	Een door de gebruiker gedefinieerde tekenreeks die is toegevoegd aan de doorvoermetagegevens voor de schrijfbewerking. Zichtbaar in de uitvoer van `DESCRIBE HISTORY`. Van toepassing op Verrijken-tabellen met aangepaste metagegevens.
`validateName`	XML	Of een uitzondering moet worden gegenereerd als een kolomnaam geen geldige XML-element-id is. Standaard: `true`. Van toepassing op xml (DataFrameWriter).
`valueTag`	XML	De veldnaam die wordt gebruikt voor tekengegevens in XML-elementen die ook kenmerken of onderliggende elementen bevatten. Standaard: `_VALUE`. Van toepassing op xml (DataFrameWriter).

Retouren

DataFrameWriterV2

Feedback

Is deze pagina nuttig?

Last updated on 2026-04-25