Naslaginformatie voor PostgreSQL-connector

Belangrijk

De PostgreSQL-connector voor Lakeflow Connect bevindt zich in openbare preview. Neem contact op met uw Databricks-accountteam om u in te schrijven voor de openbare preview.

Deze pagina bevat referentiemateriaal voor de PostgreSQL-connector in Databricks Lakeflow Connect.

Automatische gegevenstransformaties

Databricks transformeert automatisch de volgende PostgreSQL-gegevenstypen naar delta-compatibele gegevenstypen:

PostgreSQL-type Deltatype
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY STRING
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP STRING
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID BINARY
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Belangrijke opmerkingen over datum- en tijdtypen

  • DATE het gegevenstype wordt opgenomen als deltatype DATE . Het volledige PostgreSQL-datumbereik wordt ondersteund. Inf en -Inf waarden worden geconverteerd naar null. BC-datums worden opgeslagen met astronomische jaarnummering. 1 BC wijst bijvoorbeeld toe aan jaar 0 en 2 BC kaarten aan -1.
  • TIMESTAMP (zonder tijdzone) gegevenstype wordt opgenomen als tekenreeksen. Inf en -Inf waarden blijven behouden als tekenreeksen.
  • TIMESTAMP WITH TIME ZONE het gegevenstype wordt opgenomen als deltatype TIMESTAMP . Het bereik dat door PostgreSQL wordt ondersteund, is 4713-01-01 00:00:00.000000 BC bedoeld 294276-12-31 23:59:59.999999 ADvoor , terwijl het bereik dat door Databricks wordt ondersteund, is -290308-12-21 BCE 19:59:06 GMT bedoeld +294247-01-10 CE 04:00:54 GMTvoor . Tijdstempels boven de maximale ondersteunde tijdstempel van Databricks worden geconverteerd naar null. BC-datums worden opgeslagen met astronomische jaarnummering. 1 BC wijst bijvoorbeeld toe aan jaar 0 en 2 BC kaarten aan -1. Inf en -Inf waarden worden geconverteerd naar null.
  • TIME, TIME WITH TIME ZONEen INTERVAL gegevenstypen worden opgenomen als tekenreeksen in de oorspronkelijke indeling. U kunt Databricks SQL-functies gebruiken om deze tekenreeksen zo nodig te parseren in de juiste tijdweergaven. Voor INTERVAL het gegevenstype worden oneindige waarden toegewezen aan 0 years 0 mins 0 days 0 hours 0 mins 0.0 secs.

Door de gebruiker gedefinieerde gegevenstypen en gegevenstypen van derden

Door de gebruiker gedefinieerde typen en gegevenstypen uit PostgreSQL-extensies van derden worden opgenomen als tekenreeksen. Als u deze typen wilt transformeren, kunt u Databricks SQL-functies gebruiken om de tekenreeksweergaven in downstreamverwerking te parseren.

Samengestelde typen

Samengestelde postgreSQL-typen (ook wel rijtypen genoemd) worden opgenomen als tekenreeksen. De tekenreeksweergave volgt de samengestelde typeindeling van PostgreSQL: (value1,value2,value3).