Partilhar via


Referência do conector PostgreSQL

Importante

O conector PostgreSQL para Lakeflow Connect está em Visualização Pública. Entre em contato com a sua equipa de conta Databricks para se inscrever na Pré-visualização Pública.

Esta página contém material de referência para o conector PostgreSQL no Databricks Lakeflow Connect.

Transformações automáticas de dados

O Databricks transforma automaticamente os seguintes tipos de dados PostgreSQL em tipos de dados compatíveis com Delta:

Tipo PostgreSQL Tipo delta
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY STRING
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP STRING
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID BINARY
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Notas importantes sobre tipos de data e hora

  • DATE o tipo de dados é ingerido como o tipo Delta DATE . É suportado o intervalo completo de datas do PostgreSQL. Inf e -Inf os valores são convertidos para null. As datas a.C. são armazenadas usando numeração astronómica dos anos. Por exemplo, 1 a.C. mapeia para o ano 0 e 2 a.C. para -1.
  • TIMESTAMP (sem fuso horário) o tipo de dado é ingerido como strings. Inf e -Inf os valores são preservados como cadeias.
  • TIMESTAMP WITH TIME ZONE o tipo de dados é ingerido como o tipo Delta TIMESTAMP . O intervalo suportado por PostgreSQL é 4713-01-01 00:00:00.000000 BC até 294276-12-31 23:59:59.999999 AD, enquanto o intervalo suportado por Databricks é -290308-12-21 BCE 19:59:06 GMT até +294247-01-10 CE 04:00:54 GMT. Carimbos de tempo acima do carimbo máximo suportado do Databrick são convertidos para null. As datas a.C. são armazenadas usando numeração astronómica dos anos. Por exemplo, 1 a.C. mapeia para o ano 0 e 2 a.C. para -1. Inf e -Inf os valores são convertidos para null.
  • TIME, TIME WITH TIME ZONE, e INTERVAL os tipos de dados são ingeridos como cadeias no seu formato original. Podes usar as funções SQL do Databricks para analisar estas cadeias nas representações temporais apropriadas, se necessário. Para o INTERVAL tipo de dado, valores de infinito são mapeados para 0 years 0 mins 0 days 0 hours 0 mins 0.0 secs.

Tipos de dados definidos pelo utilizador e de terceiros

Tipos definidos pelo utilizador e tipos de dados provenientes de extensões PostgreSQL de terceiros são ingeridos como strings. Se precisares de transformar estes tipos, podes usar as funções SQL do Databricks para analisar as representações de strings no processamento a jusante.

Tipos compostos

Os tipos compostos do PostgreSQL (também conhecidos como tipos de linha) são tratados como strings. A representação das strings segue o formato de tipo composto do PostgreSQL: (value1,value2,value3).