Informations de référence sur le connecteur PostgreSQL

Important

Le connecteur PostgreSQL pour Lakeflow Connect est disponible en préversion publique. Contactez votre équipe de votre compte Databricks pour vous inscrire à la Préversion publique.

Cette page contient des documents de référence pour le connecteur PostgreSQL dans Databricks Lakeflow Connect.

Transformations automatiques de données

Databricks transforme automatiquement les types de données PostgreSQL suivants en types de données compatibles delta :

Type PostgreSQL Type Delta
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY STRING
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP STRING
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID BINARY
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Remarques importantes sur les types de date et d’heure

  • DATE le type de données est ingéré en tant que type Delta DATE . La plage de dates PostgreSQL complète est prise en charge. Inf et -Inf les valeurs sont converties en null. Les dates BC sont stockées à l’aide d’une numérotation d’année astronomique. Par exemple, 1 carte BC à l’année 0 et 2 BC correspond à -1.
  • TIMESTAMP (sans fuseau horaire) le type de données est ingéré en tant que chaînes. Inf et -Inf les valeurs sont conservées sous forme de chaînes.
  • TIMESTAMP WITH TIME ZONE le type de données est ingéré en tant que type Delta TIMESTAMP . La plage prise en charge par PostgreSQL est 4713-01-01 00:00:00.000000 BC à 294276-12-31 23:59:59.999999 AD, tandis que la plage prise en charge par Databricks est -290308-12-21 BCE 19:59:06 GMT à +294247-01-10 CE 04:00:54 GMT. Les horodatages au-dessus de Databricks maximum pris en charge sont convertis en null. Les dates BC sont stockées à l’aide d’une numérotation d’année astronomique. Par exemple, 1 carte BC à l’année 0 et 2 BC correspond à -1. Inf et -Inf les valeurs sont converties en null.
  • TIME, TIME WITH TIME ZONEet INTERVAL les types de données sont ingérés sous forme de chaînes dans leur format d’origine. Vous pouvez utiliser les fonctions SQL Databricks pour analyser ces chaînes dans les représentations temporelles appropriées si nécessaire. Pour INTERVAL le type de données, les valeurs infinis sont mappées à 0 years 0 mins 0 days 0 hours 0 mins 0.0 secs.

Types de données définis par l’utilisateur et tiers

Les types et types de données définis par l’utilisateur à partir d’extensions PostgreSQL tierces sont ingérés en tant que chaînes. Si vous devez transformer ces types, vous pouvez utiliser les fonctions SQL Databricks pour analyser les représentations sous forme de chaîne dans le traitement en aval.

Types composites

Les types composites PostgreSQL (également appelés types de lignes) sont ingérés en tant que chaînes. La représentation sous forme de chaîne suit le format de type composite de PostgreSQL : (value1,value2,value3).