Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
Le connecteur PostgreSQL pour Lakeflow Connect est disponible en préversion publique. Contactez votre équipe de votre compte Databricks pour vous inscrire à la Préversion publique.
Cette page contient des documents de référence pour le connecteur PostgreSQL dans Databricks Lakeflow Connect.
Transformations automatiques de données
Databricks transforme automatiquement les types de données PostgreSQL suivants en types de données compatibles delta :
| Type PostgreSQL | Type Delta |
|---|---|
BOOLEAN |
BOOLEAN |
SMALLINT |
SMALLINT |
INTEGER |
INT |
BIGINT |
BIGINT |
DECIMAL(p,s) |
DECIMAL(p,s) |
NUMERIC(p,s) |
DECIMAL(p,s) |
REAL |
FLOAT |
DOUBLE PRECISION |
DOUBLE |
SMALLSERIAL |
SMALLINT |
SERIAL |
INT |
BIGSERIAL |
BIGINT |
MONEY |
STRING |
CHAR(n) |
STRING |
VARCHAR(n) |
STRING |
TEXT |
STRING |
BYTEA |
BINARY |
DATE |
DATE |
TIME |
STRING |
TIME WITH TIME ZONE |
STRING |
TIMESTAMP |
STRING |
TIMESTAMP WITH TIME ZONE |
TIMESTAMP |
INTERVAL |
STRING |
UUID |
BINARY |
JSON |
STRING |
JSONB |
STRING |
XML |
STRING |
ARRAY |
STRING |
CIDR |
STRING |
INET |
STRING |
MACADDR |
STRING |
BIT(n) |
BINARY |
BIT VARYING(n) |
BINARY |
Remarques importantes sur les types de date et d’heure
-
DATEle type de données est ingéré en tant que type DeltaDATE. La plage de dates PostgreSQL complète est prise en charge.Infet-Infles valeurs sont converties ennull. Les dates BC sont stockées à l’aide d’une numérotation d’année astronomique. Par exemple, 1 carte BC à l’année 0 et 2 BC correspond à -1. -
TIMESTAMP(sans fuseau horaire) le type de données est ingéré en tant que chaînes.Infet-Infles valeurs sont conservées sous forme de chaînes. -
TIMESTAMP WITH TIME ZONEle type de données est ingéré en tant que type DeltaTIMESTAMP. La plage prise en charge par PostgreSQL est4713-01-01 00:00:00.000000 BCà294276-12-31 23:59:59.999999 AD, tandis que la plage prise en charge par Databricks est-290308-12-21 BCE 19:59:06 GMTà+294247-01-10 CE 04:00:54 GMT. Les horodatages au-dessus de Databricks maximum pris en charge sont convertis ennull. Les dates BC sont stockées à l’aide d’une numérotation d’année astronomique. Par exemple, 1 carte BC à l’année 0 et 2 BC correspond à -1.Infet-Infles valeurs sont converties ennull. -
TIME,TIME WITH TIME ZONEetINTERVALles types de données sont ingérés sous forme de chaînes dans leur format d’origine. Vous pouvez utiliser les fonctions SQL Databricks pour analyser ces chaînes dans les représentations temporelles appropriées si nécessaire. PourINTERVALle type de données, les valeurs infinis sont mappées à0 years 0 mins 0 days 0 hours 0 mins 0.0 secs.
Types de données définis par l’utilisateur et tiers
Les types et types de données définis par l’utilisateur à partir d’extensions PostgreSQL tierces sont ingérés en tant que chaînes. Si vous devez transformer ces types, vous pouvez utiliser les fonctions SQL Databricks pour analyser les représentations sous forme de chaîne dans le traitement en aval.
Types composites
Les types composites PostgreSQL (également appelés types de lignes) sont ingérés en tant que chaînes. La représentation sous forme de chaîne suit le format de type composite de PostgreSQL : (value1,value2,value3).