Point de contrôle V2

Le point de contrôle V2 permet à Delta Lake de prendre en charge davantage d'auteurs simultanés et réduit les conflits d'écriture sur de grandes tables ou sur celles mises à jour fréquemment.

Delta Lake écrit régulièrement des points de contrôle qui enregistrent l’état du journal des transactions. Les points de contrôle accélèrent la planification des requêtes en permettant à Delta Lake de reconstruire l’état de la table sans relire le journal des transactions complet.

Vous pouvez lire et écrire des tables avec le point de contrôle V2 dans Databricks Runtime 13.3 LTS et versions ultérieures.

Pour connaître la spécification du protocole open source, consultez le point de contrôle V2 dans le protocole Delta Lake.

Activer le point de contrôle V2

Activez le point de contrôle V2 au niveau de la table.

Activation automatique

Les tables créées avec un clustering liquide dans Databricks Runtime 14.1 et versions ultérieures utilisent le point de contrôle V2 par défaut. Consultez Compatibilité pour les tables avec regroupement liquide.

L’activation automatique des fonctionnalités (AFE) peut activer automatiquement le point de contrôle V2 pour les tables managées du catalogue Unity. Voir Activation automatique des fonctionnalités.

Activation manuelle

Pour activer le point de contrôle V2 sur une table Delta Lake existante :

ALTER TABLE table_name SET TBLPROPERTIES ('delta.checkpointPolicy' = 'v2');

Pour activer le point de contrôle V2 sur une nouvelle table Delta Lake :

CREATE TABLE table_name (...)
TBLPROPERTIES ('delta.checkpointPolicy' = 'v2');

Si vous le souhaitez, vous pouvez déclencher manuellement un point de contrôle. Voir REORG TABLE.

Rétrograder vers la version classique

Pour rétrograder une table en points de contrôle classiques et supprimer entièrement le point de contrôle V2 :

ALTER TABLE table_name DROP FEATURE v2Checkpoint;

Consultez Supprimer une fonctionnalité de table Delta Lake et passer à une version antérieure du protocole de table.