Paramètres de capacité du pilote pour le pilote JDBC Databricks (Simba)

Remarque

Cette page s’applique au pilote JDBC Simba (hérité), versions antérieures à la version 3. Databricks recommande vivement la migration vers le pilote JDBC Databricks pour la connectivité JDBC. Il inclut des améliorations telles que la prise en charge des vues de métriques du catalogue Unity, les transactions qui s’étendent sur plusieurs instructions SQL, procédures stockées, récupération de résultats volumineuses plus rapides et données de télémétrie client intégrées.

Cette page explique comment configurer des paramètres de fonctionnalité de pilote spéciaux et avancés pour le pilote JDBC Databricks.

Le pilote JDBC Databricks fournit les suivants paramètres de fonctionnalités spéciales et avancées du pilote.

Prise en charge des requêtes ANSI SQL-92 dans JDBC

Les pilotes JDBC Spark hérités acceptent les requêtes SQL dans le dialecte ANSI SQL-92 et les traduisent en Databricks SQL avant de les envoyer au serveur.

Si votre application génère Databricks SQL directement ou utilise une syntaxe NON ANSI SQL-92 spécifique à Azure Databricks, définissez UseNativeQuery=1 dans votre configuration de connexion. Ce paramètre transmet des requêtes SQL détaillées à Azure Databricks sans traduction.

Catalogue et schéma par défaut

Pour spécifier le catalogue et le schéma par défaut, ajoutez ConnCatalog=<catalog-name>;ConnSchema=<schema-name> à l’URL de connexion JDBC.

Balises de requête pour le traçage

Important

Cette fonctionnalité est disponible en préversion privée . Pour demander l’accès, contactez l’équipe de votre compte.

Attachez des balises clé-valeur à vos requêtes SQL à des fins de suivi et d’analytique. Les balises de requête apparaissent dans la system.query.history table pour l’identification et l’analyse des requêtes.

Pour ajouter des balises de requête à votre connexion, incluez le ssp_query_tags paramètre dans votre URL de connexion JDBC :

jdbc:databricks://<server-hostname>:443;httpPath=<http-path>;ssp_query_tags=key1:value1,key2:value2

Définissez les balises de requête en tant que paires clé-valeur séparées par des virgules, où chaque clé et valeur est séparée par un signe deux-points. Par exemple : key1:value1,key2:value2.

Extraire les résultats de requête volumineux dans JDBC

Pour obtenir des performances optimales lorsque vous extrayez des résultats de requête volumineux, utilisez la version la plus récente du pilote JDBC qui comprend les optimisations suivantes.

Sérialisation Arrow dans JDBC

Les versions 2.6.16 et ultérieures du pilote JDBC prennent en charge un format de sérialisation des résultats de requête optimisé qui utilise Apache Arrow.

Cloud Fetch dans JDBC

Le pilote JDBC version 2.6.19 et versions ultérieures prend en charge Cloud Fetch, une fonctionnalité qui extrait les résultats des requêtes via le stockage cloud configuré dans votre déploiement Azure Databricks.

Lorsque vous exécutez une requête, Azure Databricks stocke les résultats dans le stockage cloud de votre espace de travail sous forme de fichiers sérialisés par flèche allant jusqu'à 20 Mo. Une fois la requête terminée, le pilote envoie des requêtes de récupération et Azure Databricks retourne URL de signature d’accès partagé (SAP) aux fichiers de résultats. Le pilote utilise ensuite ces URL pour télécharger les résultats directement à partir de Azure stockage.

Cloud Fetch s’applique uniquement aux résultats de requête supérieurs à 1 Mo. Le pilote récupère des résultats plus petits directement à partir de Azure Databricks.

Azure Databricks garbage collecte automatiquement les fichiers accumulés en les marquant pour suppression après 24 heures et en les supprimant définitivement 24 heures plus tard.

Configuration réseau requise

Si votre réseau est privé, vous devez configurer les paramètres suivants pour que Cloud Fetch fonctionne :

Autorisez *.blob.core.windows.net et *.store.core.windows.net dans votre environnement réseau.
Ajoutez les téléchargements et révocations de certificats requis à votre liste verte.
Si la prise en charge du pare-feu est activée sur votre compte de stockage d’espace de travail Azure Databricks, configurez une passerelle de données réseau virtual ou une passerelle de données on-local pour autoriser l’accès privé au compte de stockage.

Pour désactiver Cloud Fetch, définissez EnableQueryResultDownload=0 dans votre configuration de connexion.

Diagnostiquer les téléchargements lents

Défini LogLevel sur 4 (INFO) et LogPath sur le chemin complet d’un dossier de journal pour afficher les métriques de vitesse de téléchargement cloud Fetch. Le pilote enregistre la vitesse de téléchargement par segment, donc les jeux de résultats volumineux génèrent plusieurs lignes de journal. Le pilote enregistre également un avertissement lorsque la vitesse tombe en dessous d’environ 1 Mo/s. Cette fonctionnalité est disponible dans les versions de pilotes JDBC (Simba) publiées après décembre 2025.

Si les téléchargements sont lents ou bloqués, les jetons SAP peuvent expirer avant la fin du téléchargement de tous les fichiers de résultats. Vérifiez la limitation de la bande passante ou la congestion du réseau entre le client et Stockage Blob Azure.

Activation de la journalisation

Pour activer la journalisation dans le pilote JDBC, définissez la LogLevel propriété sur une valeur entre 1 (événements graves uniquement) et 6 (toutes les activités du pilote). Définissez la LogPath propriété sur le chemin complet du dossier dans lequel vous souhaitez enregistrer les fichiers journaux.

Pour plus d’informations, consultez Configuration de la journalisation dans le Guide du pilote JDBC Databricks.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-30