Konfigurera en anslutning till Databricks med hjälp av Databricks JDBC-drivrutinen

Den här sidan visar hur du konfigurerar en anslutning till Databricks med hjälp av Databricks JDBC-drivrutinen, version 3 och senare.

Konfigurera anslutningen

Om du vill ansluta till din Azure Databricks arbetsyta med JDBC-drivrutinen måste du ange anslutningsinställningar, inklusive arbetsytans servervärdnamn, beräkningsresursinställningar och autentiseringsuppgifter.

Anmärkning

JDBC-drivrutinen stöder inte anslutning till jobbberäkning.

Ange dessa egenskaper på JDBC-anslutnings-URL:en, skicka dem till metoden DriverManager.getConnection eller använd en kombination av båda. Se leverantörens dokumentation för hur du bäst ansluter med din specifika app, klient, SDK, API eller SQL-verktyg.

JDBC-anslutnings-URL:en måste ha följande format. Egenskaperna är skiftlägesokänsliga.

jdbc:databricks://<server-hostname>:<port>/<schema>;[property1]=[value];[property2]=[value];...

Du kan också ange inställningarna med hjälp av java.util.Properties klassen eller en kombination:

String url = "jdbc:databricks://<server-hostname>:<port>/<schema>";
Properties properties = new java.util.Properties();
properties.put("<property1>", "<value1");
properties.put("<property2>", "<value2");
// ...
Connection conn = DriverManager.getConnection(url, properties);
String url = "jdbc:databricks://<server-hostname>:<port>/<schema>;[property1]=[value];[property2]=[value];";
Connection conn = DriverManager.getConnection(url, "token", "12345678901234667890abcdabcd");

Anslutnings-URL-element beskrivs i följande tabell.

Information om ytterligare egenskaper, inklusive autentiseringsegenskaper, SQL-konfigurationsegenskaper och loggningsegenskaper, finns i Anslutningsegenskaper som stöds.

Anmärkning

URL-element och egenskaper är skiftlägesokänsliga.

URL-element eller egenskap Beskrivning
<server-hostname> Azure Databricks-beräkningsresursens värdnamnsvärde för servern.
<port> Azure Databricks-beräkningsresursens portvärde. Standardvärdet är 443.
<schema> Namnet på schemat. Du kan också ange egenskapen ConnSchema . Se Anslutningsegenskaper som stöds.
httpPath Azure Databricks-beräkningsresursens HTTP-sökvägsvärde. Kopplaren bildar HTTP-adressen som ska anslutas till genom att lägga till httpPath värdet till den värd och port som anges i anslutnings-URL:en. Om du till exempel vill ansluta till HTTP-adressen http://localhost:10002/cliserviceanvänder du följande anslutnings-URL: jdbc:databricks://localhost:10002;httpPath=cliservice

Hämta JDBC-anslutnings-URL:en för ett Azure Databricks-kluster:

  1. Logga in på din Azure Databricks-arbetsyta.
  2. I sidofältet klickar du på Beräkning och sedan på målklustrets namn.
  3. På fliken Konfiguration expanderar du Avancerade alternativ.
  4. Klicka på fliken JDBC/ODBC .
  5. Kopiera JDBC-URL:en som ska användas som JDBC-anslutnings-URL eller konstruera URL:en från värden i fälten Servervärdnamn, Port och HTTP-sökväg .

Hämta JDBC-anslutnings-URL:en för ett Databricks SQL-lager:

  1. Logga in på din Azure Databricks-arbetsyta.
  2. I sidofältet klickar du på SQL Warehouses och sedan på mållagrets namn.
  3. Klicka på fliken Anslutningsinformation .
  4. Kopiera JDBC-URL:en som ska användas som JDBC-anslutnings-URL eller konstruera URL:en från värden i fälten Servervärdnamn, Port och HTTP-sökväg .

Konfigurera frågetaggar

Viktigt!

Den här funktionen är en privat förhandsversion. Kontakta kontoteamet om du vill begära åtkomst.

Koppla nyckelvärdestaggar till SQL-frågor i spårnings- och analyssyfte. Taggar visas i tabellen system.query.history för frågeidentifiering och analys.

Om du vill lägga till frågetaggar i anslutningen tar du med query_tags egenskapen i JDBC-URL:en:

jdbc:databricks://<server-hostname>:<port>/<schema>;query_tags=key1:value1,key2:value2

Frågetaggar använder ett kommaavgränsat key:value-parformat:

  • query_tags=key:value (enkel tagg)
  • query_tags=key1:value1,key2:value2,key3:value3 (flera taggar)

Konfigurera proxyanslutningar

Konfigurera anslutningsappen för att ansluta via en proxyserver i stället för att ansluta direkt till Databricks. Anslutningsappen stöder grundläggande autentisering och SPNEGO-autentisering vid anslutning via en proxyserver. Se Anslutningsegenskaper som stöds.

Om du vill använda proxyinställningar på systemnivå anger du UseProxy=1 och UseSystemProxy=1.

Så här konfigurerar du proxyinställningar manuellt:

  1. Ange UseProxy=1.
  2. Ange ProxyHost, ProxyPortoch ProxyIgnoreList.
  3. Om du vill autentisera med proxyservern väljer du en metod:
    • Grundläggande: Ange ProxyAuth=1, ProxyUIDoch ProxyPWD.
    • SPNEGO (Kerberos-miljöer): Autentisera kerberos-huvudkontot på systemnivå och ange ProxyAuth=2sedan .

Konfigurera en proxy för Cloud Fetch

Cloud Fetch kräver en separat proxykonfiguration från huvuddrivrutinsanslutningen. Använd anslutningsegenskaperna UseCFProxy, CFProxyHost, CFProxyPort, CFProxyAuth, CFProxyUID och CFProxyPwd för att dirigera Cloud Fetch-trafik via en proxy. Se Anslutningsegenskaper som stöds.

Om ditt nätverk är privat, tillåter du *.blob.core.windows.net och *.store.core.windows.net och lägger till de nödvändiga certifikatnedladdningarna och återkallningarna i din tillåtna lista.

Felsökning

Om du inte kan lösa proxyproblem anger du EnableQueryResultDownload=0 för att inaktivera Cloud Fetch och återgå till direkt nedladdning.

Om du vill diagnostisera prestandaproblem anger du LogLevel=4 för att aktivera loggning på INFO-nivå. Drivrutinen loggar nedladdningshastighet per del, så stora resultatuppsättningar genererar flera loggposter.

CloudFetch download speed: 21.24 MB/s
CloudFetch download speed: 20.60 MB/s

Drivrutinen loggar en varning när nedladdningshastigheten understiger cirka 1 MB/s. Loggkomponenten är com.databricks.client.spark.jdbc.ResultFileDownloadHandler. Om nedladdningarna är långsamma eller stoppas ökar du CloudFetchThreadPoolSize för att ladda ned fler filsegment parallellt.

Konfigurerar SSL

Om du ansluter till en Databricks-arbetsyta med SSL aktiverat konfigurerar du anslutningsappen för att ansluta till en SSL-aktiverad socket. Anslutningsappen använder enkelriktad autentisering för att verifiera serverns identitet.

Enkelriktad autentisering kräver ett signerat, betrott SSL-certifikat. Konfigurera anslutningsappen för åtkomst till en specifik TrustStore. Om du inte anger en TrustStore använder anslutningsappen standard-Java TrustStore (jssecacerts) eller cacerts om jssecacerts inte är tillgängligt.

Så här konfigurerar du SSL:

  1. Ange SSL=1.
  2. Om du inte använder en standard Java TrustStore konfigurerar du en anpassad:
    • Skapa en TrustStore som innehåller ditt signerade, betrodda servercertifikat.
    • Ange SSLTrustStore den fullständiga sökvägen till TrustStore.
    • Ange SSLTrustStorePwd till TrustStore-lösenordet.
    • Om TrustStore inte är en JKS TrustStore anger du SSLTrustStoreType till antingen BCFKS (BouncyCastle FIPS Keystore) eller PKCS12.

Om du vill ändra strategin för återkallade certifikat anger du följande egenskaper:

  • CheckCertRevocation: Ställ in på 0 för att acceptera återkallade certifikat. Standardvärdet är 1.
  • AcceptUndeterminedRevocation: Ställ in på för att 1 acceptera certifikat med obestämd återkallningsstatus (till exempel när CRLDP inte kan nås eller tidsgränsen överskrids). Standardvärdet är 0.

Autentisera föraren

Information om hur du konfigurerar autentisering för JDBC-drivrutinen finns i Autentiseringsinställningar för Databricks JDBC-drivrutinen.