Compartilhar via


Configurações de funcionalidade para o Driver ODBC do Databricks

Esta página descreve como definir configurações de funcionalidade de driver especiais e avançadas para o Driver ODBC do Databricks.

O driver ODBC do Databricks oferece as seguintes configurações de capacidade de drivers especiais e avançadas.

Definir o esquema inicial no ODBC

O driver ODBC permite que você especifique o esquema definindo Schema=<schema-name> como uma configuração de conexão. Isso é equivalente à execução de USE <schema-name>.

Marcas de consulta para acompanhamento

Importante

Este recurso está em Versão prévia privada. Para solicitar acesso, entre em contato com sua equipe de conta.

Anexe marcas chave-valor às suas consultas SQL para fins de acompanhamento e análise. As tags de consulta aparecem na system.query.history tabela para identificação e análise.

Para adicionar marcas de consulta à sua conexão, inclua o ssp_query_tags parâmetro na configuração de conexão ODBC:

Defina marcas de consulta como pares chave-valor separados por vírgulas, em que cada chave e valor é separada por dois pontos. Por exemplo, ssp_query_tags=team:engineering,env:prod.

Suporte à consulta ANSI SQL-92 no ODBC

Os drivers ODBC herdados do Spark aceitam consultas SQL no dialeto ANSI SQL-92 e os convertem no SQL do Databricks antes de enviá-las para o servidor.

Se o aplicativo gerar o SQL do Databricks diretamente ou usar uma sintaxe SQL-92 não ANSI específica para Azure Databricks, defina UseNativeQuery=1 na configuração de conexão. Essa configuração passa consultas SQL verbatim para Azure Databricks sem tradução.

Extrair resultados de consultas grandes no ODBC

Para obter o melhor desempenho ao extrair resultados de consulta grandes, use a versão mais recente do driver ODBC, que inclui as otimizações a seguir.

Serialização de seta no ODBC

A versão 2.6.15 e superior do driver ODBC dá suporte a um formato de serialização otimizada dos resultados de consultas que usa o Apache Arrow.

Observação

O Cloud Fetch está disponível apenas para workspaces AWS e Azure.

Busca na nuvem no ODBC

O driver ODBC versão 2.6.17 e superior dá suporte ao Cloud Fetch, uma funcionalidade que busca resultados de consulta por meio do armazenamento em nuvem configurado em sua implantação de Azure Databricks.

Quando você executa uma consulta, Azure Databricks armazena os resultados no armazenamento em nuvem do workspace como arquivos serializados por seta de até 20 MB. Após a conclusão da consulta, o driver envia solicitações de busca e Azure Databricks retorna urls SAS (assinatura de acesso compartilhado) compartilhada para os arquivos de resultados. Em seguida, o driver usa essas URLs para baixar resultados diretamente do armazenamento de Azure.

O Busca na Nuvem aplica-se apenas a resultados de consulta maiores que 1 MB. O driver recupera resultados menores diretamente de Azure Databricks.

Azure Databricks coleta automaticamente arquivos acumulados, marcando-os para exclusão após 24 horas e excluindo-os permanentemente após mais 24 horas.

Pré-requisitos de rede

Se sua rede for privada, você deverá definir as seguintes configurações para que o Cloud Fetch funcione:

  • Permitir *.blob.core.windows.net e *.store.core.windows.net em seu ambiente de rede.
  • Adicione os downloads e revogações de certificado necessários à sua lista de permissões.
  • Se o suporte ao firewall estiver habilitado em sua conta de armazenamento do workspace Azure Databricks, configure um gateway de dados de rede virtual ou um gateway de dados on-premises para permitir o acesso privado à conta de armazenamento.

Para desabilitar o Cloud Fetch, defina EnableQueryResultDownload=0 na configuração de conexão.

Habilitar o registro em log

Para habilitar o registro em log no driver ODBC, defina a LogLevel propriedade como um valor entre 1 (somente eventos graves) e 6 (todas as atividades do driver). Defina a LogPath propriedade como o caminho completo da pasta em que você deseja salvar arquivos de log.

Para obter mais informações, consulte Configurando opções de log em um computador não Windows no Guia do Driver ODBC do Databricks.