Compartilhar via


Importar e consultar dados usando o complemento Azure Databricks Excel

Importante

Esse recurso está em Visualização Pública.

O suplemento Azure Databricks Excel conecta seu espaço de trabalho Azure Databricks ao Microsoft Excel, trazendo dados controlados do Lakehouse diretamente para suas planilhas para ajudá-lo a transformar dados em decisões mais rapidamente.

Esta página descreve como usar o suplemento Azure Databricks Excel para importar e analisar dados de Azure Databricks no Excel. Você pode navegar e importar Azure Databricks tabelas por meio de uma interface intuitiva em que nenhum conhecimento do SQL é necessário. Embora o suplemento ofereça flexibilidade para executar consultas SQL personalizadas, ele é opcional.

Pré-requisitos

Antes de usar o suplemento Excel, verifique se ele está configurado.

Selecionar um sql warehouse

Escolha qual sql warehouse usar:

  1. No canto superior direito do painel do suplemento Azure Databricks no Excel, clique no menu suspenso.
  2. Selecione qual sql warehouse você deseja usar.

Importar dados de Azure Databricks

Importe dados de Azure Databricks em Excel selecionando uma tabela, escrevendo uma consulta SQL ou importando uma tabela dinâmica.

Observação

Você pode importar exibições de métrica do Catálogo do Unity usando tabelas dinâmicas, consultas SQL e funções personalizadas.

Criar tabelas dinâmicas

Para criar uma tabela dinâmica a partir de tabelas e exibições do Catálogo do Unity em Excel:

  1. No painel do Complemento do Azure Databricks para Excel, na guia Novo importação, selecione Selecionar dados como o método de Importação.

  2. Em Catálogo, selecione a tabela na qual você deseja criar uma tabela dinâmica e clique em Selecionar.

  3. Marque a caixa de seleção Dados Dinâmicos .

  4. Configure sua linha, coluna, valor e filtros conforme necessário.

  5. (Opcional) Para ver um exemplo da importação, clique em Visualizar.

  6. (Opcional) Defina um limite de linha para sua importação.

  7. Importe seus resultados. Escolha uma destas opções:

    • Clique em Save e import para salvar a consulta para reutilização na pasta de trabalho Excel e importar os resultados.
    • Clique na seta para baixo e clique em Importar resultados para importar os resultados sem salvar a consulta. Use essa opção quando quiser continuar editando uma importação.

    Observação

    Tabelas dinâmicas só podem ser importadas para uma nova planilha.

Ao trabalhar com métricas do Catálogo do Unity em tabelas de pivot, você pode ver Sum(measure) exibidas nos resultados. Esse é o comportamento esperado e nenhuma agregação adicional ocorre. Excel requer que os valores tenham uma função de agregação, mas como os dados contêm valores exclusivos, nenhuma agregação ocorre.

Selecionar tabelas

Os dados são importados como um objeto Excel table. Você pode mover a tabela ou renomear a planilha e o suplemento Excel atualiza os dados no novo local.

Para importar dados de uma tabela Azure Databricks, faça o seguinte:

  1. No painel do Complemento do Azure Databricks para Excel, na guia Novo importação, selecione Selecionar dados como o método de Importação.

  2. Escolha uma tabela para importar do Gerenciador de Catálogos. Você pode filtrar o catálogo por proprietário, status de certificação e outras propriedades usando o ícone Controles Deslizantes.

  3. Clique em Selecionar.

  4. Em Colunas, clique na seta para baixo e desmarque as colunas que você não deseja importar ou deixe todas as colunas selecionadas para importar a tabela inteira.

  5. (Opcional) Para definir filtros, clique + ao lado de Filtros, selecione a coluna à qual você deseja aplicar um filtro e, em seguida, insira sua condição de filtro. Para obter uma lista de filtros disponíveis, consulte filtros com suporte.

    Para filtros que exigem um valor, você pode fazer um dos seguintes procedimentos:

    • Introduza o valor.
    • Para gerar uma lista de até 75 valores de filtro distintos que você pode usar, clique em Valores e, em seguida, obter valores de filtro. Clique na seta para baixo e selecione um ou mais valores na lista.
    • Para usar uma referência de célula, clique em Células, selecione uma célula ou intervalo de células e clique no botão de cursor.

    Observação

    Os valores de filtro não podem conter uma vírgula. Para filtrar valores que contêm vírgulas, use o método de importação Write SQL

  6. (Opcional) Para ver um exemplo da importação, clique em Visualizar.

  7. (Opcional) Você pode definir um limite de linha para restringir o número de linhas importadas.

  8. (Opcional) Para identificar facilmente seus dados importados, você pode inserir um nome de importação.

  9. Em Destino de Saída, escolha importar os dados para uma nova planilha ou a planilha atual. Se você importar para a planilha atual, os dados serão iniciados na referência da célula inserida (por padrão, A1).

  10. Importe seus resultados. Escolha uma destas opções:

    • Clique em Save e import para salvar a consulta para reutilização na pasta de trabalho Excel e importar os resultados.
    • Clique na seta para baixo e clique em Importar resultados para importar os resultados sem salvar a consulta. Use essa opção quando quiser continuar editando uma importação.

Filtros com suporte

Ao importar dados selecionando uma tabela, você pode aplicar filtros para restringir os resultados. A tabela a seguir descreve cada filtro disponível e sua entrada esperada.

Filter Entrada esperada Descrição
IS NULL Nenhum Localiza linhas em que o valor da coluna é nulo.
IS NOT NULL Nenhum Localiza linhas em que o valor da coluna não é nulo.
EQUALS Um número ou cadeia de texto Localiza linhas em que o valor da coluna corresponde exatamente ao valor especificado.
NOT EQUALS Um número ou cadeia de texto Localiza linhas em que o valor da coluna não corresponde ao valor especificado.
IN Um ou mais números ou cadeias de texto, separados por vírgulas Localiza linhas em que o valor da coluna corresponde a qualquer um dos valores especificados.
NOT IN Um ou mais números ou cadeias de texto, separados por vírgulas Localiza linhas em que o valor da coluna não corresponde a nenhum dos valores especificados.
LIKE Um padrão usando % (qualquer caractere) e _ (um único caractere) como curingas.
%smith corresponde a qualquer valor que termina em "smith".
t_p corresponde a valores como "tap", "tip" ou "top".
Localiza linhas em que o valor da coluna corresponde ao padrão. Diferenciam maiúsculas de minúsculas.
NOT LIKE Um padrão usando % (qualquer caractere) e _ (um único caractere) como curingas.
%test% exclui valores que contêm "test".
_at exclui valores como "bat", "gato" ou "chapéu".
Localiza linhas em que o valor da coluna não corresponde ao padrão. Diferenciam maiúsculas de minúsculas.
ILIKE Um padrão usando % (qualquer caractere) e _ (um único caractere) como curingas.
%Smith corresponde a valores como "smith", "Smith" ou "SMITH".
_ob corresponde a "Bob", "rob" ou "Rob".
Localiza linhas em que o valor da coluna corresponde ao padrão. Não diferencia maiúsculas de minúsculas.
STARTS WITH Uma cadeia de caracteres de texto Localiza linhas em que o valor da coluna começa com o texto especificado.
ENDS WITH Uma cadeia de caracteres de texto Localiza linhas em que o valor da coluna termina com o texto especificado.
CONTAINS Uma cadeia de caracteres de texto Localiza linhas em que o valor da coluna contém o texto especificado em qualquer lugar da cadeia de caracteres.

Gravar consultas SQL

O método de importação Write SQL dá suporte a funções SQL e procedimentos armazenados.

Para executar consultas SQL personalizadas em seu workspace Azure Databricks, faça o seguinte:

  1. No painel Azure Databricks Excel Add-in, na guia Nova importação, selecione Write SQL como o método de Importação.

  2. Insira um nome para sua consulta para identificá-la mais tarde.

  3. Escreva uma nova consulta ou use uma consulta existente do workspace Azure Databricks.

    • Escreva sua consulta SQL no editor. Você pode consultar qualquer tabela no Catálogo do Unity que tenha permissões para acessar.

      • Clique no ícone Dados. Gerenciador de catálogos para exibir seus esquemas e tabelas.
    • Para usar uma consulta do workspace Azure Databricks ou uma consulta existente no Excel, clique no ícone de pasta. Se você usar uma consulta existente do workspace Azure Databricks, as edições feitas em Excel não serão refletidas em Azure Databricks.

      Observação

      As consultas devem ser salvas explicitamente em Azure Databricks usando o botão Save no editor de consultas antes de aparecerem no Excel.

  4. (Opcional) Para adicionar parâmetros de consulta, clique em +Adicionar ao lado de Parâmetros. Clique no parâmetro e insira o nome do parâmetro e o valor do parâmetro.

    • Para o valor do parâmetro, você pode inserir um valor específico ou clicar no botão caixa e seta para especificar uma referência de célula. Selecione uma célula ou intervalo de células e clique na seta para preencher automaticamente o valor do parâmetro.
  5. Em Destino de Saída, escolha importar os dados para uma nova planilha ou a planilha atual. Se você importar para a planilha atual, os dados serão iniciados na referência da célula inserida (por padrão, A1).

  6. Para visualizar os resultados da consulta, clique em Executar.

  7. Importe seus resultados. Escolha uma destas opções:

    • Clique em Save e import para salvar a consulta para reutilização na pasta de trabalho Excel e importar os resultados.
    • Clique na seta para baixo e clique em Importar resultados para importar os resultados sem salvar a consulta. Use essa opção quando quiser continuar editando uma importação.

Você também pode usar funções personalizadas para adicionar parâmetros de consulta. Consulte Escrever SQL.

Use funções personalizadas no Excel

O suplemento Excel fornece funções personalizadas que você pode usar em fórmulas Excel para importar dados de Azure Databricks.

Selecionar uma tabela

A DATABRICKS.Table função importa dados de uma tabela do Catálogo do Unity.

Sintaxe:

=DATABRICKS.Table(catalog_name.schema_name.table_name, [column1, ...], [limit])

Parâmetros:

  • catalog_name.schema_name.table_name (obrigatório): o nome totalmente qualificado da tabela.
  • columns (opcional): uma matriz de nomes de colunas para importação. Omita esse parâmetro para importar todas as colunas.
  • limit (opcional): o número máximo de linhas a serem importadas. Omita esse parâmetro para importar todas as linhas, até o limite de 10 MB.

Exemplo:

=DATABRICKS.Table("main.default.customers", {"customer_id", "customer_name"}, 100)

Essa fórmula importa as colunas customer_id e customer_name da tabela main.default.customers, limitadas a 100 linhas.

Escrever SQL

A DATABRICKS.SQL função executa uma consulta SQL que usa parâmetros de consulta e retorna os resultados.

Sintaxe:

Especifique parâmetros usando valores.

=DATABRICKS.SQL("query_text", {parameter1_name, parameter1_value; ...})

Especifique parâmetros usando um intervalo de células. Os parâmetros de nome e valor devem ser definidos em células que estão na mesma linha.

=DATABRICKS.SQL("query_text", {param_name_cell: param_value_cell; ...})

Parâmetros:

  • query_text (obrigatório): a consulta SQL a ser executada.
  • parameters (obrigatório): um mapeamento de valores de parâmetro para substituir na consulta.

Exemplo:

=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE longitude > :long_param AND latitude > :lat_param LIMIT 10", {"long_param",20; "lat_param",10})

=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE city = :city", M4:N4)

Esta fórmula realiza uma consulta que filtra os dados de vendas por longitude e latitude, usando os valores de parâmetro fornecidos.

Gerenciar consultas

Gerencie suas importações existentes da página Importações.

Editar uma importação existente

Para editar uma importação existente:

  1. No painel do complemento Azure Databricks no Excel, clique na guia Imports.
  2. Localize a importação que você deseja editar.
  3. Clique no menu de três pontos ao lado da importação.
  4. Clique em Editar para editar sua importação.

Atualizar dados

O suplemento Excel não atualiza automaticamente os dados importados. Para atualizar seus dados com os valores mais recentes do Azure Databricks:

  • Para atualizar uma única importação, faça o seguinte:
    1. No painel do complemento Azure Databricks no Excel, clique na guia Imports.
    2. Clique no ícone Atualizar. Atualize ao lado da importação que você deseja atualizar.
  • Para atualizar todas as importações, faça o seguinte:
    1. Clique em Refresh All no painel Azure Databricks Suplemento.

O Suplemento executa a consulta original ou a seleção de tabela novamente e atualiza sua planilha com dados novos.

Importante

Ao atualizar dados, o suplemento Excel limpa todos os dados existentes na tabela especificada e recarrega os dados mais recentes de Azure Databricks. Todas as colunas personalizadas adicionadas à tabela são excluídas durante o processo de atualização.

Implicações de compartilhamento

Ao compartilhar uma pasta de trabalho Excel que contém dados Azure Databricks, considere as seguintes implicações de acesso a dados e segurança:

Visibilidade dos dados importados

Quando um destinatário atualiza uma importação, o Suplemento usa as permissões do Catálogo do Unity do destinatário. Se eles não tiverem acesso aos dados subjacentes, a atualização falhará.

Para pastas de trabalho em que a privacidade de dados é uma preocupação, você pode usar a seguinte solução alternativa:

  1. Crie uma pasta de trabalho que contenha todas as fórmulas e importações necessárias.
  2. Exclua os dados importados da planilha.
  3. Compartilhe a pasta de trabalho com o destinatário.
  4. Fazer com que o destinatário atualize os dados.

O destinatário vê apenas os dados aos quais tem acesso com base em suas permissões do Catálogo do Unity.

Acesso a espaços de trabalho e ativos de dados

  • Os usuários sem acesso aos objetos do Catálogo do Unity referenciados na pasta de trabalho não podem atualizar os dados. Para atualizar dados, os usuários devem ter permissões de leitura nas tabelas e exibições subjacentes no Catálogo do Unity.
  • Os usuários devem ter acesso à tabela subjacente em Azure Databricks para editar importações existentes.

Visibilidade da consulta

Os usuários com acesso de edição à pasta de trabalho podem exibir as consultas usadas para gerar os dados por meio do Suplemento Azure Databricks, mesmo que não tenham acesso aos dados subjacentes no Catálogo do Unity.

Limitações

  • Funções personalizadas: para funções personalizadas, os resultados da consulta são limitados a 25 MiB devido a limitações da API de execução do SQL.
  • Carregamento de dados: o carregamento de dados poderá falhar se qualquer célula na pasta de trabalho estiver no modo de edição.
  • Limite de linha do Excel Desktop: Excel Desktop dá suporte a um máximo de 1.048.576 linhas por planilha.
  • Excel for the web limite de tamanho do arquivo: Excel for the web dá suporte a um tamanho máximo de arquivo de pasta de trabalho de aproximadamente 25 MB para exibição e edição.