Criar destinatários de dados para Delta Sharing (partilha Databricks-para-Databricks)

Esta página explica como criar destinatários no Delta Sharing, quando os destinatários estão num espaço de trabalho Databricks ativado para o Unity Catalog. Para visualizar, atualizar, eliminar, conceder acesso a partilha, gerir propriedades ou restringir o acesso com listas IP para um destinatário existente, consulte Gerir destinatários de dados para a Partilha Delta.

Um destinatário é o objeto nomeado que representa a identidade de um usuário ou grupo de usuários que consomem dados compartilhados. A maneira como você cria destinatários difere dependendo se o destinatário tem ou não acesso a um espaço de trabalho Databricks habilitado para o Unity Catalog:

Para obter mais informações sobre esses dois modos de partilha e quando escolher cada um, consulte Comparação entre partilha aberta e partilha de Databricks para Databricks.

Requisitos

Para criar um destinatário:

  • Deve ter o privilégio CREATE RECIPIENT para a metastore do Unity Catalog onde os dados que pretende partilhar estão registados.
  • Você deve criar o destinatário usando um espaço de trabalho do Azure Databricks que tenha esse metastore do Catálogo Unity anexado.
  • Se você usar um bloco de anotações Databricks para criar o destinatário, sua computação deverá usar o Databricks Runtime 11.3 LTS ou superior e o modo de acesso padrão ou dedicado (anteriormente modos de acesso compartilhado e de usuário único).

Para permissões necessárias para outras operações de destinatários (visualizar, atualizar, eliminar, conceder acesso a partilha, gerir propriedades), consulte Gerir destinatários de dados para Partilha Delta.

Criar um objeto de destinatário para usuários que têm acesso a Databricks (compartilhamento de Databricks para Databricks)

Se o destinatário dos dados tiver acesso a um espaço de trabalho Databricks habilitado para o Unity Catalog, você poderá criar um objeto de destinatário com um tipo de autenticação de DATABRICKS.

Um objeto de destinatário com o tipo de autenticação de DATABRICKS representa um destinatário de dados num metastore específico do Unity Catalog, identificado na definição do objeto de destinatário por uma cadeia de caracteres de identificação de partilha, que consiste na nuvem, região, e UUID do metastore. Os dados compartilhados com esse destinatário podem ser acessados somente nesse metastore.

Etapa 1: Solicitar o identificador de compartilhamento do destinatário

Peça a um usuário destinatário para enviar o identificador de compartilhamento para o metastore do Unity Catalog anexado aos espaços de trabalho onde o usuário destinatário ou grupo de usuários trabalhará com os dados compartilhados.

O identificador de compartilhamento é uma cadeia de caracteres que consiste na nuvem, região e UUID (o identificador exclusivo do metastore), no formato <cloud>:<region>:<uuid>.

Por exemplo, na captura de tela a seguir, a cadeia de caracteres do identificador de compartilhamento completo é aws:us-west-2:19a84bee-54bc-43a2-87de-023d0ec16016.

exemplo de CURRENT_METASTORE

O destinatário pode encontrar o identificador usando o Catalog Explorer, a CLI do Databricks Unity Catalog ou a função SQL padrão CURRENT_METASTORE em um bloco de anotações Databricks ou consulta SQL Databricks que é executada em um computador compatível com Unity Catalog no espaço de trabalho que pretende usar.

Explorador de Catálogos

Para obter o identificador de compartilhamento usando o Gerenciador de Catálogos:

  1. No seu espaço de trabalho do Azure Databricks, clique no ícone Dados.Catálogo.

  2. Na parte superior do painel Catálogo , clique no ícone de engrenagem. ícone de engrenagem e selecione Compartilhamento Delta.

    Alternativamente, no canto superior direito, clique em Partilhar > Delta Sharing.

  3. Na guia Compartilhado comigo, clique no nome da organização de compartilhamento do Databricks no canto superior direito e selecione Copiar identificador de compartilhamento.

SQL

Execute o seguinte comando em um bloco de anotações ou no editor de consultas Databricks SQL:

SELECT CURRENT_METASTORE();

CLI

Execute o seguinte comando usando a CLI do Databricks. O identificador de compartilhamento é retornado como o global_metastore_id.

databricks metastores summary

Você pode enviar ao destinatário as informações contidas nesta etapa ou apontá-lo para Obter acesso no modelo Databricks-to-Databricks.

Etapa 2: Criar o destinatário

Para criar um destinatário para compartilhamento de Databricks para Databricks, você pode usar o Gerenciador de Catálogos, a CLI do Catálogo Unity Databricks ou o CREATE RECIPIENT comando SQL em um bloco de anotações do Azure Databricks ou no editor de consultas Databricks SQL.

Permissões necessárias: administrador ou usuário do Metastore com o CREATE RECIPIENT privilégio para o metastore do Unity Catalog onde os dados que você deseja compartilhar estão registrados.

Explorador de Catálogos

  1. No seu espaço de trabalho do Azure Databricks, clique no ícone Dados.Catálogo.

  2. Na parte superior do painel Catálogo , clique no ícone de engrenagem. ícone de engrenagem e selecione Compartilhamento Delta.

    Alternativamente, no canto superior direito, clique em Partilhar > Delta Sharing.

  3. Na guia Compartilhado por mim, clique em Novo destinatário.

  4. Introduza o Nome do destinatário.

  5. Para tipo de destinatário, selecione Databricks.

  6. Introduza o identificador de partilha de do destinatário.

    Use toda a cadeia de caracteres do identificador de compartilhamento no formato <cloud>:<region>:<uuid>. Por exemplo, aws:us-west-2:19a84bee-54bc-43a2-87de-023d0ec16016.

  7. (Opcional) Insira um comentário.

  8. Clique em Criar.

  9. (Opcional) Crie propriedades personalizadas de Destinatário.

    Na guia Visão Geral do Destinatário, clique no ícone Editar ícone de edição ao lado de Propriedades do Destinatário. Em seguida, adicione um nome de propriedade (Key) e Value. Para obter detalhes, consulte Gerenciar propriedades do destinatário.

SQL

Execute o seguinte comando em um bloco de anotações ou no editor de consultas Databricks SQL:

CREATE RECIPIENT [IF NOT EXISTS] <recipient-name>
USING ID '<sharing-identifier>'
[COMMENT "<comment>"];

Use toda a cadeia de caracteres do identificador de compartilhamento no formato <cloud>:<region>:<uuid>. Por exemplo, aws:eu-west-1:g0c979c8-3e68-4cdf-94af-d05c120ed1ef.

Você também pode adicionar propriedades personalizadas para o destinatário. Para obter detalhes, consulte Gerenciar propriedades do destinatário.

CLI

Execute o seguinte comando usando a CLI do Databricks. Substitua os valores de espaço reservado:

  • <recipient-name>: O nome do destinatário.
  • <sharing-identifier>: A cadeia de caracteres do identificador de compartilhamento inteira no formato <cloud>:<region>:<uuid>. Por exemplo, aws:eu-west-1:g0c979c8-3e68-4cdf-94af-d05c120ed1ef.
  • <authentication-type>: Defina como DATABRICKS quando uma cadeia de caracteres de identificador de compartilhamento no formato <cloud>:<region>:<uuid> é fornecida para <sharing-identifier>.
databricks recipients create <recipient-name> <authentication-type> --sharing-code <sharing-identifier>

Você também pode adicionar propriedades personalizadas para o destinatário. Para obter detalhes, consulte Gerenciar propriedades do destinatário.

O destinatário é criado usando o authentication_type de DATABRICKS.

Passos seguintes