Ativos geridos versus externos no Catálogo Unity

Cada objeto securável que registas no Unity Catalog é governado centralmente. Isto significa que o Unity Catalog gere os metadados do objeto, permitindo-lhe controlar todos os aspetos da governação, incluindo acesso, auditoria e linhagem.

No entanto, para ativos de dados como tabelas e volumes, o Unity Catalog também pode controlar a localização de armazenamento e o ciclo de vida dos ficheiros de dados subjacentes na sua conta cloud, incluindo como são organizados, otimizados e quando são eliminados. Esta distinção é o que distingue os ativos de dados geridos dos externos .

  • Ativos geridos: O Unity Catalog controla tanto a governação (controlo de acessos, auditoria, linhagem) como o ciclo de vida subjacente ao armazenamento de ficheiros (otimização de ficheiros, como são organizados e quando são eliminados).
  • Recursos externos: O Unity Catalog controla apenas a governação. O ciclo de vida do armazenamento subjacente dos ficheiros é controlado por si ou por um sistema externo.

Quando regista um ativo gerido no Unity Catalog, mantém a propriedade total dos seus dados. Os ficheiros de dados permanecem sempre na sua conta cloud. O Unity Catalog determina onde estão armazenados na sua conta, mas não os transfere para o Azure Databricks nem os possui.

A distinção entre gerido e externo aplica-se apenas a tabelas e volumes. Outros objetos securáveis do Unity Catalog, como vistas, modelos e funções, não têm variantes geridas e externas.

Resumo das diferenças

A tabela seguinte resume as diferenças entre ativos geridos e externos no Unity Catalog:

Propriedade Tabela ou volume gerido do Unity Catalog Tabela ou volume externo
Local de armazenamento Definido pelo Unity Catalog (na tua conta cloud) Definido por ti
Gestão do ciclo de vida dos ficheiros Gerido pelo Unity Catalog (otimização, organização, eliminação) Gerido por ti
Comportamento ao soltar Os ficheiros de dados são eliminados permanentemente após um período de retenção de 8 dias Os ficheiros de dados permanecem no lugar
Propriedade dos dados Sim Sim

Utilizações da palavra "gerir" em todo o Catálogo Unity

A palavra gerir tem múltiplos usos em todo o Catálogo Unity. Esta secção resume o significado de gerir em diferentes contextos.

Quando as pessoas dizem que um objeto é gerido pelo Unity Catalog, normalmente querem dizer que o Unity Catalog governa o acesso a ele. Isto aplica-se a todos os objetos registados do Catálogo Unity, incluindo tabelas e volumes externos.

A palavra gerida em "managed table" ou "managed volume" tem um significado mais específico: o Unity Catalog determina onde, na sua conta cloud, os ficheiros de dados subjacentes estão armazenados e controla o ciclo de vida dos ficheiros (otimização, organização e eliminação). Isto é referido como localização de armazenamento gerido. Os seus dados permanecem sempre na sua conta na cloud. O Azure Databricks não possui nem detém os seus dados.

A palavra MANAGE também aparece como um privilégio que pode atribuir a objetos do Unity Catalog. Geralmente, MANAGE permite a um utilizador atribuir ou revogar privilégios, transferir a propriedade e eliminar um objeto sem ser o proprietário. Consulte GERENCIAR.

A tabela seguinte resume estas utilizações comuns de gerir:

Vigência Meaning Aplica-se a
"Gerido pelo Catálogo Unity" Unity Catalog governa o acesso, a auditoria e a linhagem do objeto. Todos os objetos registados do Catálogo Unity, incluindo tabelas e volumes externos
Tabela gerida ou volume gerido O Unity Catalog também controla a localização de armazenamento subjacente (localização de armazenamento gerido) e o ciclo de vida dos dados dentro da sua conta na cloud. Apenas tabelas e volumes
Localização de armazenamento gerido Um caminho designado dentro da sua conta cloud onde o Unity Catalog armazena ficheiros de dados para tabelas e volumes geridos. Pode configurar uma localização de armazenamento gerida a nível do metastore, do catálogo ou do esquema. Consulte Especificar um local de armazenamento gerenciado no Catálogo Unity. Apenas tabelas e volumes
MANAGE privilégio Um privilégio que permite a um utilizador atribuir ou revogar privilégios, transferir a propriedade e eliminar um objeto sem ser o proprietário. Consulte GERENCIAR. Todos os objetos securáveis do Unity Catalog

Tabelas geridas e externas

Uma tabela gerida do Unity Catalog é uma tabela onde o Unity Catalog determina a localização de armazenamento dos ficheiros de dados subjacentes. O Unity Catalog armazena tabelas geridas na localização de armazenamento gerida definida no esquema, catálogo ou metastore que a contém. Quando deixas uma tabela gerida, o Unity Catalog elimina os ficheiros de dados subjacentes. As tabelas geridas utilizam o formato Delta ou Apache Iceberg.

Uma tabela externa é uma tabela onde se especifica a localização de armazenamento dos ficheiros de dados subjacentes. Quando retiras uma tabela externa, o Unity Catalog remove os metadados da tabela da metastore, mas os ficheiros de dados subjacentes permanecem no lugar. As tabelas externas suportam múltiplos formatos, incluindo Delta, CSV, JSON, Avro, Parquet e ORC.

Para mais informações sobre tipos de tabela, consulte Tipos de tabela do Databricks Unity Catalog.

Tanto as tabelas geridas como externas suportam leitura, escrita e criação de acesso a partir de motores externos através de APIs abertas, incluindo a API REST da Unity e o Catálogo REST Iceberg (IRC). Isto significa que as tabelas geridas não levam ao bloqueio do fornecedor. Qualquer motor que suporte estas APIs pode aceder a tabelas geridas. Consulte aceder aos dados do Databricks usando sistemas externos.

Volumes geridos e externos

Um volume gerido pelo Unity Catalog é um volume onde o Unity Catalog determina a localização de armazenamento. O Unity Catalog armazena automaticamente volumes geridos na localização de armazenamento gerido do esquema contendo dentro da sua conta cloud. Tal como nas tabelas geridas, mantém a propriedade total dos dados subjacentes. Quando se elimina um volume gerido, o Unity Catalog apaga os ficheiros de dados subjacentes.

Um volume externo é um volume onde especificas a localização de armazenamento. A localização deve ser um caminho abrangido por uma localização externa do Unity Catalog. Quando elimina um volume externo, o Unity Catalog remove a definição de volume, mas os ficheiros de dados subjacentes permanecem no lugar.

Para obter mais informações sobre volumes, consulte O que são volumes do catálogo Unity?.