Ativos gerenciados versus externos no Catálogo do Unity

Todos os objetos protegíveis registrados no Catálogo do Unity são controlados centralmente. Isso significa que o Catálogo do Unity gerencia os metadados do objeto, permitindo que ele controle todos os aspectos da governança, incluindo acesso, auditoria e linhagem.

No entanto, para ativos de dados como tabelas e volumes, o Catálogo do Unity também pode controlar o local de armazenamento e o ciclo de vida dos arquivos de dados subjacentes em sua conta de nuvem, que inclui como eles são organizados, otimizados e quando são excluídos. Essa distinção é o que separa ativos gerenciados de ativos de dados externos.

  • Ativos gerenciados: o Catálogo do Unity controla a governança (controle de acesso, auditoria, linhagem) e o ciclo de vida de armazenamento de arquivos subjacente (otimização de arquivo, como eles são organizados e quando são excluídos).
  • Ativos externos: o Catálogo do Unity controla apenas a governança. O ciclo de vida do armazenamento de arquivos subjacente é controlado por você ou por um sistema externo.

Ao registrar um ativo gerenciado no Catálogo do Unity, você mantém a propriedade total dos dados. Os arquivos de dados sempre permanecem em sua conta de nuvem. Unity Catalog determina onde eles são armazenados dentro de sua conta, mas não os transfere para o Azure Databricks ou ser seu proprietário.

A distinção entre gerenciado e externo aplica-se somente a tabelas e volumes. Outros objetos protegíveis do Catálogo do Unity, como exibições, modelos e funções, não têm variantes gerenciadas e externas.

Resumo das diferenças

A tabela a seguir resume as diferenças entre ativos gerenciados e externos no Catálogo do Unity:

Propriedade Tabela ou volume gerenciado do Unity Catalog Tabela ou volume externo
Local de armazenamento Definido pelo Catálogo do Unity (em sua conta de nuvem) Definido por você
Gerenciamento do ciclo de vida do arquivo Gerenciado pelo Catálogo do Unity (otimização, organização, exclusão) Gerenciado por você
Comportamento de arrastar e soltar Os arquivos de dados são excluídos permanentemente após um período de retenção de 8 dias Os arquivos de dados permanecem em vigor
Propriedade dos dados Sim Sim

Usos da palavra "gerenciar" no Catálogo do Unity

A palavra gerenciar tem múltiplos usos no Unity Catalog. Esta seção resume o significado de gerenciar em contextos diferentes.

Quando as pessoas dizem que um objeto é gerenciado pelo Catálogo do Unity, normalmente significam que o Catálogo do Unity rege o acesso a ele. Isso se aplica a todos os objetos registrados do Catálogo do Unity, incluindo tabelas e volumes externos.

A palavra gerenciada em "tabela gerenciada" ou "volume gerenciado" tem um significado mais específico: o Catálogo do Unity determina onde, em sua conta de nuvem, os arquivos de dados subjacentes são armazenados e controla o ciclo de vida do arquivo (otimização, organização e exclusão). Isso é conhecido como o local de armazenamento gerenciado. Seus dados permanecem em sua conta de nuvem o tempo todo. Azure Databricks não possui nem mantém seus dados.

A palavra MANAGE também aparece como um privilégio que você pode atribuir aos objetos do Catálogo do Unity. Em geral, MANAGE permite que um usuário atribua ou revogue privilégios, transfira a propriedade e exclua um objeto sem ser o proprietário. Consulte GERENCIAR.

A tabela a seguir resume estes usos comuns de gerenciamento:

Term Meaning Aplica-se a
Gerenciado pelo Catálogo do Unity O Catálogo do Unity rege o acesso, a auditoria e a linhagem do objeto. Todos os objetos registrados do Catálogo do Unity, incluindo tabelas e volumes externos
Tabela gerenciada ou volume gerenciado O Catálogo do Unity também controla o local de armazenamento subjacente (local de armazenamento gerenciado) e o ciclo de vida de dados em sua conta de nuvem. Somente tabelas e volumes
Local de armazenamento gerenciado Um caminho designado em sua conta de nuvem em que o Catálogo do Unity armazena arquivos de dados para tabelas e volumes gerenciados. Você pode configurar um local de armazenamento gerenciado no nível de metastore, catálogo ou esquema. Consulte Especificar um local de armazenamento gerenciado no catálogo do Unity. Somente tabelas e volumes
Privilégio MANAGE Um privilégio que permite que um usuário atribua ou revogue privilégios, transfira a propriedade e exclua um objeto sem ser o proprietário. Consulte GERENCIAR. Todos os objetos protegíveis do Unity Catalog

Tabelas gerenciadas e externas

Uma tabela gerenciada do Catálogo do Unity é uma tabela em que o Catálogo do Unity determina o local de armazenamento dos arquivos de dados subjacentes. O Unity Catalog armazena as tabelas gerenciadas no local de armazenamento gerenciado definido no esquema, catálogo ou metastore que os contém. Quando você descarta uma tabela gerenciada, o Catálogo do Unity exclui os arquivos de dados subjacentes. As tabelas gerenciadas usam o formato Delta ou Apache Iceberg.

Uma tabela externa é uma tabela em que você especifica o local de armazenamento para os arquivos de dados subjacentes. Quando você descarta uma tabela externa, o Catálogo do Unity remove os metadados da tabela do metastore, mas os arquivos de dados subjacentes permanecem no local. As tabelas externas dão suporte a vários formatos, incluindo Delta, CSV, JSON, Avro, Parquet e ORC.

Para obter mais informações sobre tipos de tabela, consulte os tipos de tabela do Catálogo do Databricks Unity.

As tabelas gerenciadas e externas dão suporte à leitura, gravação e criação de acesso de mecanismos externos por meio de APIs abertas, incluindo a API REST do Unity e o Catálogo REST do Iceberg (IRC). Isso significa que as tabelas gerenciadas não causam o bloqueio do fornecedor. Qualquer mecanismo que dê suporte a essas APIs pode acessar tabelas gerenciadas. Confira Acessar os dados do Databricks usando sistemas externos.

Volumes gerenciados e externos

Um volume gerenciado do Catálogo do Unity é um volume em que o Catálogo do Unity determina o local de armazenamento. Unity Catalog armazena automaticamente volumes gerenciados no local de armazenamento gerenciado do esquema contido em sua conta de nuvem. Assim como acontece com as tabelas gerenciadas, você mantém a propriedade total dos dados subjacentes. Quando você descarta um volume gerenciado, o Catálogo do Unity exclui os arquivos de dados subjacentes.

Um volume externo é um volume em que você especifica o local de armazenamento. O local deve ser um caminho abrangido por um local externo no Unity Catalog. Quando você descarta um volume externo, o Catálogo do Unity remove a definição de volume, mas os arquivos de dados subjacentes permanecem em vigor.

Para obter mais informações sobre volumes, consulte O que são volumes do Catálogo do Unity?.