Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Cada objeto securável que registas no Unity Catalog é governado centralmente. Isto significa que o Unity Catalog gere os metadados do objeto, permitindo-lhe controlar todos os aspetos da governação, incluindo acesso, auditoria e linhagem.
No entanto, para ativos de dados como tabelas e volumes, o Unity Catalog também pode controlar a localização de armazenamento e o ciclo de vida dos ficheiros de dados subjacentes na sua conta cloud, incluindo como são organizados, otimizados e quando são eliminados. Esta distinção é o que distingue os ativos de dados geridos dos externos .
- Ativos geridos: O Unity Catalog controla tanto a governação (controlo de acessos, auditoria, linhagem) como o ciclo de vida subjacente ao armazenamento de ficheiros (otimização de ficheiros, como são organizados e quando são eliminados).
- Recursos externos: O Unity Catalog controla apenas a governação. O ciclo de vida do armazenamento subjacente dos ficheiros é controlado por si ou por um sistema externo.
Quando regista um ativo gerido no Unity Catalog, mantém a propriedade total dos seus dados. Os ficheiros de dados permanecem sempre na sua conta cloud. O Unity Catalog determina onde estão armazenados na sua conta, mas não os transfere para o Azure Databricks nem os possui.
A distinção entre gerido e externo aplica-se apenas a tabelas e volumes. Outros objetos securáveis do Unity Catalog, como vistas, modelos e funções, não têm variantes geridas e externas.
Resumo das diferenças
A tabela seguinte resume as diferenças entre ativos geridos e externos no Unity Catalog:
| Propriedade | Tabela ou volume gerido do Unity Catalog | Tabela ou volume externo |
|---|---|---|
| Local de armazenamento | Definido pelo Unity Catalog (na tua conta cloud) | Definido por ti |
| Gestão do ciclo de vida dos ficheiros | Gerido pelo Unity Catalog (otimização, organização, eliminação) | Gerido por ti |
| Comportamento ao soltar | Os ficheiros de dados são eliminados permanentemente após um período de retenção de 8 dias | Os ficheiros de dados permanecem no lugar |
| Propriedade dos dados | Sim | Sim |
Utilizações da palavra "gerir" em todo o Catálogo Unity
A palavra gerir tem múltiplos usos em todo o Catálogo Unity. Esta secção resume o significado de gerir em diferentes contextos.
Quando as pessoas dizem que um objeto é gerido pelo Unity Catalog, normalmente querem dizer que o Unity Catalog governa o acesso a ele. Isto aplica-se a todos os objetos registados do Catálogo Unity, incluindo tabelas e volumes externos.
A palavra gerida em "managed table" ou "managed volume" tem um significado mais específico: o Unity Catalog determina onde, na sua conta cloud, os ficheiros de dados subjacentes estão armazenados e controla o ciclo de vida dos ficheiros (otimização, organização e eliminação). Isto é referido como localização de armazenamento gerido. Os seus dados permanecem sempre na sua conta na cloud. O Azure Databricks não possui nem detém os seus dados.
A palavra MANAGE também aparece como um privilégio que pode atribuir a objetos do Unity Catalog. Geralmente, MANAGE permite a um utilizador atribuir ou revogar privilégios, transferir a propriedade e eliminar um objeto sem ser o proprietário. Consulte GERENCIAR.
A tabela seguinte resume estas utilizações comuns de gerir:
| Vigência | Meaning | Aplica-se a |
|---|---|---|
| "Gerido pelo Catálogo Unity" | Unity Catalog governa o acesso, a auditoria e a linhagem do objeto. | Todos os objetos registados do Catálogo Unity, incluindo tabelas e volumes externos |
| Tabela gerida ou volume gerido | O Unity Catalog também controla a localização de armazenamento subjacente (localização de armazenamento gerido) e o ciclo de vida dos dados dentro da sua conta na cloud. | Apenas tabelas e volumes |
| Localização de armazenamento gerido | Um caminho designado dentro da sua conta cloud onde o Unity Catalog armazena ficheiros de dados para tabelas e volumes geridos. Pode configurar uma localização de armazenamento gerida a nível do metastore, do catálogo ou do esquema. Consulte Especificar um local de armazenamento gerenciado no Catálogo Unity. | Apenas tabelas e volumes |
MANAGE privilégio |
Um privilégio que permite a um utilizador atribuir ou revogar privilégios, transferir a propriedade e eliminar um objeto sem ser o proprietário. Consulte GERENCIAR. | Todos os objetos securáveis do Unity Catalog |
Tabelas geridas e externas
Uma tabela gerida do Unity Catalog é uma tabela onde o Unity Catalog determina a localização de armazenamento dos ficheiros de dados subjacentes. O Unity Catalog armazena tabelas geridas na localização de armazenamento gerida definida no esquema, catálogo ou metastore que a contém. Quando deixas uma tabela gerida, o Unity Catalog elimina os ficheiros de dados subjacentes. As tabelas geridas utilizam o formato Delta ou Apache Iceberg.
Uma tabela externa é uma tabela onde se especifica a localização de armazenamento dos ficheiros de dados subjacentes. Quando retiras uma tabela externa, o Unity Catalog remove os metadados da tabela da metastore, mas os ficheiros de dados subjacentes permanecem no lugar. As tabelas externas suportam múltiplos formatos, incluindo Delta, CSV, JSON, Avro, Parquet e ORC.
Para mais informações sobre tipos de tabela, consulte Tipos de tabela do Databricks Unity Catalog.
Tanto as tabelas geridas como externas suportam leitura, escrita e criação de acesso a partir de motores externos através de APIs abertas, incluindo a API REST da Unity e o Catálogo REST Iceberg (IRC). Isto significa que as tabelas geridas não levam ao bloqueio do fornecedor. Qualquer motor que suporte estas APIs pode aceder a tabelas geridas. Consulte aceder aos dados do Databricks usando sistemas externos.
Volumes geridos e externos
Um volume gerido pelo Unity Catalog é um volume onde o Unity Catalog determina a localização de armazenamento. O Unity Catalog armazena automaticamente volumes geridos na localização de armazenamento gerido do esquema contendo dentro da sua conta cloud. Tal como nas tabelas geridas, mantém a propriedade total dos dados subjacentes. Quando se elimina um volume gerido, o Unity Catalog apaga os ficheiros de dados subjacentes.
Um volume externo é um volume onde especificas a localização de armazenamento. A localização deve ser um caminho abrangido por uma localização externa do Unity Catalog. Quando elimina um volume externo, o Unity Catalog remove a definição de volume, mas os ficheiros de dados subjacentes permanecem no lugar.
Para obter mais informações sobre volumes, consulte O que são volumes do catálogo Unity?.