Compartilhar via


Utilize tags para atribuir e acompanhar o uso

Este artigo explica como usar marcas para atribuir o uso de computação a workspaces, equipes, projetos ou usuários específicos para dar suporte ao controle de custos e ao orçamento.

Há dois tipos de marcas:

  • Marcas padrão: aplicadas automaticamente pelo Databricks aos recursos implantados na nuvem. Eles fornecem metadados básicos, como fornecedor, ID de cluster e criador.
  • Marcas personalizadas: marcas definidas pelo usuário que você pode adicionar a recursos de computação e cargas de trabalho sem servidor. Elas permitem acompanhamento granular, relatórios e orçamento.

Aviso

Os dados da etiqueta são armazenados como texto simples e podem ser replicados globalmente. Não use nomes de marca, valores ou descritores que possam comprometer a segurança de seus recursos. Por exemplo, não use nomes de marca, valores ou descritores que contenham informações pessoais ou confidenciais.

Marcas padrão

Azure Databricks adiciona automaticamente marcas padrão aos recursos de computação implantados em sua conta de nuvem. Essas marcas atribuem o uso ao Databricks e fornecem informações básicas sobre o recurso, como seu nome, ID e criador.

As marcas padrão são propagadas automaticamente para relatórios detalhados de análise de custo que você pode acessar no portal Azure.

Aqui está um relatório de detalhes da fatura de análise de custos no portal Azure que detalha o custo por etiqueta clusterid durante um período de um mês:

Análise de custo por ID de cluster

Chaves e valores padrão de tag

Azure Databricks adiciona as seguintes marcas padrão aos recursos de computação:

Chave da marca Valor
Vendor Valor constante: Databricks
ClusterId Azure Databricks ID interno do cluster
ClusterName Nome do cluster
Creator Nome de usuário (endereço de email) do usuário que criou o cluster
RunName Nome do trabalho (só se propaga na computação de trabalhos). Se você usar a API de Jobs 2.0, é equivalente a run_name. Na API de Trabalhos 2.1, é a task_key.
JobId ID do trabalho (só se propaga na computação de trabalhos)

A computação usada pela criação de perfil de dados inclui estas marcas adicionais:

Chave da marca Valor
LakehouseMonitoring verdadeiro
LakehouseMonitoringTableId ID da tabela monitorada
LakehouseMonitoringWorkspaceId ID do workspace em que o monitor foi criado
LakehouseMonitoringMetastoreId ID do metastore em que a tabela monitorada existe

Azure Databricks adiciona as seguintes tags padrão aos pools e aos recursos de computação criados por eles.

Chave da marca Valor
Vendor Valor constante: Databricks
DatabricksInstancePoolCreatorId Azure Databricks ID interna do usuário que criou o pool
DatabricksInstancePoolId Azure Databricks ID interno do pool

Tags personalizadas

As marcas personalizadas permitem atribuir o uso de computação a equipes, projetos ou centros de custo específicos com mais granularidade do que as marcas padrão. Essas tags são aplicadas por usuários ou administradores e propagam-se tanto para os logs de uso da sua conta quanto para os recursos de nuvem aplicáveis. Essas tags também são usadas para criar e monitorar orçamentos na sua conta Azure Databricks.

Recursos com suporte para etiquetas personalizadas

Objeto Interface do usuário de marcação Interface de marcação (API)
Espaço de trabalho portal do Azure API Azure Resources
piscina Interface de pools no ambiente de trabalho do Azure Databricks API do pool de instâncias
Computação de trabalho e para todos os fins Interface do usuário de computação no workspace Azure Databricks API de Clusters
SQL Warehouse Interface de usuário do SQL Warehouse no espaço de trabalho Azure Databricks API de warehouses
Instância do banco de dados Interface de usuário da instância de banco de dados no Azure Databricks workspace API de instâncias de banco de dados
Projeto de dimensionamento automático do Lakebase Aplicativo Lakebase no espaço de trabalho do Azure Databricks Postgres API

Aviso

Não atribua uma etiqueta personalizada com a chave Name a um cluster. Cada cluster tem uma marca Name cujo valor é definido por Azure Databricks. Se você alterar o valor associado à chave Name, o cluster não poderá mais ser acompanhado por Azure Databricks. Como consequência, o cluster pode não ser encerrado depois de ficar ocioso e continuará a incorrer em custos de uso.

Marcar cargas de trabalho de computação sem servidor

Importante

Esse recurso está em uma visualização pública.

Para atribuir o uso de computação sem servidor a usuários, grupos ou projetos, você pode usar políticas de uso sem servidor. Quando um usuário recebe uma política de uso sem servidor, seu uso é automaticamente marcado com as tags personalizadas de sua política. As políticas de uso sem servidor podem ser aplicadas a notebooks, trabalhos, pipelines e pontos de extremidade de serviço sem servidor.

Observação

O uso de computação sem servidor é registrado na tabela do sistema de uso faturável da sua conta. Os relatórios de uso de DBU herdados não incluem uso sem servidor ou marcas de política para uso sem servidor.

Consulte o uso de atributos com políticas de uso sem servidor.

Propagação de etiquetas

Tags de workspace, pool e cluster são agregadas por Azure Databricks e propagadas para VMs do Azure para relatórios de análise de custos. Mas as marcas de pool e cluster são propagadas de forma diferente entre si.

Marcas de workspace e pool são agregadas e atribuídas como marcas de recurso das VMs Azure que hospedam os pools.

Tags de workspace e de cluster são agregadas e atribuídas como tags de recurso das VMs do Azure que hospedam os clusters.

Quando clusters são criados a partir de pools, somente as etiquetas de workspace e as etiquetas de pool são propagadas para as VMs. As marcas de cluster não são propagadas para preservar o desempenho de inicialização do cluster de pool.

Resolução de conflitos de marcas

Quando uma marca personalizada (workspace, cluster ou marca de pool) tem o mesmo nome de chave que uma marca padrão Azure Databricks, a marca personalizada é automaticamente prefixada com x_ durante a propagação. A tag padrão do Azure Databricks mantém seu nome de chave original.

Por exemplo, Azure Databricks aplica uma marca de cluster padrão vendor = Databricks a todos os clusters. Se você adicionar uma marca de workspace personalizada vendor = Azure Databricks, isso entrará em conflito com a marca padrão vendor. Quando propagada para Azure, a marca de workspace personalizada torna-se x_vendor = Azure Databricks, enquanto a marca de Azure Databricks padrão permanece como vendor = Databricks.

Aviso

Tags personalizadas conflitantes adicionadas por meio de políticas de computação não podem ser resolvidas, resultando na falha do cluster ou pool com um erro de configuração inválida. Verifique se as políticas de computação não adicionam nomes de marca conflitantes.

Imposição de marca

Para impor o uso de marcas personalizadas específicas, você pode usar políticas de processamento. Confira Imposição de marca personalizada. Para impor marcas personalizadas em cargas de trabalho de computação sem servidor, use políticas de uso sem servidor.

Limitações

  • Pode levar até uma hora para que tags personalizadas do espaço de trabalho sejam propagadas para o Azure Databricks após qualquer alteração.
  • Não é possível atribuir mais de 50 tags a um recurso do Azure. Se a contagem geral de marcas agregadas exceder esse limite, as marcas prefixadas com x_ serão avaliadas em ordem alfabética e aquelas que excederem o limite serão ignoradas. Se todas as marcas prefixadas com x_ forem ignoradas e a contagem estiver acima do limite, as marcas restantes serão avaliadas em ordem alfabética e aquelas que excederem o limite serão ignoradas.
  • As chaves e valores de tag só podem conter letras, espaços, números ou os caracteres +, -, =, ._, :, , /, . @ As tags que contêm outros caracteres são inválidas. Essas restrições de caractere são definidas por Azure Resource Manager.
  • Se você alterar os nomes ou os valores de chave de marca, essas alterações serão aplicadas somente após a reinicialização do cluster ou a expansão do pool.
  • Se as marcas personalizadas do cluster entrarem em conflito com as marcas personalizadas de um pool, o cluster não poderá ser criado.
  • Tags de workspace recém-adicionadas, modificadas ou excluídas não são disseminadas automaticamente para os recursos de computação existentes. Para propagar novas tags, abra a página de detalhes do recurso de computação, clique em Editar e, em seguida, Confirmar e reiniciar.