Bibliotecas de espaços de trabalho (legado)

Importante

Esta documentação foi desativada e pode não ser atualizada. Os produtos, serviços ou tecnologias mencionados neste conteúdo não são mais suportados. Consulte Bibliotecas abrangidas por computação.

Nota

As bibliotecas de espaço de trabalho foram preteridas e não devem ser usadas. No entanto, o armazenamento de bibliotecas como arquivos de espaço de trabalho é distinto das bibliotecas de espaço de trabalho e ainda é totalmente suportado. Você pode instalar bibliotecas armazenadas como arquivos de espaço de trabalho diretamente para tarefas de computação ou trabalho.

As bibliotecas de área de trabalho servem de repositório local a partir do qual pode criar bibliotecas instaladas no cluster. Uma biblioteca de área de trabalho pode ser um código personalizado criado pela sua organização, ou pode ser uma versão particular de uma biblioteca open-source que a sua organização implementou como padrão.

Você deve instalar uma biblioteca de espaço de trabalho em um cluster antes que essa biblioteca possa ser usada em um bloco de anotações ou tarefa. Consulte Instalar uma biblioteca de espaços de trabalho em um cluster.

As bibliotecas de espaço de trabalho na pasta Compartilhada estão disponíveis para todos os usuários em um espaço de trabalho, enquanto as bibliotecas de espaço de trabalho em uma pasta de usuário estão disponíveis apenas para esse usuário.

Importante

As bibliotecas podem ser instaladas a partir do DBFS ao usar o Databricks Runtime 14.3 LTS e inferior. No entanto, qualquer usuário do espaço de trabalho pode modificar arquivos de biblioteca armazenados no DBFS. Para melhorar a segurança das bibliotecas num espaço de trabalho Azure Databricks, o armazenamento de ficheiros de biblioteca na raiz do DBFS está obsoleto e desativado por padrão no Databricks Runtime 15.1 e superiores. Veja A armazenagem de bibliotecas na raiz do DBFS está preterida e desativada por padrão.

Em vez disso, o Databricks recomenda carregar todas as bibliotecas, incluindo bibliotecas Python, ficheiros JAR e conectores Spark, para ficheiros do espaço de trabalho ou volumes do Unity Catalog. Alternativamente, pode usar repositórios de pacotes de bibliotecas. Se sua carga de trabalho não oferecer suporte a esses padrões, você também poderá usar bibliotecas armazenadas no armazenamento de objetos na nuvem.

Como as bibliotecas de espaço de trabalho diferem das bibliotecas armazenadas com arquivos de espaço de trabalho?

O termo "bibliotecas de espaço de trabalho" refere-se a qualquer biblioteca registada num espaço de trabalho. As bibliotecas de espaço de trabalho aparecem ao lado de blocos de anotações e arquivos de espaço de trabalho e seguem as regras da ACL para seu diretório de contenção.

O termo "arquivos de espaço de trabalho" refere-se a qualquer arquivo arbitrário armazenado no espaço de trabalho. Podes armazenar pacotes Python .whl como ficheiros de workspace e depois registá-los como bibliotecas workspace. Consulte O que são arquivos de espaço de trabalho?.

Você pode carregar bibliotecas como arquivos de espaço de trabalho. Consulte Uso básico de arquivos de espaço de trabalho.

Embora possa carregar muitos tipos de ficheiros para ficheiros de workspace, apenas ficheiros Python .whl podem ser instalados usando ficheiros de workspace. Consulte Bibliotecas abrangidas por computação.

No Databricks Runtime 13.3 LTS e superiores, pode usar %pip para instalar ficheiros de roda Python armazenados como ficheiros de espaço de trabalho. Veja Instalar um pacote armazenado como um ficheiro de área de trabalho com %pip.

Criar uma biblioteca de espaços de trabalho

Aviso

Esta funcionalidade já não está disponível. Consulte Criação e instalação de bibliotecas de ambiente de trabalho deixou de estar disponível.

  1. Clique com o botão direito do rato na pasta da área de trabalho onde pretende armazenar a biblioteca.
  2. Selecione Criar > Biblioteca. A caixa de diálogo Criar biblioteca é exibida.
  3. Selecione a Origem da Biblioteca e siga o procedimento apropriado:

Carregar um ficheiro Jar, Python egg ou ficheiro wheel do Python

Nota

A instalação de ficheiros egg em Python está obsoleta e será removida numa futura versão do Databricks Runtime.

Importante

As bibliotecas podem ser instaladas a partir do DBFS ao usar o Databricks Runtime 14.3 LTS e inferior. No entanto, qualquer usuário do espaço de trabalho pode modificar arquivos de biblioteca armazenados no DBFS. Para melhorar a segurança das bibliotecas num espaço de trabalho Azure Databricks, o armazenamento de ficheiros de biblioteca na raiz do DBFS está obsoleto e desativado por padrão no Databricks Runtime 15.1 e superiores. Veja A armazenagem de bibliotecas na raiz do DBFS está preterida e desativada por padrão.

Em vez disso, o Databricks recomenda carregar todas as bibliotecas, incluindo bibliotecas Python, ficheiros JAR e conectores Spark, para ficheiros do espaço de trabalho ou volumes do Unity Catalog. Alternativamente, pode usar repositórios de pacotes de bibliotecas. Se sua carga de trabalho não oferecer suporte a esses padrões, você também poderá usar bibliotecas armazenadas no armazenamento de objetos na nuvem.

  1. Na lista Fonte da biblioteca, selecione Carregar.
  2. Selecione Jar, Python Egg, ou Python Whl.
  3. Opcionalmente, insira um nome de biblioteca.
  4. Arraste o seu Jar, Egg ou Whl para a área de depósito ou clique na área de depósito e navegue até um ficheiro. O ficheiro é carregado para dbfs:/FileStore/jars.
  5. Clique em Criar. A tela de status da biblioteca é exibida.

Referenciar um ficheiro JAR, ovo Python ou Python roda carregado

Pode criar uma nova biblioteca de espaço de trabalho referenciando ficheiros JAR, ficheiros ovo de Python ou ficheiros wheel de Python armazenados na raiz do DBFS, no armazenamento de objetos na nuvem, ou com ficheiros do espaço de trabalho. Seguir esse fluxo de trabalho registra um ponteiro para uma biblioteca sem carregar ou mover arquivos.

Com o Databricks Runtime 13.2 e superior, você também pode fazer referência a um volume no Unity Catalog. Esse recurso está em Pré-visualização Pública.

Para computação com modo de acesso padrão (anteriormente modo de acesso compartilhado), você deve adicionar JARs ao allowlist. Consulte bibliotecas de Lista de Permissões e scripts de inicialização em computadores com o modo de acesso padrão (anteriormente modo de acesso compartilhado).

  1. Selecione Caminho do arquivo/ADLS na lista de fontes da biblioteca.
  2. Selecione Jar, Python Egg, ou Python Whl.
  3. Opcionalmente, insira um nome de biblioteca.
  4. Especifique o caminho para a biblioteca, como os seguintes exemplos:
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. Clique em Criar. A tela de status da biblioteca é exibida.

Para obter mais informações sobre como trabalhar com bibliotecas no armazenamento de objetos, consulte Instalar bibliotecas do armazenamento de objetos.

Para mais informações sobre ficheiros de espaço de trabalho, veja Trabalhar com ficheiros em Azure Databricks.

Instalar uma biblioteca de espaços de trabalho em um cluster

Nota

O Azure Databricks processa todas as bibliotecas de espaços de trabalho pela ordem em que foram instaladas no cluster. Talvez seja necessário prestar atenção à ordem de instalação no cluster se houver dependências entre bibliotecas.

Importante

As bibliotecas podem ser instaladas a partir do DBFS ao usar o Databricks Runtime 14.3 LTS e inferior. No entanto, qualquer usuário do espaço de trabalho pode modificar arquivos de biblioteca armazenados no DBFS. Para melhorar a segurança das bibliotecas num espaço de trabalho Azure Databricks, o armazenamento de ficheiros de biblioteca na raiz do DBFS está obsoleto e desativado por padrão no Databricks Runtime 15.1 e superiores. Veja A armazenagem de bibliotecas na raiz do DBFS está preterida e desativada por padrão.

Em vez disso, o Databricks recomenda carregar todas as bibliotecas, incluindo bibliotecas Python, ficheiros JAR e conectores Spark, para ficheiros do espaço de trabalho ou volumes do Unity Catalog. Alternativamente, pode usar repositórios de pacotes de bibliotecas. Se sua carga de trabalho não oferecer suporte a esses padrões, você também poderá usar bibliotecas armazenadas no armazenamento de objetos na nuvem.

No modo de acesso de utilizador único, é utilizada a identidade da entidade atribuída (um utilizador ou uma entidade de serviço). No modo de acesso padrão (anteriormente modo de acesso compartilhado), as bibliotecas usam a identidade do usuário que instalou a biblioteca. O modo de acesso compartilhado sem isolamento não suporta volumes, mas usa a mesma atribuição de identidade que o modo de acesso padrão.

Para ver todas as opções de instalação de bibliotecas em clusters, consulte Bibliotecas com âmbito computacional.

Para instalar uma biblioteca que já existe no espaço de trabalho, você pode iniciar a partir da interface do usuário do cluster ou da interface do usuário da biblioteca:

Aglomerado

  1. Na barra lateral, clique em ícone de computaçãoComputar.
  2. Clique num nome de cluster.
  3. Clique na guia Bibliotecas.
  4. Clique em Instalar novo.
  5. Na lista Origem da Biblioteca, selecione Biblioteca do Espaço de Trabalho.
  6. Selecione uma biblioteca de espaço de trabalho.
  7. Clique em Install (Instalar).

Biblioteca

  1. Vá para a pasta que contém a biblioteca.
  2. Clique no nome da biblioteca.
  3. Marque a caixa de seleção ao lado do cluster no qual você deseja instalar a biblioteca e clique em Instalar. Apenas os clusters em execução aparecem na lista.

Exibir detalhes da biblioteca do espaço de trabalho

Nota

As pastas de espaço de trabalho oferecem conveniência para descobrir bibliotecas de espaço de trabalho e gerenciar ACLs.

  1. Vá para a pasta de espaço de trabalho que contém a biblioteca.
  2. Clique no nome da biblioteca.

A página de detalhes da biblioteca mostra os clusters em execução e o status de instalação da biblioteca. Se a biblioteca estiver instalada, a página conterá um link para o host do pacote. Se a biblioteca foi carregada, a página exibe um link para o arquivo de pacote carregado.

Mover uma biblioteca de espaço de trabalho

Nota

As pastas de espaço de trabalho oferecem conveniência para descobrir bibliotecas de espaço de trabalho e gerenciar ACLs. Mover uma biblioteca de espaço de trabalho não move arquivos, mas pode modificar quais usuários têm acesso à biblioteca de espaço de trabalho.

  1. Vá para a pasta de espaço de trabalho que contém a biblioteca.
  2. Clique com o botão direito do mouse no nome da biblioteca e selecione Mover. Um navegador de pastas é exibido.
  3. Clique na pasta de destino.
  4. Clique em Mover.

Excluir uma biblioteca de espaço de trabalho

Importante

Antes de excluir uma biblioteca de espaço de trabalho, você deve desinstalá-la de todos os clusters.

Para eliminar uma biblioteca de área de trabalho:

  1. Mova a biblioteca para a pasta Lixeira.
  2. Exclua permanentemente a biblioteca na pasta Lixo ou esvazie a pasta Lixeira.