Conectar ao Ambiente de Execução de IA

Importante

O tempo de execução da IA para tarefas de nó único está em Pré-visualização Pública. A API de treino distribuída para cargas de trabalho multi-GPU permanece em Beta.

Este artigo descreve como se ligar ao AI Runtime a partir de cadernos interativos, tarefas agendadas e a API de Jobs.

Interativo (Blocos de Notas)

Esta é a principal forma de usar o tempo de execução da IA. Para conectar o seu notebook e configurar o ambiente:

  1. A partir de um portátil, clique no menu suspenso de computação no topo e selecione GPU Serverless.
  2. Clique no ícone Ambiente para abrir o painel lateral Ambiente .
  3. Selecione um acelerador do campo Acelerador . Para cargas de trabalho de treino distribuídas, selecione 8xH100. Consulte Opções de hardware para orientações sobre a escolha de um acelerador.
  4. Selecione Nenhum para o ambiente padrão ou AI v4 para o ambiente de IA no campo Ambiente básico .
  5. Clica em Aplicar e depois Confirma que queres aplicar o tempo de execução de IA ao ambiente do teu portátil.

Observação

A conexão com sua computação termina automaticamente após 60 minutos de inatividade.

Sugestão

Para operações que não requerem GPUs (por exemplo, clonar um repositório Git, converter formatos de dados ou análise exploratória de dados), ligue o seu portátil a um cluster de CPU para preservar os recursos da GPU.

Tarefas (Programadas)

Podes agendar notebooks que usam GPU sem servidor de forma recorrente. Consulte Criar e gerir trabalhos agendados de notebooks para obter mais detalhes.

Depois de abrir o bloco de notas que pretende utilizar:

  1. Selecione o botão Agendar no canto superior direito.
  2. Selecione Adicionar agenda.
  3. Preencha o formulário Nova agenda com o Nome do trabalho, Agenda e Computação.
  4. Selecione Criar.

Você também pode criar e agendar trabalhos a partir da IU Jobs e Pipelines. Consulte Criar um novo trabalho para obter orientação passo a passo.

Observação

Adicionar dependências usando o painel de Ambientes não é suportado para trabalhos agendados por GPU serverless. As dependências devem ser instaladas programaticamente dentro do seu notebook (por exemplo, %pip install). A recuperação automática não é suportada — se o seu trabalho falhar devido a pacotes incompatíveis, terá de corrigir e executar manualmente novamente. Para cargas de trabalho que possam exceder o tempo máximo de execução de 7 dias, implemente pontos de verificação manuais para permitir a retomada.

Pacotes de Ativos da Jobs API e Databricks

Pode criar e gerir programaticamente trabalhos de IA em tempo de execução usando a API Databricks Jobs ou Databricks Asset Bundles. Configura o tipo de computação como GPU serverless na definição do teu job ou bundle para automatizar pipelines de implementação.

O exemplo seguinte mostra uma configuração do Databricks Asset Bundle para um trabalho de IA Runtime em GPU serverless usando o ambiente base predefinido:

resources:
  jobs:
    sample_job:
      name: sample_job_h100

      trigger:
        periodic:
          interval: 1
          unit: DAYS

      parameters:
        - name: catalog
          default: ${var.catalog}
        - name: schema
          default: ${var.schema}

      environments:
        - environment_key: default
          spec:
            environment_version: '4'

      tasks:
        - task_key: notebook_task
          notebook_task:
            notebook_path: /Workspace/Users/your_email/your_notebook
          environment_key: default
          compute:
            hardware_accelerator: GPU_8xH100

Para usar o ambiente de IA Databricks em vez do ambiente base predefinido, defina base_environment o identificador de ambiente de IA (por exemplo, databricks_ai_v5 para AI v5) no ambiente spec e faça referência a partir da tarefa environment_key:

Importante

Selecionar um ambiente de IA do Databricks como ambiente base do espaço de trabalho encontra-se em Beta e requer que um administrador do espaço de trabalho ative esta opção. Veja Build para computação de GPU serverless (AI Runtime).

resources:
  jobs:
    sample_job:
      name: sample_job_aiv5_h100

      trigger:
        periodic:
          interval: 1
          unit: DAYS

      parameters:
        - name: catalog
          default: ${var.catalog}
        - name: schema
          default: ${var.schema}

      environments:
        - environment_key: aiv5
          spec:
            base_environment: databricks_ai_v5

      tasks:
        - task_key: notebook_task
          notebook_task:
            notebook_path: /Workspace/Users/your_email/your_notebook
          environment_key: aiv5
          compute:
            hardware_accelerator: GPU_8xH100