Compartilhar via


Esquema YAML do modelo de implantação da CLI (v2)

APPLIES TO:CLI do Azure ml extension v2 (atual)

O esquema JSON de origem pode ser encontrado em https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json.

Observação

A sintaxe YAML detalhada neste documento baseia-se no esquema JSON da última versão da extensão de ML da CLI v2. Essa sintaxe só tem a garantia de funcionar com a última versão da extensão de ML da CLI v2. Encontre os esquemas para as versões mais antigas da extensão em https://azuremlschemasprod.azureedge.net/.

Sintaxe YAML

Key Tipo Description Valores permitidos Valor padrão
$schema cadeia O esquema YAML. Se você usar a extensão Azure Machine Learning VS Code para criar o arquivo YAML, incluindo $schema na parte superior do arquivo, você poderá invocar o esquema e as conclusões de recursos.
name cadeia Obrigatório Nome do modelo de implantação.
version cadeia de caracteres ou inteiro Versão do modelo de implantação.
description cadeia Descrição do modelo de implantação.
tags objeto Dicionário de marcas para o modelo de implantação.
type cadeia Tipo do modelo de implantação.
deployment_template_type cadeia Obrigatório O tipo de modelo de implantação. "Gerenciado" é o único valor permitido no momento.
environment cadeia Obrigatório O ambiente a ser usado para o modelo de implantação. Esse valor deve ser uma referência a um ambiente com versão existente em um registro. Use a azureml://registries/<registry-name>/environments/<environment-name>/versions/<version> sintaxe.

Nota: Não há suporte para ambientes com escopo de workspace (usando azureml:<name>:<version> sintaxe) e definições de ambiente embutido para modelos de implantação.
environment_variables objeto Dicionário de pares chave-valor variáveis de ambiente a serem definidos para a implantação. Você pode acessar essas variáveis de ambiente de seus scripts de pontuação.
instance_count inteiro Obrigatório O número de instâncias a serem usadas para a implantação. Especifique o valor com base na carga de trabalho esperada.
default_instance_type cadeia Obrigatório O tipo de instância padrão a ser usado ao implantar com esse modelo.
allowed_instance_types cadeia O tipo de instância permitido que pode ser usado ao implantar com esse modelo.
model_mount_path cadeia O caminho para montar o modelo no contêiner.
scoring_path cadeia Obrigatório O caminho para o ponto de extremidade de pontuação.
scoring_port inteiro Obrigatório A porta do ponto de extremidade de pontuação.
liveness_probe objeto Configurações de investigação de atividade para monitorar a integridade do contêiner regularmente. Consulte ProbeSettings para obter o conjunto de propriedades configuráveis.
readiness_probe objeto Configurações de investigação de preparação para validação se o contêiner está pronto para atender ao tráfego. Consulte ProbeSettings para obter o conjunto de propriedades configuráveis.
request_settings objeto Solicitar configurações para a implantação. Consulte RequestSettings para obter o conjunto de propriedades configuráveis.

ProbeSettings

Key Tipo Description Valor padrão
failure_threshold inteiro Quando uma investigação falha, o sistema tenta failure_threshold vezes antes de desistir. Desistir no caso de uma investigação de atividade significa que o contêiner é reiniciado. No caso de uma investigação de preparação, o contêiner é marcado como Cancelar a recuperação. O valor mínimo é 1. 30
initial_delay inteiro O número de segundos após o início do contêiner antes do início da investigação. O valor mínimo é 1. 10
method cadeia O método HTTP a ser usado para a investigação.
path cadeia O caminho para a investigação.
period inteiro Com que frequência (em segundos) executar a investigação. 10
port inteiro A porta a ser sondada.
scheme cadeia O esquema a ser usado para a investigação (por exemplo, HTTP ou HTTPS).
success_threshold inteiro O mínimo de sucessos consecutivos para que a investigação seja considerada bem-sucedida após apresentar falha. O valor mínimo é 1. 1
timeout inteiro O número de segundos após o qual a sonda atinge o tempo limite. O valor mínimo é 1. 2

RequestSettings

Key Tipo Description Valor padrão
request_timeout_ms inteiro O tempo limite da solicitação em milissegundos. 5000
max_concurrent_requests_per_instance inteiro O número máximo de solicitações simultâneas por instância permitidas para a implantação. 1

Observações

Os modelos de implantação fornecem uma configuração reutilizável para implantar modelos. Eles definem o ambiente, as configurações de infraestrutura e as configurações de investigação que podem ser aplicadas ao criar implantações.

Exemplos

Os exemplos são mostrados abaixo.

YAML: básico

$schema: https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json
name: my-deployment-template
version: 1
description: Basic deployment template example
deployment_template_type: Managed
environment: azureml://registries/my-registry/environments/my-environment/versions/1
instance_count: 1
default_instance_type: Standard_DS3_v2
scoring_path: /score
scoring_port: 5001

YAML: com variáveis de ambiente e investigações

$schema: https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json
name: my-deployment-template
version: 1
description: Deployment template with environment variables and health probes
deployment_template_type: Managed
environment: azureml://registries/azureml/environments/minimal-ubuntu20.04-py38-cpu-inference/versions/latest
environment_variables:
  MODEL_PATH: /var/azureml-app/model
  SCORING_TIMEOUT: "60"
instance_count: 3
default_instance_type: Standard_DS3_v2
scoring_path: /score
scoring_port: 8080
liveness_probe:
  initial_delay: 30
  period: 10
  timeout: 2
  success_threshold: 1
  failure_threshold: 3
readiness_probe:
  initial_delay: 10
  period: 5
  timeout: 2
  success_threshold: 1
  failure_threshold: 3
request_settings:
  request_timeout_ms: 10000
  max_concurrent_requests_per_instance: 2

YAML: com o tipo de instância permitido

$schema: https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json
name: my-deployment-template-restricted
version: 1
description: Deployment template with instance type restrictions
deployment_template_type: Managed
environment: azureml://registries/my-registry/environments/my-environment/versions/1
instance_count: 1
default_instance_type: Standard_DS3_v2
scoring_path: /score
scoring_port: 5001
allowed_instance_types: Standard_DS3_v2

YAML: com o caminho de montagem do modelo

$schema: https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json
name: my-deployment-template-custom-mount
version: 1
description: Deployment template with custom model mount path
deployment_template_type: Managed
environment: azureml://registries/my-registry/environments/my-environment/versions/1
instance_count: 1
default_instance_type: Standard_DS3_v2
scoring_path: /score
scoring_port: 5001
model_mount_path: /var/azureml-app/models

Próximas etapas