Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
APLICA-SE A:
CLI do Azure ml de extensão v2 (atual)
O esquema JSON de origem pode ser encontrado em https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json.
Observação
A sintaxe YAML detalhada neste documento é baseada no esquema JSON para a versão mais recente da extensão ML CLI v2. Esta sintaxe é garantida apenas para funcionar com a versão mais recente da extensão ML CLI v2. Você pode encontrar os esquemas para versões de extensão mais antigas em https://azuremlschemasprod.azureedge.net/.
Sintaxe YAML
| Key | Tipo | Description | Valores permitidos | Valor predefinido |
|---|---|---|---|---|
$schema |
cadeia (de caracteres) | O esquema YAML. Se usar a extensão Azure Machine Learning VS Code para criar o ficheiro YAML, incluir $schema no topo do seu ficheiro permite-lhe invocar completas de esquemas e recursos. |
||
name |
cadeia (de caracteres) | Required. Nome do modelo de implantação. | ||
version |
Cadeia ou inteiro | Versão do modelo de implantação. | ||
description |
cadeia (de caracteres) | Descrição do modelo de implementação. | ||
tags |
objecto | Dicionário de etiquetas para o modelo de implementação. | ||
type |
cadeia (de caracteres) | Tipo de modelo de implementação. | ||
deployment_template_type |
cadeia (de caracteres) | Required. O tipo de modelo de implementação. "Gerido" é o único valor atualmente permitido. | ||
environment |
cadeia (de caracteres) | Required. O ambiente a usar para o modelo de implementação. Este valor deve ser uma referência a um ambiente versionado existente num registo. Usa a azureml://registries/<registry-name>/environments/<environment-name>/versions/<version> sintaxe. Nota: Ambientes com âmbito de espaço de trabalho (usando azureml:<name>:<version> sintaxe) e definições de ambientes inline não são suportados para templates de implementação. |
||
environment_variables |
objecto | Dicionário de pares chave-valor variável de ambiente a definir para a implementação. Podes aceder a estas variáveis de ambiente através dos teus scripts de pontuação. | ||
instance_count |
número inteiro | Required. O número de instâncias a serem usadas para a implantação. Especifica o valor com base na carga de trabalho que esperas. | ||
default_instance_type |
cadeia (de caracteres) | Required. O tipo de instância padrão a usar ao implementar com este modelo. | ||
allowed_instance_types |
cadeia (de caracteres) | O tipo de instância permitido que pode ser usado ao implementar com este modelo. | ||
model_mount_path |
cadeia (de caracteres) | O caminho para montar o modelo no contentor. | ||
scoring_path |
cadeia (de caracteres) | Required. O caminho para o ponto final de pontuação. | ||
scoring_port |
número inteiro | Required. A porta para o endpoint de pontuação. | ||
liveness_probe |
objecto | Configurações de sonda de vivacidade para monitorizar regularmente o estado do recipiente. Consulte ProbeSettings para o conjunto de propriedades configuráveis. | ||
readiness_probe |
objecto | Definições da sonda de prontidão para validar se o contentor está pronto para servir tráfego. Consulte ProbeSettings para o conjunto de propriedades configuráveis. | ||
request_settings |
objecto | Configurações de solicitação para a implantação. Consulte RequestSettings para o conjunto de propriedades configuráveis. |
ProbeSettings
| Key | Tipo | Description | Valor predefinido |
|---|---|---|---|
failure_threshold |
número inteiro | Quando uma sonda falha, o sistema tenta failure_threshold várias vezes antes de desistir. Desistir no caso de uma sonda de vivacidade significa que o contentor é reiniciado. No caso de uma sonda de prontidão, o contentor está marcado como Não Pronto. O valor mínimo é 1. |
30 |
initial_delay |
número inteiro | O número de segundos após o contentor ter começado antes de a sonda ser iniciada. O valor mínimo é 1. |
10 |
method |
cadeia (de caracteres) | O método HTTP a usar para a sonda. | |
path |
cadeia (de caracteres) | O caminho para a sonda. | |
period |
número inteiro | Com que frequência (em segundos) realizar a sonda. | 10 |
port |
número inteiro | O porto para sondar. | |
scheme |
cadeia (de caracteres) | O esquema a usar para a sonda (por exemplo, HTTP ou HTTPS). | |
success_threshold |
número inteiro | O número mínimo de sucessos consecutivos para que a sonda seja considerada bem-sucedida após ter falhado. O valor mínimo é 1. |
1 |
timeout |
número inteiro | O número de segundos após os quais a sonda termina o tempo. O valor mínimo é 1. |
2 |
RequestSettings
| Key | Tipo | Description | Valor predefinido |
|---|---|---|---|
request_timeout_ms |
número inteiro | O tempo limite do pedido em milissegundos. | 5000 |
max_concurrent_requests_per_instance |
número inteiro | O número máximo de pedidos concorrentes por instância permitido para a implementação. | 1 |
Observações
Os modelos de implementação fornecem uma configuração reutilizável para a implementação de modelos. Definem o ambiente, as definições da infraestrutura e as configurações das sondas que podem ser aplicadas na criação de implementações.
Examples
Seguem-se alguns exemplos.
YAML: básico
$schema: https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json
name: my-deployment-template
version: 1
description: Basic deployment template example
deployment_template_type: Managed
environment: azureml://registries/my-registry/environments/my-environment/versions/1
instance_count: 1
default_instance_type: Standard_DS3_v2
scoring_path: /score
scoring_port: 5001
YAML: com variáveis do ambiente e sondas
$schema: https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json
name: my-deployment-template
version: 1
description: Deployment template with environment variables and health probes
deployment_template_type: Managed
environment: azureml://registries/azureml/environments/minimal-ubuntu20.04-py38-cpu-inference/versions/latest
environment_variables:
MODEL_PATH: /var/azureml-app/model
SCORING_TIMEOUT: "60"
instance_count: 3
default_instance_type: Standard_DS3_v2
scoring_path: /score
scoring_port: 8080
liveness_probe:
initial_delay: 30
period: 10
timeout: 2
success_threshold: 1
failure_threshold: 3
readiness_probe:
initial_delay: 10
period: 5
timeout: 2
success_threshold: 1
failure_threshold: 3
request_settings:
request_timeout_ms: 10000
max_concurrent_requests_per_instance: 2
YAML: com tipo de instância permitido
$schema: https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json
name: my-deployment-template-restricted
version: 1
description: Deployment template with instance type restrictions
deployment_template_type: Managed
environment: azureml://registries/my-registry/environments/my-environment/versions/1
instance_count: 1
default_instance_type: Standard_DS3_v2
scoring_path: /score
scoring_port: 5001
allowed_instance_types: Standard_DS3_v2
YAML: com caminho de montagem do modelo
$schema: https://azuremlschemas.azureedge.net/latest/deploymentTemplate.schema.json
name: my-deployment-template-custom-mount
version: 1
description: Deployment template with custom model mount path
deployment_template_type: Managed
environment: azureml://registries/my-registry/environments/my-environment/versions/1
instance_count: 1
default_instance_type: Standard_DS3_v2
scoring_path: /score
scoring_port: 5001
model_mount_path: /var/azureml-app/models