Implante um modelo em um cluster do serviço de Kubernetes do Azure com v1

Importante

Este artigo fornece informações sobre a utilização do Azure Machine Learning SDK v1. O SDK v1 foi preterido a partir de 31 de março de 2025. O apoio terminará em 30 de junho de 2026. Você pode instalar e usar o SDK v1 até essa data. Seus fluxos de trabalho existentes usando o SDK v1 continuarão a operar após a data de fim do suporte. No entanto, eles podem estar expostos a riscos de segurança ou alterações disruptivas no caso de alterações arquitetônicas no produto.

Recomendamos a transição para o SDK v2 antes de 30 de junho de 2026. Para mais informações sobre o SDK v2, veja O que é Azure Machine Learning CLI e Python SDK v2? e a referência SDK v2.

Importante

Este artigo explica como usar o Azure Machine Learning CLI (v1) e o Azure Machine Learning SDK para Python (v1) para implementar um modelo. Para obter a abordagem recomendada para v2, consulte Desenvolver e pontuar um modelo de aprendizagem automática usando um ponto de extremidade online.

Aprenda a usar o Azure Machine Learning para implementar um modelo como serviço web no Azure Kubernetes Service (AKS). O AKS é bom para implantações de produção em alta escala. Use o AKS se precisar de um ou mais dos seguintes recursos:

Tempo de resposta rápido
Dimensionamento automático do serviço implantado
Registo
Modelo de recolha de dados
Authentication
Terminação TLS
Opções de aceleração de hardware, como GPU e FPGA (field-programmable gate arrays)

Ao implantar no AKS, você implanta em um cluster AKS conectado ao seu espaço de trabalho. Para informações sobre como ligar um cluster AKS ao seu espaço de trabalho, veja Criar e anexar um cluster Azure Kubernetes Service.

Importante

Recomendamos que você depure localmente antes de implantar no serviço Web. Para obter mais informações, consulte Solução de problemas com uma implantação de modelo local.

Nota

O Azure Machine Learning Endpoints (v2) proporciona uma experiência de implementação melhorada e mais simples. Os endpoints suportam cenários de inferência em tempo real e em lote. Os endpoints fornecem uma interface unificada para invocar e gerenciar implantações de modelo em todos os tipos de computação. Veja Quais são Azure Machine Learning endpoints?.

Pré-requisitos

Um espaço de trabalho de Azure Machine Learning. Para mais informações, consulte Criar um espaço de trabalho Azure Machine Learning.
Um modelo de aprendizagem automática registado na sua área de trabalho. Se não tiver um modelo registado, veja Deploy machine learning models to Azure.
A extensão Azure CLI (v1) para o serviço de Machine Learning, Azure Machine Learning Python SDK, ou a extensão do Azure Machine Learning para o Visual Studio Code.

Importante

Alguns dos comandos Azure CLI neste artigo utilizam a extensão azure-cli-ml, ou v1, para Azure Machine Learning. O suporte para CLI v1 terminou em 30 de setembro de 2025. A Microsoft deixará de fornecer suporte técnico ou atualizações para este serviço. Seus fluxos de trabalho existentes usando a CLI v1 continuarão a operar após a data de fim do suporte. No entanto, eles podem estar expostos a riscos de segurança ou alterações disruptivas no caso de alterações arquitetônicas no produto.

Recomendamos que você faça a transição para a mlextensão , ou v2, o mais rápido possível. Para mais informações sobre a extensão v2, veja Azure Machine Learning extensão CLI e Python SDK v2.
Os excertos de código em Python neste artigo assumem que as seguintes variáveis estão definidas:
- ws - Defina o seu espaço de trabalho.
- model - Ajuste para o seu modelo registado.
- inference_config - Defina a configuração de inferência do modelo.
Para obter mais informações sobre como definir essas variáveis, consulte Como e onde implantar modelos.
Os trechos da CLI neste artigo pressupõem que você já criou um documento inferenceconfig.json . Para mais informações sobre a criação deste documento, consulte Deploy machine learning models to Azure.
Um cluster AKS conectado ao seu espaço de trabalho. Para mais informações, consulte Criar e anexar um cluster de Azure Kubernetes Service.
- Se você quiser implantar modelos em nós de GPU ou nós FPGA (ou qualquer produto específico), deverá criar um cluster com o produto específico. Não há suporte para criar um pool de nós secundários em um cluster existente e implantar modelos no pool de nós secundários.

Compreender os processos de implantação

A palavra deployment é usada tanto no Kubernetes como no Azure Machine Learning. A implantação tem significados diferentes nesses dois contextos. No Kubernetes, uma implantação é uma entidade concreta, especificada com um arquivo YAML declarativo. Uma implantação do Kubernetes tem um ciclo de vida definido e relacionamentos concretos com outras entidades do Kubernetes, como Pods e ReplicaSets. Você pode aprender sobre o Kubernetes em documentos e vídeos em O que é o Kubernetes?.

No Azure Machine Learning, a implementação é usada no sentido mais geral de disponibilizar e limpar os recursos do seu projeto. Os passos que o Azure Machine Learning considera parte da implementação são:

Compactar os arquivos na pasta do projeto, ignorando os especificados em .amlignore ou .gitignore
Dimensionando seu cluster de computação (relacionado ao Kubernetes)
Construindo ou baixando o Dockerfile no nó de computação (relacionado ao Kubernetes)
1. O sistema calcula um hash de:
  - A imagem base
  - Etapas personalizadas do docker (consulte Implantar um modelo usando uma imagem base personalizada do Docker)
  - A definição conda YAML (ver Criar e usar ambientes de desenvolvimento em Azure Machine Learning)
2. O sistema utiliza este hash como chave numa pesquisa do workspace Azure Container Registry (ACR)
3. Se não for encontrado, procura um correspondente no ACR global
4. Se não for encontrado, o sistema cria uma nova imagem que é armazenada em cache e enviada para o ACR do espaço de trabalho
Baixando seu arquivo de projeto compactado para armazenamento temporário no nó de computação
Descompactando o arquivo de projeto
O nó de computação em execução python <entry script> <arguments>
Salvar logs, arquivos de modelo e outros arquivos gravados em ./outputs na conta de armazenamento associada ao espaço de trabalho
Redução da computação, incluindo a remoção de armazenamento temporário (relacionado ao Kubernetes)

Azure Machine Learning router

O componente front-end (azureml-fe) que roteia solicitações de inferência de entrada para serviços implantados é dimensionado automaticamente conforme necessário. O dimensionamento do azureml-fe é baseado na finalidade e no tamanho do cluster AKS (número de nós). A finalidade e os nós do cluster são configurados quando você cria ou anexa um cluster AKS. Há um serviço azureml-fe por cluster, que pode ser executado em vários pods.

Importante

Ao usar um cluster configurado como dev-test, o autodimensionador é desabilitado. Mesmo para clusters FastProd/DenseProd, o Self-Scaler só é ativado quando a telemetria mostra que é necessário.
O Azure Machine Learning não carrega nem armazena automaticamente logs de nenhum contentor, incluindo containers do sistema. Para uma depuração abrangente, é recomendável habilitar o Container Insights para seu cluster AKS. Isto permite-lhe guardar, gerir e partilhar registos de contentores com a equipa do Azure Machine Learning quando necessário. Sem isto, o Azure Machine Learning não pode garantir suporte para questões relacionadas com o azureml-fe.
A carga útil máxima da solicitação é de 100MB.

Azureml-fe escalona verticalmente para usar mais núcleos e horizontalmente para usar mais pods. Ao tomar a decisão de aumentar a escala, o tempo necessário para rotear as solicitações de inferência de entrada é usado. Se esse tempo exceder o limite, ocorrerá uma expansão. Se o tempo para encaminhar as solicitações de entrada continuar excedendo o limiar, ocorrerá um escalonamento horizontal.

Ao reduzir a escala e concentrar internamente, utiliza-se a capacidade da CPU. Se o limite de uso da CPU for atingido, o front-end será reduzido primeiro. Se o uso da CPU cair para o limite de redução de escala, ocorrerá uma operação de redução de escala. A expansão e redução só ocorre se houver recursos de cluster suficientes disponíveis.

Quando se escala para cima ou para baixo, os pods azureml-fe são reiniciados para aplicar as alterações de CPU/memória. As reinicializações não afetam as solicitações de inferência.

Entender os requisitos de conectividade para o cluster de inferência do AKS

Quando o Azure Machine Learning cria ou anexa um cluster AKS, o cluster AKS é implementado com um dos seguintes dois modelos de rede:

Rede Kubenet: Os recursos de rede são normalmente criados e configurados à medida que o cluster AKS é implantado.
Rede Azure Container Networking Interface (CNI): O cluster AKS está ligado a um recurso e configurações de rede virtual existentes.

Para redes Kubenet, a rede é criada e configurada corretamente para o serviço Azure Machine Learning. Para a rede CNI, é necessário compreender os requisitos de conectividade e garantir a resolução de DNS e a conectividade de saída para a inferência em AKS. Por exemplo, você pode estar usando um firewall para bloquear o tráfego de rede.

O diagrama a seguir mostra os requisitos de conectividade para inferência AKS. As setas pretas representam a comunicação real e as setas azuis representam os nomes de domínio. Talvez seja necessário adicionar entradas para esses hosts ao firewall ou ao servidor DNS personalizado.

Diagrama que mostra os requisitos de conectividade para inferência AKS.

Para requisitos gerais de conectividade do AKS, veja Limitar o tráfego de rede com Azure Firewall no AKS.

Para aceder a Azure Machine Learning serviços atrás de um firewall, veja Configurar tráfego de rede de entrada e saída.

Requisitos gerais de resolução de DNS

A resolução de DNS dentro de uma rede virtual existente está sob seu controle. Por exemplo, um firewall ou servidor DNS personalizado. Os seguintes hosts devem estar acessíveis:

Nome do anfitrião	Utilizado por
`<cluster>.hcp.<region>.azmk8s.io`	Servidor da API do AKS
`mcr.microsoft.com`	Microsoft Container Registry (MCR)
`<ACR name>.azurecr.io`	O seu Azure Container Registry (ACR)
`<account>.table.core.windows.net`	Azure Storage Account (armazenamento de tabelas)
`<account>.blob.core.windows.net`	Azure Storage Account (armazenamento de blob)
`api.azureml.ms`	Autenticação Microsoft Entra
`ingest-vienna<region>.kusto.windows.net`	Ponto final do Kusto para carregar telemetria
`<leaf-domain-label + auto-generated suffix>.<region>.cloudapp.azure.com`	Nome de domínio do endpoint, caso tenha sido gerado automaticamente com o Azure Machine Learning. Se utilizou um nome de domínio personalizado, não precisará desta entrada.

Requisitos de conectividade por ordem cronológica

No processo de criação ou ligação do AKS, o router Azure Machine Learning (azureml-fe) é implementado no cluster AKS. Para implementar um encaminhador do Azure Machine Learning, o nó do AKS deve ser capaz de:

Resolução de DNS para servidor de API do AKS
Resolva o DNS para o MCR a fim de transferir imagens do Docker para o router de Azure Machine Learning
Descarregue imagens do MCR, onde é necessário ter conectividade externa

Logo após a implantação do azureml-fe, ele tenta iniciar e isso requer que você:

Resolução de DNS para servidor de API do AKS
Consulte o servidor da API do AKS para descobrir outras instâncias do serviço (é um serviço multi-pod)
Conecte-se a outras instâncias dele próprio

Uma vez iniciado o azureml-fe, ele requer a seguinte conectividade para funcionar corretamente:

Ligue-se ao Azure Storage para descarregar a configuração dinâmica
Resolve o DNS para o servidor de autenticação da Microsoft Entra api.azureml.ms e comunique-se com ele quando o serviço implementado estiver a utilizar autenticação da Microsoft Entra.
Consulte o servidor da API do AKS para descobrir modelos implantados
Comunique-se com PODs de modelo implementados

No momento da implantação do modelo, para uma implantação bem-sucedida do modelo, o nó AKS deve ser capaz de:

Gestão de DNS para ACR do cliente
Download de imagens do ACR do cliente
Resolver DNS nos BLOBs do Azure onde o modelo está armazenado
Descarregue modelos a partir dos BLOBs do Azure

Depois que o modelo é implantado e o serviço é iniciado, o azureml-fe o descobre automaticamente usando a API do AKS e está pronto para rotear a solicitação para ele. Deve ser capaz de comunicar com modelos POD.

Nota

Se o modelo implantado exigir qualquer conectividade (por exemplo, consultar banco de dados externo ou outro serviço REST ou baixar um BLOB), a resolução DNS e a comunicação de saída para esses serviços deverão ser habilitadas.

Implementar para AKS

Para implantar um modelo no AKS, crie uma configuração de implantação que descreva os recursos de computação necessários. Por exemplo, o número de núcleos e memória. Você também precisa de uma configuração de inferência, que descreve o ambiente necessário para hospedar o modelo e o serviço Web. Para obter mais informações sobre como criar a configuração de inferência, consulte Como e onde implantar modelos.

Nota

O número de modelos a implementar está limitado a 1000 modelos por implementação (por contentor).

APLICA-SE A: Azure Machine Learning SDK v1 para Python

from azureml.core.webservice import AksWebservice, Webservice
from azureml.core.model import Model
from azureml.core.compute import AksCompute

aks_target = AksCompute(ws,"myaks")
# If deploying to a cluster configured for dev/test, ensure that it was created with enough
# cores and memory to handle this deployment configuration. Note that memory is also used by
# things such as dependencies and Azure Machine Learning components.
deployment_config = AksWebservice.deploy_configuration(cpu_cores = 1, memory_gb = 1)
service = Model.deploy(ws, "myservice", [model], inference_config, deployment_config, aks_target)
service.wait_for_deployment(show_output = True)
print(service.state)
print(service.get_logs())

Para obter mais informações sobre as classes, métodos e parâmetros usados neste exemplo, consulte os seguintes documentos de referência:

APLICA-SE A: Extensão Azure CLI ML v1

Para implantar usando a CLI, use o seguinte comando. Substitua myaks pelo nome do destino de computação AKS. Substitua mymodel:1 pelo nome e versão do modelo registado. Substitua myservice pelo nome para dar este serviço:

az ml model deploy --ct myaks -m mymodel:1 -n myservice --ic inferenceconfig.json --dc deploymentconfig.json

As entradas no documento deploymentconfig.json mapeiam os parâmetros para AksWebservice.deploy_configuration. A tabela a seguir descreve o mapeamento entre as entidades no documento JSON e os parâmetros para o método:

Entidade JSON	Parâmetro do método	Descrição
`computeType`	ND	O destino de computação. Para AKS, o valor deve ser `aks`.
`autoScaler`	ND	Contém elementos de configuração para dimensionamento automático. Consulte a tabela do autoscaler.
`autoscaleEnabled`	`autoscale_enabled`	Se o dimensionamento automático para o serviço Web deve ser habilitado. Se `numReplicas` = `0`, `True`; caso contrário, `False`.
`minReplicas`	`autoscale_min_replicas`	O número mínimo de contêineres a serem usados ao dimensionar automaticamente este serviço Web. Padrão, `1`.
`maxReplicas`	`autoscale_max_replicas`	O número máximo de contêineres a serem usados ao dimensionar automaticamente este serviço Web. Padrão, `10`.
`refreshPeriodInSeconds`	`autoscale_refresh_seconds`	Com que frequência o autoscaler tenta dimensionar este serviço Web. Padrão, `1`.
`targetUtilization`	`autoscale_target_utilization`	A utilização de destino (em percentagem de 100%) que o autoscaler deve procurar manter para este Serviço Web. Padrão, `70`.
`dataCollection`	ND	Contém elementos de configuração para coleta de dados.
`storageEnabled`	`collect_model_data`	Se a coleta de dados de modelo deve ser habilitada para o serviço Web. Padrão, `False`.
`authEnabled`	`auth_enabled`	Se a autenticação de chave deve ou não ser habilitada para o serviço Web. Ambos `tokenAuthEnabled` e `authEnabled` não podem ser `True`. Padrão, `True`.
`tokenAuthEnabled`	`token_auth_enabled`	Habilitar ou não a autenticação de token para o serviço Web. Ambos `tokenAuthEnabled` e `authEnabled` não podem ser `True`. Padrão, `False`.
`containerResourceRequirements`	ND	Contêiner para as entidades de CPU e memória.
`cpu`	`cpu_cores`	O número de núcleos de CPU a alocar para este serviço Web. Predefinições, `0.1`
`memoryInGB`	`memory_gb`	A quantidade de memória (em GB) a alocar para este serviço Web. Padrão, `0.5`
`appInsightsEnabled`	`enable_app_insights`	Se deve ser ativado o registo do Application Insights para o serviço web. Padrão, `False`.
`scoringTimeoutMs`	`scoring_timeout_ms`	Um tempo limite a ser imposto para avaliação das chamadas para o serviço web. Padrão, `60000`.
`maxConcurrentRequestsPerContainer`	`replica_max_concurrent_requests`	O número máximo de solicitações simultâneas por nó para este serviço web. Padrão, `1`.
`maxQueueWaitMs`	`max_request_wait_time`	O tempo máximo que uma solicitação permanece na fila (em milissegundos) antes que um erro 503 seja retornado. Padrão, `500`.
`numReplicas`	`num_replicas`	O número de contêineres a serem alocados para este serviço Web. Não existem valores predefinidos. Se esse parâmetro não estiver definido, o autoscaler será ativado por padrão.
`keys`	ND	Contém elementos de configuração para chaves.
`primaryKey`	`primary_key`	Uma chave de autenticação primária a ser usada para este Webservice
`secondaryKey`	`secondary_key`	Uma chave de autenticação secundária a ser usada para este Webservice
`gpuCores`	`gpu_cores`	O número de núcleos de GPU (réplica por contentor) a serem alocados para este serviço web. A predefinição é 1. Suporta apenas valores de números inteiros.
`livenessProbeRequirements`	ND	Contém elementos de configuração para requisitos de sonda de vivacidade.
`periodSeconds`	`period_seconds`	Com que frequência (em segundos) realizar a sonda de vivacidade. O padrão é de 10 segundos. O valor mínimo é 1.
`initialDelaySeconds`	`initial_delay_seconds`	Número de segundos após o início do recipiente antes que as sondas de vivacidade sejam iniciadas. Por padrão, definido como 310
`timeoutSeconds`	`timeout_seconds`	Número de segundos após os quais a sonda de vivacidade expira. O padrão é de 2 segundos. O valor mínimo é 1
`successThreshold`	`success_threshold`	Sucessos consecutivos mínimos para que a sonda de vivacidade seja considerada bem-sucedida depois de ter falhado. O padrão é 1. O valor mínimo é 1.
`failureThreshold`	`failure_threshold`	Quando um Pod é iniciado e a sonda de vivacidade falha, o Kubernetes tenta `failureThreshold` vezes antes de desistir. O valor padrão é 3. O valor mínimo é 1.
`namespace`	`namespace`	O namespace Kubernetes no qual o serviço Web é implantado. Até 63 caracteres alfanuméricos minúsculos ('a'-'z', '0'-'9') e hífen ('-'). O primeiro e o último personagens não podem ser hífenes.

O JSON a seguir é um exemplo de configuração de implantação para uso com a CLI:

{
    "computeType": "aks",
    "autoScaler":
    {
        "autoscaleEnabled": true,
        "minReplicas": 1,
        "maxReplicas": 3,
        "refreshPeriodInSeconds": 1,
        "targetUtilization": 70
    },
    "dataCollection":
    {
        "storageEnabled": true
    },
    "authEnabled": true,
    "containerResourceRequirements":
    {
        "cpu": 0.5,
        "memoryInGB": 1.0
    }
}

Para mais informações, consulte a referência az ml model deploy.

Dimensionamento automático

APLICA-SE A: Azure Machine Learning SDK v1 para Python

O componente que gere o autoescalonamento para implementações de modelos de Azure Machine Learning é o azureml-fe, que é um router de pedidos inteligente. Como todas as solicitações de inferência passam por ele, ele tem os dados necessários para dimensionar automaticamente os modelos implantados.

Importante

Não habilite o Kubernetes Horizontal Pod Autoscaler (HPA) para implantações de modelos. Isso faz com que os dois componentes de dimensionamento automático compitam entre si. O Azureml-fe foi concebido para auto-escalar modelos implementados pelo Azure Machine Learning, onde o HPA teria de adivinhar ou aproximar a utilização do modelo a partir de uma métrica genérica, como o uso de CPU ou uma configuração personalizada de métrica.
O Azureml-fe não dimensiona o número de nós em um cluster AKS, porque isso pode levar a aumentos de custo inesperados. Em vez disso, ele dimensiona o número de réplicas para o modelo dentro dos limites do cluster físico. Se precisar de dimensionar o número de nós no cluster, poderá dimensionar manualmente o cluster ou configurar o dimensionamento automático de clusters do AKS.

O dimensionamento automático pode ser controlado definindo autoscale_target_utilization, autoscale_min_replicase autoscale_max_replicas para o serviço Web AKS. O exemplo a seguir demonstra como habilitar o dimensionamento automático:

aks_config = AksWebservice.deploy_configuration(autoscale_enabled=True, 
                                                autoscale_target_utilization=30,
                                                autoscale_min_replicas=1,
                                                autoscale_max_replicas=4)

As decisões de aumentar ou diminuir a escala baseiam-se na utilização das réplicas de contêiner atuais. O número de réplicas que estão em uso (processando uma solicitação), dividido pelo total de réplicas em operação, é a utilização atual. Caso esse número exceda autoscale_target_utilization, mais réplicas serão criadas. Se for menor, as réplicas serão reduzidas. Por padrão, a utilização-alvo é de 70%.

As decisões para adicionar réplicas são decisivas e rápidas (cerca de 1 segundo). As decisões para remover réplicas são conservadoras (cerca de 1 minuto).

Você pode calcular as réplicas necessárias usando o seguinte código:

from math import ceil
# target requests per second
targetRps = 20
# time to process the request (in seconds)
reqTime = 10
# Maximum requests per container
maxReqPerContainer = 1
# target_utilization. 70% in this example
targetUtilization = .7

concurrentRequests = targetRps * reqTime / targetUtilization

# Number of container replicas
replicas = ceil(concurrentRequests / maxReqPerContainer)

Para obter mais informações sobre a configuração de autoscale_target_utilization, autoscale_max_replicas e autoscale_min_replicas, consulte o módulo de referência AksWebservice.

Autenticação do serviço Web

Ao implementar para Azure Kubernetes Service, a autenticação baseada em chaves está ativada por defeito. Você também pode habilitar a autenticação baseada em token. A autenticação baseada em token exige que os clientes utilizem uma conta Microsoft Entra para solicitar um token de autenticação, que é usado para fazer pedidos ao serviço implementado.

Para desabilitar a autenticação, defina o auth_enabled=False parâmetro ao criar a configuração de implantação. O exemplo a seguir desabilita a autenticação usando o SDK:

deployment_config = AksWebservice.deploy_configuration(cpu_cores=1, memory_gb=1, auth_enabled=False)

Para informações sobre autenticação a partir de uma aplicação cliente, consulte o modelo Consume an Azure Machine Learning implementado como serviço web.

Autenticação com chaves

Se a autenticação de chave estiver habilitada, você poderá usar o get_keys método para recuperar uma chave de autenticação primária e secundária:

primary, secondary = service.get_keys()
print(primary)

Importante

Se precisar regenerar uma chave, use service.regen_key.

Autenticação com tokens

Para habilitar a autenticação de token, defina o token_auth_enabled=True parâmetro quando estiver criando ou atualizando uma implantação. O exemplo a seguir habilita a autenticação de token usando o SDK:

deployment_config = AksWebservice.deploy_configuration(cpu_cores=1, memory_gb=1, token_auth_enabled=True)

Se a autenticação de token estiver habilitada, você poderá usar o get_token método para recuperar um JWT e o tempo de expiração desse token:

token, refresh_by = service.get_token()
print(token)

Importante

Você precisa solicitar um novo token após o tempo do token refresh_by.

A Microsoft recomenda vivamente que crie o seu espaço de trabalho Azure Machine Learning na mesma região do seu cluster AKS. Para autenticar com um token, o serviço web faz uma chamada para a região onde o seu espaço de trabalho Azure Machine Learning é criado. Se a região do seu espaço de trabalho não estiver disponível, você não poderá buscar um token para o seu serviço Web mesmo, se o cluster estiver em uma região diferente do seu espaço de trabalho. Isso efetivamente resulta na indisponibilidade da autenticação baseada em tokens até que a região do seu espaço de trabalho esteja disponível novamente. Além disso, quanto maior a distância entre a região do cluster e a região do espaço de trabalho, mais tempo levará para buscar um token.

Para recuperar um token, deve usar o SDK Azure Machine Learning ou o comando ml-service az get-access-token.

Análise de vulnerabilidades

O Microsoft Defender for Cloud oferece gestão unificada de segurança e proteção avançada contra ameaças em cargas de trabalho híbridas de cloud. Deve permitir que o Microsoft Defender for Cloud analise os seus recursos e siga as suas recomendações. Para mais informações, veja Segurança dos contentores em Microsoft Defender para contentores.

Comentários

Esta página foi útil?

Last updated on 2026-03-10

Partilhar via

Implante um modelo em um cluster do serviço de Kubernetes do Azure com v1

Pré-requisitos

Compreender os processos de implantação

Azure Machine Learning router

Entender os requisitos de conectividade para o cluster de inferência do AKS

Requisitos gerais de resolução de DNS

Requisitos de conectividade por ordem cronológica

Implementar para AKS

Dimensionamento automático

Autenticação do serviço Web

Autenticação com chaves

Autenticação com tokens

Análise de vulnerabilidades

Conteúdos relacionados

Comentários

Recursos adicionais