Trabalhando com modelos

Azure OpenAI no Microsoft Foundry Models é alimentado por um conjunto diversificado de modelos com diferentes funcionalidades e pontos de preço. A disponibilidade do modelo varia de acordo com a região.

Você pode obter uma lista de modelos disponíveis para inferência e ajuste fino pelo recurso Azure OpenAI usando a API de Lista Models.

Este artigo mostra como:

Configurar atualizações automáticas de modelo.
Exibir e atualizar a política de atualização de versão de uma implantação.
Atualize uma versão de modelo implantada usando a API de Azure Resource Manager.
Migre implantações provisionadas para uma versão ou família de modelos diferentes.

Pré-requisitos

Uma assinatura do Azure com modelos OpenAI do Azure.

Atualizações de modelo

Azure OpenAI dá suporte a atualizações automáticas para implantações de modelo selecionadas. Em modelos em que o suporte à atualização automática está disponível, há uma lista suspensa de política de atualização de versão do modelo.

Você pode saber mais sobre as versões de modelo Azure OpenAI e como elas funcionam no artigo Azure OpenAI model versions.

Nota

As atualizações automáticas de modelo só têm suporte para tipos de implantação Standard. Para obter mais informações sobre como gerenciar atualizações de modelo e migrações em tipos de implantação provisionados, consulte a seção sobre como gerenciar modelos em tipos de implantação provisionados

Atualização automática para padrão

Quando você define sua implantação como atualização automática como padrão, sua implantação de modelo é atualizada automaticamente dentro de duas semanas após uma alteração na versão padrão. Para uma versão prévia, ela é atualizada automaticamente quando uma nova versão prévia está disponível a partir de duas semanas após o lançamento da nova versão prévia.

Se você ainda estiver nas fases iniciais de teste para modelos de inferência, recomendamos implantar modelos com atualização automática para o conjunto padrão sempre que ele estiver disponível.

Versão específica do modelo

À medida que o uso de Azure OpenAI evolui e você começa a criar e integrar aplicativos, talvez queira controlar manualmente as atualizações de modelos. Primeiro, você pode testar e validar se o comportamento do aplicativo é consistente para o caso de uso antes de atualizar.

Quando você seleciona uma versão de modelo específica para uma implantação, essa versão permanece selecionada até que você opte por se atualizar manualmente ou depois de chegar à data de desativação do modelo. Quando a data de desativação for atingida, o modelo será atualizado automaticamente para a versão padrão no momento da desativação.

Configuração de atualização de implantação de modelo

Você pode verificar quais opções de atualização de modelo estão definidas para modelos implantados anteriormente usando REST, CLI do Azure e Azure PowerShell, bem como com o portal do Foundry.

A propriedade correspondente também pode ser acessada por meio de REST, Azure PowerShell e CLI do Azure.

Opção	Ler	Atualização
REST	Sim. Se `versionUpgradeOption` não for retornado, significa que é `null`	Sim
Azure PowerShell	Sim. `VersionUpgradeOption` pode ser verificado em relação a `$null`	Sim
CLI do Azure	Sim. Ele mostra `null` se `versionUpgradeOption` não está definido.	Não. No momento, não é possível atualizar a opção de atualização de versão.

Há três opções distintas de atualização de implantação de modelo:

Nome	Descrição
`OnceNewDefaultVersionAvailable`	Depois que uma nova versão é designada como padrão, a implantação do modelo é atualizada automaticamente para a versão padrão dentro de duas semanas após essa alteração de designação ser feita.
`OnceCurrentVersionExpired`	Depois que a data de desativação for atingida, a implantação do modelo será atualizada automaticamente para a versão padrão atual.
`NoAutoUpgrade`	O modelo de implantação nunca é atualizado automaticamente. Depois que a data de desativação for atingida, a implantação do modelo deixará de funcionar. Você precisa atualizar seu código que referencia essa implantação para apontar para uma implantação de modelo não expirada.

Nota

null é equivalente a OnceCurrentVersionExpired. Se a opção de política de atualização de versão não estiver presente nas propriedades de um modelo que dá suporte a atualizações de modelo, isso indicará que o valor está atualmente null. Depois de modificar explicitamente esse valor, a propriedade ficará visível na página de propriedades do estúdio, bem como por meio da API REST.

Revise o guia de introdução do Azure PowerShell para instalar o Azure PowerShell localmente ou você pode usar o Azure Cloud Shell.

As etapas abaixo demonstram verificar a propriedade de opção VersionUpgradeOption , bem como atualizá-la:

# Step 1: Get deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
 
# Step 2: Show VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
 
# VersionUpgradeOption can be null. One way to check is:
$null -eq $deployment.Properties.VersionUpgradeOption
 
# Step 3: Update VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
 
# Repeat steps 1 and 2 to confirm the change.
# If you aren't sure about the deployment name, list all deployments under an account:
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}

# Update to a new model version

# Step 1: Get deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}

# Step 2: Show the current model version
$deployment.Properties.Model.Version

# Step 3: Update the model version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku

# Repeat steps 1 and 2 to confirm the change.

Para consultar as configurações de implantação do modelo atual, incluindo a configuração de atualização de implantação para um determinado recurso, use Deployments List. Se o valor for nulo, você não verá uma versionUpgradeOption propriedade.

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments?api-version=2023-05-01

Parâmetros de caminho

Parâmetro	Tipo	Necessário?	Descrição
`accountName`	cadeia	Necessário	O nome do seu recurso OpenAI do Azure.
`resourceGroupName`	cadeia	Necessário	O nome do grupo de recursos associado para essa implantação de modelo.
`subscriptionId`	cadeia	Necessário	ID da Assinatura para a assinatura associada.
`api-version`	cadeia	Necessário	A versão da API a ser usada para esta operação. Isso segue o formato YYYY-MM-DD.

Versões com suporte

2025-06-01 Especificação do Swagger

Resposta de exemplo

{
  "value": [
    {
      "id": "/subscriptions/aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeeb/resourceGroups/az-test-openai/providers/Microsoft.CognitiveServices/accounts/aztestopenai001/deployments/gpt-35-turbo",
      "type": "Microsoft.CognitiveServices/accounts/deployments",
      "name": "gpt-35-turbo",
      "sku": {
        "name": "Standard",
        "capacity": 80
      },
      "properties": {
        "model": {
          "format": "OpenAI",
          "name": "gpt-35-turbo",
          "version": "0301"
        },
        "versionUpgradeOption": "OnceNewDefaultVersionAvailable",
        "capabilities": {
          "completion": "true",
          "chatCompletion": "true"
        },
        "raiPolicyName": "Microsoft.Default",
        "provisioningState": "Succeeded",
        "rateLimits": [
          {
            "key": "request",
            "renewalPeriod": 10,
            "count": 80
          },
          {
            "key": "token",
            "renewalPeriod": 60,
            "count": 80000
          }
        ]
      },
      "systemData": {
        "createdBy": "docs@contoso.com",
        "createdByType": "User",
        "createdAt": "2023-07-31T16:45:32.622404Z",
        "lastModifiedBy": "docs@contoso.com",
        "lastModifiedByType": "User",
        "lastModifiedAt": "2023-10-31T13:59:34.4978286Z"
      },
      "etag": "\"aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee\""
    }
  ]
}

Em seguida, você pode usar as configurações dessa lista para construir uma chamada à API REST do modelo de atualização, conforme descrito abaixo, se quiser modificar a configuração de atualização de implantação.

Atualizar &implantar modelos por meio da API

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2025-06-01

Parâmetros de caminho

Parâmetro	Tipo	Necessário?	Descrição
`accountName`	cadeia	Necessário	O nome do seu recurso OpenAI do Azure.
`deploymentName`	cadeia	Necessário	O nome da implantação que você escolheu quando implantou um modelo existente ou o nome que deseja que uma nova implantação de modelo tenha.
`resourceGroupName`	cadeia	Necessário	O nome do grupo de recursos associado para essa implantação de modelo.
`subscriptionId`	cadeia	Necessário	ID da Assinatura para a assinatura associada.
`api-version`	cadeia	Necessário	A versão da API a ser usada para esta operação. Isso segue o formato YYYY-MM-DD.

Versões com suporte

2025-06-01 Especificação do Swagger

Corpo da solicitação

Esse é apenas um subconjunto dos parâmetros de corpo da solicitação disponíveis. Para obter a lista completa dos parâmetros, você pode consultar a documentação de referência da API REST.

Parâmetro	Tipo	Descrição
opçãoDeAtualizaçãoDeVersão	String	Opções de atualização de versão do modelo de implantação: `OnceNewDefaultVersionAvailable` `OnceCurrentVersionExpired` `NoAutoUpgrade`
capacidade	inteiro	Isso representa a quantidade de cota que você está atribuindo a essa implantação. Um valor de 1 é igual a 1.000 tokens por minuto (TPM)

Solicitação de exemplo

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2025-06-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'

Nota

Há várias maneiras de gerar um token de autorização. O método mais fácil para o teste inicial é iniciar o Cloud Shell do Azure portal. Em seguida, execute az account get-access-token. Você pode usar esse token como seu token de autorização temporária para teste de API.

Resposta de exemplo

 {
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-35-turbo",
  "sku": {
    "name": "Standard",
    "capacity": 120
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-35-turbo",
      "version": "0613"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "capabilities": {
      "chatCompletion": "true"
    },
    "provisioningState": "Succeeded",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 120
      },
      {
        "key": "token",
        "renewalPeriod": 60,
        "count": 120000
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2023-02-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2023-10-31T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Gerenciando modelos em tipos de implantação provisionados

As implantações provisionadas dão suporte a práticas de gerenciamento de modelos distintas. As práticas de gerenciamento de modelos de implantação provisionadas destinam-se a fornecer o maior controle sobre quando e como você migra entre versões de modelo e famílias de modelos. Atualmente, há duas abordagens disponíveis para gerenciar modelos em implantações provisionadas: (1) migrações locais e (2) migrações entre múltiplas implantações.

Pré-requisitos

Valide se a versão do modelo de destino ou a família de modelos tem suporte para o tipo de implantação existente. As migrações só podem ocorrer entre implantações provisionadas do mesmo tipo de implantação. Para obter mais informações sobre tipos de implantação, examine a documentação do tipo de implantação.
Valide a disponibilidade de capacidade para sua versão de modelo de destino ou família de modelos antes de tentar uma migração. Para obter mais informações sobre como determinar a disponibilidade da capacidade, examine a documentação de transparência de capacidade.
Para migrações de várias implantações, valide se você tem cota suficiente para dar suporte a várias implantações simultaneamente. Para obter mais informações sobre como validar a cota para cada tipo de implantação provisionada, examine a documentação de custo de taxa de transferência provisionada.

Migrações in-loco para implantações provisionadas

As migrações in-loco permitem manter o mesmo nome e tamanho de implantação provisionados ao alterar a versão do modelo ou a família de modelos atribuída a essa implantação. Com as migrações no local, o Azure OpenAI cuida da migração do tráfego existente entre diferentes versões de modelos ou famílias de modelos dentro de uma janela de 20 a 30 minutos. Durante toda a janela de migração, sua implantação provisionada exibirá um estado provisionado de "atualização". Você pode continuar usando sua implantação provisionada normalmente. Depois que a migração local for concluída, o estado provisionado será atualizado para "bem-sucedido", indicando que todo o tráfego foi migrado para a versão de modelo ou família de modelos alvo.

Migração no local: atualização de versão do modelo

As migrações in-loco destinadas à atualização de uma implantação provisionada existente para uma nova versão de modelo dentro da mesma família de modelos têm suporte por meio da Foundry, da API REST e do CLI do Azure. Para executar uma migração no local focada em uma atualização de versão do modelo no Foundry, selecione Implantações> e, em seguida, na coluna de nome de implantação, escolha o nome da implantação provisionada que você deseja migrar.

Selecionar um nome de implantação abre as Propriedades para a implantação do modelo. Nesse modo de exibição, selecione o botão Editar , que mostrará a caixa de diálogo Atualizar implantação . Selecione a lista suspensa da versão do modelo para definir uma nova versão do modelo para a implantação provisionada. Como observado, o estado do provisionamento mudará para "atualizando" durante a migração e retornará para "concluído" assim que a migração for finalizada.

Migração in-loco: alteração da família do modelo

As migrações in-loco destinadas à atualização de uma implantação provisionada existente para uma nova família de modelos têm suporte por meio da API REST e CLI do Azure. Para executar uma migração in-loco direcionada a uma alteração de família de modelo, use a solicitação de exemplo abaixo como guia. Na solicitação, você precisará atualizar o nome do modelo e a versão do modelo para o qual você está migrando.

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'

Resposta de exemplo

{
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-4o-ptu-deployment",
  "sku": {
    "name": "GlobalProvisionedManaged",
    "capacity": 100
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-4o-mini",
      "version": "2024-07-18"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "currentCapacity": 100,
    "capabilities": {
      "area": "EUR",
      "chatCompletion": "true",
      "jsonObjectResponse": "true",
      "maxContextToken": "128000",
      "maxOutputToken": "16834",
      "assistants": "true"
    },
    "provisioningState": "Updating",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 300
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2025-01-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2025-01-29T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Nota

Migrações multilocais para implantações provisionadas

As migrações de várias implantações permitem que você tenha maior controle sobre o processo de migração de modelo. Com migrações de várias implantações, você pode definir a velocidade com que deseja migrar seu tráfego existente para a versão ou família de modelos de destino em uma nova implantação provisionada. O processo para migrar para uma nova versão de modelo ou família de modelos usando a abordagem de migração de várias implantações é o seguinte:

Crie uma nova implantação provisionada. Para essa nova implantação, você pode optar por manter o mesmo tipo de implantação provisionada que a implantação existente ou selecionar um novo tipo de implantação, se desejado.
Transicione o tráfego da configuração provisionada existente para a nova configuração provisionada criada com sua versão de modelo alvo ou família de modelos até que todo o tráfego seja transferido da configuração original.
Depois que o tráfego for migrado para a nova implantação, valide se não há nenhuma solicitação de inferência sendo processada na implantação provisionada anterior, garantindo que a métrica Azure solicitações openai não mostre nenhuma chamada de API feita dentro de 5 a 10 minutos após o tráfego de inferência ser migrado para a nova implantação. Para obter mais informações sobre essa métrica, veja a documentação do Monitor Azure OpenAI.
Depois de confirmar que nenhuma chamada de inferência foi feita, exclua a implantação provisionada original.

Solucionando problemas

Você obtém 401 ou 403 respostas da API de Azure Resource Manager

Confirme se o token de acesso é válido e não expirado.
Confirme se você tem permissão para ler e atualizar implementações para o recurso.

Comentários

Esta página foi útil?

Last updated on 2026-04-30

Trabalhando com modelos

Pré-requisitos

Atualizações de modelo

Atualização automática para padrão

Versão específica do modelo

Configuração de atualização de implantação de modelo

Exemplos

Atualizar &implantar modelos por meio da API

Solicitação de exemplo

Resposta de exemplo

Gerenciando modelos em tipos de implantação provisionados

Pré-requisitos

Migrações in-loco para implantações provisionadas

Migração no local: atualização de versão do modelo

Migração in-loco: alteração da família do modelo

Resposta de exemplo

Migrações multilocais para implantações provisionadas

Solucionando problemas

Você obtém 401 ou 403 respostas da API de Azure Resource Manager

Comentários

Recursos adicionais