Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Azure OpenAI no Microsoft Foundry Models é alimentado por um conjunto diversificado de modelos com diferentes funcionalidades e pontos de preço. A disponibilidade do modelo varia de acordo com a região.
Você pode obter uma lista de modelos disponíveis para inferência e ajuste fino pelo recurso Azure OpenAI usando a API de Lista Models.
Este artigo mostra como:
- Configurar atualizações automáticas de modelo.
- Exibir e atualizar a política de atualização de versão de uma implantação.
- Atualize uma versão de modelo implantada usando a API de Azure Resource Manager.
- Migre implantações provisionadas para uma versão ou família de modelos diferentes.
Pré-requisitos
- Uma assinatura do Azure com modelos OpenAI do Azure.
Atualizações de modelo
Azure OpenAI dá suporte a atualizações automáticas para implantações de modelo selecionadas. Em modelos em que o suporte à atualização automática está disponível, há uma lista suspensa de política de atualização de versão do modelo.
Você pode saber mais sobre as versões de modelo Azure OpenAI e como elas funcionam no artigo Azure OpenAI model versions.
Nota
As atualizações automáticas de modelo só têm suporte para tipos de implantação Standard. Para obter mais informações sobre como gerenciar atualizações de modelo e migrações em tipos de implantação provisionados, consulte a seção sobre como gerenciar modelos em tipos de implantação provisionados
Atualização automática para padrão
Quando você define sua implantação como atualização automática como padrão, sua implantação de modelo é atualizada automaticamente dentro de duas semanas após uma alteração na versão padrão. Para uma versão prévia, ela é atualizada automaticamente quando uma nova versão prévia está disponível a partir de duas semanas após o lançamento da nova versão prévia.
Se você ainda estiver nas fases iniciais de teste para modelos de inferência, recomendamos implantar modelos com atualização automática para o conjunto padrão sempre que ele estiver disponível.
Versão específica do modelo
À medida que o uso de Azure OpenAI evolui e você começa a criar e integrar aplicativos, talvez queira controlar manualmente as atualizações de modelos. Primeiro, você pode testar e validar se o comportamento do aplicativo é consistente para o caso de uso antes de atualizar.
Quando você seleciona uma versão de modelo específica para uma implantação, essa versão permanece selecionada até que você opte por se atualizar manualmente ou depois de chegar à data de desativação do modelo. Quando a data de desativação for atingida, o modelo será atualizado automaticamente para a versão padrão no momento da desativação.
Configuração de atualização de implantação de modelo
Você pode verificar quais opções de atualização de modelo estão definidas para modelos implantados anteriormente usando REST, CLI do Azure e Azure PowerShell, bem como com o portal do Foundry.
A propriedade correspondente também pode ser acessada por meio de REST, Azure PowerShell e CLI do Azure.
| Opção | Ler | Atualização |
|---|---|---|
| REST | Sim. Se versionUpgradeOption não for retornado, significa que é null |
Sim |
| Azure PowerShell | Sim.
VersionUpgradeOption pode ser verificado em relação a $null |
Sim |
| CLI do Azure | Sim. Ele mostra null se versionUpgradeOption não está definido. |
Não. No momento, não é possível atualizar a opção de atualização de versão. |
Há três opções distintas de atualização de implantação de modelo:
| Nome | Descrição |
|---|---|
OnceNewDefaultVersionAvailable |
Depois que uma nova versão é designada como padrão, a implantação do modelo é atualizada automaticamente para a versão padrão dentro de duas semanas após essa alteração de designação ser feita. |
OnceCurrentVersionExpired |
Depois que a data de desativação for atingida, a implantação do modelo será atualizada automaticamente para a versão padrão atual. |
NoAutoUpgrade |
O modelo de implantação nunca é atualizado automaticamente. Depois que a data de desativação for atingida, a implantação do modelo deixará de funcionar. Você precisa atualizar seu código que referencia essa implantação para apontar para uma implantação de modelo não expirada. |
Nota
null é equivalente a OnceCurrentVersionExpired. Se a opção de política de atualização de versão não estiver presente nas propriedades de um modelo que dá suporte a atualizações de modelo, isso indicará que o valor está atualmente null. Depois de modificar explicitamente esse valor, a propriedade ficará visível na página de propriedades do estúdio, bem como por meio da API REST.
Exemplos
Revise o guia de introdução do Azure PowerShell
As etapas abaixo demonstram verificar a propriedade de opção VersionUpgradeOption , bem como atualizá-la:
# Step 1: Get deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
# Step 2: Show VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
# VersionUpgradeOption can be null. One way to check is:
$null -eq $deployment.Properties.VersionUpgradeOption
# Step 3: Update VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
# Repeat steps 1 and 2 to confirm the change.
# If you aren't sure about the deployment name, list all deployments under an account:
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}
# Update to a new model version
# Step 1: Get deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
# Step 2: Show the current model version
$deployment.Properties.Model.Version
# Step 3: Update the model version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
# Repeat steps 1 and 2 to confirm the change.
Atualizar &implantar modelos por meio da API
PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2025-06-01
Parâmetros de caminho
| Parâmetro | Tipo | Necessário? | Descrição |
|---|---|---|---|
accountName |
cadeia | Necessário | O nome do seu recurso OpenAI do Azure. |
deploymentName |
cadeia | Necessário | O nome da implantação que você escolheu quando implantou um modelo existente ou o nome que deseja que uma nova implantação de modelo tenha. |
resourceGroupName |
cadeia | Necessário | O nome do grupo de recursos associado para essa implantação de modelo. |
subscriptionId |
cadeia | Necessário | ID da Assinatura para a assinatura associada. |
api-version |
cadeia | Necessário | A versão da API a ser usada para esta operação. Isso segue o formato YYYY-MM-DD. |
Versões com suporte
-
2025-06-01Especificação do Swagger
Corpo da solicitação
Esse é apenas um subconjunto dos parâmetros de corpo da solicitação disponíveis. Para obter a lista completa dos parâmetros, você pode consultar a documentação de referência da API REST.
| Parâmetro | Tipo | Descrição |
|---|---|---|
| opçãoDeAtualizaçãoDeVersão | String | Opções de atualização de versão do modelo de implantação:OnceNewDefaultVersionAvailableOnceCurrentVersionExpiredNoAutoUpgrade |
| capacidade | inteiro | Isso representa a quantidade de cota que você está atribuindo a essa implantação. Um valor de 1 é igual a 1.000 tokens por minuto (TPM) |
Solicitação de exemplo
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2025-06-01 \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'
Nota
Há várias maneiras de gerar um token de autorização. O método mais fácil para o teste inicial é iniciar o Cloud Shell do Azure portal. Em seguida, execute az account get-access-token. Você pode usar esse token como seu token de autorização temporária para teste de API.
Resposta de exemplo
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "gpt-35-turbo",
"sku": {
"name": "Standard",
"capacity": 120
},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-35-turbo",
"version": "0613"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"capabilities": {
"chatCompletion": "true"
},
"provisioningState": "Succeeded",
"rateLimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 120
},
{
"key": "token",
"renewalPeriod": 60,
"count": 120000
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2023-02-28T02:57:15.8951706Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2023-10-31T15:35:53.082912Z"
},
"etag": "\"GUID\""
}
Gerenciando modelos em tipos de implantação provisionados
As implantações provisionadas dão suporte a práticas de gerenciamento de modelos distintas. As práticas de gerenciamento de modelos de implantação provisionadas destinam-se a fornecer o maior controle sobre quando e como você migra entre versões de modelo e famílias de modelos. Atualmente, há duas abordagens disponíveis para gerenciar modelos em implantações provisionadas: (1) migrações locais e (2) migrações entre múltiplas implantações.
Pré-requisitos
- Valide se a versão do modelo de destino ou a família de modelos tem suporte para o tipo de implantação existente. As migrações só podem ocorrer entre implantações provisionadas do mesmo tipo de implantação. Para obter mais informações sobre tipos de implantação, examine a documentação do tipo de implantação.
- Valide a disponibilidade de capacidade para sua versão de modelo de destino ou família de modelos antes de tentar uma migração. Para obter mais informações sobre como determinar a disponibilidade da capacidade, examine a documentação de transparência de capacidade.
- Para migrações de várias implantações, valide se você tem cota suficiente para dar suporte a várias implantações simultaneamente. Para obter mais informações sobre como validar a cota para cada tipo de implantação provisionada, examine a documentação de custo de taxa de transferência provisionada.
Migrações in-loco para implantações provisionadas
As migrações in-loco permitem manter o mesmo nome e tamanho de implantação provisionados ao alterar a versão do modelo ou a família de modelos atribuída a essa implantação. Com as migrações no local, o Azure OpenAI cuida da migração do tráfego existente entre diferentes versões de modelos ou famílias de modelos dentro de uma janela de 20 a 30 minutos. Durante toda a janela de migração, sua implantação provisionada exibirá um estado provisionado de "atualização". Você pode continuar usando sua implantação provisionada normalmente. Depois que a migração local for concluída, o estado provisionado será atualizado para "bem-sucedido", indicando que todo o tráfego foi migrado para a versão de modelo ou família de modelos alvo.
Migração no local: atualização de versão do modelo
As migrações in-loco destinadas à atualização de uma implantação provisionada existente para uma nova versão de modelo dentro da mesma família de modelos têm suporte por meio da Foundry, da API REST e do CLI do Azure. Para executar uma migração no local focada em uma atualização de versão do modelo no Foundry, selecione Implantações> e, em seguida, na coluna de nome de implantação, escolha o nome da implantação provisionada que você deseja migrar.
Selecionar um nome de implantação abre as Propriedades para a implantação do modelo. Nesse modo de exibição, selecione o botão Editar , que mostrará a caixa de diálogo Atualizar implantação . Selecione a lista suspensa da versão do modelo para definir uma nova versão do modelo para a implantação provisionada. Como observado, o estado do provisionamento mudará para "atualizando" durante a migração e retornará para "concluído" assim que a migração for finalizada.
Migração in-loco: alteração da família do modelo
As migrações in-loco destinadas à atualização de uma implantação provisionada existente para uma nova família de modelos têm suporte por meio da API REST e CLI do Azure. Para executar uma migração in-loco direcionada a uma alteração de família de modelo, use a solicitação de exemplo abaixo como guia. Na solicitação, você precisará atualizar o nome do modelo e a versão do modelo para o qual você está migrando.
curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
-H "Content-Type: application/json" \
-H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
-d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'
Resposta de exemplo
{
"id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"name": "gpt-4o-ptu-deployment",
"sku": {
"name": "GlobalProvisionedManaged",
"capacity": 100
},
"properties": {
"model": {
"format": "OpenAI",
"name": "gpt-4o-mini",
"version": "2024-07-18"
},
"versionUpgradeOption": "OnceCurrentVersionExpired",
"currentCapacity": 100,
"capabilities": {
"area": "EUR",
"chatCompletion": "true",
"jsonObjectResponse": "true",
"maxContextToken": "128000",
"maxOutputToken": "16834",
"assistants": "true"
},
"provisioningState": "Updating",
"rateLimits": [
{
"key": "request",
"renewalPeriod": 10,
"count": 300
}
]
},
"systemData": {
"createdBy": "docs@contoso.com",
"createdByType": "User",
"createdAt": "2025-01-28T02:57:15.8951706Z",
"lastModifiedBy": "docs@contoso.com",
"lastModifiedByType": "User",
"lastModifiedAt": "2025-01-29T15:35:53.082912Z"
},
"etag": "\"GUID\""
}
Nota
Há várias maneiras de gerar um token de autorização. O método mais fácil para o teste inicial é iniciar o Cloud Shell do Azure portal. Em seguida, execute az account get-access-token. Você pode usar esse token como seu token de autorização temporária para teste de API.
Migrações multilocais para implantações provisionadas
As migrações de várias implantações permitem que você tenha maior controle sobre o processo de migração de modelo. Com migrações de várias implantações, você pode definir a velocidade com que deseja migrar seu tráfego existente para a versão ou família de modelos de destino em uma nova implantação provisionada. O processo para migrar para uma nova versão de modelo ou família de modelos usando a abordagem de migração de várias implantações é o seguinte:
- Crie uma nova implantação provisionada. Para essa nova implantação, você pode optar por manter o mesmo tipo de implantação provisionada que a implantação existente ou selecionar um novo tipo de implantação, se desejado.
- Transicione o tráfego da configuração provisionada existente para a nova configuração provisionada criada com sua versão de modelo alvo ou família de modelos até que todo o tráfego seja transferido da configuração original.
- Depois que o tráfego for migrado para a nova implantação, valide se não há nenhuma solicitação de inferência sendo processada na implantação provisionada anterior, garantindo que a métrica Azure solicitações openai não mostre nenhuma chamada de API feita dentro de 5 a 10 minutos após o tráfego de inferência ser migrado para a nova implantação. Para obter mais informações sobre essa métrica, veja a documentação do Monitor Azure OpenAI.
- Depois de confirmar que nenhuma chamada de inferência foi feita, exclua a implantação provisionada original.
Solucionando problemas
Você obtém 401 ou 403 respostas da API de Azure Resource Manager
- Confirme se o token de acesso é válido e não expirado.
- Confirme se você tem permissão para ler e atualizar implementações para o recurso.