Trabajar con modelos

Azure OpenAI en Microsoft Foundry Models se basa en un conjunto diverso de modelos con diferentes funcionalidades y puntos de precio. La disponibilidad del modelo varía según la región.

Puede obtener una lista de modelos que están disponibles tanto para la inferencia como para el ajuste fino mediante su recurso de Azure OpenAI usando la API Models List.

En este artículo se muestra cómo:

  • Configure las actualizaciones automáticas del modelo.
  • Vea y actualice la directiva de actualización de versiones de una implementación.
  • Actualice una versión de modelo implementada mediante la API de Azure Resource Manager.
  • Migre las implementaciones aprovisionadas a una versión o familia de modelos diferente.

Requisitos previos

  • Una suscripción de Azure que incluye modelos de Azure OpenAI.

Actualizaciones del modelo

Azure OpenAI admite actualizaciones automáticas para implementaciones de modelos selectas. En los modelos en los que está disponible la compatibilidad con actualizaciones automáticas, hay disponible una lista desplegable de directivas de actualización de versiones del modelo.

Puede obtener más información sobre las versiones del modelo de Azure OpenAI y cómo funcionan, en el artículo versiones del modelo de Azure OpenAI.

Nota

Las actualizaciones automáticas del modelo solo se admiten para los tipos de implementación estándar. Para obtener más información sobre cómo administrar las actualizaciones y migraciones de modelos en los tipos de implementación aprovisionados, consulte la sección sobre la administración de modelos en los tipos de implementación aprovisionados.

Actualización automática al valor predeterminado

Al establecer la implementación en Actualización automática en predeterminada, la implementación del modelo se actualiza automáticamente en un plazo de dos semanas después de un cambio en la versión predeterminada. Para una versión preliminar, se actualiza automáticamente cuando una nueva versión preliminar está disponible a partir de dos semanas después de que se publique la nueva versión preliminar.

Si todavía está en las fases de prueba tempranas para los modelos de inferencia, se recomienda implementar modelos con actualización automática en el conjunto predeterminado siempre que esté disponible.

Versión específica del modelo

A medida que el uso de Azure OpenAI evoluciona y empieza a compilar e integrar con aplicaciones, es posible que quiera controlar manualmente las actualizaciones del modelo. En primer lugar, puede probar y validar que el comportamiento de la aplicación es coherente para el caso de uso antes de actualizar.

Al seleccionar una versión de modelo específica para una implementación, esta versión permanece seleccionada hasta que elija actualizarse manualmente o una vez que llegue a la fecha de retirada del modelo. Cuando se alcanza la fecha de retirada, el modelo se actualizará automáticamente a la versión predeterminada en el momento de la retirada.

Configuración de actualización de implementación de modelos

Puede comprobar qué opciones de actualización de modelos se establecen para los modelos implementados previamente mediante REST, CLI de Azure y Azure PowerShell, así como con el portal de Foundry.

También se puede acceder a la propiedad correspondiente a través de REST, Azure PowerShell y CLI de Azure.

Opción Lectura Actualizar
REST Sí. Si versionUpgradeOption no se devuelve, significa que es null
Azure PowerShell Sí. VersionUpgradeOption se puede comprobar para $null
CLI de Azure Sí. Se muestra null si versionUpgradeOption no está establecido. No. Actualmente no es posible actualizar la opción de actualización de la versión.

Hay tres opciones de actualización de implementación de modelos distintas:

Nombre Descripción
OnceNewDefaultVersionAvailable Una vez que se designa una nueva versión como predeterminada, la implementación del modelo se actualiza automáticamente a la versión predeterminada en un plazo de dos semanas a partir de que se realice ese cambio de designación.
OnceCurrentVersionExpired Una vez que se alcanza la fecha de retirada, la implementación del modelo se actualiza automáticamente a la versión predeterminada actual.
NoAutoUpgrade La implementación del modelo nunca se actualiza automáticamente. Una vez que se alcanza la fecha de retirada, la implementación del modelo deja de funcionar. Debe actualizar el código que hace referencia a esa implementación para que apunte a una implementación de modelo no caducada.

Nota

null es equivalente a OnceCurrentVersionExpired. Si la opción Directiva de actualización de versión no está presente en las propiedades de un modelo que admita actualizaciones del modelo, indica que el valor es actualmente null. Una vez que modifique explícitamente este valor, la propiedad está visible en la página de propiedades de Studio, así como a través de la API REST.

Ejemplos

Revise la guía Azure PowerShell getting started para instalar Azure PowerShell localmente o puede usar el Azure Cloud Shell.

Los pasos siguientes muestran cómo comprobar la VersionUpgradeOption propiedad de opción, así como actualizarla:

# Step 1: Get deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
 
# Step 2: Show VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
 
# VersionUpgradeOption can be null. One way to check is:
$null -eq $deployment.Properties.VersionUpgradeOption
 
# Step 3: Update VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
 
# Repeat steps 1 and 2 to confirm the change.
# If you aren't sure about the deployment name, list all deployments under an account:
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}
# Update to a new model version

# Step 1: Get deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}

# Step 2: Show the current model version
$deployment.Properties.Model.Version

# Step 3: Update the model version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku

# Repeat steps 1 and 2 to confirm the change.

Actualizar e implementar modelos a través de la API

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2025-06-01

Parámetros de ruta de acceso

Parámetro Tipo ¿Obligatorio? Descripción
accountName string Obligatorio Nombre del recurso de Azure OpenAI.
deploymentName string Obligatorio El nombre de implementación que eligió al implementar un modelo existente o el nombre que desea que tenga una nueva implementación de modelos.
resourceGroupName string Obligatorio Nombre del grupo de recursos asociado para esta implementación del modelo.
subscriptionId string Obligatorio Identificador de suscripción para la suscripción asociada.
api-version string Obligatorio Versión de la API que se va a usar para esta operación. Esto sigue el formato YYYY-MM-DD.

Versiones admitidas

Cuerpo de la solicitud

Este es solo un subconjunto de los parámetros del cuerpo de la solicitud disponibles. Para obtener la lista completa de los parámetros, puede consultar la documentación de referencia de la API REST.

Parámetro Tipo Descripción
opciónDeActualizaciónDeVersión Cadena Opciones de actualización de la versión del modelo de implementación:
OnceNewDefaultVersionAvailable
OnceCurrentVersionExpired
NoAutoUpgrade
capacidad entero Esto representa la cantidad de cuota que va a asignar a esta implementación. Un valor de 1 es igual a 1000 tokens por minuto (TPM)

Solicitud de ejemplo

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2025-06-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'

Nota

Hay varias maneras de generar un token de autorización. El método más sencillo para las pruebas iniciales es iniciar el Cloud Shell desde el portal Azure. A continuación, ejecute az account get-access-token. Puede usar este token como token de autorización temporal para las pruebas de API.

Respuesta de ejemplo

 {
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-35-turbo",
  "sku": {
    "name": "Standard",
    "capacity": 120
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-35-turbo",
      "version": "0613"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "capabilities": {
      "chatCompletion": "true"
    },
    "provisioningState": "Succeeded",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 120
      },
      {
        "key": "token",
        "renewalPeriod": 60,
        "count": 120000
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2023-02-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2023-10-31T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Administración de modelos en tipos de implementación aprovisionados

Las implementaciones aprovisionadas admiten prácticas distintas de administración de modelos. Los procedimientos de administración de modelos de implementación aprovisionados están diseñados para proporcionarle el mayor control sobre cuándo y cómo migrar entre las versiones del modelo y las familias de modelos. Actualmente, hay dos enfoques disponibles para administrar modelos en implementaciones aprovisionadas: (1) migraciones en contexto y (2) migraciones de implementación múltiple.

Requisitos previos

  • Valide que la versión del modelo de destino o la familia de modelos sean compatibles con el tipo de implementación existente. Las migraciones solo pueden producirse entre implementaciones aprovisionadas del mismo tipo de implementación. Para obtener más información sobre los tipos de implementación, revise la documentación del tipo de implementación.
  • Valide la disponibilidad de capacidad para la versión del modelo de destino o la familia de modelos antes de intentar realizar una migración. Para más información sobre cómo determinar la disponibilidad de la capacidad, revise la documentación de transparencia de capacidad.
  • Para las migraciones de varias implementaciones, compruebe que tiene cuota suficiente para admitir varias implementaciones simultáneamente. Para obtener más información sobre cómo validar la cuota de cada tipo de implementación aprovisionada, revise la documentación sobre el costo de rendimiento aprovisionado.

Migraciones en sitio para implementaciones aprovisionadas

Las migraciones in situ permiten mantener el mismo nombre y tamaño de implementación aprovisionado al cambiar la versión del modelo o la familia de modelos asignada a esa implementación. Con las migraciones en el lugar, Azure OpenAI se encarga de migrar cualquier tráfico existente entre versiones de modelo o familias de modelos durante un período de 20 a 30 minutos durante la migración. A lo largo de la ventana de migración, la implementación aprovisionada mostrará un estado aprovisionado de "actualización". Puede seguir usando la implementación aprovisionada como lo haría normalmente. Una vez completada la migración en el lugar, el estado aprovisionado se actualizará a "exitoso", lo que indica que todo el tráfico se ha migrado a la versión del modelo de destino o a la familia de modelos.

Migración local: actualización de la versión del modelo

Las migraciones en contexto destinadas a actualizar una implementación aprovisionada existente a una nueva versión de modelo dentro de la misma familia de modelos se admiten a través de Foundry, API REST y CLI de Azure. Para realizar una migración local destinada a una actualización de la versión del modelo en Foundry, seleccione Implementaciones> en la columna nombre de implementación, seleccione el nombre de implementación de la implementación aprovisionada que desea migrar.

Al seleccionar un nombre de implementación, se abre las propiedades de la implementación del modelo. En esta vista, seleccione el botón editar , que mostrará el cuadro de diálogo Actualizar implementación . Seleccione la lista desplegable de la versión del modelo para establecer una nueva versión del modelo para la implementación provisionada. Como se indicó, el estado de aprovisionamiento cambiará a "actualización" durante la migración y volverá a "correcto" una vez completada la migración.

Migración local: cambio de familia de modelos

Las migraciones en contexto destinadas a actualizar una implementación aprovisionada existente a una nueva familia de modelos se admiten a través de la API REST y CLI de Azure. Para realizar una migración in situ destinada a un cambio en la familia de modelos, use la siguiente solicitud de ejemplo como guía. En la solicitud, deberá actualizar el nombre del modelo y la versión del modelo de destino al que va a migrar.

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'

Respuesta de ejemplo

{
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-4o-ptu-deployment",
  "sku": {
    "name": "GlobalProvisionedManaged",
    "capacity": 100
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-4o-mini",
      "version": "2024-07-18"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "currentCapacity": 100,
    "capabilities": {
      "area": "EUR",
      "chatCompletion": "true",
      "jsonObjectResponse": "true",
      "maxContextToken": "128000",
      "maxOutputToken": "16834",
      "assistants": "true"
    },
    "provisioningState": "Updating",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 300
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2025-01-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2025-01-29T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Nota

Hay varias maneras de generar un token de autorización. El método más sencillo para las pruebas iniciales es iniciar el Cloud Shell desde el portal Azure. A continuación, ejecute az account get-access-token. Puede usar este token como token de autorización temporal para las pruebas de API.

Migraciones de varias implementaciones para implementaciones aprovisionadas

Las migraciones de varias implementaciones permiten tener un mayor control sobre el proceso de migración del modelo. Con las migraciones de implementaciones múltiples, puede determinar la rapidez con la que desea migrar el tráfico actual hacia la versión de modelo objetivo o familia de modelos en una nueva implementación provisionada. El proceso para migrar a una nueva versión de modelo o familia de modelos mediante el enfoque de migración de varias implementaciones es el siguiente:

  • Cree una nueva implementación aprovisionada. Para esta nueva implementación, puede optar por mantener el mismo tipo de implementación aprovisionado que la implementación existente o seleccionar un nuevo tipo de implementación si lo desea.
  • Cambie el tráfico de la implementación aprovisionada existente a la implementación aprovisionada recién creada con la versión del modelo de destino o la familia de modelos hasta que todo el tráfico se descargue de la implementación original.
  • Una vez que el tráfico se migra a la nueva implementación, valide que no haya solicitudes de inferencia que se procesen en la implementación aprovisionada anterior asegurándose de que la métrica de solicitudes de OpenAI Azure no muestra las llamadas API realizadas en un plazo de 5 a 10 minutos del tráfico de inferencia que se va a migrar a la nueva implementación. Para obtener más información sobre esta métrica, vea la documentación de Monitor Azure OpenAI.
  • Una vez que confirme que no se han realizado llamadas de inferencia, elimine la implementación aprovisionada original.

Solución de problemas

Obtiene 401 o 403 respuestas de la API de Azure Resource Manager

  • Confirme que el token de acceso es válido y no expirado.
  • Confirme que tiene permiso para leer y actualizar las implementaciones del recurso.