Implementación de un modelo optimizado para pruebas (clásico)

Solo se aplica a:portal Foundry (clásico). Este artículo no está disponible para el nuevo portal de Foundry. Obtenga más información sobre el nuevo portal.

Nota

Los vínculos de este artículo pueden abrir contenido en la nueva documentación de Microsoft Foundry en lugar de la documentación de Foundry (clásico) que está viendo ahora.

Después de afinar un modelo, es posible que quiera probar su calidad a través de la API de completaciones de chat o el servicio Evaluaciones.

Una implementación de nivel de desarrollador le permite implementar el nuevo modelo sin la tarifa de hospedaje por hora en la que incurren las implementaciones estándar o globales. Los únicos cargos en los que se incurre son por cada token. Consulte la página de precios para obtener los precios más up-to-date.

Importante

El nivel de Desarrollador no ofrece un SLA de disponibilidad ni garantiza la residencia de datos. Si necesita un Acuerdo de Nivel de Servicio o una residencia de datos, elija un tipo de implementación alternativo para probar el modelo.

Las implementaciones de nivel de desarrollador tienen una duración fija de 24 horas. Obtenga más información sobre el ciclo de vida de la implementación.

Implementación del modelo optimizado

Para implementar el candidato del modelo, seleccione el modelo optimizado para implementar y, a continuación, seleccione Implementar.

Se abre el cuadro de diálogo Implementar modelo . En el cuadro de diálogo, escriba el nombre de la implementación y, a continuación, seleccione Desarrollador en la lista desplegable Tipo de implementación. Seleccione Crear para iniciar la implementación del modelo personalizado.

Captura de pantalla que muestra la selección de Implementación para desarrolladores en Foundry.

Puede supervisar el progreso de la nueva implementación en el panel Deployments en el portal Microsoft Foundry.

Uso del modelo optimizado implementado

Una vez implementado el modelo personalizado, puede usarlo como cualquier otro modelo implementado. Puede usar el área de juegos en el portal de Foundry para experimentar con la nueva implementación. Puede seguir usando los mismos parámetros con el modelo personalizado, como temperature y max_tokens, como puede con otros modelos implementados.

Captura de pantalla del panel Parque infantil en el portal de Foundry, con secciones resaltadas.

También puede usar el servicio Evaluations para crear y ejecutar evaluaciones del modelo en el candidato del modelo implementado, así como otras versiones del modelo.

Limpia tu implementación

Las implementaciones de desarrolladores se eliminarán automáticamente independientemente de la actividad. Cada implementación tiene una duración fija de 24 horas después de la cual está sujeta a eliminación. La eliminación de una implementación no elimina ni afecta al modelo personalizado subyacente y el modelo personalizado se puede volver a implementar en cualquier momento.

Para eliminar una implementación manualmente, puede usar el portal foundry o usar CLI de Azure.

Para usar la API REST Deployments - Delete envía un HTTP DELETE al recurso de implementación. Al igual que con la creación de implementaciones, debe incluir los parámetros siguientes:

  • identificador de suscripción de Azure
  • Nombre del grupo de recursos de Azure
  • nombre de recurso de Azure OpenAI
  • Nombre de la implementación que se va a eliminar

A continuación se muestra el ejemplo de la API REST para eliminar una implementación:

curl -X DELETE "https://management.azure.com/subscriptions/<SUBSCRIPTION>/resourceGroups/<RESOURCE_GROUP>/providers/Microsoft.CognitiveServices/accounts/<RESOURCE_NAME>/deployments/<MODEL_DEPLOYMENT_NAME>?api-version=2025-07-01-preview" \
  -H "Authorization: Bearer <TOKEN>"

Pasos siguientes