Azure OpenAI modelos y regiones para el servicio de agente de Foundry (clásico)

Nota

Este documento hace referencia al portal de Microsoft Foundry (clásico).

Los agentes (clásicos) ahora están obsoletos y se retirarán el 31 de marzo de 2027. Use los nuevos agentes de Microsoft Foundry Agents Service disponibles con carácter general. Siga la guía de migración para actualizar las cargas de trabajo.

Los modelos de Azure OpenAI impulsan agentes en el Servicio de Agentes de Foundry. Para usar estos modelos, necesita un proyecto de Microsoft Foundry con acceso al servicio del agente. Use las pestañas para buscar una combinación de modelo, tipo de implementación y región compatibles. Para obtener más información sobre los tipos de implementación, consulte Tipos de implementación para Microsoft Foundry Models.

Los agentes (clásicos) están en desuso. Para usar modelos posteriores a gpt-5, consulte la documentación de agentes (nuevos).

Modelos disponibles

Región gpt-5 gpt-5-mini gpt-5-nano gpt-5-chat gpt-4.1 gpt-4.1-nano gpt-4.1-mini gpt-4o (05-13) gpt-4o (08-06) gpt-4o (11-20) gpt-4o-mini gpt-4 gpt-4-turbo
australiaeast
brazilsouth
Canadá Este
eastus
eastus2
francecentral
alemaniawestcentral
italynorth
japaneast
norwayeast
southafricanorth
southcentralus
Sur de India
swedencentral
suizanorth
uksouth
westeurope
westus
westus3

Importante

  • Los proyectos basados en concentradores se limitan a los siguientes modelos: gpt-4o, gpt-4o-mini, gpt-4 y gpt-35-turbo.
  • Para obtener información sobre la compatibilidad con la subred de clase A, consulte la guía de configuración en GitHub.
  • familia gpt-5 (gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat): razonamiento a escala de frontera para tareas complejas y de varios pasos. Se requiere el registro . Estos modelos solo pueden usar el intérprete de código y las herramientas de búsqueda de archivos .
  • familia gpt-4.1 (gpt-4.1, gpt-4.1-mini, gpt-4.1-nano): modelos rentables para cargas de trabajo del agente de uso general.
  • familia gpt-4o (gpt-4o, gpt-4o-mini): funcionalidades bidireccionales con soporte de visión.
  • gpt-4 y gpt-35-turbo: modelos heredados para compatibilidad con versiones anteriores.

Modelos que no son de OpenAI

Además de los modelos de Azure OpenAI, puede usar modelos proporcionados directamente por Azure. Estos modelos ofrecen funcionalidades especializadas para casos de uso específicos, como el razonamiento determinista o la generación de alto rendimiento.

Models vendidos directamente por Azure:

  • MAI-DS-R1: razonamiento determinista y centrado en la precisión.
  • grok-4: razonamiento a escala de frontera para la resolución compleja de problemas de varios pasos.
  • grok-4-fast-reasoning: razonamiento agente optimizado y acelerado para la automatización del flujo de trabajo.
  • grok-4-fast-non-razonamiento: generación de alto rendimiento, baja latencia y enrutamiento de sistemas.
  • grok-3: razonamiento sólido para flujos de trabajo complejos y de nivel del sistema.
  • grok-3-mini: modelo ligero optimizado para casos de uso interactivos y de gran volumen.
  • Llama-3.3-70B-Instruct: Modelo versátil para Q&A empresarial, soporte de decisión y orquestación del sistema.
  • Llama-4-Maverick-17B-128E-Instruct-FP8: modelo optimizado para FP8 que ofrece inferencia rápida y rentable.
  • DeepSeek-V3-0324: Comprensión bidireccional entre texto e imágenes.
  • DeepSeek-V3.1: razonamiento bidireccional mejorado y recuperación fundamentada.
  • DeepSeek-R1-0528: razonamiento avanzado de forma larga y de varios pasos.
  • gpt-oss-120b: modelo de ecosistema abierto que admite transparencia y reproducibilidad.

Comprobación de la compatibilidad del modelo

La disponibilidad del modelo puede cambiar con el tiempo. Para comprobar lo que puede implementar para el proyecto y la región:

  1. Inicie sesión en Microsoft Foundry. Asegúrese de que el interruptor New Foundry está desactivado. Estos pasos hacen referencia a Foundry (clásico).
  2. Vaya al catálogo de modelos.
  3. Filtre los modelos por Funcionalidades y seleccione Agente admitido.

Si usa el rendimiento aprovisionado, asegúrese de que ha aprovisionado unidades de rendimiento (PTU) disponibles en la región de destino. Para antecedentes, consulte Rendimiento aprovisionado.

Solución de problemas

Un modelo o una versión no están disponibles en su región

  • Confirme que seleccionó la pestaña derecha para el tipo de implementación.
  • Pruebe otra región que admita el modelo y la versión.
  • Si está usando modelos gpt-5, asegúrese de que su suscripción tenga acceso. Algunos modelos requieren registro.

La búsqueda de archivos no está disponible

  • La búsqueda de archivos no está disponible en Norte de Italia y Sur de Brasil. Elija una región admitida o use otra herramienta.

Error en la implementación del ancho de banda aprovisionado