Introducción a la implementación de modelos de Microsoft Foundry (clásico)

Solo se aplica a:portal Foundry (clásico). Este artículo no está disponible para el nuevo portal de Foundry. Obtenga más información sobre el nuevo portal.

Nota

Los vínculos de este artículo pueden abrir contenido en la nueva documentación de Microsoft Foundry en lugar de la documentación de Foundry (clásico) que está viendo ahora.

El catálogo de modelos de Microsoft Foundry es el centro para detectar y usar una amplia gama de modelos foundry para crear aplicaciones de IA generativas. Debe implementar modelos para que estén disponibles para recibir solicitudes de inferencia. Foundry ofrece un conjunto completo de opciones de implementación para Foundry Models, en función de sus necesidades y requisitos de modelo.

Opciones de implementación

Foundry proporciona varias opciones de implementación en función del tipo de modelos y recursos que necesita aprovisionar. Están disponibles las siguientes opciones de implementación:

  • Implementación estándar en recursos de Foundry
  • Implementación en puntos de conexión de API sin servidor
  • Implementación en sistemas gestionados

El portal de Foundry puede elegir automáticamente una opción de implementación en función del entorno y la configuración. Use los recursos de Foundry para la implementación siempre que sea posible. Modelos que admiten varias opciones de implementación utilizan por defecto los recursos de Foundry para la implementación. Para acceder a otras opciones de implementación, use el SDK de CLI de Azure o Azure Machine Learning para la implementación.

Implementación estándar en recursos de Foundry

Los recursos de Foundry son la opción de implementación preferida en Foundry. Ofrece la gama más amplia de capacidades, incluyendo el procesamiento regional, de zona de datos o global, y proporciona opciones de rendimiento de transferencia estándar y aprovisionado (PTU). Los modelos insignia de Foundry Models admiten esta opción de implementación.

Esta opción de implementación está disponible en:

  • Recursos de fundición
  • Recursos de Azure OpenAI1
  • Azure AI hub, cuando se conecta a un recurso Foundry

1Si usa Azure recursos de OpenAI, el catálogo de modelos solo muestra Azure OpenAI en Foundry Models para su implementación. Puede obtener la lista completa de Modelos de Foundry actualizando a un recurso de Foundry.

Para empezar a trabajar con la implementación estándar en recursos de Foundry, consulte Procedimientos: Implementación de modelos en modelos de Foundry.

Punto de conexión de API sin servidor

Esta opción de implementación solo está disponible en los recursos de AI Hub. Permite crear puntos de conexión dedicados para hospedar el modelo, accesible a través de una API. Foundry Models admite puntos de conexión de API sin servidor con facturación de pago por uso y solo puede crear implementaciones regionales para puntos de conexión de API sin servidor.

Para empezar a trabajar con la implementación en un punto de conexión de API sin servidor, consulte Implementación de modelos como implementaciones de API sin servidor.

Cómputo administrado

Esta opción de implementación solo está disponible en los recursos de AI Hub. Permite crear un punto de conexión dedicado para hospedar el modelo en un proceso dedicado. Debe tener cuota de cálculo en la suscripción para hospedar el modelo, y se le factura por tiempo de actividad de cálculo.

La implementación de cómputo administrada es necesaria para las colecciones de modelos que incluyen:

  • Hugging Face
  • Microservicios de inferencia de NVIDIA (NIM)
  • Modelos del sector (Saifr, Rockwell, Bayer, Cerence, Sight Machine, Page AI, SDAIA)
  • Databricks
  • Modelos personalizados

Para empezar, consulte Implementación y utilización de una implementación computacional gestionada e Implementación de Modelos Foundry en computación administrada con facturación de pago por uso.

Funcionalidades para las opciones de implementación

Use implementaciones estándar en recursos de Foundry siempre que sea posible. Esta opción de implementación proporciona la mayoría de las funcionalidades entre las opciones de implementación disponibles. En la tabla siguiente se enumeran los detalles sobre las funcionalidades específicas de cada opción de implementación:

Capacidad Implementación estándar en recursos de Foundry Punto de conexión de API sin servidor Cómputo administrado
¿Qué modelos se pueden implementar? Foundry Models vendido directamente por Azure
Modelos de foundry de asociados y comunidad
Modelos Foundry con facturación por uso Modelos abiertos y personalizados
Recurso de implementación Recurso de fundición Proyecto de inteligencia artificial (en el recurso del hub de inteligencia artificial) Proyecto de INTELIGENCIA ARTIFICIAL (en el recurso del centro de INTELIGENCIA ARTIFICIAL)
Requiere centros de IA No
Opciones de procesamiento de datos Regional
Zona de datos
Mundial
Regional Regional
Redes privadas
Filtrado de contenido No
Filtrado de contenido personalizado No No
Autenticación sin claves No No
Bases de facturación Uso de tokens y unidades de rendimiento aprovisionadas Uso de tokens2 Horas de núcleo de cómputo3

2 Una infraestructura de punto de conexión mínima se factura por minuto. No se le factura la infraestructura que hospeda el modelo en la implementación sin servidor. Después de eliminar el punto de conexión, no se acumulan cargos adicionales.

3 La facturación se realiza por minuto, según el nivel de producto y el número de instancias usadas en la implementación desde el momento de la creación. Después de eliminar el punto de conexión, no se acumulan cargos adicionales.