Modelos de fuegos artificiales en Microsoft Foundry (versión preliminar)

Importante

Los elementos marcados (versión preliminar) de este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se proporciona sin un contrato de nivel de servicio y no se recomienda para cargas de trabajo de producción. Es posible que algunas características no se admitan o que tengan funcionalidades restringidas. Para obtener más información, vea Supplemental Terms of Use for Microsoft Azure Previews.

Mediante la integración con Fireworks AI, los clientes de Microsoft Foundry pueden:

Experimenta con los modelos de código abierto más recientes frecuentemente antes de que estén disponibles directamente de Azure.
Importe e implemente modelos con pesos del modelo (trae tu propio modelo, también conocido como BYOM) en la infraestructura habilitada para GPU de Fireworks. Para obtener más información, consulte Importar modelos personalizados en Microsoft Foundry with Fireworks.
Escalado vertical mediante Rendimiento aprovisionado

Todas estas funcionalidades están disponibles directamente en tu proyecto Foundry, con la gobernanza de Azure, controles de acceso y gestión de proyectos integrados.

Requisitos previos

Una suscripción Azure. Si no tiene una, cree una cuenta gratuita.
Un recurso Foundry con un proyecto Foundry.
Una identidad de Azure con el rol Propietario de la suscripción o Colaborador de la suscripción para habilitar la característica de vista previa.
Para implementar modelos, necesita el rol Propietario de Azure AI en el proyecto de Foundry. Para obtener más información, consulte roles integrados de Azure.

Disponibilidad de regiones

Las implementaciones estándar de zona de datos de modelos a través de Fireworks on Foundry están disponibles en las siguientes regiones Azure:

Este de EE. UU. (eastus)
East US 2 (eastus2)
Centro de EE. UU. (centralus)
Centro-norte de EE. UU. (northcentralus)
Oeste de EE. UU. (westus)
Oeste de EE. UU. 3 (westus3)

Las implementaciones de rendimiento aprovisionado globales de modelos base y personalizados están disponibles en todas las regiones globales de Azure, excepto en los entornos de nube de Azure Government.

Habilitación de fuegos artificiales en Foundry

Importante

Los fuegos artificiales en Foundry se excluyen actualmente de los compromisos de límite de datos de la UE.

No se consigue FedRAMP para Fireworks en Foundry. Si su organización requiere FedRAMP, antes de su uso, consulte con su oficial de autorización para determinar si se permite el uso de Fuegos artificiales en Foundry.

El Estándar de Seguridad de Datos (DSS) del Sector de Tarjetas de Pago (PCI) no es aplicable a Fireworks en Foundry. No debes usar Fireworks en Foundry para almacenar, procesar o transmitir datos de pago y datos del titular de la tarjeta.

Durante la versión preliminar, Fireworks requiere que un administrador habilite la característica de vista previa dentro de la suscripción de Azure.

Inicie sesión en el portal Azure.
En el cuadro de búsqueda, escriba suscripciones y seleccione Suscripciones.
Seleccione el vínculo del nombre de la suscripción.
En el menú de la izquierda, en Configuración, seleccione Características de vista previa.
Busque y seleccione la función de vista previa Fireworks.EnableDeploy.
Revise los términos proporcionados en la sección Descripción y privacidad de datos de esta documentación.
Si no acepta los términos, seleccione Cerrar y no continúe. De lo contrario, seleccione Registrar.
Seleccione Aceptar. La pantalla Características de vista previa se actualiza y se muestra el estado de la característica de vista previa. La característica puede tardar hasta 30 minutos en habilitarse para la suscripción.

Sugerencia

Para comprobar el registro, actualice la página Características de vista previa y confirme que la columna Estado muestra Registrado para la característica Fuegos artificiales en Foundry .

Implementación de modelos Fireworks en el portal de Foundry

Una vez habilitada la característica, se pueden implementar modelos Fireworks desde el catálogo de modelos Foundry. Complete estos pasos para obtener un punto de conexión activo para las finalizaciones de chat. Examine los modelos disponibles en la sección Modelos de catálogo disponibles o importe su propio modelo personalizado.

En la página principal del portal, seleccione Detectar en la navegación superior derecha.
En el panel izquierdo, seleccione Modelos para abrir el catálogo Modelo.
Seleccione el modelo de Fuegos artificiales deseado para ver sus detalles en la página del modelo:
En la página modelo, seleccione Implementar. Para obtener más información sobre las opciones de implementación, consulte Implementación de Modelos Foundry en el portal.
En la ventana de implementación, configure los valores siguientes:
- Nombre de implementación: mantenga el nombre predeterminado o escriba un nombre personalizado para identificar la implementación.
- Tipo de implementación: seleccione Data Zone Standard o Rendimiento aprovisionado global. Para obtener más información, consulte Tipos de implementación.
- Configuración de la versión del modelo: seleccione la versión del modelo para la implementación.
- Límite de tokens por minuto: Configure un límite personalizado de tokens por minuto para administrar los costos y controlar el uso. El valor predeterminado se basa en el perfil de costo y rendimiento típicos del modelo.
- Límites de protección: seleccione la configuración de límites de protección DefaultV2 o Predeterminada. Los modelos usan el Microsoft. DefaultV2 límite de protección a menos que se especifique otro. Para obtener más información, consulte Uso de barreras de seguridad para definir los límites en las salidas del modelo.
Seleccione Implementar. El proceso de implementación puede tardar hasta 30 minutos.
Una vez completada la implementación, use el punto de conexión y la clave proporcionados para enviar solicitudes de inferencia al modelo. Para probar rápidamente la implementación, use el área de juegos del proyecto Foundry.

Sugerencia

Para comprobar la implementación, vaya a la página Implementaciones del proyecto y confirme que el estado de implementación muestra Correcto.

Modelos de catálogo disponibles

Los siguientes modelos de Fuegos artificiales están disponibles en el catálogo de modelos de Foundry:

Proveedor de modelos	Nombre del modelo	Id. de modelo	Tipo	Ofertas soportadas	Descripción
DeepSeek	DeepSeek v3.1	`FW-DeepSeek-v3.1`	Completaciones del chat	PTU	Modelo de peso abierto de uso general para tareas de chat y razonamiento.
DeepSeek	DeepSeek v3.2	`FW-DeepSeek-v3.2`	Completaciones del chat	Per-Token y PTU	Modelo de peso abierto optimizado para razonamiento para tareas complejas.
MiniMax	MiniMax 2.5	`FW-MiniMax-2.5`	Completaciones del chat	Per-Token y PTU	Modelo de propósito general para tareas conversacionales y de seguimiento de instrucciones.
Inteligencia artificial de captura de luna	Kimi K2 Instruct 0905	`FW-Kimi-K2-Instruct-0905`	Completaciones del chat	PTU	Modelo optimizado de instrucciones para cargas de trabajo de chat.
Inteligencia artificial de captura de luna	Kimi K2 Thinking	`FW-Kimi-K2-Thinking`	Completaciones del chat	PTU	Modelo centrado en el razonamiento para la resolución de problemas de varios pasos.
Inteligencia artificial de captura de luna	Kimi K2.5	`FW-Kimi-K2.5`	Completaciones del chat	Per-Token y PTU	Modelo multimodal con sólidas capacidades de contexto largo.
OpenAI	gpt-oss-120b	`FW-gpt-oss-120b`	Completaciones del chat	Per-Token y PTU	Modelo de peso abierto a gran escala para amplias tareas generativas.
Qwen	Qwen3.5 122B A10B	`FW-Qwen3.5-122B-A10B`	Completaciones del chat	PTU	Modelo de peso abierto de uso general para tareas de chat y razonamiento.
Qwen	Qwen3.5 397B A17B	`FW-Qwen3.5-397B-A17B`	Completaciones del chat	PTU	Modelo de peso abierto de uso general para tareas de chat y razonamiento.
Zhipu AI	GLM-4.7	`FW-GLM-4.7`	Completaciones del chat	PTU	Modelo bilingüe para tareas de chat y razonamiento.
Zhipu AI	GLM-5	`FW-GLM-5`	Completaciones del chat	Per-Token y PTU	Modelo bilingüe de alto rendimiento para chat y razonamiento.

Todos los modelos del catálogo son compatibles con la API OpenAI/v1 para la API de completado de chat y con el SDK de Foundry y el punto de conexión para acceder a la API de respuestas.

Modelos personalizados (traiga su propio modelo)

Además de los modelos de catálogo, Fireworks en Foundry admite la importación e implementación de sus propios pesos del modelo personalizados. Esta funcionalidad BYOM le permite ejecutar modelos de peso abierto, ya sean propios o ajustados, dentro del ecosistema de Foundry, con la inferencia proporcionada por la nube optimizada de Fireworks.

Arquitecturas de modelo admitidas

Los modelos personalizados deben basarse en una de las siguientes arquitecturas admitidas:

DeepSeek (V3.1, V3.2)
Kimi (K2, K2.5)
GLM (4.7)
OpenAI (gpt-oss-120b)
Qwen (qwen3-14b, qwen3.5-397B-A17B, qwen3.5-122B-A10B)

Limitaciones

Solo modelos de peso completo. No se admiten modelos basados en LoRA y en adaptadores.
Flujo de trabajo orientado a la CLI. El proceso de importación usa la CLI Azure Developer (azd). El portal de Foundry admite el registro, la visualización y la implementación de modelos después de la carga.
Los flujos de trabajo de agentes de fuegos artificiales y del Generador de agentes están fuera del ámbito de esta versión preliminar.

Para obtener instrucciones paso a paso, consulte Importación de modelos personalizados en Foundry.

Privacidad de datos

Al usar Fireworks en Foundry, los datos se comparten entre Microsoft y Fireworks AI, y se aplicarán diferentes reglas de cumplimiento y manejo de datos. Consulte a continuación para obtener más información. Los clientes son responsables de evaluar si el uso compartido de datos entre Microsoft y Fireworks es adecuado para los requisitos de cumplimiento de sus organizaciones.

Los fuegos artificiales en Foundry se excluyen actualmente de los compromisos de límite de datos de la UE.
No se consigue FedRAMP para Fireworks en Foundry. Si su organización requiere FedRAMP, antes de su uso, consulte con su oficial de autorización para determinar si se permite el uso de Fuegos artificiales en Foundry.
El Estándar de Seguridad de Datos (DSS) del Sector de Tarjetas de Pago (PCI) no es aplicable a Fireworks en Foundry. No debes usar Fireworks en Foundry para almacenar, procesar o transmitir datos de pago y datos del titular de la tarjeta.

Nota de transparencia

Fireworks en Foundry permite a los clientes implementar y operar modelos de inteligencia artificial de terceros y de código abierto utilizando los servicios de plataforma Microsoft Foundry.

Microsoft no desarrolla, entrena, ajusta finamente ni evalúa las características de seguridad, protección o inteligencia artificial responsable de los modelos implementados a través de Fireworks en Foundry.
Microsoft no realiza ninguna representación en relación con el comportamiento, el rendimiento o el perfil de riesgo de estos modelos.
Los clientes son los únicos responsables de evaluar la idoneidad de cualquier modelo para su uso previsto, incluida la realización de las evaluaciones de seguridad, cumplimiento y inteligencia artificial responsable necesarias, antes de implementar modelos en aplicaciones orientadas al cliente o de producción.

Foundry proporciona las herramientas y procedimientos recomendados para realizar sus propias evaluaciones de riesgos y seguridad de los modelos.

Preguntas más frecuentes

¿Está Fireworks on Foundry disponible en Azure para el Gobierno de EE. UU.?

No, actualmente el servicio Fireworks on Foundry no está disponible para usuarios de Azure Government en la nube.

¿Cómo puedo obtener una cuota para las implementaciones del modelo Fireworks?

Utiliza el formulario de solicitud de cuota para solicitar cuota adicional para Fireworks en Foundry.

Tengo una cuenta de Fireworks AI. ¿Puedo usar mis despliegues de Adobe Fireworks existentes?

No, necesitas crear nuevos despliegues en Foundry. Si desea cambiar el consumo a Azure, póngase en contacto con el equipo de la cuenta de Fireworks para ayudar.

¿Puedo implementar modelos basados en loRA o adaptadores?

No, la versión preliminar actual solo admite modelos personalizados de peso completo. Los modelos LoRA y basados en adaptador no se admiten en este momento.

¿La versión de prueba de Fireworks es adecuada para cargas de trabajo de producción?

No. Como versión preliminar pública, Fireworks on Foundry no incluye un acuerdo de nivel de servicio (SLA) de producción. La versión preliminar está pensada para pruebas tempranas, experimentación y validación.

¿Cómo se importa e implementa un modelo personalizado?

La importación de modelos personalizados utiliza un flujo de trabajo centrado en la CLI con la CLI para desarrolladores de Azure. Para obtener instrucciones paso a paso, consulte Importación de modelos personalizados en Foundry.

¿Cómo se facturan los fuegos artificiales en Foundry?

Los modelos de fuegos artificiales implementados a través de Foundry admiten las ofertas de pago por token y rendimiento aprovisionado.

¿Cómo deshabilito Fireworks en mi proyecto Foundry?

Los fuegos artificiales se pueden deshabilitar en el nivel de suscripción de Azure. Siga los pasos para unregister preview features en la suscripción de Azure.

¿Cómo se usa la API de respuestas?

La API de respuestas es compatible a través de la API y el SDK de Foundry Projects. Asegúrese de dirigir a su cliente al punto de conexión de la API de su proyecto o use el SDK de Foundry.

Solución de problemas de Fireworks en Foundry

Siga las siguientes instrucciones para resolver problemas comunes con Fireworks en Foundry.

Problema	Resolución
El registro de la versión preliminar permanece en estado "Registro"	El registro puede tardar hasta 30 minutos. Actualice la página Características de vista previa para comprobar el estado actual. Si el estado no cambia después de 30 minutos, intente anular el registro y volver a registrar la característica.
Los modelos de fuegos artificiales no aparecen en el catálogo de modelos	Confirme que el estado de la característica de vista previa muestra Registrado para la suscripción. Compruebe que está trabajando en una región admitida.
La implementación falla debido a un error de cuota	Use el formulario de solicitud de cuota para solicitar capacidad agregada para Fuegos artificiales en Foundry.
"Prohibido" o acceso denegado durante la implementación	Comprueba que tu identidad tenga el rol Azure AI Developer o superior en el proyecto Foundry. Los roles a nivel de suscripción por sí solos no son suficientes para la implementación.
El punto de conexión del modelo devuelve errores después de la implementación	Confirme que el estado de implementación muestra Exitoso en la página Implementaciones del proyecto. Compruebe que usa el URI de destino y la clave correctos de los detalles de implementación.

Para otras consultas, consulte la sección de preguntas más frecuentes .

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-29