Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Importante
Los elementos marcados (versión preliminar) de este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se proporciona sin un contrato de nivel de servicio y no se recomienda para cargas de trabajo de producción. Es posible que algunas características no se admitan o que tengan funcionalidades restringidas. Para obtener más información, vea Supplemental Terms of Use for Microsoft Azure Previews.
Importe y despliegue sus propios pesos de modelo en Foundry utilizando el entorno de ejecución de inferencia Fireworks.
En este artículo, aprenderá a importar, registrar e implementar sus propios pesos de modelo personalizados en Microsoft Foundry. La importación de modelos personalizados (también conocida como bring your own weights) le permite ejecutar sus modelos propietarios o ajustados de pesos abiertos dentro del ecosistema Foundry.
Nota
Esta guía de importación de un modelo personalizado utiliza la integración con Fireworks on Foundry. Para obtener información general sobre los modelos de catálogo disponibles, las arquitecturas admitidas, la privacidad de los datos y las limitaciones, consulte Uso de modelos de Fuegos artificiales en Foundry.
El flujo de trabajo de importación tiene cuatro pasos:
- Prepare los archivos de modelo en una arquitectura compatible.
- Registre el modelo en el portal de Foundry.
- Sube ponderaciones del modelo mediante la CLI de Desarrollador de Azure.
- Desplegar el modelo a la infraestructura de inferencia de Fireworks.
Requisitos previos
Antes de comenzar, asegúrese de que el entorno de Azure esté configurado y de que tenga instaladas las herramientas necesarias. Para completar los pasos de este artículo, necesita los siguientes recursos y permisos:
- Una suscripción Azure. Si no tiene una, cree una cuenta gratuita.
- Un recurso Foundry con un proyecto Foundry.
- La función de vista previa Fuegos artificiales en Foundry está habilitada en su suscripción. Para conocer los pasos de configuración, consulte Uso de modelos de Fuegos artificiales en Foundry.
- El rol Colaborador de Cognitive Services o los permisos equivalentes del recurso Foundry necesarios para crear y administrar implementaciones. Para obtener más información, consulte control de acceso basado en roles de Azure.
-
Azure CLI para desarrolladores (
azd) instalada localmente. El flujo de trabajo de importación usaazdpara cargar pesos del modelo.
Disponibilidad de regiones
La compatibilidad con la implementación de modelos personalizados está disponible en todas las regiones globales de Azure excepto en entornos de nube de Azure Government.
Requisitos del modelo
Los modelos personalizados deben coincidir con una arquitectura compatible e incluir archivos específicos para que Foundry los registre e implemente. Revise ambos requisitos antes de iniciar el proceso de importación.
Arquitecturas admitidas
Los modelos personalizados deben basarse en una de las siguientes arquitecturas de modelo:
| Arquitectura del modelo | Versiones |
|---|---|
| DeepSeek | V3.1, V3.2 |
| Kimi | K2, K2.5 |
| GLM | 4.7, 4.8 |
| OpenAI | gpt-oss-120b |
| Qwen | qwen3-14b |
Archivos de modelo necesarios
El directorio del modelo debe incluir los siguientes archivos:
| Archivo | Descripción |
|---|---|
config.json |
Configuración del modelo (arquitectura, hiperparámetros). |
*.safetensors o *.bin |
Uno o varios archivos de peso del modelo. |
*.index.json |
Al menos un archivo de índice de pesos que asigna particiones de peso. |
tokenizer.model, tokenizer.jsono tokenizer_config.json |
Archivos de tokenizador necesarios para el modelo. |
Importante
Solo se admiten modelos de peso completo con cuantificación original. Los adaptadores de LoRA o los modelos cuantificados personalizados no se admiten actualmente en esta versión preliminar.
Importación de un modelo personalizado
El proceso de importación se inicia en el portal de Foundry, donde registra el modelo y, a continuación, usa la CLI para desarrolladores de Azure para cargar los pesos del modelo desde la máquina local.
Inicie sesión en el portal de Foundry.
En la página principal del portal de Foundry, seleccione Compilar en el panel superior derecho y, a continuación, seleccione Modelos en el panel izquierdo.
Seleccione la pestaña Modelos personalizados .
Seleccione Agregar un modelo personalizado.
Configure los valores siguientes:
Nombre del modelo: escriba un nombre descriptivo para el modelo personalizado.
Arquitectura del modelo base: seleccione la arquitectura del modelo que coincida con el modelo (por ejemplo,
DeepSeek V3.2oGLM 4.7).
El portal genera un
azdcomando. Copie el comando y péguelo en un terminal local. Actualice el--sourceparámetro para que apunte al directorio que contiene los archivos de peso del modelo.Propina
Asegúrese de que el directorio especificado contiene todos los archivos de modelo necesarios. Los archivos que faltan hacen que se produzca un error en la importación.
Espere a que se complete la carga. El tiempo de carga depende del tamaño del modelo y del ancho de banda de red. Los modelos grandes (decenas de gigabytes) pueden tardar mucho tiempo en las conexiones estándar.
Comprobación del registro de modelos
Una vez finalizada la carga, confirme que Foundry registró correctamente el modelo antes de continuar con la implementación.
Vuelva al portal de Foundry y actualice la página Modelos personalizados .
Confirme que el modelo personalizado importado aparece en la lista con un estado Registrado .
Seleccione su modelo para revisar sus detalles, incluida la arquitectura y el manifiesto de archivo.
Implementación del modelo importado
Con el modelo registrado, puede implementarlo en la nube de Fireworks para realizar inferencias.
En la lista Modelos personalizados , seleccione el modelo personalizado.
Seleccione Implementar.
Configure la implementación:
-
Nombre de implementación: proporcione un nombre de implementación. Durante la inferencia, este nombre se usa en el
modelparámetro para enrutar las solicitudes a esta implementación. - Unidades de rendimiento aprovisionadas: asigne el número de unidades de rendimiento aprovisionadas (PTU) para la implementación. Para más información, consulte Conceptos de rendimiento aprovisionados.
-
Nombre de implementación: proporcione un nombre de implementación. Durante la inferencia, este nombre se usa en el
Revise y confirme los términos de precios.
Seleccione Implementar.
Cuando se completa la implementación, el estado muestra Exitoso en la lista de implementaciones.
Nota
Solo puede tener una implementación activa de un modelo personalizado en un proyecto determinado a la vez.
Ejemplos de implementación
Use los ejemplos siguientes para automatizar partes del flujo de trabajo de implementación después de registrar el modelo personalizado. Cada ejemplo implementa el modelo personalizado con 80 unidades de rendimiento aprovisionado global. Asegúrese de reemplazar los marcadores de posición con sus datos.
PUT https://management.azure.com/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/deployments/{deployment-name}?api-version=2025-06-01
Authorization: Bearer <access-token>
Content-Type: application/json
{
"sku": {
"name": "GlobalProvisionedManaged",
"capacity": 80
},
"properties": {
"model": {
"name": "<registered-model-name>",
"format": "FireworksCustom",
"version": "1",
"source": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}"
}
}
}
Prueba de la implementación
Una vez que la implementación se realiza correctamente, compruebe que funciona enviando una solicitud de prueba:
- Abra el Foundry Playground.
- Seleccione la implementación del modelo personalizado en la lista de modelos.
- Envíe un mensaje de prueba y confirme que el modelo devuelve una respuesta válida.
Solución de problemas
Si encuentra problemas durante la importación o la implementación, use la tabla siguiente para identificar problemas y soluciones comunes.
| Problema | Resolución |
|---|---|
| Se produce un error en la importación con archivos que faltan | Compruebe que el directorio del modelo contiene todos los archivos de modelo necesarios, incluidos config.jsonlos archivos de peso , un archivo de índice y los archivos de tokenizador. |
| Error de coincidencia de arquitectura | Confirme que la arquitectura seleccionada coincide con el modelo. Consulte arquitecturas admitidas. |
| Tiempos de espera de carga o se bloquea | Compruebe la conexión de red y vuelva a intentarlo. Para modelos de gran tamaño, use una conexión estable de ancho de banda alto. |
| Error en la implementación | Confirme que tiene cuota suficiente y que la característica de vista previa de Fuegos artificiales está habilitada y registrada en su suscripción. |
| Cuota superada | Solicite más cuota o reasigne las unidades de rendimiento aprovisionadas de los despliegues existentes. |
Para obtener más instrucciones de solución de problemas, consulte Solución de problemas de fuegos artificiales en Foundry.
Contenido relacionado
Explore los siguientes recursos para obtener más información sobre los modelos de Fuegos artificiales, las opciones de implementación y la autenticación en Foundry.