Importación de modelos personalizados con Fuegos artificiales (versión preliminar)

Importante

Los elementos marcados (versión preliminar) de este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se proporciona sin un contrato de nivel de servicio y no se recomienda para cargas de trabajo de producción. Es posible que algunas características no se admitan o que tengan funcionalidades restringidas. Para obtener más información, vea Supplemental Terms of Use for Microsoft Azure Previews.

Importe y despliegue sus propios pesos de modelo en Foundry utilizando el entorno de ejecución de inferencia Fireworks.

En este artículo, aprenderá a importar, registrar e implementar sus propios pesos de modelo personalizados en Microsoft Foundry. La importación de modelos personalizados (también conocida como bring your own weights) le permite ejecutar sus modelos propietarios o ajustados de pesos abiertos dentro del ecosistema Foundry.

Nota

Esta guía de importación de un modelo personalizado utiliza la integración con Fireworks on Foundry. Para obtener información general sobre los modelos de catálogo disponibles, las arquitecturas admitidas, la privacidad de los datos y las limitaciones, consulte Uso de modelos de Fuegos artificiales en Foundry.

El flujo de trabajo de importación tiene cuatro pasos:

Prepare los archivos de modelo en una arquitectura compatible.
Registre el modelo en el portal de Foundry.
Sube ponderaciones del modelo mediante la CLI de Desarrollador de Azure.
Desplegar el modelo a la infraestructura de inferencia de Fireworks.

Requisitos previos

Antes de comenzar, asegúrese de que el entorno de Azure esté configurado y de que tenga instaladas las herramientas necesarias. Para completar los pasos de este artículo, necesita los siguientes recursos y permisos:

Una suscripción Azure. Si no tiene una, cree una cuenta gratuita.
Un recurso Foundry con un proyecto Foundry.
La función de vista previa Fuegos artificiales en Foundry está habilitada en su suscripción. Para conocer los pasos de configuración, consulte Uso de modelos de Fuegos artificiales en Foundry.
El rol Colaborador de Cognitive Services o los permisos equivalentes del recurso Foundry necesarios para crear y administrar implementaciones. Para obtener más información, consulte control de acceso basado en roles de Azure.
Azure CLI para desarrolladores (azd) instalada localmente. El flujo de trabajo de importación usa azd para cargar pesos del modelo.

Disponibilidad de regiones

La compatibilidad con la implementación de modelos personalizados está disponible en todas las regiones globales de Azure excepto en entornos de nube de Azure Government.

Requisitos del modelo

Los modelos personalizados deben coincidir con una arquitectura compatible e incluir archivos específicos para que Foundry los registre e implemente. Revise ambos requisitos antes de iniciar el proceso de importación.

Arquitecturas admitidas

Los modelos personalizados deben basarse en una de las siguientes arquitecturas de modelo:

Arquitectura del modelo	Versiones
DeepSeek	V3.1, V3.2
Kimi	K2, K2.5
GLM	4.7, 4.8
OpenAI	gpt-oss-120b
Qwen	qwen3-14b

Archivos de modelo necesarios

El directorio del modelo debe incluir los siguientes archivos:

Archivo	Descripción
`config.json`	Configuración del modelo (arquitectura, hiperparámetros).
`.safetensors` o `.bin`	Uno o varios archivos de peso del modelo.
`*.index.json`	Al menos un archivo de índice de pesos que asigna particiones de peso.
`tokenizer.model`, `tokenizer.json`o `tokenizer_config.json`	Archivos de tokenizador necesarios para el modelo.

Importante

Solo se admiten modelos de peso completo con cuantificación original. Los adaptadores de LoRA o los modelos cuantificados personalizados no se admiten actualmente en esta versión preliminar.

Importación de un modelo personalizado

El proceso de importación se inicia en el portal de Foundry, donde registra el modelo y, a continuación, usa la CLI para desarrolladores de Azure para cargar los pesos del modelo desde la máquina local.

Inicie sesión en el portal de Foundry.
En la página principal del portal de Foundry, seleccione Compilar en el panel superior derecho y, a continuación, seleccione Modelos en el panel izquierdo.
Seleccione la pestaña Modelos personalizados .
Seleccione Agregar un modelo personalizado.
Configure los valores siguientes:
- Nombre del modelo: escriba un nombre descriptivo para el modelo personalizado.
- Arquitectura del modelo base: seleccione la arquitectura del modelo que coincida con el modelo (por ejemplo, DeepSeek V3.2 o GLM 4.7).
El portal genera un azd comando. Copie el comando y péguelo en un terminal local. Actualice el --source parámetro para que apunte al directorio que contiene los archivos de peso del modelo.

Propina

Asegúrese de que el directorio especificado contiene todos los archivos de modelo necesarios. Los archivos que faltan hacen que se produzca un error en la importación.
Espere a que se complete la carga. El tiempo de carga depende del tamaño del modelo y del ancho de banda de red. Los modelos grandes (decenas de gigabytes) pueden tardar mucho tiempo en las conexiones estándar.

Comprobación del registro de modelos

Una vez finalizada la carga, confirme que Foundry registró correctamente el modelo antes de continuar con la implementación.

Vuelva al portal de Foundry y actualice la página Modelos personalizados .
Confirme que el modelo personalizado importado aparece en la lista con un estado Registrado .
Seleccione su modelo para revisar sus detalles, incluida la arquitectura y el manifiesto de archivo.

Implementación del modelo importado

Con el modelo registrado, puede implementarlo en la nube de Fireworks para realizar inferencias.

En la lista Modelos personalizados , seleccione el modelo personalizado.
Seleccione Implementar.
Configure la implementación:
- Nombre de implementación: proporcione un nombre de implementación. Durante la inferencia, este nombre se usa en el model parámetro para enrutar las solicitudes a esta implementación.
- Unidades de rendimiento aprovisionadas: asigne el número de unidades de rendimiento aprovisionadas (PTU) para la implementación. Para más información, consulte Conceptos de rendimiento aprovisionados.
Revise y confirme los términos de precios.
Seleccione Implementar.

Cuando se completa la implementación, el estado muestra Exitoso en la lista de implementaciones.

Nota

Solo puede tener una implementación activa de un modelo personalizado en un proyecto determinado a la vez.

Ejemplos de implementación

Use los ejemplos siguientes para automatizar partes del flujo de trabajo de implementación después de registrar el modelo personalizado. Cada ejemplo implementa el modelo personalizado con 80 unidades de rendimiento aprovisionado global. Asegúrese de reemplazar los marcadores de posición con sus datos.

PUT https://management.azure.com/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/deployments/{deployment-name}?api-version=2025-06-01
Authorization: Bearer <access-token>
Content-Type: application/json

{
  "sku": {
    "name": "GlobalProvisionedManaged",
    "capacity": 80
  },
  "properties": {
    "model": {
      "name": "<registered-model-name>",
      "format": "FireworksCustom",
      "version": "1",
      "source": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}"
    }
  }
}

az cognitiveservices account deployment create `
  --name "<foundry-resource-name>" `
  --resource-group "<resource-group>" `
  --deployment-name "<deployment-name>" `
  --model-name "<registered-model-name>" `
  --model-version "1" `
  --model-format "FireworksCustom" `
  --model-source "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}" `
  --sku-name "GlobalProvisionedManaged" `
  --sku-capacity 80

az cognitiveservices account deployment create \
  --name "<foundry-resource-name>" \
  --resource-group "<resource-group>" \
  --deployment-name "<deployment-name>" \
  --model-name "<registered-model-name>" \
  --model-version "1" \
  --model-format "FireworksCustom" \
  --model-source "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}" \
  --sku-name "GlobalProvisionedManaged" \
  --sku-capacity 80

Prueba de la implementación

Una vez que la implementación se realiza correctamente, compruebe que funciona enviando una solicitud de prueba:

Abra el Foundry Playground.
Seleccione la implementación del modelo personalizado en la lista de modelos.
Envíe un mensaje de prueba y confirme que el modelo devuelve una respuesta válida.

Solución de problemas

Si encuentra problemas durante la importación o la implementación, use la tabla siguiente para identificar problemas y soluciones comunes.

Problema	Resolución
Se produce un error en la importación con archivos que faltan	Compruebe que el directorio del modelo contiene todos los archivos de modelo necesarios, incluidos `config.json`los archivos de peso , un archivo de índice y los archivos de tokenizador.
Error de coincidencia de arquitectura	Confirme que la arquitectura seleccionada coincide con el modelo. Consulte arquitecturas admitidas.
Tiempos de espera de carga o se bloquea	Compruebe la conexión de red y vuelva a intentarlo. Para modelos de gran tamaño, use una conexión estable de ancho de banda alto.
Error en la implementación	Confirme que tiene cuota suficiente y que la característica de vista previa de Fuegos artificiales está habilitada y registrada en su suscripción.
Cuota superada	Solicite más cuota o reasigne las unidades de rendimiento aprovisionadas de los despliegues existentes.

Para obtener más instrucciones de solución de problemas, consulte Solución de problemas de fuegos artificiales en Foundry.

Explore los siguientes recursos para obtener más información sobre los modelos de Fuegos artificiales, las opciones de implementación y la autenticación en Foundry.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-29