Importar modelos personalizados com Fireworks (pré-visualização)

Importante

Os itens marcados (pré-visualização) neste artigo encontram-se atualmente em pré-visualização pública. Esta pré-visualização é fornecida sem um acordo de nível de serviço, e não a recomendamos para cargas de trabalho em produção. Certas funcionalidades podem não ser suportadas ou podem ter capacidades limitadas. Para mais informações, consulte Termos de Utilização Suplementares para Microsoft Azure Pré-visualizações.

Importa e implementa os teus próprios pesos de modelo no Foundry usando o ambiente de execução de inferência do Fireworks.

Neste artigo, aprende a importar, registar e implementar os seus próprios pesos personalizados de modelos no Microsoft Foundry. A importação de modelos personalizados (também conhecida como bring your own weights) permite executar os seus modelos proprietários ou otimizados de pesos abertos dentro do ecossistema Foundry.

Nota

Este guia personalizado de importação de modelos utiliza a integração Fireworks no Foundry. Para uma visão geral dos modelos de catálogo disponíveis, arquiteturas suportadas, privacidade de dados e limitações, consulte Usar modelos Fireworks no Foundry.

O fluxo de trabalho de importação tem quatro passos:

Prepare os seus ficheiros de modelo numa arquitetura suportada.
Registe o modelo no portal da Foundry.
Carregar pesos do modelo usando a CLI do Azure Developer.
Implemente o modelo na infraestrutura de inferência do Fireworks.

Pré-requisitos

Antes de começar, certifique-se de que o seu ambiente Azure está configurado e que tem as ferramentas necessárias instaladas. Para completar os passos deste artigo, precisa dos seguintes recursos e permissões:

Uma subscrição do Azure. Se não tiveres uma, cria uma conta gratuita.
Um recurso da Foundry com um projeto da Foundry.
A funcionalidade de pré-visualização Fireworks on Foundry foi ativada na sua subscrição. Para os passos de configuração, veja Usar modelos Fireworks no Foundry.
A função de Contribuidor de Serviços Cognitivos ou permissões equivalentes no recurso Foundry para criar e gerir implantações. Para obter mais informações, consulte Azure Controlo de Acesso Baseado em Funções.
Azure Developer CLI (azd) instalado localmente. O fluxo de trabalho de importação utiliza azd para carregar os pesos do modelo.

Disponibilidade regional

O suporte para implementação de modelos personalizados está disponível em todas as regiões globais Azure exceto em ambientes cloud Azure Government.

Requisitos do modelo

Os modelos personalizados devem corresponder a uma arquitetura suportada e incluir ficheiros específicos para o Foundry os registar e implementar. Revise ambos os requisitos antes de iniciar o processo de importação.

Arquiteturas suportadas

Os modelos personalizados devem basear-se numa das seguintes arquiteturas de modelo:

Arquitetura de Modelos	Versões
DeepSeek	V3.1, V3.2
Kimi	K2, K2.5
GLM	4.7, 4.8
OpenAI	GPT-OSS-120B
Qwen	qwen3-14b

Ficheiros de modelos obrigatórios

O seu diretório de modelos deve incluir os seguintes ficheiros:

Ficheiro	Descrição
`config.json`	Configuração do modelo (arquitetura, hiperparâmetros).
`.safetensors` ou `.bin`	Um ou mais ficheiros de peso de modelo.
`*.index.json`	Pelo menos um ficheiro de índice de pesos que mapeia fragmentos de peso.
`tokenizer.model`, `tokenizer.json`, ou `tokenizer_config.json`	Os ficheiros de tokenizer necessários para o modelo.

Importante

Apenas modelos de peso total com quantização original são suportados. Adaptadores LoRA ou modelos quantizados personalizados não são atualmente suportados nesta pré-visualização.

Importar um modelo personalizado

O processo de importação começa no portal Foundry, onde regista o seu modelo, e depois usa a CLI do Azure Developer para carregar os pesos dos modelos a partir da sua máquina local.

Inicie sessão no portal da Foundry.
Na página inicial do portal Foundry, selecione Construir no canto superior direito da navegação, depois selecione Modelos no painel esquerdo.
Selecione o separador Modelos Personalizados .
Selecionar Adicionar um modelo personalizado.
Configure as seguintes definições:
- Nome do modelo: Introduza um nome descritivo para o seu modelo personalizado.
- Arquitetura do modelo base: Selecione a arquitetura do modelo que corresponde ao seu modelo (por exemplo, DeepSeek V3.2 ou GLM 4.7).
O portal gera um azd comando. Copia o comando e cola-o num terminal local. Atualize o parâmetro --source para apontar para o diretório que contém os ficheiros de pesos do modelo.

Dica

Certifique-se de que o diretório que especifica contém todos os ficheiros de modelo necessários. Ficheiros em falta fazem com que a importação falhe.
Espera que o upload termine. O tempo de upload depende do tamanho do modelo e da largura de banda da sua rede. Modelos grandes (dezenas de gigabytes) podem demorar um tempo significativo em ligações padrão.

Verificar o registo do modelo

Após o upload terminar, confirme que a Foundry registou com sucesso o modelo antes de avançar para a implementação.

Volte ao portal da Foundry e atualize a página de Modelos Personalizados .
Confirme que o seu modelo personalizado importado aparece na lista com o estado de Registado .
Selecione o seu modelo para rever os seus detalhes, incluindo a arquitetura e o manifesto do ficheiro.

Implementar o modelo importado

Com o modelo registado, pode implementá-lo na cloud do Fireworks para inferência.

Na lista de Modelos Personalizados , selecione o seu modelo personalizado.
Selecionar Implementar.
Configurar a implementação:
- Nome da implantação: forneça um nome da implantação. Durante a inferência, este nome é usado no model parâmetro para encaminhar pedidos para esta implementação.
- Unidades de throughput provisionadas: alocar o número de unidades de throughput provisionadas (PTUs) para a implantação. Para mais informações, consulte Conceitos de Débito Provisionado.
Revise e reconheça os termos de preço.
Selecionar Implementar.

Quando a implementação termina, o estado mostra Bem-sucedido na sua lista de implementação.

Nota

Só podes ter uma implementação ativa de um modelo personalizado de cada vez num determinado projeto.

Exemplos de implantação

Use os seguintes exemplos para automatizar partes do fluxo de trabalho de implementação após o registo do modelo personalizado. Cada exemplo implementa o modelo personalizado com 80 unidades de throughput provisionado global. Certifique-se de substituir quaisquer marcadores de lugar pelos seus dados.

PUT https://management.azure.com/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/deployments/{deployment-name}?api-version=2025-06-01
Authorization: Bearer <access-token>
Content-Type: application/json

{
  "sku": {
    "name": "GlobalProvisionedManaged",
    "capacity": 80
  },
  "properties": {
    "model": {
      "name": "<registered-model-name>",
      "format": "FireworksCustom",
      "version": "1",
      "source": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}"
    }
  }
}

az cognitiveservices account deployment create `
  --name "<foundry-resource-name>" `
  --resource-group "<resource-group>" `
  --deployment-name "<deployment-name>" `
  --model-name "<registered-model-name>" `
  --model-version "1" `
  --model-format "FireworksCustom" `
  --model-source "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}" `
  --sku-name "GlobalProvisionedManaged" `
  --sku-capacity 80

az cognitiveservices account deployment create \
  --name "<foundry-resource-name>" \
  --resource-group "<resource-group>" \
  --deployment-name "<deployment-name>" \
  --model-name "<registered-model-name>" \
  --model-version "1" \
  --model-format "FireworksCustom" \
  --model-source "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}" \
  --sku-name "GlobalProvisionedManaged" \
  --sku-capacity 80

Teste a sua implantação

Depois de a implementação ser bem-sucedida, verifique se funciona enviando um pedido de teste:

Abra o Foundry Playground.
Selecione a implementação do seu modelo personalizado na lista de modelos.
Envie um prompt de teste e confirme que o modelo devolve uma resposta válida.

Resolução de problemas

Se encontrar problemas durante a importação ou implementação, use a tabela seguinte para identificar problemas comuns e resoluções.

Problema	Resolução
A importação falha com ficheiros em falta	Verifique se o seu diretório de modelos contém todos os ficheiros de modelo necessários, incluindo `config.json`ficheiros de pesos, um ficheiro de índice e ficheiros tokenizadores.
Incompatibilidade arquitetónica	Confirma que a arquitetura que selecionaste corresponde ao teu modelo. Ver arquiteturas suportadas.
Tempos esgotados ou interrupções de carregamento	Verifica a tua ligação à rede e tenta novamente. Para modelos grandes, utilize uma ligação estável de alta largura de banda.
Falhas na implementação	Confirme que tem uma quota suficiente e que a funcionalidade de pré-visualização do Fireworks está ativada e registada na sua subscrição.
Quota ultrapassada	Solicite mais quotas ou realoque unidades de throughput provisionadas a partir de implantações existentes.

Para mais orientações sobre resolução de problemas, consulte Solucionar Fogos de Artifício no Foundry.

Explore os seguintes recursos para saber mais sobre modelos Fireworks, opções de implementação e autenticação no Foundry.

Comentários

Esta página foi útil?

Last updated on 2026-04-30