Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Importante
Os itens marcados (pré-visualização) neste artigo encontram-se atualmente em pré-visualização pública. Esta pré-visualização é fornecida sem um acordo de nível de serviço, e não a recomendamos para cargas de trabalho em produção. Certas funcionalidades podem não ser suportadas ou podem ter capacidades limitadas. Para mais informações, consulte Termos de Utilização Suplementares para Microsoft Azure Pré-visualizações.
Importa e implementa os teus próprios pesos de modelo no Foundry usando o ambiente de execução de inferência do Fireworks.
Neste artigo, aprende a importar, registar e implementar os seus próprios pesos personalizados de modelos no Microsoft Foundry. A importação de modelos personalizados (também conhecida como bring your own weights) permite executar os seus modelos proprietários ou otimizados de pesos abertos dentro do ecossistema Foundry.
Nota
Este guia personalizado de importação de modelos utiliza a integração Fireworks no Foundry. Para uma visão geral dos modelos de catálogo disponíveis, arquiteturas suportadas, privacidade de dados e limitações, consulte Usar modelos Fireworks no Foundry.
O fluxo de trabalho de importação tem quatro passos:
- Prepare os seus ficheiros de modelo numa arquitetura suportada.
- Registe o modelo no portal da Foundry.
- Carregar pesos do modelo usando a CLI do Azure Developer.
- Implemente o modelo na infraestrutura de inferência do Fireworks.
Pré-requisitos
Antes de começar, certifique-se de que o seu ambiente Azure está configurado e que tem as ferramentas necessárias instaladas. Para completar os passos deste artigo, precisa dos seguintes recursos e permissões:
- Uma subscrição do Azure. Se não tiveres uma, cria uma conta gratuita.
- Um recurso da Foundry com um projeto da Foundry.
- A funcionalidade de pré-visualização Fireworks on Foundry foi ativada na sua subscrição. Para os passos de configuração, veja Usar modelos Fireworks no Foundry.
- A função de Contribuidor de Serviços Cognitivos ou permissões equivalentes no recurso Foundry para criar e gerir implantações. Para obter mais informações, consulte Azure Controlo de Acesso Baseado em Funções.
-
Azure Developer CLI (
azd) instalado localmente. O fluxo de trabalho de importação utilizaazdpara carregar os pesos do modelo.
Disponibilidade regional
O suporte para implementação de modelos personalizados está disponível em todas as regiões globais Azure exceto em ambientes cloud Azure Government.
Requisitos do modelo
Os modelos personalizados devem corresponder a uma arquitetura suportada e incluir ficheiros específicos para o Foundry os registar e implementar. Revise ambos os requisitos antes de iniciar o processo de importação.
Arquiteturas suportadas
Os modelos personalizados devem basear-se numa das seguintes arquiteturas de modelo:
| Arquitetura de Modelos | Versões |
|---|---|
| DeepSeek | V3.1, V3.2 |
| Kimi | K2, K2.5 |
| GLM | 4.7, 4.8 |
| OpenAI | GPT-OSS-120B |
| Qwen | qwen3-14b |
Ficheiros de modelos obrigatórios
O seu diretório de modelos deve incluir os seguintes ficheiros:
| Ficheiro | Descrição |
|---|---|
config.json |
Configuração do modelo (arquitetura, hiperparâmetros). |
*.safetensors ou *.bin |
Um ou mais ficheiros de peso de modelo. |
*.index.json |
Pelo menos um ficheiro de índice de pesos que mapeia fragmentos de peso. |
tokenizer.model, tokenizer.json, ou tokenizer_config.json |
Os ficheiros de tokenizer necessários para o modelo. |
Importante
Apenas modelos de peso total com quantização original são suportados. Adaptadores LoRA ou modelos quantizados personalizados não são atualmente suportados nesta pré-visualização.
Importar um modelo personalizado
O processo de importação começa no portal Foundry, onde regista o seu modelo, e depois usa a CLI do Azure Developer para carregar os pesos dos modelos a partir da sua máquina local.
Inicie sessão no portal da Foundry.
Na página inicial do portal Foundry, selecione Construir no canto superior direito da navegação, depois selecione Modelos no painel esquerdo.
Selecione o separador Modelos Personalizados .
Selecionar Adicionar um modelo personalizado.
Configure as seguintes definições:
Nome do modelo: Introduza um nome descritivo para o seu modelo personalizado.
Arquitetura do modelo base: Selecione a arquitetura do modelo que corresponde ao seu modelo (por exemplo,
DeepSeek V3.2ouGLM 4.7).
O portal gera um
azdcomando. Copia o comando e cola-o num terminal local. Atualize o parâmetro--sourcepara apontar para o diretório que contém os ficheiros de pesos do modelo.Dica
Certifique-se de que o diretório que especifica contém todos os ficheiros de modelo necessários. Ficheiros em falta fazem com que a importação falhe.
Espera que o upload termine. O tempo de upload depende do tamanho do modelo e da largura de banda da sua rede. Modelos grandes (dezenas de gigabytes) podem demorar um tempo significativo em ligações padrão.
Verificar o registo do modelo
Após o upload terminar, confirme que a Foundry registou com sucesso o modelo antes de avançar para a implementação.
Volte ao portal da Foundry e atualize a página de Modelos Personalizados .
Confirme que o seu modelo personalizado importado aparece na lista com o estado de Registado .
Selecione o seu modelo para rever os seus detalhes, incluindo a arquitetura e o manifesto do ficheiro.
Implementar o modelo importado
Com o modelo registado, pode implementá-lo na cloud do Fireworks para inferência.
Na lista de Modelos Personalizados , selecione o seu modelo personalizado.
Selecionar Implementar.
Configurar a implementação:
-
Nome da implantação: forneça um nome da implantação. Durante a inferência, este nome é usado no
modelparâmetro para encaminhar pedidos para esta implementação. - Unidades de throughput provisionadas: alocar o número de unidades de throughput provisionadas (PTUs) para a implantação. Para mais informações, consulte Conceitos de Débito Provisionado.
-
Nome da implantação: forneça um nome da implantação. Durante a inferência, este nome é usado no
Revise e reconheça os termos de preço.
Selecionar Implementar.
Quando a implementação termina, o estado mostra Bem-sucedido na sua lista de implementação.
Nota
Só podes ter uma implementação ativa de um modelo personalizado de cada vez num determinado projeto.
Exemplos de implantação
Use os seguintes exemplos para automatizar partes do fluxo de trabalho de implementação após o registo do modelo personalizado. Cada exemplo implementa o modelo personalizado com 80 unidades de throughput provisionado global. Certifique-se de substituir quaisquer marcadores de lugar pelos seus dados.
PUT https://management.azure.com/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/deployments/{deployment-name}?api-version=2025-06-01
Authorization: Bearer <access-token>
Content-Type: application/json
{
"sku": {
"name": "GlobalProvisionedManaged",
"capacity": 80
},
"properties": {
"model": {
"name": "<registered-model-name>",
"format": "FireworksCustom",
"version": "1",
"source": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}"
}
}
}
Teste a sua implantação
Depois de a implementação ser bem-sucedida, verifique se funciona enviando um pedido de teste:
- Abra o Foundry Playground.
- Selecione a implementação do seu modelo personalizado na lista de modelos.
- Envie um prompt de teste e confirme que o modelo devolve uma resposta válida.
Resolução de problemas
Se encontrar problemas durante a importação ou implementação, use a tabela seguinte para identificar problemas comuns e resoluções.
| Problema | Resolução |
|---|---|
| A importação falha com ficheiros em falta | Verifique se o seu diretório de modelos contém todos os ficheiros de modelo necessários, incluindo config.jsonficheiros de pesos, um ficheiro de índice e ficheiros tokenizadores. |
| Incompatibilidade arquitetónica | Confirma que a arquitetura que selecionaste corresponde ao teu modelo. Ver arquiteturas suportadas. |
| Tempos esgotados ou interrupções de carregamento | Verifica a tua ligação à rede e tenta novamente. Para modelos grandes, utilize uma ligação estável de alta largura de banda. |
| Falhas na implementação | Confirme que tem uma quota suficiente e que a funcionalidade de pré-visualização do Fireworks está ativada e registada na sua subscrição. |
| Quota ultrapassada | Solicite mais quotas ou realoque unidades de throughput provisionadas a partir de implantações existentes. |
Para mais orientações sobre resolução de problemas, consulte Solucionar Fogos de Artifício no Foundry.
Conteúdo relacionado
Explore os seguintes recursos para saber mais sobre modelos Fireworks, opções de implementação e autenticação no Foundry.