Modelos de fogo de artifício no Microsoft Foundry (pré-visualização)

Importante

Os itens marcados (pré-visualização) neste artigo encontram-se atualmente em pré-visualização pública. Esta pré-visualização é fornecida sem um acordo de nível de serviço, e não a recomendamos para cargas de trabalho em produção. Certas funcionalidades podem não ser suportadas ou podem ter capacidades limitadas. Para mais informações, consulte Termos de Utilização Suplementares para Microsoft Azure Pré-visualizações.

Através da integração com Fireworks AI, os clientes da Microsoft Foundry podem:

Experimente os modelos open-source mais recentes muitas vezes antes de estarem disponíveis diretamente de Azure.
Importa e implementa pesos personalizados de modelos (traz o teu próprio modelo, ou BYOM) para a infraestrutura on-demand apoiada por GPU da Fireworks. Para mais informações, consulte Importar modelos personalizados no Microsoft Foundry com Fireworks.
Aumente a escala usando taxa de transferência provisionada.

Todas estas funcionalidades estão disponíveis diretamente no seu projeto Foundry, com governação do Azure, controlos de acesso e gestão de projetos integrados.

Pré-requisitos

Uma subscrição do Azure. Se não tiveres uma, cria uma conta gratuita.
Um recurso da Foundry com um projeto da Foundry.
Uma identidade Azure com o papel Subscription Owner ou Subscription Contributor para ativar a funcionalidade de pré-visualização.
Para implementar modelos, é necessário o papel Azure AI Owner no projeto Foundry. Para mais informações, consulte funções internas do Azure.

Disponibilidade regional

As implementações de modelos do Data Zone Standard no Foundry via Fireworks estão disponíveis nas seguintes regiões Azure:

Leste dos EUA (eastus)
East US 2 (eastus2)
Central dos EUA (centralus)
Norte Central dos EUA (norte central EUA)
Oeste EUA (westus)
West US 3 (westus3)

Implementações globais de throughput de modelos base e personalizados estão disponíveis em todas as regiões globais do Azure, exceto em ambientes de cloud do Azure Government.

Ativar Fogo de Artifício na Fundição

Importante

"Fireworks on Foundry está atualmente excluído dos compromissos de Limites de Dados da UE."

O FedRAMP não foi obtido para o Fireworks no Foundry. Se a sua organização exigir o FedRAMP, antes do uso, consulte o seu Oficial de Autorização para determinar se o uso de fogos de artifício na fundição é permitido.

O Padrão de Segurança de Dados (DSS) da Indústria de Cartões de Pagamento (PCI) não é aplicável ao Fireworks on Foundry. Não deve usar o Fireworks no Foundry para armazenar, processar ou transmitir dados de pagamentos e de titulares de cartões.

Enquanto estiver em pré-visualização, o Fireworks exige que um administrador ative a funcionalidade de pré-visualização dentro da sua subscrição Azure.

Inicie sessão no portal Azure.
Na caixa de pesquisa, insira subscrições e selecione Subscrições.
Selecione o link para o nome da sua subscrição.
No menu esquerdo, em Definições, selecione Funcionalidades de Pré-visualização.
Procure e selecione a funcionalidade de pré-visualização Fireworks.EnableDeploy .
Consulte os termos fornecidos na Descrição e a secção de privacidade de dados nesta documentação.
Se não concordar com os termos, selecione Fechar e não continue. Caso contrário, selecione Registar.
Seleciona OK. A funcionalidade de Pré-visualização atualiza o ecrã e o Estado da funcionalidade de pré-visualização é exibido. Pode demorar até 30 minutos para a funcionalidade ativar a sua subscrição.

Dica

Para verificar o registo, atualize a página de funcionalidades de Pré-visualização e confirme que a coluna Estado mostra Registado para a funcionalidade Fogos de Artifício na Fundição .

Implemente modelos de fogos de artifício a partir do portal Foundry

Depois de a funcionalidade estar ativada, pode implementar modelos Fireworks a partir do catálogo de modelos Foundry. Complete estes passos para obter um endpoint em tempo real para concluir o chat. Navegue pelos modelos disponíveis na secção de catálogo de modelos disponíveis, ou importe o seu próprio modelo personalizado.

Na página inicial do portal, selecione Descobrir no canto superior direito da navegação.
No painel esquerdo, selecione Modelos para abrir o catálogo de Modelos.
Selecione o modelo Fireworks desejado para ver os seus detalhes na página do modelo:
Na página do modelo, selecione Implementar. Para mais informações sobre opções de implementação, consulte Deploy Foundry Models no portal.
Na janela de implementação, configure as seguintes definições:
- Nome da implantação: Mantenha o nome padrão ou insira um nome personalizado para identificar a implementação.
- Tipo de implementação: Selecione Data Zone Standard ou Global provisioned throughput. Para mais informações, consulte Tipos de Implantação.
- Definições da versão do modelo: Selecione a versão do modelo para a implementação.
- Limite de Taxa de Tokens por Minuto: Defina um limite personalizado de tokens por minuto para gerir custos e controlar o uso. O valor padrão baseia-se no desempenho típico e no perfil de custos do modelo.
- Guardrails: Selecione Guardrail de configuração DefaultV2 ou Default. Os modelos usam o Microsoft. Guardrail padrão V2 a menos que esteja especificado outro diferente. Para mais informações, veja Usar guarda-raias para definir limites nas saídas dos modelos.
Selecionar Implementar. O processo de implementação pode demorar até 30 minutos.
Após a conclusão da implementação, utilize o endpoint e a chave fornecidos para enviar pedidos de inferência ao modelo. Para testar rapidamente a implementação, use o Playground no seu projeto Foundry.

Dica

Para verificar a implementação, dirija-se à página de Implementações do seu projeto e confirme que o Estado da implementação mostra Bem-sucedido.

Modelos disponíveis no catálogo

Os seguintes modelos Fireworks estão disponíveis no catálogo de modelos Foundry:

Fornecedor de modelos	Nome do modelo	ID do modelo	Tipo	Ofertas suportadas	Descrição
DeepSeek	DeepSeek v3.1	`FW-DeepSeek-v3.1`	Conclusões do chat	PTU	Modelo de finalidade geral de peso variável para tarefas de chat e raciocínio.
DeepSeek	DeepSeek v3.2	`FW-DeepSeek-v3.2`	Conclusões do chat	Per-Token e PTU	Modelo de peso aberto otimizado para raciocínio para tarefas complexas.
MiniMax	MiniMax 2.5	`FW-MiniMax-2.5`	Conclusões do chat	Per-Token e PTU	Modelo de uso geral para tarefas conversacionais e de seguir instruções.
IA Moonshot	Kimi K2 Instruct 0905	`FW-Kimi-K2-Instruct-0905`	Conclusões do chat	PTU	Modelo ajustado por instruções para cargas de trabalho de chat.
IA Moonshot	Pensamento Kimi K2	`FW-Kimi-K2-Thinking`	Conclusões do chat	PTU	Modelo focado no raciocínio para resolução de problemas em múltiplos passos.
IA Moonshot	Kimi K2.5	`FW-Kimi-K2.5`	Conclusões do chat	Per-Token e PTU	Modelo multimodal com fortes capacidades para contexto extenso.
OpenAI	GPT-OSS-120B	`FW-gpt-oss-120b`	Conclusões do chat	Per-Token e PTU	Modelo de peso aberto em grande escala para tarefas generativas amplas.
Qwen	Qwen3.5 122B A10B	`FW-Qwen3.5-122B-A10B`	Conclusões do chat	PTU	Modelo de finalidade geral de peso variável para tarefas de chat e raciocínio.
Qwen	Qwen3.5 397B A17B	`FW-Qwen3.5-397B-A17B`	Conclusões do chat	PTU	Modelo de finalidade geral de peso variável para tarefas de chat e raciocínio.
Zhipu AI	GLM-4.7	`FW-GLM-4.7`	Conclusões do chat	PTU	Modelo bilingue para tarefas de chat e raciocínio.
Zhipu AI	GLM-5	`FW-GLM-5`	Conclusões do chat	Per-Token e PTU	Modelo bilingue de alto desempenho para chat e raciocínio.

Todos os modelos de catálogo suportam a API OpenAI/v1 para a API Chat Completions e o SDK e endpoint Foundry para aceder à API Responses.

Modelos personalizados (traga o seu próprio modelo)

Para além dos modelos de catálogo, o Fireworks no Foundry suporta importar e implementar os seus próprios pesos de modelos personalizados. Esta funcionalidade BYOM (Bring Your Own Model) permite-lhe executar modelos proprietários ou modelos de código aberto ajustados dentro do ecossistema Foundry, com inferência fornecida pela cloud Fireworks otimizada.

Arquiteturas de modelos suportadas

Os modelos personalizados devem basear-se numa das seguintes arquiteturas suportadas:

DeepSeek (V3.1, V3.2)
Kimi (K2, K2.5)
GLM (4.7)
OpenAI (gpt-oss-120b)
Qwen (qwen3-14b, qwen3.5-397B-A17B, qwen3.5-122B-A10B)

Limitações

Apenas modelos de peso completo. Modelos LoRA e baseados em adaptadores não são suportados.
Fluxo de trabalho centrado na CLI. O processo de importação utiliza a CLI Azure Developer CLI (azd). O portal Foundry suporta o registo, visualização e implementação de modelos após o upload.
Os fluxos de trabalho do Fireworks Agents e do Agent Builder estão fora do âmbito desta pré-visualização.

Para instruções passo a passo, consulte Importar modelos personalizados para o Foundry.

Privacidade de dados

Quando utiliza o Fireworks no Foundry, os dados são partilhados entre a Microsoft e a Fireworks AI, e aplicam-se regras diferentes de conformidade e tratamento de dados. Veja abaixo para mais detalhes. Os clientes são responsáveis por avaliar se a partilha de dados entre a Microsoft e a Fireworks é adequada para os requisitos de conformidade das suas organizações.

"Fireworks on Foundry está atualmente excluído dos compromissos de Limites de Dados da UE."
O FedRAMP não foi obtido para o Fireworks no Foundry. Se a sua organização exigir o FedRAMP, antes do uso, consulte o seu Oficial de Autorização para determinar se o uso de fogos de artifício na fundição é permitido.
O Padrão de Segurança de Dados (DSS) da Indústria de Cartões de Pagamento (PCI) não é aplicável ao Fireworks on Foundry. Não deve usar o Fireworks no Foundry para armazenar, processar ou transmitir dados de pagamentos e de titulares de cartões.

Nota sobre transparência

O Fireworks on Foundry permite aos clientes implementar e operar modelos de IA de terceiros e de peso aberto utilizando os serviços da plataforma Microsoft Foundry.

A Microsoft não desenvolve, treina, afina ou avalia as características de segurança, proteção ou IA responsável dos modelos implementados através do Fireworks no Foundry.
A Microsoft não faz qualquer garantia quanto ao comportamento, desempenho ou perfil de risco destes modelos.
Os clientes são os únicos responsáveis por avaliar a adequação de qualquer modelo para o seu uso pretendido, incluindo a realização de quaisquer avaliações obrigatórias de segurança, conformidade e IA Responsável, antes de implementarem modelos em aplicações de produção ou de contacto com o cliente.

A Foundry fornece as ferramentas e as melhores práticas para realizar as suas próprias avaliações de risco e segurança dos modelos.

Perguntas frequentes

O Fireworks na plataforma Foundry está disponível no Azure para o Governo dos EUA?

Não, atualmente o serviço Fireworks on Foundry não está disponível para utilizadores cloud do Azure Government.

Como posso obter uma quota para implementações do modelo Fireworks?

Use o formulário de pedido de quota para solicitar uma quota adicional para fogos de artifício na Foundry.

Tenho uma conta Fireworks AI. Posso usar as minhas implementações Fireworks existentes?

Não, precisas de criar novas implementações no Foundry. Se quiser transferir o consumo para o Azure, contacte a sua equipa de contas Fireworks para ajudar.

Posso implementar LoRA ou modelos baseados em adaptadores?

Não, a atual pré-visualização suporta apenas modelos personalizados completos. Modelos LoRA e baseados em adaptadores não são suportados neste momento.

A versão preliminar de Fireworks é adequada para processos de produção?

Não. A versão preliminar pública do Fireworks on Foundry não inclui um acordo de nível de serviço de produção (SLA). A pré-visualização destina-se a testes iniciais, experimentação e validação.

Como importo e implemento um modelo personalizado?

A importação de modelos personalizados utiliza um fluxo de trabalho orientado para CLI com a CLI Azure Developer. Para instruções passo a passo, consulte Importar modelos personalizados para o Foundry.

Como é cobrado o Fireworks on Foundry?

Os modelos Fireworks implementados através da Foundry suportam tanto ofertas de pagamento por token como de largura de banda provisionada.

Como desativo o Fogo de Artifício no meu projeto Foundry?

O Fireworks pode ser desativado a nível de subscrição do Azure. Siga os passos para desregistar funcionalidades de pré-visualização na sua subscrição do Azure.

Como uso a API de Respostas?

A API Responses é suportada através da API e do SDK dos Projetos Foundry. Certifique-se de apontar o seu cliente para o endpoint da API do seu projeto ou usar o SDK do Foundry.

Resolução de Problemas com Fireworks na Foundry

Use as seguintes orientações para resolver problemas comuns com fogos de artifício na Foundry.

Problema	Resolução
O registo de pré-visualização mantém-se no estado "A registar"	A inscrição pode demorar até 30 minutos. Atualize a página de funcionalidades de Pré-visualização para verificar o estado atual. Se o estado não mudar após 30 minutos, tente desregistar e voltar a registar a funcionalidade.
Os modelos de fogo de artifício não aparecem no catálogo de modelos	Confirme que o estado da funcionalidade de pré-visualização mostra Registado para a sua subscrição. Confirma que estás a trabalhar numa região suportada.
A implementação falha devido a um erro de quota	Use o formulário de pedido de quotas para solicitar capacidade adicional para fogos de artifício na Foundry.
"Proibido" ou acesso negado durante a implantação	Verifique se a sua identidade tem a função Azure AI Developer ou superior no projeto Foundry. Só funções ao nível de subscrição não são suficientes para a implementação.
O endpoint do modelo devolve erros após a implementação	Confirme que o estado da implementação mostra Bem-sucedido na página de Implementações do projeto. Confirme que está a usar o URI de Destino e a Chave corretos dos detalhes de implementação.

Para outras questões, consulte a secção de perguntas frequentes .

Comentários

Esta página foi útil?

Last updated on 2026-04-30