Modelos de fogos de artifício no Microsoft Foundry (versão prévia)

Importante

Itens marcados (versão prévia) neste artigo estão atualmente em versão prévia pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não recomendamos isso para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou ter recursos restritos. Para obter mais informações, consulte Supplemental Terms of Use for Microsoft Azure Previews.

Por meio da integração com a IA do Fireworks, os clientes do Microsoft Foundry podem:

Experimente os modelos de software livre mais recentes frequentemente antes de estarem disponíveis diretamente do Azure.
Importe e implante pesos de modelo personalizado (Traga o seu Próprio Modelo, ou BYOM) na infraestrutura baseada em GPU sob demanda do Fireworks. Para obter mais informações, consulte Importar modelos personalizados no Microsoft Foundry com Fireworks.
Ampliar capacidade usando taxa de transferência provisionada.

Todos esses recursos estão disponíveis diretamente no seu projeto do Foundry, incluindo governança do Azure, controle de acesso e gerenciamento de projetos integrados.

Pré-requisitos

Uma assinatura Azure. Se você não tiver uma, crie uma conta gratuita.
Um recurso do Foundry com um projeto do Foundry.
Uma identidade do Azure com a função de Proprietário da Assinatura ou Colaborador da Assinatura para habilitar o recurso de pré-visualização.
Para implantar modelos, você precisa da função Azure Administrador de IA no projeto Foundry. Para obter mais informações, consulte Azure funções incorporadas.

Disponibilidade da região

As implantações padrão de modelos da zona de dados por meio do Fireworks on Foundry estão disponíveis nas seguintes regiões Azure:

Leste dos EUA (eastus)
Leste dos EUA 2 (eastus2)
EUA Central (centralus)
Centro-Norte dos EUA (northcentralus)
Oeste dos EUA (oesteus)
Oeste dos EUA 3 (westus3)

Implantações globais de taxa de transferência provisionada de modelos básicos e personalizados estão disponíveis em todas as regiões do Azure globalmente, exceto em ambientes de nuvem do Azure Governamental.

Habilitar Fogos de Artifício na Fundiária

Importante

O Fireworks no Foundry no momento está excluído de compromissos de Limite de Dados da UE.

FedRAMP não foi obtido para Fireworks on Foundry. Se sua organização exigir FedRAMP, antes do uso, consulte seu Oficial de Autorização para determinar se o uso do Fireworks on Foundry é permitido.

O PCI DSS (Payment Card Industry Data Security Standard) não é aplicável ao Fireworks on Foundry. Você não deve usar o Fireworks na Foundry para armazenar, processar ou transmitir dados de pagamento e de titular do cartão.

Na versão prévia, Fireworks requer que um administrador habilite o recurso de visualização em sua assinatura Azure.

Entre no portal Azure.
Na caixa de pesquisa, insira assinaturas e selecione Assinaturas.
Selecione o link referente ao nome da sua assinatura.
No menu à esquerda, em Configurações, selecione Recursos de Visualização.
Pesquise e selecione o recurso de visualização Fireworks.EnableDeploy .
Examine os termos fornecidos na seção Descrição e privacidade de dados nesta documentação.
Se você não concordar com os termos, selecione Fechar e não continuar. Caso contrário, selecione Registrar.
Selecione OK. A tela de recursos de visualização é atualizada e o Estado do recurso de visualização é exibido. Pode levar até 30 minutos para que o recurso seja habilitado para sua assinatura.

Dica

Para verificar o registro, atualize a página De visualização de recursos e confirme se a coluna Estado mostra Registrado para o recurso Fireworks on Foundry .

Implantar modelos do Fireworks no portal do Foundry

Depois que o recurso estiver habilitado, você poderá implantar modelos do Fireworks no catálogo de modelos do Foundry. Conclua estas etapas para obter um ponto de extremidade ativo para conclusões de bate-papo. Procure modelos disponíveis na seção Modelos de catálogo disponíveis ou importe seu próprio modelo personalizado.

Na home page do portal, selecione Descobrir na navegação superior direita.
No painel esquerdo, selecione Modelos para abrir o catálogo de modelos.
Selecione o modelo do Fireworks desejado para exibir seus detalhes na página do modelo:
Na página do modelo, selecione Implantar. Para obter mais informações sobre opções de implantação, consulte Implantar Modelos de Fundação no portal.
Na janela de implantação, defina as seguintes configurações:
- Nome da implantação: mantenha o nome padrão ou insira um nome personalizado para identificar a implantação.
- Tipo de implantação: Selecione Data Zone Standard ou Taxa de transferência provisionada global. Para obter mais informações, consulte Tipos de implantação.
- Configurações de versão do modelo: selecione a versão do modelo para a implantação.
- Limite de Tokens por Minuto: Defina um limite personalizado de tokens por minuto para gerenciar custos e controlar o uso. O valor padrão é baseado no perfil de custo e desempenho típicos do modelo.
- Guardrails: Selecione DefaultV2 ou configuração padrão de guardrail. Os modelos usam a medida de segurança Microsoft.DefaultV2, salvo se um diferente for especificado. Para obter mais informações, consulte Usar guardrails para definir limites em saídas de modelo.
Selecione Implantar. O processo de implantação pode levar até 30 minutos.
Após a conclusão da implantação, use o ponto de extremidade e a chave fornecidos para enviar solicitações de inferência para o modelo. Para testar rapidamente a implantação, use o Playground em seu projeto Foundry.

Dica

Para verificar a implantação, navegue até a página Implantações do projeto e confirme se o Status da implantação é bem-sucedido.

Modelos de catálogo disponíveis

Os seguintes modelos do Fireworks estão disponíveis no catálogo de modelos do Foundry:

Provedor de modelos	Nome do modelo	ID do modelo	Tipo	Ofertas com suporte	Descrição
DeepSeek	DeepSeek v3.1	`FW-DeepSeek-v3.1`	Finalizações de chat	PTU	Modelo de peso aberto de uso geral para tarefas de chat e raciocínio.
DeepSeek	DeepSeek v3.2	`FW-DeepSeek-v3.2`	Finalizações de chat	Per-Token e PTU	Modelo de acesso aberto otimizado para raciocínio para tarefas complexas.
Minimax	MiniMax 2.5	`FW-MiniMax-2.5`	Finalizações de chat	Per-Token e PTU	Modelo de uso geral para tarefas conversacionais e de seguimento de instruções.
Moonshot AI	Kimi K2 Instruct 0905	`FW-Kimi-K2-Instruct-0905`	Finalizações de chat	PTU	Modelo ajustado por meio de instruções para tarefas de chat.
Moonshot AI	Kimi K2 Pensando	`FW-Kimi-K2-Thinking`	Finalizações de chat	PTU	Modelo focado em raciocínio para solução de problemas de várias etapas.
Moonshot AI	Kimi K2.5	`FW-Kimi-K2.5`	Finalizações de chat	Per-Token e PTU	Modelo multimodal com recursos de contexto longo fortes.
OpenAI	gpt-oss-120b	`FW-gpt-oss-120b`	Finalizações de chat	Per-Token e PTU	Modelo open-weight de grande escala para tarefas generativas amplas.
Qwen	Qwen3.5 122B A10B	`FW-Qwen3.5-122B-A10B`	Finalizações de chat	PTU	Modelo de peso aberto de uso geral para tarefas de chat e raciocínio.
Qwen	Qwen3.5 397B A17B	`FW-Qwen3.5-397B-A17B`	Finalizações de chat	PTU	Modelo de peso aberto de uso geral para tarefas de chat e raciocínio.
Zhipu AI	GLM-4.7	`FW-GLM-4.7`	Finalizações de chat	PTU	Modelo bilíngue para tarefas de chat e raciocínio.
Zhipu AI	GLM-5	`FW-GLM-5`	Finalizações de chat	Per-Token e PTU	Modelo bilíngue de alto desempenho para chat e raciocínio.

Todos os modelos do catálogo são compatíveis com a API OpenAI/v1 para API de Conclusões de Bate-papo e com o SDK do Foundry e ponto de extremidade para acessar a API de Respostas.

Modelos personalizados (traga seu próprio modelo)

Além dos modelos de catálogo, o Fireworks no Foundry é compatível com a importação e a implantação de seus próprios pesos de modelo personalizado. Esse recursos BYOM permite executar modelos proprietários ou de acesso aberto ajustados no ecossistema do Foundry, com inferência oferecida pela nuvem otimizada do Fireworks.

Arquiteturas de modelo com suporte

Os modelos personalizados devem ser baseados em uma das seguintes arquiteturas com suporte:

DeepSeek (V3.1, V3.2)
Kimi (K2, K2.5)
GLM (4.7)
OpenAI (gpt-oss-120b)
Qwen (qwen3-14b, qwen3.5-397B-A17B, qwen3.5-122B-A10B)

Limitações

Apenas modelos de peso completo. Não há suporte para modelos baseados em LoRA e adaptador.
Fluxo de trabalho prioritário de CLI. O processo de importação usa a CLI Azure Developer (azd). O portal do Foundry dá suporte ao registro, exibição e implantação de modelos após o upload.
Os fluxos de trabalho do Fireworks Agents e do Agent Builder estão fora do escopo para esta versão prévia.

Para obter instruções passo a passo, consulte Importar modelos personalizados para o Foundry.

Privacidade de dados

Quando você usa o Fireworks on Foundry, os dados são compartilhados entre Microsoft e a IA do Fireworks, e diferentes regras de conformidade e manipulação de dados serão aplicadas. Consulte abaixo para obter detalhes. Os clientes são responsáveis por avaliar se o compartilhamento de dados entre Microsoft e o Fireworks é apropriado para os requisitos de conformidade de suas organizações.

O Fireworks no Foundry no momento está excluído de compromissos de Limite de Dados da UE.
FedRAMP não foi obtido para Fireworks on Foundry. Se sua organização exigir FedRAMP, antes do uso, consulte seu Oficial de Autorização para determinar se o uso do Fireworks on Foundry é permitido.
O PCI DSS (Payment Card Industry Data Security Standard) não é aplicável ao Fireworks on Foundry. Você não deve usar o Fireworks na Foundry para armazenar, processar ou transmitir dados de pagamento e de titular do cartão.

Nota de transparência

Fireworks on Foundry permite que os clientes implantem e operem modelos de IA de terceiros e modelos leves usando os serviços de plataforma Microsoft Foundry.

Microsoft não desenvolve, treina, ajusta ou avalia as características de segurança, segurança ou IA responsável dos modelos implantados por meio do Fireworks on Foundry.
Microsoft não faz representações sobre o comportamento, o desempenho ou o perfil de risco desses modelos.
Os clientes são os únicos responsáveis por avaliar a adequação de qualquer modelo para seu uso pretendido, incluindo a execução de quaisquer avaliações necessárias de segurança, conformidade e IA responsável, antes de implantar modelos em aplicativos voltados para o cliente ou produção.

A Foundry fornece as ferramentas e as práticas recomendadas para executar suas próprias avaliações de risco e segurança de modelos .

Perguntas frequentes

O Fireworks on Foundry está disponível em Azure para o governo dos EUA?

Não, atualmente o serviço Fireworks on Foundry não está disponível para usuários de nuvem Azure Governamental.

Como obter cota para implantações de modelo do Fireworks?

Use o formulário de solicitação de cota para solicitar cota adicional para Fireworks on Foundry.

Tenho uma conta de IA do Fireworks. Posso usar minhas implantações existentes do Fireworks?

Não, você precisa criar novas implementações no Foundry. Se você quiser transferir o consumo para Azure, entre em contato com sua equipe de conta do Fireworks para ajudar.

Posso implantar o LoRA ou modelos baseados em adaptador?

Não, a versão prévia atual dá suporte apenas a modelos personalizados com peso completo. Não há suporte para modelos baseados em LoRA e adaptadores no momento.

A versão preliminar do Fireworks é adequada para cargas de trabalho de produção?

Não. Como uma versão prévia pública, o Fireworks on Foundry não inclui um SLA (contrato de nível de serviço de produção). A visualização destina-se a testes, experimentações e validação antecipada.

Como importar e implantar um modelo personalizado?

A importação de modelo personalizado utiliza um fluxo de trabalho com prioridade na CLI usando a Azure Developer CLI. Para obter instruções passo a passo, consulte Importar modelos personalizados para o Foundry.

Como é cobrado o Fireworks on Foundry?

Os modelos do Fireworks implantados usando o Foundry são compatíveis com ofertas de pagamento por token e taxa de transferência provisionada.

Como desabilitar o Fireworks no meu projeto do Foundry?

Fogos de artifício podem ser desabilitados no nível da assinatura Azure. Siga as etapas para cancelar registro de recursos de visualização em sua assinatura do Azure.

Como posso usar a API de Respostas?

A API de Respostas tem suporte por meio da API de Projetos do Foundry e do SDK. Certifique-se de apontar o cliente para o endereço da API do projeto ou usar o SDK do Foundry.

Solução de problemas do Fireworks no Foundry

Use as diretrizes a seguir para resolver problemas comuns com o Fireworks on Foundry.

Questão	Resolução
O registro de versão preliminar fica no estado "Registrando"	O registro pode levar até 30 minutos. Atualize a página de recursos de visualização para verificar o status atual. Se o estado não mudar após 30 minutos, tente cancelar o registro e registrar novamente o recurso.
Modelos de fogos de artifício não aparecem no catálogo de modelos	Confirme se o estado da funcionalidade de visualização mostra Registrado para sua assinatura. Verifique se você está trabalhando em uma região com suporte.
A implantação falha com um erro de cota	Use o formulário de solicitação de cota para solicitar capacidade adicional para Fireworks on Foundry.
"Proibido" ou acesso negado durante a implantação	Verifique se sua identidade tem a função Desenvolvedor de IA do Azure ou superior no projeto do Foundry. Apenas as funções em nível da assinatura não são suficientes para a implantação.
O ponto de extremidade do modelo retorna erros após a implantação	Confirme se o status da implantação mostra Bem-sucedido na página Implantações do projeto. Verifique se você está usando o URI de destino correto e a Chave dos detalhes da implantação.

Para outras consultas, consulte a seção de perguntas frequentes .

Comentários

Esta página foi útil?

Last updated on 2026-05-05