Modelos de fogos de artifício no Microsoft Foundry (versão prévia)

Importante

Itens marcados (versão prévia) neste artigo estão atualmente em versão prévia pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não recomendamos isso para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou ter recursos restritos. Para obter mais informações, consulte Supplemental Terms of Use for Microsoft Azure Previews.

Por meio da integração com a IA do Fireworks, os clientes do Microsoft Foundry podem:

Todos esses recursos estão disponíveis diretamente no seu projeto do Foundry, incluindo governança do Azure, controle de acesso e gerenciamento de projetos integrados.

Pré-requisitos

  • Uma assinatura Azure. Se você não tiver uma, crie uma conta gratuita.
  • Um recurso do Foundry com um projeto do Foundry.
  • Uma identidade do Azure com a função de Proprietário da Assinatura ou Colaborador da Assinatura para habilitar o recurso de pré-visualização.
  • Para implantar modelos, você precisa da função Azure Administrador de IA no projeto Foundry. Para obter mais informações, consulte Azure funções incorporadas.

Disponibilidade da região

As implantações padrão de modelos da zona de dados por meio do Fireworks on Foundry estão disponíveis nas seguintes regiões Azure:

  • Leste dos EUA (eastus)
  • Leste dos EUA 2 (eastus2)
  • EUA Central (centralus)
  • Centro-Norte dos EUA (northcentralus)
  • Oeste dos EUA (oesteus)
  • Oeste dos EUA 3 (westus3)

Implantações globais de taxa de transferência provisionada de modelos básicos e personalizados estão disponíveis em todas as regiões do Azure globalmente, exceto em ambientes de nuvem do Azure Governamental.

Habilitar Fogos de Artifício na Fundiária

Importante

O Fireworks no Foundry no momento está excluído de compromissos de Limite de Dados da UE.

FedRAMP não foi obtido para Fireworks on Foundry. Se sua organização exigir FedRAMP, antes do uso, consulte seu Oficial de Autorização para determinar se o uso do Fireworks on Foundry é permitido.

O PCI DSS (Payment Card Industry Data Security Standard) não é aplicável ao Fireworks on Foundry. Você não deve usar o Fireworks na Foundry para armazenar, processar ou transmitir dados de pagamento e de titular do cartão.

Na versão prévia, Fireworks requer que um administrador habilite o recurso de visualização em sua assinatura Azure.

  1. Entre no portal Azure.

  2. Na caixa de pesquisa, insira assinaturas e selecione Assinaturas.

  3. Selecione o link referente ao nome da sua assinatura.

  4. No menu à esquerda, em Configurações, selecione Recursos de Visualização.

  5. Pesquise e selecione o recurso de visualização Fireworks.EnableDeploy .

  6. Examine os termos fornecidos na seção Descrição e privacidade de dados nesta documentação.

  7. Se você não concordar com os termos, selecione Fechar e não continuar. Caso contrário, selecione Registrar.

  8. Selecione OK. A tela de recursos de visualização é atualizada e o Estado do recurso de visualização é exibido. Pode levar até 30 minutos para que o recurso seja habilitado para sua assinatura.

    Dica

    Para verificar o registro, atualize a página De visualização de recursos e confirme se a coluna Estado mostra Registrado para o recurso Fireworks on Foundry .

    Screenshot da configuração de recursos de visualização no Azure portal.

Implantar modelos do Fireworks no portal do Foundry

Depois que o recurso estiver habilitado, você poderá implantar modelos do Fireworks no catálogo de modelos do Foundry. Conclua estas etapas para obter um ponto de extremidade ativo para conclusões de bate-papo. Procure modelos disponíveis na seção Modelos de catálogo disponíveis ou importe seu próprio modelo personalizado.

  1. Na home page do portal, selecione Descobrir na navegação superior direita.

  2. No painel esquerdo, selecione Modelos para abrir o catálogo de modelos.

  3. Selecione o modelo do Fireworks desejado para exibir seus detalhes na página do modelo:

    Captura de tela da página inicial dos modelos do Foundry mostrando modelos disponíveis do Fireworks.

  4. Na página do modelo, selecione Implantar. Para obter mais informações sobre opções de implantação, consulte Implantar Modelos de Fundação no portal.

  5. Na janela de implantação, defina as seguintes configurações:

    • Nome da implantação: mantenha o nome padrão ou insira um nome personalizado para identificar a implantação.
    • Tipo de implantação: Selecione Data Zone Standard ou Taxa de transferência provisionada global. Para obter mais informações, consulte Tipos de implantação.
    • Configurações de versão do modelo: selecione a versão do modelo para a implantação.
    • Limite de Tokens por Minuto: Defina um limite personalizado de tokens por minuto para gerenciar custos e controlar o uso. O valor padrão é baseado no perfil de custo e desempenho típicos do modelo.
    • Guardrails: Selecione DefaultV2 ou configuração padrão de guardrail. Os modelos usam a medida de segurança Microsoft.DefaultV2, salvo se um diferente for especificado. Para obter mais informações, consulte Usar guardrails para definir limites em saídas de modelo.
  6. Selecione Implantar. O processo de implantação pode levar até 30 minutos.

  7. Após a conclusão da implantação, use o ponto de extremidade e a chave fornecidos para enviar solicitações de inferência para o modelo. Para testar rapidamente a implantação, use o Playground em seu projeto Foundry.

    Dica

    Para verificar a implantação, navegue até a página Implantações do projeto e confirme se o Status da implantação é bem-sucedido.

Modelos de catálogo disponíveis

Os seguintes modelos do Fireworks estão disponíveis no catálogo de modelos do Foundry:

Provedor de modelos Nome do modelo ID do modelo Tipo Ofertas com suporte Descrição
DeepSeek DeepSeek v3.1 FW-DeepSeek-v3.1 Finalizações de chat PTU Modelo de peso aberto de uso geral para tarefas de chat e raciocínio.
DeepSeek DeepSeek v3.2 FW-DeepSeek-v3.2 Finalizações de chat Per-Token e PTU Modelo de acesso aberto otimizado para raciocínio para tarefas complexas.
Minimax MiniMax 2.5 FW-MiniMax-2.5 Finalizações de chat Per-Token e PTU Modelo de uso geral para tarefas conversacionais e de seguimento de instruções.
Moonshot AI Kimi K2 Instruct 0905 FW-Kimi-K2-Instruct-0905 Finalizações de chat PTU Modelo ajustado por meio de instruções para tarefas de chat.
Moonshot AI Kimi K2 Pensando FW-Kimi-K2-Thinking Finalizações de chat PTU Modelo focado em raciocínio para solução de problemas de várias etapas.
Moonshot AI Kimi K2.5 FW-Kimi-K2.5 Finalizações de chat Per-Token e PTU Modelo multimodal com recursos de contexto longo fortes.
OpenAI gpt-oss-120b FW-gpt-oss-120b Finalizações de chat Per-Token e PTU Modelo open-weight de grande escala para tarefas generativas amplas.
Qwen Qwen3.5 122B A10B FW-Qwen3.5-122B-A10B Finalizações de chat PTU Modelo de peso aberto de uso geral para tarefas de chat e raciocínio.
Qwen Qwen3.5 397B A17B FW-Qwen3.5-397B-A17B Finalizações de chat PTU Modelo de peso aberto de uso geral para tarefas de chat e raciocínio.
Zhipu AI GLM-4.7 FW-GLM-4.7 Finalizações de chat PTU Modelo bilíngue para tarefas de chat e raciocínio.
Zhipu AI GLM-5 FW-GLM-5 Finalizações de chat Per-Token e PTU Modelo bilíngue de alto desempenho para chat e raciocínio.

Todos os modelos do catálogo são compatíveis com a API OpenAI/v1 para API de Conclusões de Bate-papo e com o SDK do Foundry e ponto de extremidade para acessar a API de Respostas.

Modelos personalizados (traga seu próprio modelo)

Além dos modelos de catálogo, o Fireworks no Foundry é compatível com a importação e a implantação de seus próprios pesos de modelo personalizado. Esse recursos BYOM permite executar modelos proprietários ou de acesso aberto ajustados no ecossistema do Foundry, com inferência oferecida pela nuvem otimizada do Fireworks.

Arquiteturas de modelo com suporte

Os modelos personalizados devem ser baseados em uma das seguintes arquiteturas com suporte:

  • DeepSeek (V3.1, V3.2)
  • Kimi (K2, K2.5)
  • GLM (4.7)
  • OpenAI (gpt-oss-120b)
  • Qwen (qwen3-14b, qwen3.5-397B-A17B, qwen3.5-122B-A10B)

Limitações

  • Apenas modelos de peso completo. Não há suporte para modelos baseados em LoRA e adaptador.
  • Fluxo de trabalho prioritário de CLI. O processo de importação usa a CLI Azure Developer (azd). O portal do Foundry dá suporte ao registro, exibição e implantação de modelos após o upload.
  • Os fluxos de trabalho do Fireworks Agents e do Agent Builder estão fora do escopo para esta versão prévia.

Para obter instruções passo a passo, consulte Importar modelos personalizados para o Foundry.

Privacidade de dados

Quando você usa o Fireworks on Foundry, os dados são compartilhados entre Microsoft e a IA do Fireworks, e diferentes regras de conformidade e manipulação de dados serão aplicadas. Consulte abaixo para obter detalhes. Os clientes são responsáveis por avaliar se o compartilhamento de dados entre Microsoft e o Fireworks é apropriado para os requisitos de conformidade de suas organizações.

  • O Fireworks no Foundry no momento está excluído de compromissos de Limite de Dados da UE.

  • FedRAMP não foi obtido para Fireworks on Foundry. Se sua organização exigir FedRAMP, antes do uso, consulte seu Oficial de Autorização para determinar se o uso do Fireworks on Foundry é permitido.

  • O PCI DSS (Payment Card Industry Data Security Standard) não é aplicável ao Fireworks on Foundry. Você não deve usar o Fireworks na Foundry para armazenar, processar ou transmitir dados de pagamento e de titular do cartão.

Nota de transparência

Fireworks on Foundry permite que os clientes implantem e operem modelos de IA de terceiros e modelos leves usando os serviços de plataforma Microsoft Foundry.

  • Microsoft não desenvolve, treina, ajusta ou avalia as características de segurança, segurança ou IA responsável dos modelos implantados por meio do Fireworks on Foundry.
  • Microsoft não faz representações sobre o comportamento, o desempenho ou o perfil de risco desses modelos.
  • Os clientes são os únicos responsáveis por avaliar a adequação de qualquer modelo para seu uso pretendido, incluindo a execução de quaisquer avaliações necessárias de segurança, conformidade e IA responsável, antes de implantar modelos em aplicativos voltados para o cliente ou produção.

A Foundry fornece as ferramentas e as práticas recomendadas para executar suas próprias avaliações de risco e segurança de modelos .

Perguntas frequentes

O Fireworks on Foundry está disponível em Azure para o governo dos EUA?

Não, atualmente o serviço Fireworks on Foundry não está disponível para usuários de nuvem Azure Governamental.

Como obter cota para implantações de modelo do Fireworks?

Use o formulário de solicitação de cota para solicitar cota adicional para Fireworks on Foundry.

Tenho uma conta de IA do Fireworks. Posso usar minhas implantações existentes do Fireworks?

Não, você precisa criar novas implementações no Foundry. Se você quiser transferir o consumo para Azure, entre em contato com sua equipe de conta do Fireworks para ajudar.

Posso implantar o LoRA ou modelos baseados em adaptador?

Não, a versão prévia atual dá suporte apenas a modelos personalizados com peso completo. Não há suporte para modelos baseados em LoRA e adaptadores no momento.

A versão preliminar do Fireworks é adequada para cargas de trabalho de produção?

Não. Como uma versão prévia pública, o Fireworks on Foundry não inclui um SLA (contrato de nível de serviço de produção). A visualização destina-se a testes, experimentações e validação antecipada.

Como importar e implantar um modelo personalizado?

A importação de modelo personalizado utiliza um fluxo de trabalho com prioridade na CLI usando a Azure Developer CLI. Para obter instruções passo a passo, consulte Importar modelos personalizados para o Foundry.

Como é cobrado o Fireworks on Foundry?

Os modelos do Fireworks implantados usando o Foundry são compatíveis com ofertas de pagamento por token e taxa de transferência provisionada.

Como desabilitar o Fireworks no meu projeto do Foundry?

Fogos de artifício podem ser desabilitados no nível da assinatura Azure. Siga as etapas para cancelar registro de recursos de visualização em sua assinatura do Azure.

Como posso usar a API de Respostas?

A API de Respostas tem suporte por meio da API de Projetos do Foundry e do SDK. Certifique-se de apontar o cliente para o endereço da API do projeto ou usar o SDK do Foundry.

Solução de problemas do Fireworks no Foundry

Use as diretrizes a seguir para resolver problemas comuns com o Fireworks on Foundry.

Questão Resolução
O registro de versão preliminar fica no estado "Registrando" O registro pode levar até 30 minutos. Atualize a página de recursos de visualização para verificar o status atual. Se o estado não mudar após 30 minutos, tente cancelar o registro e registrar novamente o recurso.
Modelos de fogos de artifício não aparecem no catálogo de modelos Confirme se o estado da funcionalidade de visualização mostra Registrado para sua assinatura. Verifique se você está trabalhando em uma região com suporte.
A implantação falha com um erro de cota Use o formulário de solicitação de cota para solicitar capacidade adicional para Fireworks on Foundry.
"Proibido" ou acesso negado durante a implantação Verifique se sua identidade tem a função Desenvolvedor de IA do Azure ou superior no projeto do Foundry. Apenas as funções em nível da assinatura não são suficientes para a implantação.
O ponto de extremidade do modelo retorna erros após a implantação Confirme se o status da implantação mostra Bem-sucedido na página Implantações do projeto. Verifique se você está usando o URI de destino correto e a Chave dos detalhes da implantação.

Para outras consultas, consulte a seção de perguntas frequentes .