Modelos de fundição de parceiros e comunidade

Modelos de Fundação Microsoft no catálogo de modelos compreendem duas categorias principais: modelos Foundry vendidos diretamente pela Azure e modelos Foundry de parceiros e comunidade. Este artigo lista uma seleção de Modelos Foundry de parceiros e da comunidade, juntamente com seus recursos, tipos de implantação e regiões disponíveis, excluindo modelos obsoletos e desativados. A maioria dos provedores de Modelos de Fundição são organizações confiáveis de terceiros, parceiros, laboratórios de pesquisa e colaboradores da comunidade.

Importante

Modelos de parceiros e comunidade que não são vendidos diretamente por Azure são produtos não Microsoft nos Termos do Produto.

Para obter uma lista de Modelos Foundry vendidos diretamente pela Azure, consulte Modelos Foundry vendidos diretamente pela Azure, e para obter uma lista de Modelos Foundry com suporte pelo Serviço do Agente Foundry, consulte Modelos com suporte pelo Serviço do Agente.

Os Modelos de Foundry dão suporte a vários tipos de implantação para um recurso do Foundry. Alguns modelos do catálogo exigem um projeto em hub, hospedado por um hub Foundry, para implementação. Selecionar esses modelos no catálogo os abre na experiência clássica do portal Foundry.

Pré-requisitos

  • Uma assinatura Azure. Se você não tiver uma, crie uma conta gratuita.

    Importante

    As assinaturas de Azure a seguir não podem ser usadas para comprar ofertas de SaaS (software como serviço) no Marketplace: Student, Visual Studio Enterprise ou Crédito gratuito. Para obter mais informações sobre como comprar ofertas de SaaS, consulte a experiência de compra de SaaS.

  • Um projeto Microsoft Foundry.

Permissões necessárias para assinar modelos de parceiros e da Comunidade

Modelos Foundry de parceiros e comunidade disponíveis para implantação (por exemplo, modelos Cohere) exigem Azure Marketplace. Os provedores de modelo definem os termos de licença e definem o preço para o uso de seus modelos usando Azure Marketplace.

Ao implantar modelos de terceiros, verifique se você tem as seguintes permissões em sua conta:

  • Na assinatura Azure:
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • No grupo de recursos, para criar e utilizar o recurso SaaS:
    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write

As funções internas Owner e Contributor na assinatura Azure incluem essas permissões. Se você não tiver as permissões necessárias, peça ao administrador da assinatura que lhe atribua a função colaborador ou crie uma função personalizada que inclua as ações listadas.

Para verificar suas permissões, acesse o portal do Azure, abra sua assinatura, selecione Controle de Acesso (IAM)>Verificar acesso e reveja seus papéis atribuídos.

Dica

Microsoft.SaaS/register/action é um registro único do provedor de recursos SaaS na assinatura. Após o registro, ele não precisa ser repetido para cada implantação.

Disponibilidade de país/região

Você pode acessar modelos de parceiros e da comunidade com cobrança conforme o uso somente se a sua assinatura Azure pertencer a uma conta de cobrança em um país/região onde a oferta de modelo está disponível. A disponibilidade varia de acordo com o provedor de modelo e a SKU do modelo. Para obter mais informações, consulte a disponibilidade de região para modelos.

Anthropic

O principal produto da Anthropic é Claude, um modelo de IA de ponta confiável para empresas líderes e milhões de usuários pelo mundo todo para tarefas complexas, incluindo codificação, agentes, análise financeira, tarefas de pesquisa e de escritório. Claude oferece um desempenho excepcional, mantendo altos padrões de segurança.

Para trabalhar com modelos Claude no Foundry, consulte Implantar e usar modelos Claude na Microsoft Foundry.

Nota

Claude Mythos Preview só está disponível como uma prévia de pesquisa restrita. O acesso ao modelo é concedido apenas a critério de Anthropic e é priorizado para casos de uso de segurança cibernética defensiva. Consulte o cartão do sistema Claude Mythos Preview para obter diretrizes de uso responsável.

Tipo de assinatura e suporte à região

Para usar os Modelos Claude no Microsoft Foundry, você deve ter uma assinatura paga do Azure com uma conta de cobrança em um país ou região onde a Anthropic oferece os modelos para compra. Para obter uma lista de erros comuns relacionados à assinatura, consulte mensagens de erro comuns e soluções. Atualmente, não há suporte para os seguintes tipos de assinatura:

  • Contas corporativas localizadas na Coreia do Sul
  • Provedor de Soluções na Nuvem assinaturas
  • Azure assinaturas que não têm um método de cobrança pago conforme o uso ativo (por exemplo, estudante, avaliação gratuita ou contas baseadas em crédito de inicialização)
  • Assinaturas patrocinadas que usam apenas créditos do Azure. Nota: se você tiver uma conta registrada com um cartão de crédito, o cartão de crédito será cobrado em vez de Créditos do Azure.

Para obter uma lista de regiões com suporte, consulte as localizações geográficas com suporte. Observe que, a "Política de Regiões com Suporte" do Anthropic pode se aplicar à disponibilidade em sua região, verifique regiões com suporte para obter detalhes.

Modelo Tipo Capacidades
claude-mythos-preview
Prévia de pesquisa restrita
Mensagens - Entrada: texto, imagem e código
- Saída: texto, imagem e código (128.000 tokens máximos)
- Janela de contexto: 1.000.000
- Idiomas:en, fr, ar, , zh, ja, ko, es, hi
- Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código)
- Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação)
- Parâmetros de chave:top_p deve ser pelo menos 0,99. As solicitações abaixo top_p desse limite são rejeitadas com um erro de 400. Quando top_p é omitido, o padrão (0,99) é usado.
claude-opus-4-7
Visualizar
Mensagens - Entrada: texto, imagem e código
- Saída: texto, imagem e código (128.000 tokens máximos)
- Janela de contexto: 1.000.000
- Idiomas:en, fr, ar, , zh, ja, ko, es, hi
- Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código)
- Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação)
- Parâmetros de chave:
top_k, temperature e thinking={"type":"enabled"} não são suportados.
top_p deve ser 0,99. Quando omitido, o padrão (0,99) é usado.
claude-opus-4-6
Visualizar
Mensagens - Entrada: texto, imagem e código
- Saída: texto, imagem e código (128.000 tokens máximos)
- Janela de contexto: 1.000.000
- Idiomas:en, fr, ar, , zh, ja, ko, es, hi
- Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código)
- Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação)
claude-opus-4-5
Visualizar
Mensagens - Entrada: texto, imagem e código
- Saída: texto (64.000 tokens máximos)
- Janela de contexto: 200.000
- Idiomas:en, fr, ar, , zh, ja, ko, es, hi
- Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código)
- Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação)
claude-opus-4-1
Visualizar
Mensagens - Entrada: texto, imagem e código
- Saída: texto (32.000 tokens máximos)
- Janela de contexto: 200.000
- Idiomas:en, fr, ar, , zh, ja, ko, es, hi
- Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código)
- Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação)
claude-sonnet-4-6
Visualizar
Mensagens - Entrada: texto, imagem e código
- Saída: texto, imagem e código (128.000 tokens máximos)
- Janela de contexto: 1.000.000
- Idiomas:en, fr, ar, , zh, ja, ko, es, hi
- Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código)
- Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação)
claude-sonnet-4-5
Visualizar
Mensagens - Entrada: texto, imagem e código
- Saída: texto (64.000 tokens máximos)
- Janela de contexto: 200.000
- Idiomas:en, fr, ar, , zh, ja, ko, es, hi
- Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código)
- Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação)
claude-haiku-4-5
Visualizar
Mensagens - Entrada: texto e imagem
- Saída: texto (64.000 tokens máximos)
- Janela de contexto: 200.000
- Idiomas:en, fr, ar, , zh, ja, ko, es, hi
- Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código)
- Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação)

Cohere

A família cohere de modelos inclui vários modelos otimizados para diferentes casos de uso, incluindo conclusões de chat e inserções. Os modelos da Cohere são otimizados para vários casos de uso que incluem raciocínio, sumarização e resposta a perguntas.

Para implantar modelos do Cohere no Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.

Modelo Tipo Capacidades
Cohere-command-r-plus-08-2024 completação de chat - Entrada: texto (131.072 tokens)
- Saída: texto (4.096 tokens)
- Idiomas:en, fr, es, , it, de, pt-br, ja, ko, , zh-cne ar
- Chamada de ferramenta: Sim
- Formatos de resposta: Texto, JSON
Cohere-command-r-08-2024 completação de chat - Entrada: texto (131.072 tokens)
- Saída: texto (4.096 tokens)
- Idiomas:en, fr, es, , it, de, pt-br, ja, ko, , zh-cne ar
- Chamada de ferramenta: Sim
- Formatos de resposta: Texto, JSON
Cohere-embed-v3-english Embeddings - Entrada: texto e imagens (512 tokens)
- Saída: Vetor (1024 dimensões)
- Idiomas:en
Cohere-embed-v3-multilingual Embeddings - Entrada: texto (512 tokens)
- Saída: Vetor (1024 dimensões)
- Idiomas:en, fr, es, , it, de, pt-br, ja, ko, , zh-cne ar

Meta

Os modelos e ferramentas Meta Llama são uma coleção de modelos de IA generativa e raciocínio de texto e imagem pré-treinados e afinados. Os meta modelos variam em escala para incluir:

  • Modelos de linguagem pequenos (SLMs), como os modelos Base e Instruct de 1B e 3B, para inferência no dispositivo e na borda.
  • LlMs (modelos de linguagem grande) de tamanho médio, como modelos de base e instrução de 7B, 8B e 70B
  • Modelos de alto desempenho, como o Meta Llama 3.1-405B Instruct, para casos de uso de geração e destilação de dados sintéticos.

Para implantar modelos Meta Llama no Foundry, consulte Implantar Modelos Microsoft Foundry no Portal Foundry.

Modelo Tipo Capacidades
Llama-3.2-11B-Vision-Instruct completação de chat - Entrada: texto e imagem (128.000 tokens)
- Saída: texto (8.192 tokens)
- Idiomas:en
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Llama-3.2-90B-Vision-Instruct completação de chat - Entrada: texto e imagem (128.000 tokens)
- Saída: texto (8.192 tokens)
- Idiomas:en
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Meta-Llama-3.1-405B-Instruct completação de chat - Entrada: texto (131.072 tokens)
- Saída: texto (8.192 tokens)
- Idiomas:en, de, fr, , it, pt, hi, ese th
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Meta-Llama-3.1-8B-Instruct completação de chat - Entrada: texto (131.072 tokens)
- Saída: texto (8.192 tokens)
- Idiomas:en, de, fr, , it, pt, hi, ese th
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Llama-4-Scout-17B-16E-Instruct completação de chat - Entrada: texto e imagem (128.000 tokens)
- Saída: texto (8.192 tokens)
- Idiomas:en
- Chamada de ferramenta: Não
- Formatos de resposta: Texto

Microsoft

Modelos da Microsoft incluem vários grupos de modelos, como modelos MAI, modelos Phi, modelos de IA para a área de saúde e muito mais.

Para implantar modelos de Microsoft na Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.

Modelo Tipo Capacidades
Phi-4-mini-instruct completação de chat - Entrada: texto (131.072 tokens)
- Saída: texto (4.096 tokens)
- Idiomas:ar, zh, cs, da, nl, en, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, e truk
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Phi-4-multimodal-instruct completação de chat - Entrada: texto, imagens e áudio (131.072 tokens)
- Saída: texto (4.096 tokens)
- Idiomas:ar, zh, cs, da, nl, en, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, e truk
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Phi-4 completação de chat - Entrada: texto (16,384 tokens)
- Saída: texto (16.384 tokens)
- Idiomas:en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, ur, e vi, yo, zh
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Phi-4-reasoning chat-completion com conteúdo de processamento de raciocínio - Entrada: texto (32.768 tokens)
- Saída: texto (32.768 tokens)
- Idiomas:en
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Phi-4-mini-reasoning chat-completion com conteúdo de processamento de raciocínio - Entrada: texto (128.000 tokens)
- Saída: texto (128.000 tokens)
- Idiomas:en
- Chamada de ferramenta: Não
- Formatos de resposta: Texto

Mistral IA

A IA do Mistral oferece modelos para geração de código, chat de uso geral e tarefas multimodal, incluindo Codestral, Ministral, Mistral Small e Mistral Medium.

Para implantar modelos de IA do Mistral na Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.

Modelo Tipo Capacidades
Codestral-2501 completação de chat - Entrada: texto (262.144 tokens)
- Saída: texto (4.096 tokens)
- Idiomas: en
- Chamada de ferramenta: Não
- Formatos de resposta: Texto
Ministral-3B completação de chat - Entrada: texto (131.072 tokens)
- Saída: texto (4.096 tokens)
- Idiomas: fr, de, es, it e en
- Chamada de ferramenta: Sim
- Formatos de resposta: Texto, JSON
Mistral-small-2503 completação de chat - Entrada: texto (32.768 tokens)
- Saída: texto (4.096 tokens)
- Idiomas: fr, de, es, it e en
- Chamada de ferramenta: Sim
- Formatos de resposta: Texto, JSON
Mistral-medium-2505 completação de chat - Entrada: texto (128.000 tokens), imagem
- Saída: texto (128.000 tokens)
- Chamada de ferramenta: Não
- Formatos de resposta: Texto, JSON
mistralai-Mistral-7B-Instruct-v01 1 completação de chat - Entrada: texto
- Saída: texto
- Idiomas: en
- Formatos de resposta: Texto
mistralai-Mistral-7B-Instruct-v0-2 1 completação de chat - Entrada: texto
- Saída: texto
- Idiomas: en
- Formatos de resposta: Texto
mistralai-Mixtral-8x7B-Instruct-v01 1 completação de chat - Entrada: texto
- Saída: texto
- Idiomas: en
- Formatos de resposta: Texto
mistralai-Mixtral-8x22B-Instruct-v0-1 1 completação de chat - Entrada: texto (64.000 tokens)
- Saída: texto (4.096 tokens)
- Idiomas: fr, it, de, es, en
- Formatos de resposta: Texto

1 Esses modelos exigem um projeto baseado em hub para implantação. Selecioná-los no catálogo de modelos abre-os na experiência clássica do portal do Foundry.

Nixtla

O TimeGEN-1 da Nixtla é um modelo gerativo de previsão e detecção de anomalias pré-treinado para dados de séries temporais. O TimeGEN-1 produz previsões precisas para novas séries temporais sem treinamento, usando apenas valores históricos e covariados exógenos como entradas.

Para implantar o TimeGEN-1 na Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.

Para executar a inferência, o TimeGEN-1 exige que você use a API de inferência personalizada do Nixtla.

Modelo Tipo Capacidades API de inferência
TimeGEN-1 1 Previsão - Entrada: Dados de série temporal como JSON ou dataframes (com suporte para entrada multivariada)
- Saída: Dados de série temporal como JSON
- Chamada de ferramenta: Não
- Formatos de resposta: JSON
Cliente de previsão para interagir com a API do Nixtla

1 Esse modelo requer um projeto baseado em hub para implantação. Selecionar o modelo no catálogo de modelos abre-o na experiência do portal do Foundry (clássico).

Para obter mais detalhes sobre os preços dos modelos nixtla, consulte Nixtla.

Consulte os modelos Nixtla no portal do Foundry.

NTT Data

tsuzumi é um transformador com otimização de linguagem autoregressiva. As versões ajustadas usam SFT (ajuste fino supervisionado). tsuzumi manipula idioma japonês e inglês com alta eficiência.

Para implantar o tsuzumi-7b no Foundry, consulte Deploy Microsoft Foundry Models no portal da Foundry.

Modelo Tipo Capacidades
tsuzumi-7b 1 completação de chat - Entrada: texto (8.192 tokens)
- Saída: texto (8.192 tokens)
- Idiomas:en E jp
- Chamada de ferramenta: Não
- Formatos de resposta: Texto

1 Esse modelo requer um projeto baseado em hub para implantação. Selecionar o modelo no catálogo de modelos abre-o na experiência do portal do Foundry (clássico).

Consulte os modelos de dados NTT no portal do Foundry.

IA de estabilidade

A coleção de modelos da Stability AI para geração de imagens inclui Stable Image Core, Stable Image Ultra e Stable Diffusion 3.5 Large. A Difusão Estável 3.5 Grande aceita a entrada de imagem e de texto.

Para implantar modelos de IA de estabilidade no Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.

Modelo Tipo Capacidades
Stable Diffusion 3.5 Large Geração de imagem - Entrada: texto e imagem (1.000 tokens e 1 imagem)
- Saída: Uma imagem
- Chamada de ferramenta: Não
- Formatos de resposta: Imagem (PNG e JPG)
Stable Image Core Geração de imagem - Entrada: texto (1.000 tokens)
- Saída: Uma imagem
- Chamada de ferramenta: Não
- Formatos de resposta: Imagem (PNG e JPG)
Stable Image Ultra Geração de imagem - Entrada: texto (1.000 tokens)
- Saída: Uma imagem
- Chamada de ferramenta: Não
- Formatos de resposta: Imagem (PNG e JPG)

Solucionando problemas

Use o seguinte guia de solução de problemas para localizar e resolver erros ao implantar modelos de terceiros no Foundry Models.

Erro Descrição
Oferta não disponível em seu país/região O provedor de modelos não disponibilizou o SKU de modelo específico no país/região em que você registrou sua assinatura. Cada provedor de modelo decide quais países/regiões estão disponíveis e a disponibilidade pode variar de acordo com a SKU do modelo. Implante o modelo em uma assinatura com cobrança em um país/região com suporte. Consulte a disponibilidade regional para modelos.
Falha na verificação de qualificação de compra do Marketplace O provedor de modelos não disponibilizou o SKU de modelo específico em seu país/região ou o modelo não está disponível na região em que você implantou o recurso Foundry. Consulte a disponibilidade regional para modelos.
Não é possível criar uma implantação de modelo Azure Marketplace rejeitou a solicitação para criar uma assinatura de modelo. Essa rejeição pode ocorrer por vários motivos, incluindo a assinatura do modelo de assinatura com muita frequência ou devido a várias assinaturas ao mesmo tempo. Contate o suporte e inclua sua ID de assinatura.
Assinatura CSP não é suportada As assinaturas do Provedor de Soluções na Nuvem (CSP) não podem adquirir ofertas de modelos de terceiros. Considere o uso de modelos oferecidos como um serviço de consumo de primeira parte.