Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Modelos de Fundação Microsoft no catálogo de modelos compreendem duas categorias principais: modelos Foundry vendidos diretamente pela Azure e modelos Foundry de parceiros e comunidade. Este artigo lista uma seleção de Modelos Foundry de parceiros e da comunidade, juntamente com seus recursos, tipos de implantação e regiões disponíveis, excluindo modelos obsoletos e desativados. A maioria dos provedores de Modelos de Fundição são organizações confiáveis de terceiros, parceiros, laboratórios de pesquisa e colaboradores da comunidade.
Importante
Modelos de parceiros e comunidade que não são vendidos diretamente por Azure são produtos não Microsoft nos Termos do Produto.
Para obter uma lista de Modelos Foundry vendidos diretamente pela Azure, consulte Modelos Foundry vendidos diretamente pela Azure, e para obter uma lista de Modelos Foundry com suporte pelo Serviço do Agente Foundry, consulte Modelos com suporte pelo Serviço do Agente.
Os Modelos de Foundry dão suporte a vários tipos de implantação para um recurso do Foundry. Alguns modelos do catálogo exigem um projeto em hub, hospedado por um hub Foundry, para implementação. Selecionar esses modelos no catálogo os abre na experiência clássica do portal Foundry.
Pré-requisitos
Uma assinatura Azure. Se você não tiver uma, crie uma conta gratuita.
Importante
As assinaturas de Azure a seguir não podem ser usadas para comprar ofertas de SaaS (software como serviço) no Marketplace: Student, Visual Studio Enterprise ou Crédito gratuito. Para obter mais informações sobre como comprar ofertas de SaaS, consulte a experiência de compra de SaaS.
Um projeto Microsoft Foundry.
Permissões necessárias para assinar modelos de parceiros e da Comunidade
Modelos Foundry de parceiros e comunidade disponíveis para implantação (por exemplo, modelos Cohere) exigem Azure Marketplace. Os provedores de modelo definem os termos de licença e definem o preço para o uso de seus modelos usando Azure Marketplace.
Ao implantar modelos de terceiros, verifique se você tem as seguintes permissões em sua conta:
- Na assinatura Azure:
Microsoft.MarketplaceOrdering/agreements/offers/plans/readMicrosoft.MarketplaceOrdering/agreements/offers/plans/sign/actionMicrosoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/readMicrosoft.Marketplace/offerTypes/publishers/offers/plans/agreements/readMicrosoft.SaaS/register/action
- No grupo de recursos, para criar e utilizar o recurso SaaS:
Microsoft.SaaS/resources/readMicrosoft.SaaS/resources/write
As funções internas Owner e Contributor na assinatura Azure incluem essas permissões. Se você não tiver as permissões necessárias, peça ao administrador da assinatura que lhe atribua a função colaborador ou crie uma função personalizada que inclua as ações listadas.
Para verificar suas permissões, acesse o portal do Azure, abra sua assinatura, selecione Controle de Acesso (IAM)>Verificar acesso e reveja seus papéis atribuídos.
Dica
Microsoft.SaaS/register/action é um registro único do provedor de recursos SaaS na assinatura. Após o registro, ele não precisa ser repetido para cada implantação.
Disponibilidade de país/região
Você pode acessar modelos de parceiros e da comunidade com cobrança conforme o uso somente se a sua assinatura Azure pertencer a uma conta de cobrança em um país/região onde a oferta de modelo está disponível. A disponibilidade varia de acordo com o provedor de modelo e a SKU do modelo. Para obter mais informações, consulte a disponibilidade de região para modelos.
Anthropic
O principal produto da Anthropic é Claude, um modelo de IA de ponta confiável para empresas líderes e milhões de usuários pelo mundo todo para tarefas complexas, incluindo codificação, agentes, análise financeira, tarefas de pesquisa e de escritório. Claude oferece um desempenho excepcional, mantendo altos padrões de segurança.
Para trabalhar com modelos Claude no Foundry, consulte Implantar e usar modelos Claude na Microsoft Foundry.
Nota
Claude Mythos Preview só está disponível como uma prévia de pesquisa restrita. O acesso ao modelo é concedido apenas a critério de Anthropic e é priorizado para casos de uso de segurança cibernética defensiva. Consulte o cartão do sistema Claude Mythos Preview para obter diretrizes de uso responsável.
Tipo de assinatura e suporte à região
Para usar os Modelos Claude no Microsoft Foundry, você deve ter uma assinatura paga do Azure com uma conta de cobrança em um país ou região onde a Anthropic oferece os modelos para compra. Para obter uma lista de erros comuns relacionados à assinatura, consulte mensagens de erro comuns e soluções. Atualmente, não há suporte para os seguintes tipos de assinatura:
- Contas corporativas localizadas na Coreia do Sul
- Provedor de Soluções na Nuvem assinaturas
- Azure assinaturas que não têm um método de cobrança pago conforme o uso ativo (por exemplo, estudante, avaliação gratuita ou contas baseadas em crédito de inicialização)
- Assinaturas patrocinadas que usam apenas créditos do Azure. Nota: se você tiver uma conta registrada com um cartão de crédito, o cartão de crédito será cobrado em vez de Créditos do Azure.
Para obter uma lista de regiões com suporte, consulte as localizações geográficas com suporte. Observe que, a "Política de Regiões com Suporte" do Anthropic pode se aplicar à disponibilidade em sua região, verifique regiões com suporte para obter detalhes.
| Modelo | Tipo | Capacidades |
|---|---|---|
claude-mythos-preview Prévia de pesquisa restrita |
Mensagens |
-
Entrada: texto, imagem e código - Saída: texto, imagem e código (128.000 tokens máximos) - Janela de contexto: 1.000.000 - Idiomas: en, fr, ar, , zh, ja, ko, es, hi - Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código) - Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação) - Parâmetros de chave: top_p deve ser pelo menos 0,99. As solicitações abaixo top_p desse limite são rejeitadas com um erro de 400. Quando top_p é omitido, o padrão (0,99) é usado. |
claude-opus-4-7 Visualizar |
Mensagens |
-
Entrada: texto, imagem e código - Saída: texto, imagem e código (128.000 tokens máximos) - Janela de contexto: 1.000.000 - Idiomas: en, fr, ar, , zh, ja, ko, es, hi - Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código) - Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação) - Parâmetros de chave: top_k, temperature e thinking={"type":"enabled"} não são suportados.top_p deve ser 0,99. Quando omitido, o padrão (0,99) é usado. |
claude-opus-4-6 Visualizar |
Mensagens |
-
Entrada: texto, imagem e código - Saída: texto, imagem e código (128.000 tokens máximos) - Janela de contexto: 1.000.000 - Idiomas: en, fr, ar, , zh, ja, ko, es, hi - Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código) - Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação) |
claude-opus-4-5 Visualizar |
Mensagens |
-
Entrada: texto, imagem e código - Saída: texto (64.000 tokens máximos) - Janela de contexto: 200.000 - Idiomas: en, fr, ar, , zh, ja, ko, es, hi - Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código) - Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação) |
claude-opus-4-1 Visualizar |
Mensagens |
-
Entrada: texto, imagem e código - Saída: texto (32.000 tokens máximos) - Janela de contexto: 200.000 - Idiomas: en, fr, ar, , zh, ja, ko, es, hi - Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código) - Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação) |
claude-sonnet-4-6 Visualizar |
Mensagens |
-
Entrada: texto, imagem e código - Saída: texto, imagem e código (128.000 tokens máximos) - Janela de contexto: 1.000.000 - Idiomas: en, fr, ar, , zh, ja, ko, es, hi - Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código) - Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação) |
claude-sonnet-4-5 Visualizar |
Mensagens |
-
Entrada: texto, imagem e código - Saída: texto (64.000 tokens máximos) - Janela de contexto: 200.000 - Idiomas: en, fr, ar, , zh, ja, ko, es, hi - Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código) - Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação) |
claude-haiku-4-5 Visualizar |
Mensagens |
-
Entrada: texto e imagem - Saída: texto (64.000 tokens máximos) - Janela de contexto: 200.000 - Idiomas: en, fr, ar, , zh, ja, ko, es, hi - Chamada de ferramenta: Sim (pesquisa de arquivo e execução de código) - Formatos de resposta: Texto em vários formatos (por exemplo, prosa, listas, tabelas markdown, JSON, HTML, código em várias linguagens de programação) |
Cohere
A família cohere de modelos inclui vários modelos otimizados para diferentes casos de uso, incluindo conclusões de chat e inserções. Os modelos da Cohere são otimizados para vários casos de uso que incluem raciocínio, sumarização e resposta a perguntas.
Para implantar modelos do Cohere no Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.
| Modelo | Tipo | Capacidades |
|---|---|---|
Cohere-command-r-plus-08-2024 |
completação de chat |
-
Entrada: texto (131.072 tokens) - Saída: texto (4.096 tokens) - Idiomas: en, fr, es, , it, de, pt-br, ja, ko, , zh-cne ar - Chamada de ferramenta: Sim - Formatos de resposta: Texto, JSON |
Cohere-command-r-08-2024 |
completação de chat |
-
Entrada: texto (131.072 tokens) - Saída: texto (4.096 tokens) - Idiomas: en, fr, es, , it, de, pt-br, ja, ko, , zh-cne ar - Chamada de ferramenta: Sim - Formatos de resposta: Texto, JSON |
Cohere-embed-v3-english |
Embeddings |
-
Entrada: texto e imagens (512 tokens) - Saída: Vetor (1024 dimensões) - Idiomas: en |
Cohere-embed-v3-multilingual |
Embeddings |
-
Entrada: texto (512 tokens) - Saída: Vetor (1024 dimensões) - Idiomas: en, fr, es, , it, de, pt-br, ja, ko, , zh-cne ar |
Meta
Os modelos e ferramentas Meta Llama são uma coleção de modelos de IA generativa e raciocínio de texto e imagem pré-treinados e afinados. Os meta modelos variam em escala para incluir:
- Modelos de linguagem pequenos (SLMs), como os modelos Base e Instruct de 1B e 3B, para inferência no dispositivo e na borda.
- LlMs (modelos de linguagem grande) de tamanho médio, como modelos de base e instrução de 7B, 8B e 70B
- Modelos de alto desempenho, como o Meta Llama 3.1-405B Instruct, para casos de uso de geração e destilação de dados sintéticos.
Para implantar modelos Meta Llama no Foundry, consulte Implantar Modelos Microsoft Foundry no Portal Foundry.
| Modelo | Tipo | Capacidades |
|---|---|---|
Llama-3.2-11B-Vision-Instruct |
completação de chat |
-
Entrada: texto e imagem (128.000 tokens) - Saída: texto (8.192 tokens) - Idiomas: en - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Llama-3.2-90B-Vision-Instruct |
completação de chat |
-
Entrada: texto e imagem (128.000 tokens) - Saída: texto (8.192 tokens) - Idiomas: en - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Meta-Llama-3.1-405B-Instruct |
completação de chat |
-
Entrada: texto (131.072 tokens) - Saída: texto (8.192 tokens) - Idiomas: en, de, fr, , it, pt, hi, ese th - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Meta-Llama-3.1-8B-Instruct |
completação de chat |
-
Entrada: texto (131.072 tokens) - Saída: texto (8.192 tokens) - Idiomas: en, de, fr, , it, pt, hi, ese th - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Llama-4-Scout-17B-16E-Instruct |
completação de chat |
-
Entrada: texto e imagem (128.000 tokens) - Saída: texto (8.192 tokens) - Idiomas: en - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Microsoft
Modelos da Microsoft incluem vários grupos de modelos, como modelos MAI, modelos Phi, modelos de IA para a área de saúde e muito mais.
Para implantar modelos de Microsoft na Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.
| Modelo | Tipo | Capacidades |
|---|---|---|
Phi-4-mini-instruct |
completação de chat |
-
Entrada: texto (131.072 tokens) - Saída: texto (4.096 tokens) - Idiomas: ar, zh, cs, da, nl, en, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, e truk - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Phi-4-multimodal-instruct |
completação de chat |
-
Entrada: texto, imagens e áudio (131.072 tokens) - Saída: texto (4.096 tokens) - Idiomas: ar, zh, cs, da, nl, en, fi, fr, de, he, hu, it, ja, ko, no, pl, pt, ru, es, sv, th, e truk - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Phi-4 |
completação de chat |
-
Entrada: texto (16,384 tokens) - Saída: texto (16.384 tokens) - Idiomas: en, ar, bn, cs, da, de, el, es, fa, fi, fr, gu, ha, he, hi, hu, id, it, ja, jv, kn, ko, ml, mr, nl, no, or, pa, pl, ps, pt, ro, ru, sv, sw, ta, te, th, tl, tr, uk, ur, e vi, yo, zh - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Phi-4-reasoning |
chat-completion com conteúdo de processamento de raciocínio |
-
Entrada: texto (32.768 tokens) - Saída: texto (32.768 tokens) - Idiomas: en - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Phi-4-mini-reasoning |
chat-completion com conteúdo de processamento de raciocínio |
-
Entrada: texto (128.000 tokens) - Saída: texto (128.000 tokens) - Idiomas: en - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Mistral IA
A IA do Mistral oferece modelos para geração de código, chat de uso geral e tarefas multimodal, incluindo Codestral, Ministral, Mistral Small e Mistral Medium.
Para implantar modelos de IA do Mistral na Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.
| Modelo | Tipo | Capacidades |
|---|---|---|
Codestral-2501 |
completação de chat |
-
Entrada: texto (262.144 tokens) - Saída: texto (4.096 tokens) - Idiomas: en - Chamada de ferramenta: Não - Formatos de resposta: Texto |
Ministral-3B |
completação de chat |
-
Entrada: texto (131.072 tokens) - Saída: texto (4.096 tokens) - Idiomas: fr, de, es, it e en - Chamada de ferramenta: Sim - Formatos de resposta: Texto, JSON |
Mistral-small-2503 |
completação de chat |
-
Entrada: texto (32.768 tokens) - Saída: texto (4.096 tokens) - Idiomas: fr, de, es, it e en - Chamada de ferramenta: Sim - Formatos de resposta: Texto, JSON |
Mistral-medium-2505 |
completação de chat |
-
Entrada: texto (128.000 tokens), imagem - Saída: texto (128.000 tokens) - Chamada de ferramenta: Não - Formatos de resposta: Texto, JSON |
mistralai-Mistral-7B-Instruct-v01
1 |
completação de chat |
-
Entrada: texto - Saída: texto - Idiomas: en - Formatos de resposta: Texto |
mistralai-Mistral-7B-Instruct-v0-2
1 |
completação de chat |
-
Entrada: texto - Saída: texto - Idiomas: en - Formatos de resposta: Texto |
mistralai-Mixtral-8x7B-Instruct-v01
1 |
completação de chat |
-
Entrada: texto - Saída: texto - Idiomas: en - Formatos de resposta: Texto |
mistralai-Mixtral-8x22B-Instruct-v0-1
1 |
completação de chat |
-
Entrada: texto (64.000 tokens) - Saída: texto (4.096 tokens) - Idiomas: fr, it, de, es, en - Formatos de resposta: Texto |
1 Esses modelos exigem um projeto baseado em hub para implantação. Selecioná-los no catálogo de modelos abre-os na experiência clássica do portal do Foundry.
Nixtla
O TimeGEN-1 da Nixtla é um modelo gerativo de previsão e detecção de anomalias pré-treinado para dados de séries temporais. O TimeGEN-1 produz previsões precisas para novas séries temporais sem treinamento, usando apenas valores históricos e covariados exógenos como entradas.
Para implantar o TimeGEN-1 na Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.
Para executar a inferência, o TimeGEN-1 exige que você use a API de inferência personalizada do Nixtla.
| Modelo | Tipo | Capacidades | API de inferência |
|---|---|---|---|
TimeGEN-1
1 |
Previsão |
-
Entrada: Dados de série temporal como JSON ou dataframes (com suporte para entrada multivariada) - Saída: Dados de série temporal como JSON - Chamada de ferramenta: Não - Formatos de resposta: JSON |
Cliente de previsão para interagir com a API do Nixtla |
1 Esse modelo requer um projeto baseado em hub para implantação. Selecionar o modelo no catálogo de modelos abre-o na experiência do portal do Foundry (clássico).
Para obter mais detalhes sobre os preços dos modelos nixtla, consulte Nixtla.
Consulte os modelos Nixtla no portal do Foundry.
NTT Data
tsuzumi é um transformador com otimização de linguagem autoregressiva. As versões ajustadas usam SFT (ajuste fino supervisionado). tsuzumi manipula idioma japonês e inglês com alta eficiência.
Para implantar o tsuzumi-7b no Foundry, consulte Deploy Microsoft Foundry Models no portal da Foundry.
| Modelo | Tipo | Capacidades |
|---|---|---|
tsuzumi-7b
1 |
completação de chat |
-
Entrada: texto (8.192 tokens) - Saída: texto (8.192 tokens) - Idiomas: en E jp - Chamada de ferramenta: Não - Formatos de resposta: Texto |
1 Esse modelo requer um projeto baseado em hub para implantação. Selecionar o modelo no catálogo de modelos abre-o na experiência do portal do Foundry (clássico).
Consulte os modelos de dados NTT no portal do Foundry.
IA de estabilidade
A coleção de modelos da Stability AI para geração de imagens inclui Stable Image Core, Stable Image Ultra e Stable Diffusion 3.5 Large. A Difusão Estável 3.5 Grande aceita a entrada de imagem e de texto.
Para implantar modelos de IA de estabilidade no Foundry, consulte Deploy Microsoft Foundry Models no portal do Foundry.
| Modelo | Tipo | Capacidades |
|---|---|---|
Stable Diffusion 3.5 Large |
Geração de imagem |
-
Entrada: texto e imagem (1.000 tokens e 1 imagem) - Saída: Uma imagem - Chamada de ferramenta: Não - Formatos de resposta: Imagem (PNG e JPG) |
Stable Image Core |
Geração de imagem |
-
Entrada: texto (1.000 tokens) - Saída: Uma imagem - Chamada de ferramenta: Não - Formatos de resposta: Imagem (PNG e JPG) |
Stable Image Ultra |
Geração de imagem |
-
Entrada: texto (1.000 tokens) - Saída: Uma imagem - Chamada de ferramenta: Não - Formatos de resposta: Imagem (PNG e JPG) |
Solucionando problemas
Use o seguinte guia de solução de problemas para localizar e resolver erros ao implantar modelos de terceiros no Foundry Models.
| Erro | Descrição |
|---|---|
| Oferta não disponível em seu país/região | O provedor de modelos não disponibilizou o SKU de modelo específico no país/região em que você registrou sua assinatura. Cada provedor de modelo decide quais países/regiões estão disponíveis e a disponibilidade pode variar de acordo com a SKU do modelo. Implante o modelo em uma assinatura com cobrança em um país/região com suporte. Consulte a disponibilidade regional para modelos. |
| Falha na verificação de qualificação de compra do Marketplace | O provedor de modelos não disponibilizou o SKU de modelo específico em seu país/região ou o modelo não está disponível na região em que você implantou o recurso Foundry. Consulte a disponibilidade regional para modelos. |
| Não é possível criar uma implantação de modelo | Azure Marketplace rejeitou a solicitação para criar uma assinatura de modelo. Essa rejeição pode ocorrer por vários motivos, incluindo a assinatura do modelo de assinatura com muita frequência ou devido a várias assinaturas ao mesmo tempo. Contate o suporte e inclua sua ID de assinatura. |
| Assinatura CSP não é suportada | As assinaturas do Provedor de Soluções na Nuvem (CSP) não podem adquirir ofertas de modelos de terceiros. Considere o uso de modelos oferecidos como um serviço de consumo de primeira parte. |
Conteúdo relacionado
- Visão geral da implantação para modelos Foundry
- Deploy Microsoft Foundry Models no portal da Foundry
- Tipos de Implantação para Modelos Microsoft Foundry
- Disponibilidade de região para Modelos de Fundição
- Explorar modelos de fundição