Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Exibição no momento:Versão do portal Foundry (clássico) - Alternar para a versão do novo portal Foundry
Nota
Links neste artigo podem abrir conteúdo na nova documentação do Microsoft Foundry em vez da documentação da Foundry (clássica) que você está exibindo agora.
os modelos Claude da Anthropic trazem recursos avançados de IA de conversa para Microsoft Foundry, permitindo que você crie aplicativos inteligentes com a compreensão e geração de linguagem de última geração. Os modelos Claude se destacam em raciocínio complexo, geração de código e tarefas multimodais, incluindo análise de imagem.
Neste artigo, você aprenderá a:
- Desplegar modelos Claude no Microsoft Foundry
- Autenticar usando Microsoft Entra ID ou chaves de API
- Chamar a Claude Messages API a partir de Python, JavaScript ou REST
- Escolha o modelo Claude correto para o seu caso de uso
Os modelos de Claude na Foundry incluem:
| Família de modelos | Modelos |
|---|---|
| Claude Mythos |
claude-mythos-preview
1 (visualização de pesquisa restrita) |
| Claude Opus |
claude-opus-4-7
2 (versão prévia), claude-opus-4-6 (versão prévia), claude-opus-4-5 (versão prévia) claude-opus-4-1 |
| Claude Sonnet |
claude-sonnet-4-6 (versão prévia), claude-sonnet-4-5 (versão prévia) |
| Claude Haiku |
claude-haiku-4-5 (versão prévia) |
1Claude Mythos Preview só está disponível como uma visualização de pesquisa fechada. O acesso ao modelo é concedido apenas a critério de Anthropic e é priorizado para casos de uso de segurança cibernética defensiva. Consulte o cartão do sistema Claude Mythos Preview para obter diretrizes de uso responsável.
2 Siga o guia de Migração para migrar o código da API de Mensagens de versões anteriores de Claude para Claude Opus 4.7.
Para saber mais sobre os modelos individuais, consulte os modelos de Claude disponíveis.
Pré-requisitos
- Uma assinatura Azure com uma forma de pagamento válida. Se você não tiver uma assinatura de Azure, crie uma conta de Azure paga . Consulte o tipo de assinatura e o suporte à região para obter mais detalhes.
- Acesso ao Microsoft Foundry com permissões apropriadas para criar e gerenciar recursos.
- Um projeto Microsoft Foundry criado em uma das regiões com suporte: East US2 ou Sweden Central.
- Modelos Foundry de parceiros e comunidade exigem acesso ao Azure Marketplace para criar assinaturas. Confirme se você tem as permissões necessárias para assinar ofertas de modelos.
- Papel de colaborador ou proprietário no grupo de recursos para implantar modelos. Para obter mais informações, consulte funções do Azure RBAC.
Tipo de assinatura e suporte à região
Para usar os Modelos Claude no Microsoft Foundry, você deve ter uma assinatura paga do Azure com uma conta de cobrança em um país ou região onde a Anthropic oferece os modelos para compra. Para obter uma lista de erros comuns relacionados à assinatura, consulte mensagens de erro comuns e soluções. Atualmente, não há suporte para os seguintes tipos de assinatura:
- Contas corporativas localizadas na Coreia do Sul
- Provedor de Soluções na Nuvem assinaturas
- Azure assinaturas que não têm um método de cobrança pago conforme o uso ativo (por exemplo, estudante, avaliação gratuita ou contas baseadas em crédito de inicialização)
- Assinaturas patrocinadas que usam apenas créditos do Azure. Nota: se você tiver uma conta registrada com um cartão de crédito, o cartão de crédito será cobrado em vez de Créditos do Azure.
Para obter uma lista de regiões com suporte, consulte as localizações geográficas com suporte. Observe que, a "Política de Regiões com Suporte" do Anthropic pode se aplicar à disponibilidade em sua região, verifique regiões com suporte para obter detalhes.
Implantar modelos Claude
Os modelos Claude no Foundry estão disponíveis para implantação global padrão. Para implantar um modelo claude, siga as instruções em Deploy Microsoft Foundry Models no portal do Foundry.
Após a implantação, use o playground do Foundry para testar interativamente o modelo.
Chamar a API de Mensagens da Claude
Depois de implantar um modelo claude, interaja com ele para gerar respostas de texto:
Use os SDKs Anthropic e as seguintes APIs Claude:
- API de Mensagens: enviar uma lista estruturada de mensagens de entrada com conteúdo de texto ou imagem. O modelo gera a próxima mensagem na conversa.
- API de Contagem de Tokens: conte o número de tokens em uma mensagem.
- API de arquivos: carregue e gerencie arquivos para uso com a API Claude sem carregar novamente o conteúdo com cada solicitação.
- API de habilidades: criar habilidades personalizadas para a IA de Claude.
Enviar mensagens com autenticação
Os exemplos a seguir mostram como enviar solicitações ao Claude Sonnet 4.6 usando Microsoft Entra ID ou autenticação de chave de API. Para trabalhar com seu modelo implantado, você precisa:
- Sua URL base, que é do formato
https://<resource name>.services.ai.azure.com/anthropic. - O URI de destino dos seus detalhes de implantação, que segue o formato
https://<resource name>.services.ai.azure.com/anthropic/v1/messages. - Microsoft Entra ID para autenticação sem chave ou a chave de API da sua implantação para autenticação de API.
- Nome da implantação que você escolheu durante a criação da implantação. Esse nome pode ser diferente da ID do modelo.
Nota
Para Opus 4.6 e Sonnet 4.6, o thinking parâmetro dá suporte a tipos: enabled, disablede adaptive. O adaptive tipo permite que o modelo decida se deve pensar, com base na complexidade da consulta e no nível de esforço requerido.
Para o Mythos Preview, o thinking parâmetro dá suporte apenasadaptive e enabled.
Para o Opus 4.7, o thinking parâmetro dá suporte somente a adaptive e disabled.
O effort parâmetro, que controla a troca de qualidade/custo para respostas, dá suporte aos níveis de esforço: low, mediume high. Para Opus 4.7, Opus 4.6 e Sonnet 4.6, o parâmetro também suporta max nível de esforço. Use esse parâmetro com ou sem habilitar o pensamento.
Usar autenticação Microsoft Entra ID
Para os endpoints da API de Mensagens, use sua URL base com autenticação do Microsoft Entra ID.
Instale a biblioteca de clientes do Azure Identity: instale essa biblioteca para usar o
DefaultAzureCredential. A autorização é mais fácil quando você usaDefaultAzureCredentialporque encontra a melhor credencial a ser usada em seu ambiente em execução.pip install azure-identityDefina os valores da ID do cliente, da ID do locatário e do segredo do cliente do aplicativo Microsoft Entra ID como variáveis de ambiente:
AZURE_CLIENT_ID,AZURE_TENANT_ID,AZURE_CLIENT_SECRET.export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>" export AZURE_TENANT_ID="<AZURE_TENANT_ID>" export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"Instalar dependências: instale o SDK do Anthropic usando pip (requer Python 3.8 ou posterior).
pip install -U "anthropic"Execute um exemplo de código básico para concluir as seguintes tarefas:
- Crie um cliente com o SDK do Anthropic, usando a autenticação do Microsoft Entra ID.
- Faça uma chamada básica para a API de Mensagens. A chamada é síncrona.
from anthropic import AnthropicFoundry from azure.identity import DefaultAzureCredential, get_bearer_token_provider baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-6" # Replace with your deployment name # Create token provider for Entra ID authentication tokenProvider = get_bearer_token_provider( DefaultAzureCredential(), "https://ai.azure.com/.default" ) # Create client with Entra ID authentication client = AnthropicFoundry( azure_ad_token_provider=tokenProvider, base_url=baseURL ) # Send request message = client.messages.create( model=deploymentName, messages=[ {"role": "user", "content": "What are 3 things to visit in Seattle?"} ], max_tokens=1048, temperature=1, thinking={"type":"adaptive"}, output_config={"effort": "max"}, stream=False ) print(message.content)Saída esperada: Uma resposta JSON que contém a conclusão do texto do modelo com três recomendações de Seattle.
Reference:Anthropic Client SDK, DefaultAzureCredential
Usar autenticação de chave de API
Importante
Claude Mythos Preview dá suporte apenas à autenticação Microsoft Entra ID.
Para os endpoints da API de Mensagens, use seu base URL e chave de API para autenticar-se no serviço.
Instalar dependências: instale o SDK do Anthropic usando pip (requer Python 3.8 ou posterior):
pip install -U "anthropic"Execute um exemplo de código básico para concluir as seguintes tarefas:
- Crie um cliente com o SDK Anthropic passando sua chave de API para a configuração do SDK. Esse método de autenticação permite que você interaja perfeitamente com o serviço.
- Faça uma chamada básica para a API de Mensagens. A chamada é síncrona.
from anthropic import AnthropicFoundry baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-6" # Replace with your deployment name apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key # Create client with API key authentication client = AnthropicFoundry( api_key=apiKey, base_url=baseURL ) # Send request message = client.messages.create( model=deploymentName, messages=[ {"role": "user", "content": "What are 3 things to visit in Seattle?"} ], max_tokens=1048, temperature=1, thinking={"type":"adaptive"}, output_config={"effort": "max"}, stream=False ) print(message.content)Saída esperada: Uma resposta JSON que contém a conclusão do texto do modelo com três recomendações de Seattle.
Reference:Anthropic Client SDK
Modelos de Claude disponíveis
A Foundry dá suporte a Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 e Claude Haiku 4.5 por meio da implantação padrão global. Esses modelos têm os principais recursos:
- Pensamento adaptável: uma atualização para o pensamento estendido que dá a Claude a liberdade de pensar tanto ou tão pouco quanto necessário, dependendo do nível de tarefa e esforço.
- Pensamento estendido: raciocínio aprimorado para tarefas complexas.
- Entrada de imagem e texto: visão forte para analisar gráficos, grafos, diagramas técnicos, relatórios e outros ativos visuais.
- Geração de código: geração avançada de código, análise e depuração.
Para obter mais detalhes sobre as funcionalidades do modelo, consulte os recursos dos modelos claude.
Claude Mythos (versão prévia da pesquisa fechada)
Importante
Claude Mythos Preview só está disponível como uma prévia de pesquisa restrita. O acesso ao modelo é concedido apenas a critério de Anthropic e é priorizado para casos de uso de segurança cibernética defensiva. Consulte o cartão do sistema Claude Mythos Preview para obter diretrizes de uso responsável.
O Claude Mythos Preview dá suporte apenas à autenticação Microsoft Entra ID.
Claude Mythos Preview é uma nova classe de inteligência criada para projetos ambiciosos e o melhor modelo mundial para segurança cibernética, codificação autônoma e agentes de longa duração. Disponível apenas como uma visualização de pesquisa fechada com acesso priorizado para casos de uso de segurança cibernética defensiva. Com uma janela de contexto de token de 1M e uma saída máxima de 128K, o Claude Mythos Preview foi criado para:
- Segurança cibernética: o melhor modelo mundial para segurança defensiva. Ele pode encontrar e sugerir correções para vulnerabilidades reais em bases de código de produção e, em seguida, ajudar a provar que as correções são eficazes.
- Codificação autônoma: lida com o ciclo de engenharia completo com mais eficiência do que qualquer modelo anterior – investigando, implementando e testando em grandes bases de código do objetivo ao enviado.
- Agentes de longa execução: estabelece um novo padrão para o trabalho de agentes com horizonte longo. Ele pode sustentar a execução coerente em tarefas estendidas de várias horas, adaptando-se à medida que as condições mudam e levando o trabalho adiante com menos intervenções.
Claude Mythos Preview dá suporte ao pensamento adaptável, um upgrade para o pensamento estendido que dá a Claude a liberdade de pensar tanto ou tão pouco quanto necessário, dependendo do nível de tarefa e esforço.
Claude Opus 4.7 (versão prévia)
Dica
Siga o guia de Migração para migrar o código da API de Mensagens das versões anteriores de Claude para Claude Opus 4.7.
Claude Opus 4.7 é o modelo mais capaz na família Claude Opus, melhorando o desempenho em codificação, fluxos de trabalho empresariais e tarefas agentivas de longa duração. Com uma janela de contexto de token de 1M e saída máxima de 128K, o Opus 4.7 é ideal para codificação autônoma, trabalho corporativo de conhecimento, fluxos de trabalho de múltiplas ferramentas de longa duração, raciocínio multimodal de alta resolução (até 2576 px e 3,75 MP), análise financeira e cibersegurança. O Opus 4.7 dá suporte ao pensamento adaptável, uma atualização para o pensamento estendido que dá a Claude a liberdade de pensar tanto ou tão pouco quanto necessário, dependendo do nível de tarefa e esforço.
Claude Opus 4.6 (versão prévia)
Claude Opus 4.6 é um modelo altamente capaz na família Claude Opus para codificação, agentes empresariais e trabalho profissional. Com uma janela de contexto de token 1M e saída máxima de 128K, o Opus 4.6 é ideal para código de produção, agentes sofisticados, tarefas do office, análise financeira, segurança cibernética e uso de computador.
Claude Opus 4.5 (versão prévia)
Claude Opus 4.5 é líder do setor em codificação, agentes, uso de computador e fluxos de trabalho corporativos. Com uma janela de contexto de 200 mil tokens e saída máxima de 64K, o Opus 4.5 é ideal para código de produção, agentes sofisticados, tarefas de escritório, análise financeira, cibersegurança e tarefas de computação.
Claude Opus 4.1 (versão prévia)
Claude Opus 4.1 é um líder do setor para codificação. Ele fornece desempenho sustentado em tarefas de execução longa que exigem esforço focado e milhares de etapas, expandindo significativamente o que os agentes de IA podem resolver.
Claude Sonnet 4.6 (versão prévia)
O Claude Sonnet 4.6 fornece inteligência de fronteira em escala, criada para codificação, agentes e fluxos de trabalho corporativos. Com uma janela de contexto de token 1M e uma saída máxima de 128K, o Sonnet 4.6 é ideal para codificação, agentes, tarefas do office, análise financeira, segurança cibernética e uso de computador.
Claude Sonnet 4.5 (versão prévia)
Aviso
O contexto beta de 1M no Claude Sonnet 4.5 será desativado após 30 de abril de 2026.
A partir de 1º de maio de 2026:
- Solicitações maiores que 200 mil tokens que incluem o
context-1m-2025-08-07cabeçalho beta no Sonnet 4.5 retornarão um erro. - As solicitações de tokens de 200 mil ou menos permanecerão não afetadas, mesmo com o cabeçalho presente.
Para migrar, remova o context-1m-2025-08-07 cabeçalho beta de suas solicitações. Para cargas de trabalho que exigem contexto de 1M, migre para Claude Sonnet 4.6 (em que o contexto de 1M está disponível em geral) ou para Claude Opus 4.6 ou Claude Opus 4.7 para cargas de trabalho de inteligência superior.
Claude Sonnet 4.5 é um modelo altamente capaz projetado para criar agentes do mundo real e lidar com tarefas complexas e de horizonte longo. Ele oferece um forte equilíbrio de velocidade e custo para casos de uso de alto volume. O Sonnet 4.5 também fornece precisão avançada para uso de computador, permitindo que os desenvolvedores direcionem Claude a usar computadores como as pessoas fazem.
Claude Haiku 4.5 (versão prévia)
Claude Haiku 4.5 oferece desempenho próximo à fronteira para uma ampla gama de casos de uso. Ele se destaca como um dos melhores modelos de codificação e agente, com a velocidade e o custo certos para alimentar produtos gratuitos e subagentes escalonados.
Recursos avançados e funcionalidades de modelos claude
O Claude in Foundry Models dá suporte a funcionalidades e capacidades avançadas. As principais funcionalidades aprimoram as habilidades fundamentais de Claude para processar, analisar e gerar conteúdo em vários formatos e casos de uso. As ferramentas permitem que Claude interaja com sistemas externos, execute código e execute tarefas automatizadas por meio de várias interfaces de ferramentas.
Alguns dos principais recursos compatíveis com o Foundry são:
Janela de contexto grande: Uma janela de contexto estendida que processa documentos maiores e conversas mais longas.
Habilidades do agente: Estenda as funcionalidades de Claude com habilidades.
Citações: Basear as respostas de Claude em documentos de origem.
Edição de contexto: Gerencie automaticamente o contexto de conversa com estratégias configuráveis.
Pensamento estendido: Funcionalidades de raciocínio aprimoradas para tarefas complexas disponíveis com todos os modelos claude.
Dica
Para Opus 4.6 e Sonnet 4.6, o
thinkingparâmetro dá suporte a tipos:enabled,disabledeadaptive. Oadaptivetipo permite que o modelo decida se deve pensar, com base na complexidade da consulta e no nível de esforço requerido.Para o Mythos Preview, o
thinkingparâmetro dá suporte apenasadaptiveeenabled.Para o Opus 4.7, o
thinkingparâmetro dá suporte somente aadaptiveedisabled.Esforço: Capacidade de controlar a troca de qualidade/custo para respostas.
Dica
O
effortparâmetro dá suporte aos níveis de esforço:low,mediumehigh. Para Opus 4.7, Opus 4.6 e Sonnet 4.6, o parâmetro também suportamaxnível de esforço. Use esse parâmetro com ou sem habilitar o pensamento.Suporte a PDF: Processe e analise o conteúdo de texto e visual de documentos PDF.
Cache de prompts: Forneça a Claude mais conhecimento de fundo e saídas de exemplo para reduzir custos e latência.
Algumas das ferramentas compatíveis com a Foundry são:
- Conector MCP: Conecte-se a servidores MCP remotos diretamente da API de Mensagens sem um cliente MCP separado.
- Memória: Armazene e recupere informações em conversas. Crie bases de dados de conhecimento ao longo do tempo, mantenha o contexto do projeto e aprenda com as interações passadas.
- Busca na Web: Recupere o conteúdo completo de páginas da Web especificadas e documentos PDF para análise detalhada.
Para obter uma lista completa de recursos e ferramentas com suporte, confira a visão geral dos recursos de Claude.
Suporte ao agente
- Microsoft Agent Framework dá suporte à criação de agentes que usam modelos claude.
- Crie agentes de IA personalizados com o SDK do Claude Agent.
Cotas e limites de API
Importante
Atualmente, somente assinaturas Enterprise e MCA-E são qualificadas para o uso do modelo Claude no Foundry.
Os modelos claude na Foundry têm os seguintes limites de taxa, medidos em Tokens por Minuto (TPM) e Solicitações por Minuto (RPM):
| Modelo | Tipo de implantação | RPM padrão | TPM padrão | RPM corporativo e MCA-E | Enterprise e MCA-E TPM |
|---|---|---|---|---|---|
| claude-opus-4-7 | Padrão Global | 0 | 0 | 2.000 | 2,000,000 |
| claude-opus-4-6 | Padrão Global | 0 | 0 | 2.000 | 2,000,000 |
| claude-opus-4-5 | Padrão Global | 0 | 0 | 2.000 | 2,000,000 |
| claude-opus-4-1 | Padrão Global | 0 | 0 | 2.000 | 2,000,000 |
| claude-sonnet-4-6 | Padrão Global | 0 | 0 | 2.000 | 2,000,000 |
| claude-sonnet-4-5 | Padrão Global | 0 | 0 | 4,000 | 2,000,000 |
| claude-haiku-4-5 | Padrão Global | 0 | 0 | 4,000 | 4.000.000 |
Para aumentar sua cota além dos limites padrão, envie uma solicitação por meio do formulário de solicitação de aumento de cota.
Práticas recomendadas de limite de taxa
Para otimizar seu uso e evitar a limitação de taxa:
- Implementar lógica de repetição: manipular respostas 429 com retirada exponencial.
- Solicitações em lote: combine vários prompts quando possível.
- Monitorar o uso: acompanhe o consumo de token e os padrões de solicitação.
- Use modelos apropriados: escolha o modelo Claude correto para seu caso de uso.
Considerações sobre IA responsável
Ao usar modelos Claude no Foundry, considere estas práticas responsáveis de IA:
Configure a segurança de conteúdo de IA durante a inferência do modelo, pois a Foundry não fornece filtragem de conteúdo interna para modelos Claude no momento da implantação.
Verifique se seus aplicativos estão em conformidade com Anthropic política de uso aceitável. Além disso, confira os detalhes das avaliações de segurança para Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 e Claude Haiku 4.5.
Práticas recomendadas
Siga estas melhores práticas ao trabalhar com os modelos Claude no Foundry.
Seleção de modelo
Escolha o modelo claude apropriado com base em seus requisitos específicos:
- Claude Mythos Preview: Para segurança cibernética defensiva, codificação autônoma e agentes de execução prolongada.
- Claude Opus 4.7: o modelo mais robusto para programação, fluxos de trabalho empresariais e tarefas prolongadas e decisivas.
- Claude Opus 4.6: modelo altamente capaz para criar agentes, codificação e fluxos de trabalho corporativos.
- Claude Opus 4.5: Melhor desempenho em codificação, agentes, uso de computador e fluxos de trabalho corporativos.
- Claude Opus 4.1: raciocínio complexo e aplicativos empresariais.
- Claude Sonnet 4.6: Inteligência de fronteira em escala para codificação, agentes e a maioria dos casos de uso.
- Claude Sonnet 4.5: Desempenho e recursos equilibrados, fluxos de trabalho de produção.
- Claude Haiku 4.5: otimização de velocidade e custo, processamento de alto volume.
Engenharia de prompt
- Instruções claras: forneça prompts específicos e detalhados.
- Gerenciamento de contexto: use a janela de contexto disponível efetivamente.
- Definições de função: use mensagens do sistema para definir a função e o comportamento do assistente.
- Prompts estruturados: utilize uma formatação consistente para obter melhores resultados.
Otimização de custo
- Gerenciamento de tokens: monitore e otimize o uso do token.
- Seleção de modelo: use o modelo mais econômico para seu caso de uso.
- Cache: implemente o cache de prompt explícito quando apropriado.
- Solicitação em lote: combine várias solicitações quando possível.
Solucionando problemas
A tabela a seguir lista erros comuns quando você trabalha com modelos Claude no Foundry e suas soluções:
| Erro | Causa | Solução |
|---|---|---|
| 401 Não autorizado | Chave de API inválida ou expirada ou escopo de token de Entra ID incorreto. | Verifique se a chave de API está correta. Para Entra ID, confirme se você usa o escopo https://ai.azure.com/.default. |
| 403 Proibido | Permissões insuficientes no recurso ou na assinatura. | Verifique se você tem a função Colaborador ou Proprietário no grupo de recursos. Para Entra ID, verifique se a função Cognitive Services User está atribuída. |
| 404 Não Encontrado | URL do ponto de extremidade ou nome de implantação incorreto. | Confirme se a URL base segue o padrão https://<resource-name>.services.ai.azure.com/anthropic e o nome da implantação corresponde à sua configuração. |
| 429 Solicitações demais | Limite de taxa excedido para a camada de assinatura. | Implemente o recuo exponencial com lógica de novas tentativas. Considere reduzir a frequência da solicitação ou solicitar um aumento de cota. |
| Erro de qualificação da assinatura | Assinatura não Enterprise ou não MCA-E. | Os modelos Claude exigem uma assinatura Enterprise ou MCA-E. Consulte cotas e limites de API para obter detalhes. |
| Região não disponível | Tentativa de implantação em região não suportada. | Implantar no Leste dos EUA2 ou na Suécia Central, as regiões com suporte para modelos Claude. |