Implantar e usar modelos claude no Microsoft Foundry (versão prévia) (clássico)

Exibição no momento:Versão do portal Foundry (clássico) - Alternar para a versão do novo portal Foundry

Nota

Links neste artigo podem abrir conteúdo na nova documentação do Microsoft Foundry em vez da documentação da Foundry (clássica) que você está exibindo agora.

os modelos Claude da Anthropic trazem recursos avançados de IA de conversa para Microsoft Foundry, permitindo que você crie aplicativos inteligentes com a compreensão e geração de linguagem de última geração. Os modelos Claude se destacam em raciocínio complexo, geração de código e tarefas multimodais, incluindo análise de imagem.

Neste artigo, você aprenderá a:

Desplegar modelos Claude no Microsoft Foundry
Autenticar usando Microsoft Entra ID ou chaves de API
Chamar a Claude Messages API a partir de Python, JavaScript ou REST
Escolha o modelo Claude correto para o seu caso de uso

Os modelos de Claude na Foundry incluem:

Família de modelos	Modelos
Claude Mythos	`claude-mythos-preview` ¹ (visualização de pesquisa restrita)
Claude Opus	`claude-opus-4-7` ² (versão prévia), `claude-opus-4-6` (versão prévia), `claude-opus-4-5` (versão prévia) `claude-opus-4-1`
Claude Sonnet	`claude-sonnet-4-6` (versão prévia), `claude-sonnet-4-5` (versão prévia)
Claude Haiku	`claude-haiku-4-5` (versão prévia)

¹Claude Mythos Preview só está disponível como uma visualização de pesquisa fechada. O acesso ao modelo é concedido apenas a critério de Anthropic e é priorizado para casos de uso de segurança cibernética defensiva. Consulte o cartão do sistema Claude Mythos Preview para obter diretrizes de uso responsável.

² Siga o guia de Migração para migrar o código da API de Mensagens de versões anteriores de Claude para Claude Opus 4.7.

Para saber mais sobre os modelos individuais, consulte os modelos de Claude disponíveis.

Pré-requisitos

Uma assinatura Azure com uma forma de pagamento válida. Se você não tiver uma assinatura de Azure, crie uma conta de Azure paga . Consulte o tipo de assinatura e o suporte à região para obter mais detalhes.
Acesso ao Microsoft Foundry com permissões apropriadas para criar e gerenciar recursos.
Um projeto Microsoft Foundry criado em uma das regiões com suporte: East US2 ou Sweden Central.
Modelos Foundry de parceiros e comunidade exigem acesso ao Azure Marketplace para criar assinaturas. Confirme se você tem as permissões necessárias para assinar ofertas de modelos.
Papel de colaborador ou proprietário no grupo de recursos para implantar modelos. Para obter mais informações, consulte funções do Azure RBAC.

Tipo de assinatura e suporte à região

Para usar os Modelos Claude no Microsoft Foundry, você deve ter uma assinatura paga do Azure com uma conta de cobrança em um país ou região onde a Anthropic oferece os modelos para compra. Para obter uma lista de erros comuns relacionados à assinatura, consulte mensagens de erro comuns e soluções. Atualmente, não há suporte para os seguintes tipos de assinatura:

Contas corporativas localizadas na Coreia do Sul
Provedor de Soluções na Nuvem assinaturas
Azure assinaturas que não têm um método de cobrança pago conforme o uso ativo (por exemplo, estudante, avaliação gratuita ou contas baseadas em crédito de inicialização)
Assinaturas patrocinadas que usam apenas créditos do Azure. Nota: se você tiver uma conta registrada com um cartão de crédito, o cartão de crédito será cobrado em vez de Créditos do Azure.

Para obter uma lista de regiões com suporte, consulte as localizações geográficas com suporte. Observe que, a "Política de Regiões com Suporte" do Anthropic pode se aplicar à disponibilidade em sua região, verifique regiões com suporte para obter detalhes.

Implantar modelos Claude

Os modelos Claude no Foundry estão disponíveis para implantação global padrão. Para implantar um modelo claude, siga as instruções em Deploy Microsoft Foundry Models no portal do Foundry.

Após a implantação, use o playground do Foundry para testar interativamente o modelo.

Chamar a API de Mensagens da Claude

Depois de implantar um modelo claude, interaja com ele para gerar respostas de texto:

Use os SDKs Anthropic e as seguintes APIs Claude:
- API de Mensagens: enviar uma lista estruturada de mensagens de entrada com conteúdo de texto ou imagem. O modelo gera a próxima mensagem na conversa.
- API de Contagem de Tokens: conte o número de tokens em uma mensagem.
- API de arquivos: carregue e gerencie arquivos para uso com a API Claude sem carregar novamente o conteúdo com cada solicitação.
- API de habilidades: criar habilidades personalizadas para a IA de Claude.

Enviar mensagens com autenticação

Os exemplos a seguir mostram como enviar solicitações ao Claude Sonnet 4.6 usando Microsoft Entra ID ou autenticação de chave de API. Para trabalhar com seu modelo implantado, você precisa:

Sua URL base, que é do formato https://<resource name>.services.ai.azure.com/anthropic.
O URI de destino dos seus detalhes de implantação, que segue o formato https://<resource name>.services.ai.azure.com/anthropic/v1/messages.
Microsoft Entra ID para autenticação sem chave ou a chave de API da sua implantação para autenticação de API.
Nome da implantação que você escolheu durante a criação da implantação. Esse nome pode ser diferente da ID do modelo.

Nota

Para Opus 4.6 e Sonnet 4.6, o thinking parâmetro dá suporte a tipos: enabled, disablede adaptive. O adaptive tipo permite que o modelo decida se deve pensar, com base na complexidade da consulta e no nível de esforço requerido.

Para o Mythos Preview, o thinking parâmetro dá suporte apenasadaptive e enabled.

Para o Opus 4.7, o thinking parâmetro dá suporte somente a adaptive e disabled.

O effort parâmetro, que controla a troca de qualidade/custo para respostas, dá suporte aos níveis de esforço: low, mediume high. Para Opus 4.7, Opus 4.6 e Sonnet 4.6, o parâmetro também suporta max nível de esforço. Use esse parâmetro com ou sem habilitar o pensamento.

Usar autenticação Microsoft Entra ID

Para os endpoints da API de Mensagens, use sua URL base com autenticação do Microsoft Entra ID.

Instale a biblioteca de clientes do Azure Identity: instale essa biblioteca para usar o DefaultAzureCredential. A autorização é mais fácil quando você usa DefaultAzureCredential porque encontra a melhor credencial a ser usada em seu ambiente em execução.
```
pip install azure-identity
```
Defina os valores da ID do cliente, da ID do locatário e do segredo do cliente do aplicativo Microsoft Entra ID como variáveis de ambiente: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.
```
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
```
Instalar dependências: instale o SDK do Anthropic usando pip (requer Python 3.8 ou posterior).
```
pip install -U "anthropic"
```

Execute um exemplo de código básico para concluir as seguintes tarefas:

Crie um cliente com o SDK do Anthropic, usando a autenticação do Microsoft Entra ID.
Faça uma chamada básica para a API de Mensagens. A chamada é síncrona.

from anthropic import AnthropicFoundry
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
deploymentName = "claude-sonnet-4-6" # Replace with your deployment name

# Create token provider for Entra ID authentication
tokenProvider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://ai.azure.com/.default"
)

# Create client with Entra ID authentication
client = AnthropicFoundry(
    azure_ad_token_provider=tokenProvider,
    base_url=baseURL
)

# Send request
message = client.messages.create(
    model=deploymentName,
    messages=[
        {"role": "user", "content": "What are 3 things to visit in Seattle?"}
    ],
    max_tokens=1048,
    temperature=1,
    thinking={"type":"adaptive"},
    output_config={"effort": "max"},
    stream=False
)

print(message.content)

Saída esperada: Uma resposta JSON que contém a conclusão do texto do modelo com três recomendações de Seattle.

Reference:Anthropic Client SDK, DefaultAzureCredential

Usar autenticação de chave de API

Importante

Claude Mythos Preview dá suporte apenas à autenticação Microsoft Entra ID.

Para os endpoints da API de Mensagens, use seu base URL e chave de API para autenticar-se no serviço.

Instalar dependências: instale o SDK do Anthropic usando pip (requer Python 3.8 ou posterior):
```
pip install -U "anthropic"
```

Execute um exemplo de código básico para concluir as seguintes tarefas:

Crie um cliente com o SDK Anthropic passando sua chave de API para a configuração do SDK. Esse método de autenticação permite que você interaja perfeitamente com o serviço.
Faça uma chamada básica para a API de Mensagens. A chamada é síncrona.

from anthropic import AnthropicFoundry

baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key

# Create client with API key authentication
client = AnthropicFoundry(
    api_key=apiKey,
    base_url=baseURL
)

# Send request
message = client.messages.create(
    model=deploymentName,
    messages=[
        {"role": "user", "content": "What are 3 things to visit in Seattle?"}
    ],
    max_tokens=1048,
    temperature=1,
    thinking={"type":"adaptive"},
    output_config={"effort": "max"},
    stream=False
)

print(message.content)

Saída esperada: Uma resposta JSON que contém a conclusão do texto do modelo com três recomendações de Seattle.

Reference:Anthropic Client SDK

Usar autenticação Microsoft Entra ID

Para os endpoints da API de Mensagens, use sua URL base com autenticação do Microsoft Entra ID.

Instale a biblioteca de clientes do Azure Identity: instale o pacote @azure/identity para usar o DefaultAzureCredential. A autorização é mais fácil quando você usa DefaultAzureCredential porque encontra a melhor credencial a ser usada em seu ambiente em execução.
```
npm install @azure/identity
```
Defina os valores da ID do cliente, da ID do locatário e do segredo do cliente do aplicativo Microsoft Entra ID como variáveis de ambiente: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.
```
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
```
Instalar dependências
1. Instale Node.js versões 20 LTS ou posteriores (não EOL).
2. Copie as seguintes linhas de texto e salve-as como um arquivo package.json dentro de sua pasta.
```
{
  "type": "module",
  "dependencies": {
    "@anthropic-ai/sdk": "latest",
    "@azure/identity": "latest"
  }
}
```
3. Abra uma janela de terminal nesta pasta e execute npm install.
4. Para cada um dos snippets de código a seguir, copie o conteúdo em um arquivo sample.js e execute com node sample.js.

Execute um exemplo de código básico para concluir as seguintes tarefas:

Cria um cliente com o SDK do Anthropic, usando a autenticação do Microsoft Entra ID.
Faz uma chamada básica para a API de Mensagens. A chamada é síncrona.

import AnthropicFoundry from '@anthropic-ai/foundry-sdk';
import { getBearerTokenProvider, DefaultAzureCredential } from "@azure/identity";

const baseURL = "https://<resource-name>.services.ai.azure.com/anthropic"; // Your base URL. Replace <resource-name> with your resource name
const deploymentName = "claude-sonnet-4-6" // Replace with your deployment name

// Create token provider for Entra ID authentication
const tokenProvider = getBearerTokenProvider(
    new DefaultAzureCredential(),
    'https://ai.azure.com/.default');

// Create client with Entra ID authentication
const client = new AnthropicFoundry({
    azureADTokenProvider: tokenProvider,
    baseURL: baseURL,
    apiVersion: "2023-06-01"
});

// Send request
const message = await client.messages.create({
    model: deploymentName,
    messages: [{ role: "user", content: "What are 3 things to visit in Seattle?" }],
    max_tokens: 1048,
    temperature: 1,
    thinking: {"type": "adaptive"},
    output_config: {"effort": "max"},
    stream: false
});
console.log(message);

Saída esperada: Uma resposta JSON que contém a conclusão do texto do modelo com três recomendações de Seattle.

Reference:Anthropic Client SDK, DefaultAzureCredential

Usar autenticação de chave de API

Importante

Claude Mythos Preview dá suporte apenas à autenticação Microsoft Entra ID.

Para os endpoints da API de Mensagens, use seu base URL e chave de API para autenticar-se no serviço.

Instalar dependências
1. Instale Node.js versões 20 LTS ou posteriores (não EOL).
2. Copie as seguintes linhas de texto e salve-as como um arquivo package.json dentro de sua pasta.
```
{
  "type": "module",
  "dependencies": {
    "@anthropic-ai/sdk": "latest"
  }
}
```
3. Abra uma janela de terminal nesta pasta e execute npm install.
4. Para cada um dos snippets de código a seguir, copie o conteúdo em um arquivo sample.js e execute com node sample.js.

Execute um exemplo de código básico. Este exemplo conclui as seguintes tarefas:

Cria um cliente com o SDK Anthropic passando sua chave de API para a configuração do SDK. Esse método de autenticação permite que você interaja perfeitamente com o serviço.
Faz uma chamada básica para a API de Mensagens. A chamada é síncrona.

import AnthropicFoundry from '@anthropic-ai/foundry-sdk';

const baseURL = "https://<resource-name>.services.ai.azure.com/anthropic"; // Your base URL. Replace <resource-name> with your resource name
const deploymentName = "claude-sonnet-4-6" // Replace with your deployment name
const apiKey = "<your-api-key>"; // Your API key

// Create client with API key
const client = new AnthropicFoundry({
    apiKey: apiKey,
    baseURL: baseURL,
    apiVersion: "2023-06-01"
});

// Send request
const message = await client.messages.create({
    model: deploymentName,
    messages: [{ role: "user", content: "What are 3 things to visit in Seattle?" }],
    max_tokens: 1048,
    temperature: 1,
    thinking: {"type": "adaptive"},
    output_config: {"effort": "max"},
    stream: false
});
console.log(message);

Saída esperada: Uma resposta JSON que contém a conclusão do texto do modelo com três recomendações de Seattle.

SDK Reference:AnthropicFoundry

Para obter uma lista de runtimes com suporte, consulte Requisitos para usar a Biblioteca de API TypeScript da Anthropic.

Usar autenticação Microsoft Entra ID

Para endpoints da API de Mensagens, use o URI do endpoint do modelo implantado https://<resource-name>.services.ai.azure.com/anthropic/v1/messages com autenticação Microsoft Entra ID.

Se você configurar o recurso com suporte ao Microsoft Entra ID, passe o token no cabeçalho de autorização com o formato Bearer $AZURE_AUTH_TOKEN. Use o escopo https://ai.azure.com/.default. Usar Microsoft Entra ID pode exigir configuração adicional em seu recurso para conceder acesso. Para obter mais informações, consulte Configurar a autenticação com o Microsoft Entra ID.

Exporte seu token de Microsoft Entra ID para uma variável de ambiente:

Se você estiver usando o bash:
```
export AZURE_AUTH_TOKEN="<your-entra-id-key>"
```
Se você estiver no PowerShell:
```
$Env:AZURE_AUTH_TOKEN = "<your-entra-id-key>"
```
Se você estiver usando o Prompt de Comando do Windows:
```
set AZURE_AUTH_TOKEN = <your-entra-id-key>
```

Execute o comando cURL a seguir. Para cURL, use o URI https://<resource-name>.services.ai.azure.com/anthropic/v1/messagesde destino da implantação.

curl -X POST https://<resource-name>.services.ai.azure.com/anthropic/v1/messages \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_AUTH_TOKEN" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "messages": [
      {
        "role": "user", "content": "You are a helpful assistant."
      },
      {
        "role": "user", "content": "What are 3 things to visit in Seattle?"
      }
    ],
    "max_tokens": 1048,
    "temperature": 1,
    "model": "claude-sonnet-4-6",
    "thinking": {"type":"adaptive"},
    "output_config": {"effort": "max"},
    "stream": false
    }'

Saída esperada: Uma resposta JSON que contém a conclusão do texto do modelo com três recomendações de Seattle.

Referência:API de Mensagens do Claude

Usar autenticação de chave de API

Importante

Claude Mythos Preview dá suporte apenas à autenticação Microsoft Entra ID.

Para os pontos de extremidade da API de Mensagens, use o URI do ponto de extremidade do modelo implantado https://<resource-name>.services.ai.azure.com/anthropic/v1/messages e a chave de API para se autenticar no serviço.

Exporte sua chave de API para uma variável de ambiente:

Se você estiver usando o bash:
```
export AZURE_API_KEY="<your-api-key>"
```
Se você estiver no PowerShell:
```
$Env:AZURE_API_KEY = "<your-api-key>"
```
Se você estiver usando o Prompt de Comando do Windows:
```
set AZURE_API_KEY = <your-api-key>
```

Execute o seguinte comando cURL:

curl -X POST https://<resource-name>.services.ai.azure.com/anthropic/v1/messages \
  -H "Content-Type: application/json" \
  -H "x-api-key: $AZURE_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "messages": [
      {
        "role": "user", "content": "You are a helpful assistant."
      },
      {
        "role": "user", "content": "What are 3 things to visit in Seattle?"
      }
    ],
    "max_tokens": 1048,
    "temperature": 1,
    "model": "claude-sonnet-4-6",
    "thinking": {"type":"adaptive"},
    "output_config": {"effort": "max"},
    "stream": false
    }'

Saída esperada: Uma resposta JSON que contém a conclusão do texto do modelo com três recomendações de Seattle.

Referência:API de Mensagens do Claude

Modelos de Claude disponíveis

A Foundry dá suporte a Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 e Claude Haiku 4.5 por meio da implantação padrão global. Esses modelos têm os principais recursos:

Pensamento adaptável: uma atualização para o pensamento estendido que dá a Claude a liberdade de pensar tanto ou tão pouco quanto necessário, dependendo do nível de tarefa e esforço.
Pensamento estendido: raciocínio aprimorado para tarefas complexas.
Entrada de imagem e texto: visão forte para analisar gráficos, grafos, diagramas técnicos, relatórios e outros ativos visuais.
Geração de código: geração avançada de código, análise e depuração.

Para obter mais detalhes sobre as funcionalidades do modelo, consulte os recursos dos modelos claude.

Claude Mythos (versão prévia da pesquisa fechada)

Importante

Claude Mythos Preview só está disponível como uma prévia de pesquisa restrita. O acesso ao modelo é concedido apenas a critério de Anthropic e é priorizado para casos de uso de segurança cibernética defensiva. Consulte o cartão do sistema Claude Mythos Preview para obter diretrizes de uso responsável.

O Claude Mythos Preview dá suporte apenas à autenticação Microsoft Entra ID.

Claude Mythos Preview é uma nova classe de inteligência criada para projetos ambiciosos e o melhor modelo mundial para segurança cibernética, codificação autônoma e agentes de longa duração. Disponível apenas como uma visualização de pesquisa fechada com acesso priorizado para casos de uso de segurança cibernética defensiva. Com uma janela de contexto de token de 1M e uma saída máxima de 128K, o Claude Mythos Preview foi criado para:

Segurança cibernética: o melhor modelo mundial para segurança defensiva. Ele pode encontrar e sugerir correções para vulnerabilidades reais em bases de código de produção e, em seguida, ajudar a provar que as correções são eficazes.
Codificação autônoma: lida com o ciclo de engenharia completo com mais eficiência do que qualquer modelo anterior – investigando, implementando e testando em grandes bases de código do objetivo ao enviado.
Agentes de longa execução: estabelece um novo padrão para o trabalho de agentes com horizonte longo. Ele pode sustentar a execução coerente em tarefas estendidas de várias horas, adaptando-se à medida que as condições mudam e levando o trabalho adiante com menos intervenções.

Claude Mythos Preview dá suporte ao pensamento adaptável, um upgrade para o pensamento estendido que dá a Claude a liberdade de pensar tanto ou tão pouco quanto necessário, dependendo do nível de tarefa e esforço.

Claude Opus 4.7 (versão prévia)

Dica

Siga o guia de Migração para migrar o código da API de Mensagens das versões anteriores de Claude para Claude Opus 4.7.

Claude Opus 4.7 é o modelo mais capaz na família Claude Opus, melhorando o desempenho em codificação, fluxos de trabalho empresariais e tarefas agentivas de longa duração. Com uma janela de contexto de token de 1M e saída máxima de 128K, o Opus 4.7 é ideal para codificação autônoma, trabalho corporativo de conhecimento, fluxos de trabalho de múltiplas ferramentas de longa duração, raciocínio multimodal de alta resolução (até 2576 px e 3,75 MP), análise financeira e cibersegurança. O Opus 4.7 dá suporte ao pensamento adaptável, uma atualização para o pensamento estendido que dá a Claude a liberdade de pensar tanto ou tão pouco quanto necessário, dependendo do nível de tarefa e esforço.

Claude Opus 4.6 (versão prévia)

Claude Opus 4.6 é um modelo altamente capaz na família Claude Opus para codificação, agentes empresariais e trabalho profissional. Com uma janela de contexto de token 1M e saída máxima de 128K, o Opus 4.6 é ideal para código de produção, agentes sofisticados, tarefas do office, análise financeira, segurança cibernética e uso de computador.

Claude Opus 4.5 (versão prévia)

Claude Opus 4.5 é líder do setor em codificação, agentes, uso de computador e fluxos de trabalho corporativos. Com uma janela de contexto de 200 mil tokens e saída máxima de 64K, o Opus 4.5 é ideal para código de produção, agentes sofisticados, tarefas de escritório, análise financeira, cibersegurança e tarefas de computação.

Claude Opus 4.1 (versão prévia)

Claude Opus 4.1 é um líder do setor para codificação. Ele fornece desempenho sustentado em tarefas de execução longa que exigem esforço focado e milhares de etapas, expandindo significativamente o que os agentes de IA podem resolver.

Claude Sonnet 4.6 (versão prévia)

O Claude Sonnet 4.6 fornece inteligência de fronteira em escala, criada para codificação, agentes e fluxos de trabalho corporativos. Com uma janela de contexto de token 1M e uma saída máxima de 128K, o Sonnet 4.6 é ideal para codificação, agentes, tarefas do office, análise financeira, segurança cibernética e uso de computador.

Claude Sonnet 4.5 (versão prévia)

Aviso

O contexto beta de 1M no Claude Sonnet 4.5 será desativado após 30 de abril de 2026.

A partir de 1º de maio de 2026:

Solicitações maiores que 200 mil tokens que incluem o context-1m-2025-08-07 cabeçalho beta no Sonnet 4.5 retornarão um erro.
As solicitações de tokens de 200 mil ou menos permanecerão não afetadas, mesmo com o cabeçalho presente.

Para migrar, remova o context-1m-2025-08-07 cabeçalho beta de suas solicitações. Para cargas de trabalho que exigem contexto de 1M, migre para Claude Sonnet 4.6 (em que o contexto de 1M está disponível em geral) ou para Claude Opus 4.6 ou Claude Opus 4.7 para cargas de trabalho de inteligência superior.

Claude Sonnet 4.5 é um modelo altamente capaz projetado para criar agentes do mundo real e lidar com tarefas complexas e de horizonte longo. Ele oferece um forte equilíbrio de velocidade e custo para casos de uso de alto volume. O Sonnet 4.5 também fornece precisão avançada para uso de computador, permitindo que os desenvolvedores direcionem Claude a usar computadores como as pessoas fazem.

Claude Haiku 4.5 (versão prévia)

Claude Haiku 4.5 oferece desempenho próximo à fronteira para uma ampla gama de casos de uso. Ele se destaca como um dos melhores modelos de codificação e agente, com a velocidade e o custo certos para alimentar produtos gratuitos e subagentes escalonados.

Recursos avançados e funcionalidades de modelos claude

O Claude in Foundry Models dá suporte a funcionalidades e capacidades avançadas. As principais funcionalidades aprimoram as habilidades fundamentais de Claude para processar, analisar e gerar conteúdo em vários formatos e casos de uso. As ferramentas permitem que Claude interaja com sistemas externos, execute código e execute tarefas automatizadas por meio de várias interfaces de ferramentas.

Alguns dos principais recursos compatíveis com o Foundry são:

Janela de contexto grande: Uma janela de contexto estendida que processa documentos maiores e conversas mais longas.
Habilidades do agente: Estenda as funcionalidades de Claude com habilidades.
Citações: Basear as respostas de Claude em documentos de origem.
Edição de contexto: Gerencie automaticamente o contexto de conversa com estratégias configuráveis.
Pensamento estendido: Funcionalidades de raciocínio aprimoradas para tarefas complexas disponíveis com todos os modelos claude.

Dica

Para Opus 4.6 e Sonnet 4.6, o thinking parâmetro dá suporte a tipos: enabled, disablede adaptive. O adaptive tipo permite que o modelo decida se deve pensar, com base na complexidade da consulta e no nível de esforço requerido.

Para o Mythos Preview, o thinking parâmetro dá suporte apenasadaptive e enabled.

Para o Opus 4.7, o thinking parâmetro dá suporte somente a adaptive e disabled.
Esforço: Capacidade de controlar a troca de qualidade/custo para respostas.

Dica

O effort parâmetro dá suporte aos níveis de esforço: low, mediume high. Para Opus 4.7, Opus 4.6 e Sonnet 4.6, o parâmetro também suporta max nível de esforço. Use esse parâmetro com ou sem habilitar o pensamento.
Suporte a PDF: Processe e analise o conteúdo de texto e visual de documentos PDF.
Cache de prompts: Forneça a Claude mais conhecimento de fundo e saídas de exemplo para reduzir custos e latência.

Algumas das ferramentas compatíveis com a Foundry são:

Conector MCP: Conecte-se a servidores MCP remotos diretamente da API de Mensagens sem um cliente MCP separado.
Memória: Armazene e recupere informações em conversas. Crie bases de dados de conhecimento ao longo do tempo, mantenha o contexto do projeto e aprenda com as interações passadas.
Busca na Web: Recupere o conteúdo completo de páginas da Web especificadas e documentos PDF para análise detalhada.

Para obter uma lista completa de recursos e ferramentas com suporte, confira a visão geral dos recursos de Claude.

Suporte ao agente

Microsoft Agent Framework dá suporte à criação de agentes que usam modelos claude.
Crie agentes de IA personalizados com o SDK do Claude Agent.

Cotas e limites de API

Importante

Atualmente, somente assinaturas Enterprise e MCA-E são qualificadas para o uso do modelo Claude no Foundry.

Os modelos claude na Foundry têm os seguintes limites de taxa, medidos em Tokens por Minuto (TPM) e Solicitações por Minuto (RPM):

Modelo	Tipo de implantação	RPM corporativo e MCA-E	Enterprise e MCA-E TPM
claude-opus-4-7	Padrão Global	2.000	2,000,000
claude-opus-4-6	Padrão Global	2.000	2,000,000
claude-opus-4-5	Padrão Global	2.000	2,000,000
claude-opus-4-1	Padrão Global	2.000	2,000,000
claude-sonnet-4-6	Padrão Global	2.000	2,000,000
claude-sonnet-4-5	Padrão Global	4,000	2,000,000
claude-haiku-4-5	Padrão Global	4,000	4.000.000

Para aumentar sua cota além dos limites padrão, envie uma solicitação por meio do formulário de solicitação de aumento de cota.

Práticas recomendadas de limite de taxa

Para otimizar seu uso e evitar a limitação de taxa:

Implementar lógica de repetição: manipular respostas 429 com retirada exponencial.
Solicitações em lote: combine vários prompts quando possível.
Monitorar o uso: acompanhe o consumo de token e os padrões de solicitação.
Use modelos apropriados: escolha o modelo Claude correto para seu caso de uso.

Considerações sobre IA responsável

Ao usar modelos Claude no Foundry, considere estas práticas responsáveis de IA:

Configure a segurança de conteúdo de IA durante a inferência do modelo, pois a Foundry não fornece filtragem de conteúdo interna para modelos Claude no momento da implantação.
Verifique se seus aplicativos estão em conformidade com Anthropic política de uso aceitável. Além disso, confira os detalhes das avaliações de segurança para Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 e Claude Haiku 4.5.

Práticas recomendadas

Siga estas melhores práticas ao trabalhar com os modelos Claude no Foundry.

Seleção de modelo

Escolha o modelo claude apropriado com base em seus requisitos específicos:

Claude Mythos Preview: Para segurança cibernética defensiva, codificação autônoma e agentes de execução prolongada.
Claude Opus 4.7: o modelo mais robusto para programação, fluxos de trabalho empresariais e tarefas prolongadas e decisivas.
Claude Opus 4.6: modelo altamente capaz para criar agentes, codificação e fluxos de trabalho corporativos.
Claude Opus 4.5: Melhor desempenho em codificação, agentes, uso de computador e fluxos de trabalho corporativos.
Claude Opus 4.1: raciocínio complexo e aplicativos empresariais.
Claude Sonnet 4.6: Inteligência de fronteira em escala para codificação, agentes e a maioria dos casos de uso.
Claude Sonnet 4.5: Desempenho e recursos equilibrados, fluxos de trabalho de produção.
Claude Haiku 4.5: otimização de velocidade e custo, processamento de alto volume.

Engenharia de prompt

Instruções claras: forneça prompts específicos e detalhados.
Gerenciamento de contexto: use a janela de contexto disponível efetivamente.
Definições de função: use mensagens do sistema para definir a função e o comportamento do assistente.
Prompts estruturados: utilize uma formatação consistente para obter melhores resultados.

Otimização de custo

Gerenciamento de tokens: monitore e otimize o uso do token.
Seleção de modelo: use o modelo mais econômico para seu caso de uso.
Cache: implemente o cache de prompt explícito quando apropriado.
Solicitação em lote: combine várias solicitações quando possível.

Solucionando problemas

A tabela a seguir lista erros comuns quando você trabalha com modelos Claude no Foundry e suas soluções:

Erro	Causa	Solução
401 Não autorizado	Chave de API inválida ou expirada ou escopo de token de Entra ID incorreto.	Verifique se a chave de API está correta. Para Entra ID, confirme se você usa o escopo `https://ai.azure.com/.default`.
403 Proibido	Permissões insuficientes no recurso ou na assinatura.	Verifique se você tem a função Colaborador ou Proprietário no grupo de recursos. Para Entra ID, verifique se a função Cognitive Services User está atribuída.
404 Não Encontrado	URL do ponto de extremidade ou nome de implantação incorreto.	Confirme se a URL base segue o padrão `https://<resource-name>.services.ai.azure.com/anthropic` e o nome da implantação corresponde à sua configuração.
429 Solicitações demais	Limite de taxa excedido para a camada de assinatura.	Implemente o recuo exponencial com lógica de novas tentativas. Considere reduzir a frequência da solicitação ou solicitar um aumento de cota.
Erro de qualificação da assinatura	Assinatura não Enterprise ou não MCA-E.	Os modelos Claude exigem uma assinatura Enterprise ou MCA-E. Consulte cotas e limites de API para obter detalhes.
Região não disponível	Tentativa de implantação em região não suportada.	Implantar no Leste dos EUA2 ou na Suécia Central, as regiões com suporte para modelos Claude.

Comentários

Esta página foi útil?

Last updated on 2026-05-01

Implantar e usar modelos claude no Microsoft Foundry (versão prévia) (clássico)

Pré-requisitos

Tipo de assinatura e suporte à região

Implantar modelos Claude

Chamar a API de Mensagens da Claude

Enviar mensagens com autenticação

Usar autenticação Microsoft Entra ID

Usar autenticação de chave de API

Modelos de Claude disponíveis

Claude Mythos (versão prévia da pesquisa fechada)

Claude Opus 4.7 (versão prévia)

Claude Opus 4.6 (versão prévia)

Claude Opus 4.5 (versão prévia)

Claude Opus 4.1 (versão prévia)

Claude Sonnet 4.6 (versão prévia)

Claude Sonnet 4.5 (versão prévia)

Claude Haiku 4.5 (versão prévia)

Recursos avançados e funcionalidades de modelos claude

Suporte ao agente

Cotas e limites de API

Práticas recomendadas de limite de taxa

Considerações sobre IA responsável

Práticas recomendadas

Seleção de modelo

Engenharia de prompt

Otimização de custo

Solucionando problemas

Conteúdo relacionado

Comentários

Recursos adicionais