Bereitstellen und Verwenden von Claude-Modellen in Microsoft Foundry (Vorschau)

Anthropic Claude-Modelle bringen fortschrittliche konversationelle KI-Funktionen zu Microsoft Foundry, sodass Sie intelligente Anwendungen mit fortschrittlichstem Sprachverständnis und Sprachgenerierung erstellen können. Claude-Modelle zeichnen sich durch komplexe Gründe, Codegenerierung und multimodale Aufgaben wie Bildanalyse aus.

In diesem Artikel erfahren Sie, wie Sie:

Bereitstellen von Claude-Modellen in Microsoft Foundry
Authentifizieren mithilfe von Microsoft Entra ID oder API-Schlüsseln
Aufrufen der Claude Messages-API aus Python, JavaScript oder REST
Wählen Sie das richtige Claude-Modell für Ihren Anwendungsfall aus.

Claude Modelle in Foundry umfassen:

Modellfamilie	Modelle
Claude Mythos	`claude-mythos-preview` ¹ (Eingeschränkte Forschungsvorschau)
Claude Opus	`claude-opus-4-7` ² (Vorschau), `claude-opus-4-6` (Vorschau), `claude-opus-4-5` (Vorschau), `claude-opus-4-1` (Vorschau)
Claude Sonnet	`claude-sonnet-4-6` (Vorschau), `claude-sonnet-4-5` (Vorschau)
Claude Haiku	`claude-haiku-4-5` (Vorschau)

¹Claude Mythos Preview ist nur als Gated Research Preview verfügbar. Der Zugriff auf das Modell wird ausschließlich nach ermessen Anthropic gewährt und wird für defensive Cybersicherheitsanwendungsfälle priorisiert. Zur verantwortungsvollen Verwendung finden Sie Leitlinien in der Claude Mythos Preview Systemkarte.

² Folgen Sie dem Migrationshandbuch zum Migrieren von Nachrichten-API-Code aus früheren Claude-Versionen zu Claude Opus 4.7.

Weitere Informationen zu den einzelnen Modellen finden Sie unter Verfügbare Claude Modelle.

Voraussetzungen

Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Wenn Sie kein Azure-Abonnement haben, erstellen Sie ein paid Azure Konto. Weitere Details finden Sie unter Abonnementtyp- und Regionsunterstützung .
Zugriff auf Microsoft Foundry mit entsprechenden Berechtigungen zum Erstellen und Verwalten von Ressourcen.
Ein Microsoft Foundry-Projekt in einem der unterstützten Regionen erstellt: East US2 oder Sweden Central.
Foundry Models von Partnern und der Community benötigen Zugriff auf Azure Marketplace, um Abonnements zu erstellen. Stellen Sie sicher, dass Sie über die erforderlichen Berechtigungen zum Abonnieren von Modellangeboten verfügen.
Rolle "Mitwirkender" oder "Besitzer" in der Ressourcengruppe zum Bereitstellen von Modellen. Weitere Informationen finden Sie unter Azure RBAC-Rollen.

Support für Abonnementtyp und Region

Um Claude Modelle in Microsoft Foundry zu verwenden, müssen Sie über ein kostenpflichtiges Azure-Abonnement mit einem Abrechnungskonto in einem Land oder einer Region verfügen, in dem Anthropic die Modelle zum Kauf anbietet. Eine Liste allgemeiner Abonnementfehler finden Sie unter Allgemeine Fehlermeldungen und Lösungen. Die folgenden Abonnementtypen werden derzeit nicht unterstützt:

Unternehmenskonten in Südkorea
Cloud Solution Provider Abonnements
Azure Abonnements ohne aktive Abrechnungsmethode (z. B. Studenten-, kostenlose Test- oder Startguthabenkonten)
Gesponserte Abonnements, die nur Azure Credits verwenden. Hinweis: Wenn Sie über ein Konto mit einer Kreditkarte verfügen, wird die Kreditkarte anstelle von "Azure Credits" belastet.

Eine Liste der unterstützten Regionen finden Sie unter unterstützten geografischen Standorten. Beachten Sie, dass die "Richtlinie für unterstützte Regionen" von Anthropic möglicherweise für die Verfügbarkeit in Ihrer Region gilt. Überprüfen Sie unterstützte Regionen für Details.

Bereitstellen von Claude-Modellen

Claude-Modelle in Foundry sind für die globale Standardbereitstellung verfügbar. Um ein Claude-Modell bereitzustellen, befolgen Sie die Anweisungen in Deploy Microsoft Foundry Models im Foundry-Portal.

Verwenden Sie nach der Bereitstellung den Foundry-Playground , um das Modell interaktiv zu testen.

Aufrufen der Claude Messages-API

Nachdem Sie ein Claude-Modell bereitgestellt haben, interagieren Sie damit, um Textantworten zu generieren:

Verwenden Sie die Anthropic SDKs und die folgenden Claude-APIs:
- Nachrichten-API: Senden Einer strukturierten Liste von Eingabemeldungen mit Text- oder Bildinhalten. Das Modell generiert die nächste Nachricht in der Unterhaltung.
- Api für die Tokenanzahl: Zählen Sie die Anzahl der Token in einer Nachricht.
- Datei-API: Hochladen und Verwalten von Dateien für die Verwendung mit der Claude-API ohne erneutes Hochladen von Inhalten mit jeder Anforderung.
- Skills API: Erstellen benutzerdefinierter Fähigkeiten für Claude AI.

Senden von Nachrichten mit Authentifizierung

Die folgenden Beispiele zeigen, wie Anforderungen mithilfe von Microsoft Entra ID oder API-Schlüsselauthentifizierung an Claude Sonnet 4.6 gesendet werden. Um mit Ihrem bereitgestellten Modell zu arbeiten, benötigen Sie Folgendes:

Ihre Basis-URL, die dem Formular https://<resource name>.services.ai.azure.com/anthropicentspricht.
Ihr Ziel-URI aus den Bereitstellungsdetails, der das Format https://<resource name>.services.ai.azure.com/anthropic/v1/messages hat.
Microsoft Entra ID für die schlüssellose Authentifizierung oder den API-Schlüssel Ihrer Implementierung für die API-Authentifizierung.
Der Bereitstellungsname, den Sie während der Bereitstellungserstellung ausgewählt haben. Dieser Name kann sich von der Modell-ID unterscheiden.

Hinweis

Für Opus 4.6 und Sonnet 4.6 unterstützt der thinking Parameter Typen: enabled, , disabledund adaptive. Der Typ adaptive erlaubt es dem Modell, basierend auf der Abfragekomplexität und der Aufwandsebene zu entscheiden, ob es denken soll.

Für Mythos Preview unterstützt der thinking Parameter nuradaptive und enabled.

Für Opus 4.7 unterstützt der thinking Parameter nuradaptive und disabled.

Der effort Parameter, der den Qualitäts-/Kosten-Kompromiss für Antworten steuert, unterstützt die Leistungsstufen: low, , mediumund high. Für Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützt max der Parameter auch den Leistungsgrad. Verwenden Sie diesen Parameter mit oder ohne Denken.

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL mit Microsoft Entra ID Authentifizierung.

Installieren Sie die Azure Identity-Clientbibliothek: Installieren Sie diese Bibliothek, um die DefaultAzureCredential zu verwenden. Die Autorisierung ist am einfachsten, wenn Sie DefaultAzureCredential verwenden, da es die besten Anmeldeinformationen für die ausgeführte Umgebung findet.
```
pip install azure-identity
```
Legen Sie die Werte der Client-ID, der Mandanten-ID und des geheimen Clientschlüssels der Microsoft Entra ID Anwendung als Umgebungsvariablen fest: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.
```
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
```
Install-Abhängigkeiten: Installieren Sie das Anthropic SDK mithilfe von Pip (erfordert Python 3.8 oder höher).
```
pip install -U "anthropic"
```

Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:

Erstellen Sie einen Client mit dem Anthropic SDK mit Microsoft Entra ID Authentifizierung.
Führen Sie einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.

from anthropic import AnthropicFoundry
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
deploymentName = "claude-sonnet-4-6" # Replace with your deployment name

# Create token provider for Entra ID authentication
tokenProvider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://ai.azure.com/.default"
)

# Create client with Entra ID authentication
client = AnthropicFoundry(
    azure_ad_token_provider=tokenProvider,
    base_url=baseURL
)

# Send request
message = client.messages.create(
    model=deploymentName,
    messages=[
        {"role": "user", "content": "What are 3 things to visit in Seattle?"}
    ],
    max_tokens=1048,
    temperature=1,
    thinking={"type":"adaptive"},
    output_config={"effort": "max"},
    stream=False
)

print(message.content)

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Reference:Anthropic Client SDK, DefaultAzureCredential

Verwenden der API-Schlüsselauthentifizierung

Wichtig

Claude Mythos Preview unterstützt nur Microsoft Entra ID Authentifizierung.

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL und Ihren API-Schlüssel, um sich bei dem Dienst zu authentifizieren.

Install-Abhängigkeiten: Installieren Sie das Anthropic SDK mithilfe von Pip (erfordert Python 3.8 oder höher):
```
pip install -U "anthropic"
```

Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:

Erstellen Sie einen Client mit dem Anthropic SDK, indem Sie Ihren API-Schlüssel an die Konfiguration des SDK übergeben. Mit dieser Authentifizierungsmethode können Sie nahtlos mit dem Dienst interagieren.
Führen Sie einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.

from anthropic import AnthropicFoundry

baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key

# Create client with API key authentication
client = AnthropicFoundry(
    api_key=apiKey,
    base_url=baseURL
)

# Send request
message = client.messages.create(
    model=deploymentName,
    messages=[
        {"role": "user", "content": "What are 3 things to visit in Seattle?"}
    ],
    max_tokens=1048,
    temperature=1,
    thinking={"type":"adaptive"},
    output_config={"effort": "max"},
    stream=False
)

print(message.content)

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Reference:Anthropic Client SDK

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL mit Microsoft Entra ID Authentifizierung.

Installieren Sie die Azure Identity-Clientbibliothek: Installieren Sie das paket @azure/identity, um das DefaultAzureCredential zu verwenden. Die Autorisierung ist am einfachsten, wenn Sie DefaultAzureCredential verwenden, da es die besten Anmeldeinformationen für die ausgeführte Umgebung findet.
```
npm install @azure/identity
```
Legen Sie die Werte der Client-ID, der Mandanten-ID und des geheimen Clientschlüssels der Microsoft Entra ID Anwendung als Umgebungsvariablen fest: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.
```
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
```
Installieren von Abhängigkeiten
1. Installieren Sie Node.js 20 LTS oder höher (nicht EOL)-Versionen.
2. Kopieren Sie die folgenden Textzeilen, und speichern Sie sie als Datei package.json in Ihrem Ordner.
```
{
  "type": "module",
  "dependencies": {
    "@anthropic-ai/sdk": "latest",
    "@azure/identity": "latest"
  }
}
```
3. Öffnen Sie ein Terminalfenster in diesem Ordner und führen Sie npm install aus.
4. Kopieren Sie bei den folgenden Codeausschnitten den Inhalt in eine Datei sample.js und führen Sie sie mit node sample.js aus.

Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:

Erstellt einen Client mit dem Anthropic SDK, indem Microsoft Entra ID zur Authentifizierung verwendet wird.
Führt einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.

import AnthropicFoundry from '@anthropic-ai/foundry-sdk';
import { getBearerTokenProvider, DefaultAzureCredential } from "@azure/identity";

const baseURL = "https://<resource-name>.services.ai.azure.com/anthropic"; // Your base URL. Replace <resource-name> with your resource name
const deploymentName = "claude-sonnet-4-6" // Replace with your deployment name

// Create token provider for Entra ID authentication
const tokenProvider = getBearerTokenProvider(
    new DefaultAzureCredential(),
    'https://ai.azure.com/.default');

// Create client with Entra ID authentication
const client = new AnthropicFoundry({
    azureADTokenProvider: tokenProvider,
    baseURL: baseURL,
    apiVersion: "2023-06-01"
});

// Send request
const message = await client.messages.create({
    model: deploymentName,
    messages: [{ role: "user", content: "What are 3 things to visit in Seattle?" }],
    max_tokens: 1048,
    temperature: 1,
    thinking: {"type": "adaptive"},
    output_config: {"effort": "max"},
    stream: false
});
console.log(message);

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Reference:Anthropic Client SDK, DefaultAzureCredential

Verwenden der API-Schlüsselauthentifizierung

Wichtig

Claude Mythos Preview unterstützt nur Microsoft Entra ID Authentifizierung.

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL und Ihren API-Schlüssel, um sich bei dem Dienst zu authentifizieren.

Installieren von Abhängigkeiten
1. Installieren Sie Node.js 20 LTS oder höher (nicht EOL)-Versionen.
2. Kopieren Sie die folgenden Textzeilen, und speichern Sie sie als Datei package.json in Ihrem Ordner.
```
{
  "type": "module",
  "dependencies": {
    "@anthropic-ai/sdk": "latest"
  }
}
```
3. Öffnen Sie ein Terminalfenster in diesem Ordner und führen Sie npm install aus.
4. Kopieren Sie bei den folgenden Codeausschnitten den Inhalt in eine Datei sample.js und führen Sie sie mit node sample.js aus.

Führen Sie ein einfaches Codebeispiel aus. In diesem Beispiel werden die folgenden Aufgaben ausgeführt:

Erstellt einen Client mit dem Anthropic SDK, indem Sie Ihren API-Schlüssel an die SDK-Konfiguration übergeben. Mit dieser Authentifizierungsmethode können Sie nahtlos mit dem Dienst interagieren.
Führt einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.

import AnthropicFoundry from '@anthropic-ai/foundry-sdk';

const baseURL = "https://<resource-name>.services.ai.azure.com/anthropic"; // Your base URL. Replace <resource-name> with your resource name
const deploymentName = "claude-sonnet-4-6" // Replace with your deployment name
const apiKey = "<your-api-key>"; // Your API key

// Create client with API key
const client = new AnthropicFoundry({
    apiKey: apiKey,
    baseURL: baseURL,
    apiVersion: "2023-06-01"
});

// Send request
const message = await client.messages.create({
    model: deploymentName,
    messages: [{ role: "user", content: "What are 3 things to visit in Seattle?" }],
    max_tokens: 1048,
    temperature: 1,
    thinking: {"type": "adaptive"},
    output_config: {"effort": "max"},
    stream: false
});
console.log(message);

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Reference:AnthropicFoundry SDK

Eine Liste der unterstützten Laufzeiten finden Sie unter Requirements zur Verwendung Anthropic TypeScript-API-Bibliothek.

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden Sie für Nachrichten-API-Endpunkte den Endpunkt-URI des bereitgestellten Modells https://<resource-name>.services.ai.azure.com/anthropic/v1/messages mit Microsoft Entra ID Authentifizierung.

Wenn Sie die Ressource mit Microsoft Entra ID Unterstützung konfigurieren, übergeben Sie Ihr Token im Autorisierungsheader mit dem Format Bearer $AZURE_AUTH_TOKEN. Verwenden Sie den Bereich https://ai.azure.com/.default. Die Verwendung von Microsoft Entra ID erfordert möglicherweise eine zusätzliche Konfiguration in Ihrer Ressource, um Zugriff zu gewähren. Weitere Informationen finden Sie unter Authentifizierung mit Microsoft Entra ID konfigurieren.

Exportieren Sie Ihr Microsoft Entra ID Token in eine Umgebungsvariable:

Wenn Sie Bash verwenden:
```
export AZURE_AUTH_TOKEN="<your-entra-id-key>"
```
Wenn Sie sich in PowerShell befinden:
```
$Env:AZURE_AUTH_TOKEN = "<your-entra-id-key>"
```
Wenn Sie Windows Eingabeaufforderung verwenden:
```
set AZURE_AUTH_TOKEN = <your-entra-id-key>
```

Führen Sie den folgenden cURL-Befehl aus. Verwenden Sie für cURL den Ziel-URI https://<resource-name>.services.ai.azure.com/anthropic/v1/messages Ihrer Bereitstellung.

curl -X POST https://<resource-name>.services.ai.azure.com/anthropic/v1/messages \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_AUTH_TOKEN" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "messages": [
      {
        "role": "user", "content": "You are a helpful assistant."
      },
      {
        "role": "user", "content": "What are 3 things to visit in Seattle?"
      }
    ],
    "max_tokens": 1048,
    "temperature": 1,
    "model": "claude-sonnet-4-6",
    "thinking": {"type":"adaptive"},
    "output_config": {"effort": "max"},
    "stream": false
    }'

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Referenz:Claude Messages API

Verwenden der API-Schlüsselauthentifizierung

Wichtig

Claude Mythos Preview unterstützt nur Microsoft Entra ID Authentifizierung.

Verwenden Sie für Nachrichten-API-Endpunkte den Endpunkt-URI https://<resource-name>.services.ai.azure.com/anthropic/v1/messages und den API-Schlüssel des bereitgestellten Modells, um sich bei dem Dienst zu authentifizieren.

Exportieren Sie Ihren API-Schlüssel in eine Umgebungsvariable:

Wenn Sie Bash verwenden:
```
export AZURE_API_KEY="<your-api-key>"
```
Wenn Sie sich in PowerShell befinden:
```
$Env:AZURE_API_KEY = "<your-api-key>"
```
Wenn Sie Windows Eingabeaufforderung verwenden:
```
set AZURE_API_KEY = <your-api-key>
```

Führen Sie den folgenden cURL-Befehl aus:

curl -X POST https://<resource-name>.services.ai.azure.com/anthropic/v1/messages \
  -H "Content-Type: application/json" \
  -H "x-api-key: $AZURE_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "messages": [
      {
        "role": "user", "content": "You are a helpful assistant."
      },
      {
        "role": "user", "content": "What are 3 things to visit in Seattle?"
      }
    ],
    "max_tokens": 1048,
    "temperature": 1,
    "model": "claude-sonnet-4-6",
    "thinking": {"type":"adaptive"},
    "output_config": {"effort": "max"},
    "stream": false
    }'

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Referenz:Claude Messages API

Verfügbare Claude Modelle

Foundry unterstützt die Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 und Claude Haiku 4.5 Modelle durch globale Standardbereitstellung. Diese Modelle verfügen über wichtige Funktionen:

Adaptives Denken: Ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Vorgangs- und Leistungsniveau so viel oder so wenig wie nötig zu denken.
Erweitertes Denken: Erweiterte Begründung für komplexe Aufgaben.
Bild- und Texteingabe: Ausgeprägte Fähigkeit zur Analyse von Diagrammen, Grafiken, technischen Diagrammen, Berichten und anderen visuellen Vermögenswerten.
Codegenerierung: Erweiterte Codegenerierung, -analyse und -debugging.

Weitere Informationen zu den Modellfunktionen finden Sie in den Funktionen von Claude-Modellen.

Claude Mythos (Beschränkte Forschungs-Vorschau)

Wichtig

Claude Mythos Preview ist nur als Gated Research Preview verfügbar. Der Zugriff auf das Modell wird ausschließlich nach ermessen Anthropic gewährt und wird für defensive Cybersicherheitsanwendungsfälle priorisiert. Zur verantwortungsvollen Verwendung finden Sie Leitlinien in der Claude Mythos Preview Systemkarte.

Claude Mythos Preview unterstützt nur Microsoft Entra ID-Authentifizierung.

Claude Mythos Preview ist eine neue Klasse von Intelligenz, die für ehrgeizige Projekte entwickelt wurde, und das weltweit beste Modell für Cybersicherheit, autonomes Codieren und langjährige Agenten. Nur als Gated Research Preview verfügbar, wobei der Zugriff für defensive Cybersicherheits-Anwendungsfälle priorisiert ist. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K wird Claude Mythos Preview für:

Cybersicherheit: Das weltweit beste Modell für defensive Sicherheit. Es kann Korrekturen für echte Sicherheitsrisiken in Produktionscodebasen finden und vorschlagen und dann helfen, die Korrekturen zu beweisen.
Autonomes Codieren: Behandelt den vollständigen Engineering-Zyklus effektiver als jedes vorherige Modell – Untersuchung, Implementierung und Tests über große Codebasen hinweg von Ziel zu Versand.
Langlaufende Agenten: Legt einen neuen Maßstab für agentische Arbeit mit langer Reichweite fest. Sie kann eine kohärente Ausführung über verlängerte, mehrstündige Aufgaben aufrechterhalten, sich an veränderte Bedingungen anpassen und die Arbeit mit weniger Interventionen voranbringen.

Claude Mythos Preview unterstützt adaptives Denken, ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Vorgangs- und Leistungsniveau so viel oder so wenig wie nötig zu denken.

Claude Opus 4.7 (Vorschau)

Tipp

Folgen Sie dem Migrationshandbuch , um Nachrichten-API-Code aus früheren Claude-Versionen zu Claude Opus 4.7 zu migrieren.

Claude Opus 4.7 ist das fähigste Modell in der Claude Opus-Familie, das die Leistung über Codierung, Unternehmensworkflows und langfristige agentische Aufgaben hinweg verbessert. Mit einem Kontextfenster von 1M-Token und einer maximalen Ausgabe von 128K ist Opus 4.7 ideal für agentische Codierung, Unternehmenswissensarbeit, langlebige Multi-Tool-Workflows, hochauflösende multimodale Begründung (bis zu 2576px / 3,75MP), Finanzanalyse und Cybersicherheit. Opus 4.7 unterstützt adaptives Denken, ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Aufgaben- und Leistungsniveau so viel oder so wenig wie nötig zu denken.

Claude Opus 4.6 (Vorschau)

Claude Opus 4.6 ist ein hochfähiges Modell in der Claude Opus-Familie für Codierung, Unternehmensmitarbeiter und professionelle Arbeit. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K eignet sich Opus 4.6 ideal für Produktionscode, anspruchsvolle Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendung.

Claude Opus 4.5 (Vorschau)

Claude Opus 4.5 ist branchenweit führend in Codierung, Agenten, Computernutzung und Unternehmensworkflows. Mit einem Kontextfenster von 200K-Token und einer maximalen Ausgabe von 64K eignet sich Opus 4.5 ideal für Produktionscode, anspruchsvolle Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendungsaufgaben.

Claude Opus 4.1 (Vorschau)

Claude Opus 4.1 ist Branchenführer für Codierung. Es bietet eine nachhaltige Leistung für langandauernde Aufgaben, die konzentrierte Anstrengungen und Tausende von Schritten erfordern, wodurch die Aufgaben, die KI-Agenten lösen können, erheblich erweitert werden.

Claude Sonnet 4.6 (Vorschau)

Claude Sonnet 4.6 liefert fortschrittliche Intelligenz in großem Umfang – konzipiert für Programmierung, Agenten und Unternehmensworkflows. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K ist Sonnet 4.6 ideal für Codierung, Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendung geeignet.

Claude Sonnet 4.5 (Vorschau)

Warnung

Die 1M Context Beta auf Claude Sonnet 4.5 wird nach dem 30. April 2026 eingestellt.

Ab dem 1. Mai 2026:

Anforderungen von mehr als 200K-Token , die den context-1m-2025-08-07 Betaheader auf Sonnet 4.5 enthalten, geben einen Fehler zurück.
Die Anforderungen von 200K-Token oder weniger bleiben unbeeinflusst, auch wenn der Header vorhanden ist.

Entfernen Sie zum Migrieren den context-1m-2025-08-07 Beta-Header aus Ihren Anforderungen. Für Workloads, die 1M-Kontext erfordern, migrieren Sie zu Claude Sonnet 4.6 (wobei 1M-Kontext allgemein verfügbar ist) oder zu Claude Opus 4.6 oder Claude Opus 4.7 für Workloads mit höherer Intelligenz.

Claude Sonnet 4.5 ist ein hochfähiges Modell, das für die Erstellung von realen Agenten entwickelt wurde und komplexe, langhorizonte Aufgaben verarbeitet. Es bietet eine starke Balance von Geschwindigkeit und Kosten für großvolumige Anwendungsfälle. Sonnet 4.5 bietet auch eine fortschrittliche Genauigkeit für die Computernutzung, sodass Entwickler Claude so leiten können, wie menschen es tun.

Claude Haiku 4.5 (Vorschau)

Claude Haiku 4.5 bietet Spitzenleistung für eine breite Palette von Anwendungsfällen. Es zeichnet sich als eines der besten Programmierungs- und Agentmodelle aus, mit der passenden Geschwindigkeit und den geeigneten Kosten für kostenlose Produkte und skalierte Subagenten.

Erweiterte Funktionen und Fähigkeiten von Claude-Modellen

Claude in Foundry Models unterstützt erweiterte Merkmale und Funktionen. Kernfunktionen verbessern die grundlegenden Fähigkeiten von Claude für die Verarbeitung, Analyse und Generierung von Inhalten in verschiedenen Formaten und Anwendungsfällen. Mit Tools kann Claude mit externen Systemen interagieren, Code ausführen und automatisierte Aufgaben über verschiedene Toolschnittstellen ausführen.

Einige der Kernfunktionen , die Foundry unterstützt, sind:

Großes Kontextfenster: Ein erweitertes Kontextfenster, das größere Dokumente und längere Unterhaltungen verarbeitet.
Agent-Fähigkeiten: Erweitern Sie Claudes Fähigkeiten mit Fähigkeiten.
Zitate: Claudes Antworten müssen in Quelldokumenten verankert sein.
Kontextbearbeitung: Verwalten Sie den Unterhaltungskontext automatisch mit konfigurierbaren Strategien.
Erweitertes Denken: Erweiterte Logikfunktionen für komplexe Aufgaben, die mit allen Claude-Modellen zur Verfügung stehen.

Tipp

Für Opus 4.6 und Sonnet 4.6 unterstützt der thinking Parameter Typen: enabled, , disabledund adaptive. Der Typ adaptive erlaubt es dem Modell, basierend auf der Abfragekomplexität und der Aufwandsebene zu entscheiden, ob es denken soll.

Für Mythos Preview unterstützt der thinking Parameter nuradaptive und enabled.

Für Opus 4.7 unterstützt der thinking Parameter nuradaptive und disabled.
Anstrengung: Möglichkeit, den Qualitäts-/Kosten-Kompromiss für Antworten zu kontrollieren.

Tipp

Der effort Parameter unterstützt Leistungsstufen: low, , mediumund high. Für Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützt max der Parameter auch den Leistungsgrad. Verwenden Sie diesen Parameter mit oder ohne Denken.
PDF-Unterstützung: Verarbeiten und Analysieren von Text und visuellen Inhalten aus PDF-Dokumenten.
Zwischenspeichern von Aufforderungen: Geben Sie Claude mehr Hintergrundwissen und Beispielausgaben, um Kosten und Latenz zu reduzieren.

Einige der Tools , die Foundry unterstützt, sind:

MCP-Connector: Stellen Sie eine direkte Verbindung mit Remote-MCP-Servern über die Nachrichten-API ohne einen separaten MCP-Client her.
Speicher: Speichern und Abrufen von Informationen über Unterhaltungen hinweg. Erstellen Sie Wissensbasen im Laufe der Zeit, verwalten Sie den Projektkontext, und lernen Sie aus früheren Interaktionen.
Web-Abruf: Abrufen vollständiger Inhalte aus angegebenen Webseiten und PDF-Dokumenten für eine eingehende Analyse.

Eine vollständige Liste der unterstützten Funktionen und Tools finden Sie in der Übersicht über die Features von Claude.

Agentensupport

Microsoft Agent Framework unterstützt das Erstellen von Agents, die Claude-Modelle verwenden.
Erstellen Sie benutzerdefinierte KI-Agents mit dem Claude Agent SDK.

API-Kontingente und -Grenzwerte

Wichtig

Derzeit sind nur Enterprise- und MCA-E-Abonnements für die Claude-Modellnutzung in Foundry berechtigt.

Claude Modelle in Foundry haben die folgenden Geschwindigkeitsgrenzwerte, gemessen in Token pro Minute (TPM) und Anforderungen pro Minute (RPM):

Modell	Bereitstellungstyp	Enterprise und MCA-E RPM	Enterprise- und MCA-E-TPM
claude-opus-4-7	Globaler Standard	2.000	2,000,000
claude-opus-4-6	Globaler Standard	2.000	2,000,000
claude-opus-4-5	Globaler Standard	2.000	2,000,000
claude-opus-4-1	Globaler Standard	2.000	2,000,000
claude-sonnet-4-6	Globaler Standard	2.000	2,000,000
claude-sonnet-4-5	Globaler Standard	4,000	2,000,000
claude-haiku-4-5	Globaler Standard	4,000	4.000.000

Um Ihr Kontingent über die Standardgrenzwerte hinaus zu erhöhen, senden Sie eine Anforderung über das Anforderungsformular zur Erhöhung des Kontingents.

Bewährte Methoden für Zinslimits

So optimieren Sie Ihre Nutzung und vermeiden Sie eine Begrenzung der Rate:

Implementieren Sie Wiederholungslogik: Behandeln von 429-Antworten mit exponentiellem Backoff.
Batch-Anfragen: Kombinieren Sie nach Möglichkeit mehrere Anweisungen.
Überwachen Sie die Verwendung: Verfolgen Sie Ihre Tokennutzung und Anforderungsmuster.
Verwenden Sie geeignete Modelle: Wählen Sie das richtige Claude-Modell für Ihren Anwendungsfall aus.

Verantwortungsvolle KI-Überlegungen

Berücksichtigen Sie bei der Verwendung von Claude-Modellen in Gießerei die folgenden verantwortungsvollen KI-Praktiken:

Konfigurieren Sie die KI-Inhaltssicherheit während der Modell-Ableitung, da Foundry zur Bereitstellungszeit keine integrierte Inhaltsfilterung für Claude-Modelle bereitstellt.
Stellen Sie sicher, dass Ihre Anwendungen Anthropic zulässige Nutzungsrichtlinie einhalten. Weitere Informationen zu Sicherheitsbewertungen für Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 und Claude Haiku 4.5.

Bewährte Methoden

Befolgen Sie die folgenden bewährten Methoden beim Arbeiten mit Claude-Modellen in Foundry:

Modellauswahl

Wählen Sie das entsprechende Claude-Modell basierend auf Ihren spezifischen Anforderungen aus:

Claude Mythos Preview: Für defensive Cybersicherheit, autonomes Codieren und langjährige Agenten.
Claude Opus 4.7: Am besten geeignetes Modell für Codierung, Unternehmensworkflows und langfristige agentische Aufgaben.
Claude Opus 4.6: Hochfähiges Modell zum Erstellen von Agenten, Codierung und Unternehmensworkflows.
Claude Opus 4.5: Optimale Leistung für Codierung, Agents, Computernutzung und Unternehmensworkflows.
Claude Opus 4.1: Komplexe Logik und Geschäftsanwendungen.
Claude Sonnet 4.6: Grenzintelligenz im Maßstab für Codierung, Agenten und die meisten Anwendungsfälle.
Claude Sonnet 4.5: Ausgewogene Leistung und Fähigkeiten, Produktionsabläufe.
Claude Haiku 4.5: Geschwindigkeit und Kostenoptimierung, Verarbeitung mit hohem Volumen.

Prompt-Entwicklung

Klare Anweisungen: Geben Sie bestimmte und detaillierte Eingabeaufforderungen an.
Kontextverwaltung: Verwenden Sie das verfügbare Kontextfenster effektiv.
Rollendefinitionen: Verwenden Sie Systemmeldungen, um die Rolle und das Verhalten des Assistenten zu definieren.
Strukturierte Eingabeaufforderungen: Verwenden Sie eine konsistente Formatierung, um bessere Ergebnisse zu erzielen.

Kostenoptimierung

Tokenverwaltung: Überwachen und Optimieren der Tokennutzung.
Modellauswahl: Verwenden Sie das kostengünstigste Modell für Ihren Anwendungsfall.
Zwischenspeichern: Implementieren Sie bei Bedarf explizite Eingabeaufforderungszwischenspeicherung .
Batchverarbeitung anfordern: Kombinieren Sie nach Möglichkeit mehrere Anforderungen.

Problembehandlung

In der folgenden Tabelle sind häufige Fehler aufgeführt, wenn Sie mit Claude-Modellen in Foundry arbeiten, und deren Lösungen:

Fehler	Ursache	Lösung
401 Nicht autorisiert	Ungültiger oder abgelaufener API-Schlüssel oder ungültiger Entra ID Tokenbereich.	Überprüfen Sie, ob der API-Schlüssel korrekt ist. Bestätigen Sie für Entra ID, dass Sie den Bereich `https://ai.azure.com/.default` verwenden.
403 Verboten	Unzureichende Berechtigungen für die Ressource oder das Abonnement.	Vergewissern Sie sich, dass Sie über die Rolle "Mitwirkender " oder "Besitzer " in der Ressourcengruppe verfügen. Stellen Sie für Entra ID sicher, dass die Rolle Cognitive Services User zugewiesen ist.
404 nicht gefunden	Falsche Endpunkt-URL oder Bereitstellungsname.	Vergewissern Sie sich, dass Ihre Basis-URL dem Muster `https://<resource-name>.services.ai.azure.com/anthropic` folgt, und der Bereitstellungsname entspricht Ihrer Konfiguration.
429 zu viele Anforderungen	Das Limit Ihrer Abonnementstufe wurde überschritten.	Implementieren Sie exponentielle Backoffs mit Wiederholungslogik. Erwägen Sie, die Anforderungshäufigkeit zu reduzieren oder eine Kontingenterhöhung anzufordern.
Fehler bei der Abonnementberechtigung	Nicht-Enterprise- oder nicht-MCA-E-Abonnement.	Claude-Modelle erfordern ein Enterprise- oder MCA-E-Abonnement. Details finden Sie unter API-Kontingente und -Grenzwerte .
Region nicht verfügbar	Die versuchte Bereitstellung erfolgte in einem nicht unterstützten Bereich.	Stellen Sie in ost-US2 oder Schweden Central, den unterstützten Regionen für Claude-Modelle, bereit.

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-01

Bereitstellen und Verwenden von Claude-Modellen in Microsoft Foundry (Vorschau)

Voraussetzungen

Support für Abonnementtyp und Region

Bereitstellen von Claude-Modellen

Aufrufen der Claude Messages-API

Senden von Nachrichten mit Authentifizierung

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden der API-Schlüsselauthentifizierung

Verfügbare Claude Modelle

Claude Mythos (Beschränkte Forschungs-Vorschau)

Claude Opus 4.7 (Vorschau)

Claude Opus 4.6 (Vorschau)

Claude Opus 4.5 (Vorschau)

Claude Opus 4.1 (Vorschau)

Claude Sonnet 4.6 (Vorschau)

Claude Sonnet 4.5 (Vorschau)

Claude Haiku 4.5 (Vorschau)

Erweiterte Funktionen und Fähigkeiten von Claude-Modellen

Agentensupport

API-Kontingente und -Grenzwerte

Bewährte Methoden für Zinslimits

Verantwortungsvolle KI-Überlegungen

Bewährte Methoden

Modellauswahl

Prompt-Entwicklung

Kostenoptimierung

Problembehandlung

Verwandte Inhalte

Feedback

Zusätzliche Ressourcen