Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Anthropic Claude-Modelle bringen fortschrittliche konversationelle KI-Funktionen zu Microsoft Foundry, sodass Sie intelligente Anwendungen mit fortschrittlichstem Sprachverständnis und Sprachgenerierung erstellen können. Claude-Modelle zeichnen sich durch komplexe Gründe, Codegenerierung und multimodale Aufgaben wie Bildanalyse aus.
In diesem Artikel erfahren Sie, wie Sie:
- Bereitstellen von Claude-Modellen in Microsoft Foundry
- Authentifizieren mithilfe von Microsoft Entra ID oder API-Schlüsseln
- Aufrufen der Claude Messages-API aus Python, JavaScript oder REST
- Wählen Sie das richtige Claude-Modell für Ihren Anwendungsfall aus.
Claude Modelle in Foundry umfassen:
| Modellfamilie | Modelle |
|---|---|
| Claude Mythos |
claude-mythos-preview
1 (Eingeschränkte Forschungsvorschau) |
| Claude Opus |
claude-opus-4-7
2 (Vorschau), claude-opus-4-6 (Vorschau), claude-opus-4-5 (Vorschau), claude-opus-4-1 (Vorschau) |
| Claude Sonnet |
claude-sonnet-4-6 (Vorschau), claude-sonnet-4-5 (Vorschau) |
| Claude Haiku |
claude-haiku-4-5 (Vorschau) |
1Claude Mythos Preview ist nur als Gated Research Preview verfügbar. Der Zugriff auf das Modell wird ausschließlich nach ermessen Anthropic gewährt und wird für defensive Cybersicherheitsanwendungsfälle priorisiert. Zur verantwortungsvollen Verwendung finden Sie Leitlinien in der Claude Mythos Preview Systemkarte.
2 Folgen Sie dem Migrationshandbuch zum Migrieren von Nachrichten-API-Code aus früheren Claude-Versionen zu Claude Opus 4.7.
Weitere Informationen zu den einzelnen Modellen finden Sie unter Verfügbare Claude Modelle.
Voraussetzungen
- Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Wenn Sie kein Azure-Abonnement haben, erstellen Sie ein paid Azure Konto. Weitere Details finden Sie unter Abonnementtyp- und Regionsunterstützung .
- Zugriff auf Microsoft Foundry mit entsprechenden Berechtigungen zum Erstellen und Verwalten von Ressourcen.
- Ein Microsoft Foundry-Projekt in einem der unterstützten Regionen erstellt: East US2 oder Sweden Central.
- Foundry Models von Partnern und der Community benötigen Zugriff auf Azure Marketplace, um Abonnements zu erstellen. Stellen Sie sicher, dass Sie über die erforderlichen Berechtigungen zum Abonnieren von Modellangeboten verfügen.
- Rolle "Mitwirkender" oder "Besitzer" in der Ressourcengruppe zum Bereitstellen von Modellen. Weitere Informationen finden Sie unter Azure RBAC-Rollen.
Support für Abonnementtyp und Region
Um Claude Modelle in Microsoft Foundry zu verwenden, müssen Sie über ein kostenpflichtiges Azure-Abonnement mit einem Abrechnungskonto in einem Land oder einer Region verfügen, in dem Anthropic die Modelle zum Kauf anbietet. Eine Liste allgemeiner Abonnementfehler finden Sie unter Allgemeine Fehlermeldungen und Lösungen. Die folgenden Abonnementtypen werden derzeit nicht unterstützt:
- Unternehmenskonten in Südkorea
- Cloud Solution Provider Abonnements
- Azure Abonnements ohne aktive Abrechnungsmethode (z. B. Studenten-, kostenlose Test- oder Startguthabenkonten)
- Gesponserte Abonnements, die nur Azure Credits verwenden. Hinweis: Wenn Sie über ein Konto mit einer Kreditkarte verfügen, wird die Kreditkarte anstelle von "Azure Credits" belastet.
Eine Liste der unterstützten Regionen finden Sie unter unterstützten geografischen Standorten. Beachten Sie, dass die "Richtlinie für unterstützte Regionen" von Anthropic möglicherweise für die Verfügbarkeit in Ihrer Region gilt. Überprüfen Sie unterstützte Regionen für Details.
Bereitstellen von Claude-Modellen
Claude-Modelle in Foundry sind für die globale Standardbereitstellung verfügbar. Um ein Claude-Modell bereitzustellen, befolgen Sie die Anweisungen in Deploy Microsoft Foundry Models im Foundry-Portal.
Verwenden Sie nach der Bereitstellung den Foundry-Playground , um das Modell interaktiv zu testen.
Aufrufen der Claude Messages-API
Nachdem Sie ein Claude-Modell bereitgestellt haben, interagieren Sie damit, um Textantworten zu generieren:
Verwenden Sie die Anthropic SDKs und die folgenden Claude-APIs:
- Nachrichten-API: Senden Einer strukturierten Liste von Eingabemeldungen mit Text- oder Bildinhalten. Das Modell generiert die nächste Nachricht in der Unterhaltung.
- Api für die Tokenanzahl: Zählen Sie die Anzahl der Token in einer Nachricht.
- Datei-API: Hochladen und Verwalten von Dateien für die Verwendung mit der Claude-API ohne erneutes Hochladen von Inhalten mit jeder Anforderung.
- Skills API: Erstellen benutzerdefinierter Fähigkeiten für Claude AI.
Senden von Nachrichten mit Authentifizierung
Die folgenden Beispiele zeigen, wie Anforderungen mithilfe von Microsoft Entra ID oder API-Schlüsselauthentifizierung an Claude Sonnet 4.6 gesendet werden. Um mit Ihrem bereitgestellten Modell zu arbeiten, benötigen Sie Folgendes:
- Ihre Basis-URL, die dem Formular
https://<resource name>.services.ai.azure.com/anthropicentspricht. - Ihr Ziel-URI aus den Bereitstellungsdetails, der das Format
https://<resource name>.services.ai.azure.com/anthropic/v1/messageshat. - Microsoft Entra ID für die schlüssellose Authentifizierung oder den API-Schlüssel Ihrer Implementierung für die API-Authentifizierung.
- Der Bereitstellungsname, den Sie während der Bereitstellungserstellung ausgewählt haben. Dieser Name kann sich von der Modell-ID unterscheiden.
Hinweis
Für Opus 4.6 und Sonnet 4.6 unterstützt der thinking Parameter Typen: enabled, , disabledund adaptive. Der Typ adaptive erlaubt es dem Modell, basierend auf der Abfragekomplexität und der Aufwandsebene zu entscheiden, ob es denken soll.
Für Mythos Preview unterstützt der thinking Parameter nuradaptive und enabled.
Für Opus 4.7 unterstützt der thinking Parameter nuradaptive und disabled.
Der effort Parameter, der den Qualitäts-/Kosten-Kompromiss für Antworten steuert, unterstützt die Leistungsstufen: low, , mediumund high. Für Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützt max der Parameter auch den Leistungsgrad. Verwenden Sie diesen Parameter mit oder ohne Denken.
Verwenden Sie die Microsoft Entra ID-Authentifizierung
Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL mit Microsoft Entra ID Authentifizierung.
Installieren Sie die Azure Identity-Clientbibliothek: Installieren Sie diese Bibliothek, um die
DefaultAzureCredentialzu verwenden. Die Autorisierung ist am einfachsten, wenn SieDefaultAzureCredentialverwenden, da es die besten Anmeldeinformationen für die ausgeführte Umgebung findet.pip install azure-identityLegen Sie die Werte der Client-ID, der Mandanten-ID und des geheimen Clientschlüssels der Microsoft Entra ID Anwendung als Umgebungsvariablen fest:
AZURE_CLIENT_ID,AZURE_TENANT_ID,AZURE_CLIENT_SECRET.export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>" export AZURE_TENANT_ID="<AZURE_TENANT_ID>" export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"Install-Abhängigkeiten: Installieren Sie das Anthropic SDK mithilfe von Pip (erfordert Python 3.8 oder höher).
pip install -U "anthropic"Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:
- Erstellen Sie einen Client mit dem Anthropic SDK mit Microsoft Entra ID Authentifizierung.
- Führen Sie einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.
from anthropic import AnthropicFoundry from azure.identity import DefaultAzureCredential, get_bearer_token_provider baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-6" # Replace with your deployment name # Create token provider for Entra ID authentication tokenProvider = get_bearer_token_provider( DefaultAzureCredential(), "https://ai.azure.com/.default" ) # Create client with Entra ID authentication client = AnthropicFoundry( azure_ad_token_provider=tokenProvider, base_url=baseURL ) # Send request message = client.messages.create( model=deploymentName, messages=[ {"role": "user", "content": "What are 3 things to visit in Seattle?"} ], max_tokens=1048, temperature=1, thinking={"type":"adaptive"}, output_config={"effort": "max"}, stream=False ) print(message.content)Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.
Reference:Anthropic Client SDK, DefaultAzureCredential
Verwenden der API-Schlüsselauthentifizierung
Wichtig
Claude Mythos Preview unterstützt nur Microsoft Entra ID Authentifizierung.
Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL und Ihren API-Schlüssel, um sich bei dem Dienst zu authentifizieren.
Install-Abhängigkeiten: Installieren Sie das Anthropic SDK mithilfe von Pip (erfordert Python 3.8 oder höher):
pip install -U "anthropic"Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:
- Erstellen Sie einen Client mit dem Anthropic SDK, indem Sie Ihren API-Schlüssel an die Konfiguration des SDK übergeben. Mit dieser Authentifizierungsmethode können Sie nahtlos mit dem Dienst interagieren.
- Führen Sie einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.
from anthropic import AnthropicFoundry baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-6" # Replace with your deployment name apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key # Create client with API key authentication client = AnthropicFoundry( api_key=apiKey, base_url=baseURL ) # Send request message = client.messages.create( model=deploymentName, messages=[ {"role": "user", "content": "What are 3 things to visit in Seattle?"} ], max_tokens=1048, temperature=1, thinking={"type":"adaptive"}, output_config={"effort": "max"}, stream=False ) print(message.content)Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.
Reference:Anthropic Client SDK
Verfügbare Claude Modelle
Foundry unterstützt die Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 und Claude Haiku 4.5 Modelle durch globale Standardbereitstellung. Diese Modelle verfügen über wichtige Funktionen:
- Adaptives Denken: Ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Vorgangs- und Leistungsniveau so viel oder so wenig wie nötig zu denken.
- Erweitertes Denken: Erweiterte Begründung für komplexe Aufgaben.
- Bild- und Texteingabe: Ausgeprägte Fähigkeit zur Analyse von Diagrammen, Grafiken, technischen Diagrammen, Berichten und anderen visuellen Vermögenswerten.
- Codegenerierung: Erweiterte Codegenerierung, -analyse und -debugging.
Weitere Informationen zu den Modellfunktionen finden Sie in den Funktionen von Claude-Modellen.
Claude Mythos (Beschränkte Forschungs-Vorschau)
Wichtig
Claude Mythos Preview ist nur als Gated Research Preview verfügbar. Der Zugriff auf das Modell wird ausschließlich nach ermessen Anthropic gewährt und wird für defensive Cybersicherheitsanwendungsfälle priorisiert. Zur verantwortungsvollen Verwendung finden Sie Leitlinien in der Claude Mythos Preview Systemkarte.
Claude Mythos Preview unterstützt nur Microsoft Entra ID-Authentifizierung.
Claude Mythos Preview ist eine neue Klasse von Intelligenz, die für ehrgeizige Projekte entwickelt wurde, und das weltweit beste Modell für Cybersicherheit, autonomes Codieren und langjährige Agenten. Nur als Gated Research Preview verfügbar, wobei der Zugriff für defensive Cybersicherheits-Anwendungsfälle priorisiert ist. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K wird Claude Mythos Preview für:
- Cybersicherheit: Das weltweit beste Modell für defensive Sicherheit. Es kann Korrekturen für echte Sicherheitsrisiken in Produktionscodebasen finden und vorschlagen und dann helfen, die Korrekturen zu beweisen.
- Autonomes Codieren: Behandelt den vollständigen Engineering-Zyklus effektiver als jedes vorherige Modell – Untersuchung, Implementierung und Tests über große Codebasen hinweg von Ziel zu Versand.
- Langlaufende Agenten: Legt einen neuen Maßstab für agentische Arbeit mit langer Reichweite fest. Sie kann eine kohärente Ausführung über verlängerte, mehrstündige Aufgaben aufrechterhalten, sich an veränderte Bedingungen anpassen und die Arbeit mit weniger Interventionen voranbringen.
Claude Mythos Preview unterstützt adaptives Denken, ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Vorgangs- und Leistungsniveau so viel oder so wenig wie nötig zu denken.
Claude Opus 4.7 (Vorschau)
Tipp
Folgen Sie dem Migrationshandbuch , um Nachrichten-API-Code aus früheren Claude-Versionen zu Claude Opus 4.7 zu migrieren.
Claude Opus 4.7 ist das fähigste Modell in der Claude Opus-Familie, das die Leistung über Codierung, Unternehmensworkflows und langfristige agentische Aufgaben hinweg verbessert. Mit einem Kontextfenster von 1M-Token und einer maximalen Ausgabe von 128K ist Opus 4.7 ideal für agentische Codierung, Unternehmenswissensarbeit, langlebige Multi-Tool-Workflows, hochauflösende multimodale Begründung (bis zu 2576px / 3,75MP), Finanzanalyse und Cybersicherheit. Opus 4.7 unterstützt adaptives Denken, ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Aufgaben- und Leistungsniveau so viel oder so wenig wie nötig zu denken.
Claude Opus 4.6 (Vorschau)
Claude Opus 4.6 ist ein hochfähiges Modell in der Claude Opus-Familie für Codierung, Unternehmensmitarbeiter und professionelle Arbeit. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K eignet sich Opus 4.6 ideal für Produktionscode, anspruchsvolle Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendung.
Claude Opus 4.5 (Vorschau)
Claude Opus 4.5 ist branchenweit führend in Codierung, Agenten, Computernutzung und Unternehmensworkflows. Mit einem Kontextfenster von 200K-Token und einer maximalen Ausgabe von 64K eignet sich Opus 4.5 ideal für Produktionscode, anspruchsvolle Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendungsaufgaben.
Claude Opus 4.1 (Vorschau)
Claude Opus 4.1 ist Branchenführer für Codierung. Es bietet eine nachhaltige Leistung für langandauernde Aufgaben, die konzentrierte Anstrengungen und Tausende von Schritten erfordern, wodurch die Aufgaben, die KI-Agenten lösen können, erheblich erweitert werden.
Claude Sonnet 4.6 (Vorschau)
Claude Sonnet 4.6 liefert fortschrittliche Intelligenz in großem Umfang – konzipiert für Programmierung, Agenten und Unternehmensworkflows. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K ist Sonnet 4.6 ideal für Codierung, Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendung geeignet.
Claude Sonnet 4.5 (Vorschau)
Warnung
Die 1M Context Beta auf Claude Sonnet 4.5 wird nach dem 30. April 2026 eingestellt.
Ab dem 1. Mai 2026:
- Anforderungen von mehr als 200K-Token , die den
context-1m-2025-08-07Betaheader auf Sonnet 4.5 enthalten, geben einen Fehler zurück. - Die Anforderungen von 200K-Token oder weniger bleiben unbeeinflusst, auch wenn der Header vorhanden ist.
Entfernen Sie zum Migrieren den context-1m-2025-08-07 Beta-Header aus Ihren Anforderungen. Für Workloads, die 1M-Kontext erfordern, migrieren Sie zu Claude Sonnet 4.6 (wobei 1M-Kontext allgemein verfügbar ist) oder zu Claude Opus 4.6 oder Claude Opus 4.7 für Workloads mit höherer Intelligenz.
Claude Sonnet 4.5 ist ein hochfähiges Modell, das für die Erstellung von realen Agenten entwickelt wurde und komplexe, langhorizonte Aufgaben verarbeitet. Es bietet eine starke Balance von Geschwindigkeit und Kosten für großvolumige Anwendungsfälle. Sonnet 4.5 bietet auch eine fortschrittliche Genauigkeit für die Computernutzung, sodass Entwickler Claude so leiten können, wie menschen es tun.
Claude Haiku 4.5 (Vorschau)
Claude Haiku 4.5 bietet Spitzenleistung für eine breite Palette von Anwendungsfällen. Es zeichnet sich als eines der besten Programmierungs- und Agentmodelle aus, mit der passenden Geschwindigkeit und den geeigneten Kosten für kostenlose Produkte und skalierte Subagenten.
Erweiterte Funktionen und Fähigkeiten von Claude-Modellen
Claude in Foundry Models unterstützt erweiterte Merkmale und Funktionen. Kernfunktionen verbessern die grundlegenden Fähigkeiten von Claude für die Verarbeitung, Analyse und Generierung von Inhalten in verschiedenen Formaten und Anwendungsfällen. Mit Tools kann Claude mit externen Systemen interagieren, Code ausführen und automatisierte Aufgaben über verschiedene Toolschnittstellen ausführen.
Einige der Kernfunktionen , die Foundry unterstützt, sind:
Großes Kontextfenster: Ein erweitertes Kontextfenster, das größere Dokumente und längere Unterhaltungen verarbeitet.
Agent-Fähigkeiten: Erweitern Sie Claudes Fähigkeiten mit Fähigkeiten.
Zitate: Claudes Antworten müssen in Quelldokumenten verankert sein.
Kontextbearbeitung: Verwalten Sie den Unterhaltungskontext automatisch mit konfigurierbaren Strategien.
Erweitertes Denken: Erweiterte Logikfunktionen für komplexe Aufgaben, die mit allen Claude-Modellen zur Verfügung stehen.
Tipp
Für Opus 4.6 und Sonnet 4.6 unterstützt der
thinkingParameter Typen:enabled, ,disabledundadaptive. Der Typadaptiveerlaubt es dem Modell, basierend auf der Abfragekomplexität und der Aufwandsebene zu entscheiden, ob es denken soll.Für Mythos Preview unterstützt der
thinkingParameter nuradaptiveundenabled.Für Opus 4.7 unterstützt der
thinkingParameter nuradaptiveunddisabled.Anstrengung: Möglichkeit, den Qualitäts-/Kosten-Kompromiss für Antworten zu kontrollieren.
Tipp
Der
effortParameter unterstützt Leistungsstufen:low, ,mediumundhigh. Für Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstütztmaxder Parameter auch den Leistungsgrad. Verwenden Sie diesen Parameter mit oder ohne Denken.PDF-Unterstützung: Verarbeiten und Analysieren von Text und visuellen Inhalten aus PDF-Dokumenten.
Zwischenspeichern von Aufforderungen: Geben Sie Claude mehr Hintergrundwissen und Beispielausgaben, um Kosten und Latenz zu reduzieren.
Einige der Tools , die Foundry unterstützt, sind:
- MCP-Connector: Stellen Sie eine direkte Verbindung mit Remote-MCP-Servern über die Nachrichten-API ohne einen separaten MCP-Client her.
- Speicher: Speichern und Abrufen von Informationen über Unterhaltungen hinweg. Erstellen Sie Wissensbasen im Laufe der Zeit, verwalten Sie den Projektkontext, und lernen Sie aus früheren Interaktionen.
- Web-Abruf: Abrufen vollständiger Inhalte aus angegebenen Webseiten und PDF-Dokumenten für eine eingehende Analyse.
Eine vollständige Liste der unterstützten Funktionen und Tools finden Sie in der Übersicht über die Features von Claude.
Agentensupport
- Microsoft Agent Framework unterstützt das Erstellen von Agents, die Claude-Modelle verwenden.
- Erstellen Sie benutzerdefinierte KI-Agents mit dem Claude Agent SDK.
API-Kontingente und -Grenzwerte
Wichtig
Derzeit sind nur Enterprise- und MCA-E-Abonnements für die Claude-Modellnutzung in Foundry berechtigt.
Claude Modelle in Foundry haben die folgenden Geschwindigkeitsgrenzwerte, gemessen in Token pro Minute (TPM) und Anforderungen pro Minute (RPM):
| Modell | Bereitstellungstyp | Standard-RPM | Standard-TPM | Enterprise und MCA-E RPM | Enterprise- und MCA-E-TPM |
|---|---|---|---|---|---|
| claude-opus-4-7 | Globaler Standard | 0 | 0 | 2.000 | 2,000,000 |
| claude-opus-4-6 | Globaler Standard | 0 | 0 | 2.000 | 2,000,000 |
| claude-opus-4-5 | Globaler Standard | 0 | 0 | 2.000 | 2,000,000 |
| claude-opus-4-1 | Globaler Standard | 0 | 0 | 2.000 | 2,000,000 |
| claude-sonnet-4-6 | Globaler Standard | 0 | 0 | 2.000 | 2,000,000 |
| claude-sonnet-4-5 | Globaler Standard | 0 | 0 | 4,000 | 2,000,000 |
| claude-haiku-4-5 | Globaler Standard | 0 | 0 | 4,000 | 4.000.000 |
Um Ihr Kontingent über die Standardgrenzwerte hinaus zu erhöhen, senden Sie eine Anforderung über das Anforderungsformular zur Erhöhung des Kontingents.
Bewährte Methoden für Zinslimits
So optimieren Sie Ihre Nutzung und vermeiden Sie eine Begrenzung der Rate:
- Implementieren Sie Wiederholungslogik: Behandeln von 429-Antworten mit exponentiellem Backoff.
- Batch-Anfragen: Kombinieren Sie nach Möglichkeit mehrere Anweisungen.
- Überwachen Sie die Verwendung: Verfolgen Sie Ihre Tokennutzung und Anforderungsmuster.
- Verwenden Sie geeignete Modelle: Wählen Sie das richtige Claude-Modell für Ihren Anwendungsfall aus.
Verantwortungsvolle KI-Überlegungen
Berücksichtigen Sie bei der Verwendung von Claude-Modellen in Gießerei die folgenden verantwortungsvollen KI-Praktiken:
Konfigurieren Sie die KI-Inhaltssicherheit während der Modell-Ableitung, da Foundry zur Bereitstellungszeit keine integrierte Inhaltsfilterung für Claude-Modelle bereitstellt.
Stellen Sie sicher, dass Ihre Anwendungen Anthropic zulässige Nutzungsrichtlinie einhalten. Weitere Informationen zu Sicherheitsbewertungen für Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 und Claude Haiku 4.5.
Bewährte Methoden
Befolgen Sie die folgenden bewährten Methoden beim Arbeiten mit Claude-Modellen in Foundry:
Modellauswahl
Wählen Sie das entsprechende Claude-Modell basierend auf Ihren spezifischen Anforderungen aus:
- Claude Mythos Preview: Für defensive Cybersicherheit, autonomes Codieren und langjährige Agenten.
- Claude Opus 4.7: Am besten geeignetes Modell für Codierung, Unternehmensworkflows und langfristige agentische Aufgaben.
- Claude Opus 4.6: Hochfähiges Modell zum Erstellen von Agenten, Codierung und Unternehmensworkflows.
- Claude Opus 4.5: Optimale Leistung für Codierung, Agents, Computernutzung und Unternehmensworkflows.
- Claude Opus 4.1: Komplexe Logik und Geschäftsanwendungen.
- Claude Sonnet 4.6: Grenzintelligenz im Maßstab für Codierung, Agenten und die meisten Anwendungsfälle.
- Claude Sonnet 4.5: Ausgewogene Leistung und Fähigkeiten, Produktionsabläufe.
- Claude Haiku 4.5: Geschwindigkeit und Kostenoptimierung, Verarbeitung mit hohem Volumen.
Prompt-Entwicklung
- Klare Anweisungen: Geben Sie bestimmte und detaillierte Eingabeaufforderungen an.
- Kontextverwaltung: Verwenden Sie das verfügbare Kontextfenster effektiv.
- Rollendefinitionen: Verwenden Sie Systemmeldungen, um die Rolle und das Verhalten des Assistenten zu definieren.
- Strukturierte Eingabeaufforderungen: Verwenden Sie eine konsistente Formatierung, um bessere Ergebnisse zu erzielen.
Kostenoptimierung
- Tokenverwaltung: Überwachen und Optimieren der Tokennutzung.
- Modellauswahl: Verwenden Sie das kostengünstigste Modell für Ihren Anwendungsfall.
- Zwischenspeichern: Implementieren Sie bei Bedarf explizite Eingabeaufforderungszwischenspeicherung .
- Batchverarbeitung anfordern: Kombinieren Sie nach Möglichkeit mehrere Anforderungen.
Problembehandlung
In der folgenden Tabelle sind häufige Fehler aufgeführt, wenn Sie mit Claude-Modellen in Foundry arbeiten, und deren Lösungen:
| Fehler | Ursache | Lösung |
|---|---|---|
| 401 Nicht autorisiert | Ungültiger oder abgelaufener API-Schlüssel oder ungültiger Entra ID Tokenbereich. | Überprüfen Sie, ob der API-Schlüssel korrekt ist. Bestätigen Sie für Entra ID, dass Sie den Bereich https://ai.azure.com/.default verwenden. |
| 403 Verboten | Unzureichende Berechtigungen für die Ressource oder das Abonnement. | Vergewissern Sie sich, dass Sie über die Rolle "Mitwirkender " oder "Besitzer " in der Ressourcengruppe verfügen. Stellen Sie für Entra ID sicher, dass die Rolle Cognitive Services User zugewiesen ist. |
| 404 nicht gefunden | Falsche Endpunkt-URL oder Bereitstellungsname. | Vergewissern Sie sich, dass Ihre Basis-URL dem Muster https://<resource-name>.services.ai.azure.com/anthropic folgt, und der Bereitstellungsname entspricht Ihrer Konfiguration. |
| 429 zu viele Anforderungen | Das Limit Ihrer Abonnementstufe wurde überschritten. | Implementieren Sie exponentielle Backoffs mit Wiederholungslogik. Erwägen Sie, die Anforderungshäufigkeit zu reduzieren oder eine Kontingenterhöhung anzufordern. |
| Fehler bei der Abonnementberechtigung | Nicht-Enterprise- oder nicht-MCA-E-Abonnement. | Claude-Modelle erfordern ein Enterprise- oder MCA-E-Abonnement. Details finden Sie unter API-Kontingente und -Grenzwerte . |
| Region nicht verfügbar | Die versuchte Bereitstellung erfolgte in einem nicht unterstützten Bereich. | Stellen Sie in ost-US2 oder Schweden Central, den unterstützten Regionen für Claude-Modelle, bereit. |