Importieren von benutzerdefinierten Modellen mit Feuerwerk (Vorschau)

Wichtig

In diesem Artikel markierte Elemente (Vorschau) befinden sich derzeit in der öffentlichen Vorschau. Diese Vorschau wird ohne Vereinbarung auf Serviceebene bereitgestellt und wird für Produktionsworkloads nicht empfohlen. Bestimmte Features werden möglicherweise nicht unterstützt oder weisen eingeschränkte Funktionen auf. Weitere Informationen finden Sie unter Supplementale Nutzungsbedingungen für Microsoft Azure Previews.

Importieren und bereitstellen Sie ihre eigenen Modellgewichte auf Foundry mithilfe der Feuerwerks-Ableitungslaufzeit.

In diesem Artikel erfahren Sie, wie Sie ihre eigenen benutzerdefinierten Modellgewichte in Microsoft Foundry importieren, registrieren und bereitstellen. Mit dem Import von benutzerdefinierten Modellen (auch bekannt als bring your own weights) können Sie Ihre proprietären oder fein abgestimmten Modelle mit offenen Gewichten im Foundry-Ökosystem ausführen.

Hinweis

Dieser benutzerdefinierte Modell-Import-Leitfaden verwendet "Fireworks on Foundry" für die Integration. Eine Übersicht über verfügbare Katalogmodelle, unterstützte Architekturen, Datenschutz und Einschränkungen finden Sie unter Verwenden von Feuerwerksmodellen in Foundry.

Der Importworkflow verfügt über vier Schritte:

Bereiten Sie Ihre Modelldateien in einer unterstützten Architektur vor.
Registrieren Sie das Modell im Foundry-Portal.
Hochladen Modellgewichte mithilfe der Azure Developer CLI.
Stellen Sie das Modell in der Fireworks Inferenzinfrastruktur bereit.

Voraussetzungen

Bevor Sie beginnen, stellen Sie sicher, dass Ihre Azure Umgebung eingerichtet ist und dass die erforderlichen Tools installiert sind. Zum Ausführen der Schritte in diesem Artikel benötigen Sie die folgenden Ressourcen und Berechtigungen:

Ein Azure-Abonnement. Wenn Sie kein Konto haben, erstellen Sie ein kostenloses Konto.
Eine Foundry-Ressource mit einem Foundry-Projekt.
Das Vorschau-Feature "Fireworks on Foundry" wurde in Ihrem Abonnement aktiviert. Die Einrichtungsschritte finden Sie unter Verwenden von Feuerwerksmodellen in Foundry.
Die Rolle " Cognitive Services-Mitwirkender" oder gleichwertige Berechtigungen für die Foundry-Ressource zum Erstellen und Verwalten von Bereitstellungen. Weitere Informationen finden Sie unter Azure rollenbasierte Zugriffssteuerung.
Azure Developer CLI (azd) lokal installiert. Der Importworkflow verwendet azd zum Hochladen von Modellgewichtungen.

Verfügbarkeit der Region

Die Unterstützung für die Bereitstellung von benutzerdefinierten Modellen ist in allen globalen Azure Regionen mit Ausnahme von Azure Government Cloudumgebungen verfügbar.

Modellanforderungen

Benutzerdefinierte Modelle müssen einer unterstützten Architektur entsprechen und bestimmte Dateien für Foundry einschließen, um sie zu registrieren und bereitzustellen. Überprüfen Sie beide Anforderungen, bevor Sie den Importvorgang starten.

Unterstützte Architekturen

Benutzerdefinierte Modelle müssen auf einer der folgenden Modellarchitekturen basieren:

Modellarchitektur	Versionen
DeepSeek	V3.1, V3.2
Kimi	K2, K2.5
GLM	4.7, 4.8
OpenAI	gpt-oss-120b
Qwen	qwen3-14b

Erforderliche Modelldateien

Ihr Modellverzeichnis muss die folgenden Dateien enthalten:

Datei	Beschreibung
`config.json`	Modellkonfiguration (Architektur, Hyperparameter).
`.safetensors` Oder `.bin`	Eine oder mehrere Modellgewichtungsdateien.
`*.index.json`	Mindestens eine Gewichtungsindexdatei, die Gewichtungsshards zuordnet.
`tokenizer.model`, `tokenizer.json`, oder `tokenizer_config.json`	Tokenizerdateien, die für das Modell erforderlich sind.

Wichtig

Nur Vollgewichtsmodelle mit ursprünglicher Quantisierung werden unterstützt. LoRA-Adapter oder benutzerdefinierte quantisierte Modelle werden in dieser Vorschau derzeit nicht unterstützt.

Importieren eines benutzerdefinierten Modells

Der Importvorgang beginnt im Foundry-Portal, in dem Sie Ihr Modell registrieren, und verwendet dann die Azure Developer CLI, um die Modellgewichte von Ihrem lokalen Computer hochzuladen.

Melden Sie sich beim Foundry-Portal an.
Wählen Sie auf der Startseite des Foundry-Portals " Erstellen" in der oberen rechten Navigation und dann im linken Bereich " Modelle" aus.
Wählen Sie die Registerkarte "Benutzerdefinierte Modelle " aus.
Wählen Sie "Benutzerdefiniertes Modell hinzufügen" aus.
Konfigurieren Sie die folgenden Einstellungen:
- Modellname: Geben Sie einen beschreibenden Namen für Ihr benutzerdefiniertes Modell ein.
- Basismodellarchitektur: Wählen Sie die Modellarchitektur aus, DeepSeek V3.2 die Ihrem Modell entspricht (z. B. oder GLM 4.7).
Das Portal generiert einen azd Befehl. Kopieren Sie den Befehl, und fügen Sie ihn in ein lokales Terminal ein. Aktualisieren Sie den --source Parameter so, dass er auf das Verzeichnis verweist, das Ihre Modellgewichtungsdateien enthält.

Tipp

Stellen Sie sicher, dass das angegebene Verzeichnis alle erforderlichen Modelldateien enthält. Fehlende Dateien führen dazu, dass der Import fehlschlägt.
Warten Sie, bis der Upload abgeschlossen ist. Die Uploadzeit hängt von der Modellgröße und der Netzwerkbandbreite ab. Große Modelle (zehn Gigabyte) können über Standardverbindungen eine erhebliche Zeit in Anspruch nehmen.

Überprüfen der Modellregistrierung

Vergewissern Sie sich nach Abschluss des Uploads, dass Foundry das Modell erfolgreich registriert hat, bevor Sie mit der Bereitstellung fortfahren.

Kehren Sie zum Foundry-Portal zurück, und aktualisieren Sie die Seite "Benutzerdefinierte Modelle ".
Vergewissern Sie sich, dass Ihr importiertes benutzerdefiniertes Modell in der Liste mit einem registrierten Status angezeigt wird.
Wählen Sie Ihr Modell aus, um die Details zu überprüfen, einschließlich der Architektur und des Dateimanifests.

Bereitstellen des importierten Modells

Mit dem registrierten Modell können Sie es zur Ableitung in der Feuerwerks-Cloud bereitstellen.

Wählen Sie in der Liste "Benutzerdefinierte Modelle " Ihr benutzerdefiniertes Modell aus.
Wählen Sie "Bereitstellen" aus.
Konfigurieren Sie die Bereitstellung:
- Bereitstellungsname: Geben Sie einen Bereitstellungsnamen an. Während der Ableitung wird dieser Name im model Parameter verwendet, um Anforderungen an diese Bereitstellung weiterzuleiten.
- Bereitgestellte Durchsatzeinheiten: Weisen Sie die Anzahl der bereitgestellten Durchsatzeinheiten (PTUs) für die Bereitstellung zu. Weitere Informationen finden Sie unter Bereitgestellte Durchsatzkonzepte.
Überprüfen und bestätigen Sie die Preisbedingungen.
Wählen Sie "Bereitstellen" aus.

Nach Abschluss der Bereitstellung wird der Status in der Bereitstellungsliste "Erfolgreich" angezeigt.

Hinweis

In einem bestimmten Projekt können Sie zu einem Zeitpunkt nur eine aktive Bereitstellung eines benutzerdefinierten Modells haben.

Bereitstellungsbeispiele

Verwenden Sie die folgenden Beispiele, um Teile des Bereitstellungsworkflows zu automatisieren, nachdem das benutzerdefinierte Modell registriert wurde. Jedes Beispiel implementiert das benutzerdefinierte Modell mit 80 Einheiten des globalen bereitgestellten Durchsatzes. Achten Sie darauf, alle Platzhalter durch Ihre Details zu ersetzen.

PUT https://management.azure.com/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/deployments/{deployment-name}?api-version=2025-06-01
Authorization: Bearer <access-token>
Content-Type: application/json

{
  "sku": {
    "name": "GlobalProvisionedManaged",
    "capacity": 80
  },
  "properties": {
    "model": {
      "name": "<registered-model-name>",
      "format": "FireworksCustom",
      "version": "1",
      "source": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}"
    }
  }
}

az cognitiveservices account deployment create `
  --name "<foundry-resource-name>" `
  --resource-group "<resource-group>" `
  --deployment-name "<deployment-name>" `
  --model-name "<registered-model-name>" `
  --model-version "1" `
  --model-format "FireworksCustom" `
  --model-source "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}" `
  --sku-name "GlobalProvisionedManaged" `
  --sku-capacity 80

az cognitiveservices account deployment create \
  --name "<foundry-resource-name>" \
  --resource-group "<resource-group>" \
  --deployment-name "<deployment-name>" \
  --model-name "<registered-model-name>" \
  --model-version "1" \
  --model-format "FireworksCustom" \
  --model-source "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.CognitiveServices/accounts/{foundry-account}/projects/{foundry-project}" \
  --sku-name "GlobalProvisionedManaged" \
  --sku-capacity 80

Testen Sie Ihre Bereitstellung

Nachdem die Bereitstellung erfolgreich war, überprüfen Sie, ob sie funktioniert, indem Sie eine Testanforderung senden:

Öffnen Sie den Foundry Playground.
Wählen Sie Ihre benutzerdefinierte Modellbereitstellung aus der Modellliste aus.
Senden Sie eine Testaufforderung, und bestätigen Sie, dass das Modell eine gültige Antwort zurückgibt.

Problembehandlung

Wenn während des Imports oder der Bereitstellung Probleme auftreten, verwenden Sie die folgende Tabelle, um häufige Probleme und Lösungen zu identifizieren.

Angelegenheit	Auflösung
Fehler beim Importieren mit fehlenden Dateien	Überprüfen Sie, ob Das Modellverzeichnis alle erforderlichen Modelldateien enthält, einschließlich `config.json`Gewichtungsdateien, einer Indexdatei und Tokenizerdateien.
Architekturinkongruenz	Vergewissern Sie sich, dass die ausgewählte Architektur Ihrem Modell entspricht. Siehe unterstützte Architekturen.
Zeitüberschreitungen oder Stillstand beim Hochladen	Überprüfen Sie Ihre Netzwerkverbindung, und versuchen Sie es erneut. Verwenden Sie für große Modelle eine stabile Verbindung mit hoher Bandbreite.
Bereitstellung schlägt fehl	Vergewissern Sie sich, dass Sie über ein ausreichendes Kontingent verfügen und dass das Feuerwerk-Vorschaufeature in Ihrem Abonnement aktiviert und registriert ist.
Kontingent überschritten	Fordern Sie ein höheres Kontingent an oder weisen Sie bereitgestellte Durchsatzeinheiten aus vorhandenen Bereitstellungen neu zu.

Weitere Anleitungen zur Problembehandlung finden Sie unter "Problemlösung für Fireworks auf Foundry".

Erkunden Sie die folgenden Ressourcen, um mehr über Feuerwerksmodelle, Bereitstellungsoptionen und Authentifizierung in Foundry zu erfahren.

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-30