Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
MAI-Image-2 und MAI-Image-2e sind Text-zu-Bild-Generierungsmodelle, die qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache erstellen.
In diesem Artikel erfahren Sie, wie Sie:
- Bereitstellen von MAI-Imagegenerierungsmodellen in Microsoft Foundry
- Authentifizieren mithilfe von Microsoft Entra ID oder API-Schlüsseln
- Generieren von Bildern mithilfe der MAI-Bildgenerierungs-API
Voraussetzungen
- Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Wenn Sie kein Azure-Abonnement haben, erstellen Sie ein paid Azure Konto.
- Zugriff auf Microsoft Foundry mit entsprechenden Berechtigungen zum Erstellen und Verwalten von Ressourcen.
- Ein Microsoft Foundry-Projekt. MAI-Image-2 und MAI-Image-2e sind für die globale Standardbereitstellung verfügbar (West Central US, Ost-USA, West-USA, Westeuropa, Schweden Zentral und Südindien).
- Die Rolle Cognitive Services Contributor auf der Azure AI Foundry Ressource, um Modelle bereitzustellen. Weitere Informationen finden Sie unter Azure RBAC-Rollen.
Bereitstellen von MAI-Imagegenerierungsmodellen
MAI-Image-2 und MAI-Image-2e sind für die globale Standardbereitstellung in West Central USA, Ost-USA, West-USA, Westeuropa, Schweden Mitte und Südindien verfügbar. Um ein Modell bereitzustellen, befolgen Sie die Anweisungen in Deploy Microsoft Foundry Models im Foundry-Portal.
Alternativ können Sie ein Modell mithilfe der Azure CLI bereitstellen. Der folgende Code zeigt die Bereitstellung von MAI-Image-2e. Wenn Sie stattdessen MAI-Image-2 bereitstellen möchten, ersetzen Sie es --model-name MAI-Image-2e durch --model-name MAI-Image-2 und --model-version 2026-04-09 durch .--model-version 2026-02-20
az cognitiveservices account deployment create \
--name <ACCOUNT_NAME> \
--resource-group <RESOURCE_GROUP> \
--deployment-name <DEPLOYMENT_NAME> \
--model-name MAI-Image-2e \
--model-format Microsoft \
--model-version 2026-04-09 \
--sku-name GlobalStandard \
--sku-capacity 1
Referenz:az cognitiveservices account deployment delete
Verwenden Sie nach der Bereitstellung den Foundry-Playground , um das Modell interaktiv mit Textaufforderungen zu testen.
Verfügbare MAI-Bildgenerierungsmodelle
Foundry unterstützt die Verwendung von MAI-Image-2 (Vorschau) und MAI-Image-2e (Vorschau). Jedes dieser Modelle verfügt über wichtige Funktionen, die Folgendes umfassen:
- Text-zu-Bild-Generierung: Generieren Sie qualitativ hochwertige Bilder aus Aufforderungen in natürlicher Sprache, sodass Benutzer Textbeschreibungen in visuell kohärente Ausgaben übersetzen können, die für eine breite Palette von Kreativen und Design-Anwendungsfällen geeignet sind.
- Photorealistische Bildsynthese: In der Lage, realistische Bilder mit konsistenter visueller Struktur zu generieren, sodass sie für Konzeptvisualisierungs- und Inhaltserstellungsszenarien geeignet ist.
- Produkt-, Branding- und kommerzielles Design: Gut geeignet für Produktbilder, Marketingvisuale, Markenobjekte und kommerzielle kreative Workflows.
Weitere Informationen zu den Modellfunktionen finden Sie unter Funktionen von Microsoft-Modellen in Foundry-Modelle, die direkt von Azure verkauft werden.
MAI-Image-2 (Vorschau)
MAI-Image-2 (Vorschau) ist ein Text-zu-Bild-Generierungsmodell, das entwickelt wurde, um qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache zu erstellen. Es verwendet einen diffusionsbasierten generativen Ansatz, um Bilder schrittweise zu verfeinern und eine starke Ausrichtung zwischen dem Eingabetext und der generierten Ausgabe zu ermöglichen. Das Modell ist optimiert, um vielfältige und kohärente Bilder in einer breiten Palette von kreativen und Designszenarien zu erzeugen, sodass es gut für Aufgaben wie Konzeptvisualisierung, kreative Inhaltsgenerierung und Bildentwurfsworkflows geeignet ist.
MAI-Image-2e (Vorschau)
MAI-Image-2e (Vorschau) bietet eine qualitativ hochwertige Bildgenerierung – genau wie MAI-Image-2 – aber bis zu 22% schneller und viermal effizienter als MAI-Image-2, wodurch es die intelligenteste Wahl für Entwickler ist, die im Maßstab erstellen. MAI-Image-2e eignet sich am besten für großvolumige, schnelle Bearbeitungsszenarien – z. B. Produktbilder im Maßstab, Marketingvariationen, Brandingobjekte oder workflows, bei denen Effizienz und Kosten pro Bild entscheidend sind.
Übersicht über die Bildgenerierung mit MAI-Bildgenerierungsmodellen
Nachdem Sie ein MAI-Imagegenerierungsmodell bereitgestellt haben, verwenden Sie die MAI-Imagegenerierungs-API , um Bilder zu generieren. Dies ist ein Microsoft verwalteter Endpunkt, der eine Textaufforderung akzeptiert und ein PNG-Bild zurückgibt.
API-Endpunkt
Der API-Endpunkt hat das folgende Formular:
https://<resource-name>.services.ai.azure.com/mai/v1/images/generations
Zum Authentifizieren benötigen Sie Ihren ressourcenendpunkt und entweder ein Microsoft Entra ID-Token oder einen API-Schlüssel. Sie finden diese Werte im Abschnitt Keys und Endpoint Ihrer Ressource im Azure-Portal oder auf der Seite mit den Bereitstellungsdetails im Foundry-Portal.
Modellfunktionen
Beide Modelle akzeptieren Texteingaben (32.000 Token) und geben ein PNG-Bild aus. Sowohl width als auch height müssen jeweils mindestens 768 Pixel betragen. Die Gesamtpixelanzahl (width × height) darf 1.048.576 nicht überschreiten (entspricht 1024×1024). Da die Einschränkung auf Gesamtpixel und nicht auf jeder Dimension einzeln liegt, kann eine Dimension 1024 überschreiten, solange die Gesamtmenge innerhalb des Grenzwerts bleibt. Ein Bild von 768×1365 hat beispielsweise 1.048.320 Gesamtpixel, die sich innerhalb der zulässigen maximalen Gesamtpixel befinden.
In der folgenden Tabelle sind die Anforderungsparameter aufgeführt:
| Parameter | Typ | Beschreibung |
|---|---|---|
model |
Schnur | Der Bereitstellungsname, den Sie beim Bereitstellen des Modells zugewiesen haben. |
prompt |
Schnur | Die Textaufforderung, die das zu generierende Bild beschreibt. Maximale Kontextlänge: 32.000 Token. |
width |
Ganzzahl | Breite des Ausgabebilds in Pixeln. Mindestwert: 768. Das Produkt von width × height darf 1.048.576 nicht überschreiten. |
height |
Ganzzahl | Höhe des Ausgabebilds in Pixeln. Mindestwert: 768. Das Produkt von width × height darf 1.048.576 nicht überschreiten. |
Hinweis
Das Ausgabeformat ist immer PNG. Die maximale Gesamtpixelanzahl beträgt 1.048.576 (entspricht 1024×1024). Sowohl width als auch height müssen jeweils mindestens 768 Pixel groß sein. Beide Dimensionen können 1024 überschreiten, solange die Gesamtpixelanzahl innerhalb des Grenzwerts bleibt.
Generieren von Bildern
Die folgenden Beispiele zeigen, wie Sie ein Bild aus einer Textaufforderung mithilfe von MAI-Bildgenerierungsmodellen mit der MAI-Bildgenerierungs-API generieren.
Verwenden der API-Schlüsselauthentifizierung
Installieren Sie die
requestsBibliothek:pip install requestsFestlegen von Umgebungsvariablen:
export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com" export AZURE_API_KEY="<your-api-key>" export DEPLOYMENT_NAME="<your-deployment-name>"Führen Sie den folgenden Code aus:
import os import base64 import requests endpoint = os.environ["AZURE_ENDPOINT"] api_key = os.environ["AZURE_API_KEY"] deployment_name = os.environ["DEPLOYMENT_NAME"] width = 1024 height = 1024 url = f"{endpoint}/mai/v1/images/generations" payload = { "model": deployment_name, "prompt": "A photorealistic image of a mountain lake at sunrise", "width": width, "height": height } response = requests.post( url, headers={ "Content-Type": "application/json", "api-key": api_key, }, json=payload, ) response.raise_for_status() result = response.json() print(result) image_data = [ output for output in result.get("data", []) if "b64_json" in output ] if image_data: image_base64 = image_data[0]["b64_json"] output_path = "output.png" with open(output_path, "wb") as f: f.write(base64.b64decode(image_base64)) print(f"Image saved to {output_path}") else: print("Unexpected response format:", result)Erwartete Ausgabe: Eine JSON-Antwort, die die generierten Bilddaten im Base64-Format enthält. Das Bild wird decodiert und als
output.pngim aktuellen Verzeichnis gespeichert.
Verwenden Sie die Microsoft Entra ID-Authentifizierung
Um Microsoft Entra ID anstelle eines API-Schlüssels zu verwenden, ersetzen Sie den header api-key durch ein Bearertoken, das mit dem DefaultAzureCredential abgerufen wird:
Installieren Sie die Azure Identity library:
pip install azure-identityAktualisieren Sie die Anforderungsheader im vorherigen Code:
from azure.identity import DefaultAzureCredential, get_bearer_token_provider token_provider = get_bearer_token_provider( DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default" ) token = token_provider() headers = { "Content-Type": "application/json", "Authorization": f"Bearer {token}", }Reference:DefaultAzureCredential
API-Kontingente und -Grenzwerte
MAI-Bildgenerierungsmodelle weisen die folgenden Geschwindigkeitsgrenzwerte auf, die in Anforderungen pro Minute (RPM) gemessen werden. Die für Sie verfügbare Stufe hängt von Ihrer Abonnement- und Bereitstellungskonfiguration ab.
| Bereitstellungstyp | Rang | MAI-Image-2e RPM | MAI-Image-2 U/min |
|---|---|---|---|
| Globaler Standard | 1 | 18 | 9 |
| Globaler Standard | 2 | 30 | 15 |
| Globaler Standard | 3 | 60 | 30 |
| Globaler Standard | 4 | 90 | 45 |
| Globaler Standard | 5 | 120 | 60 |
| Globaler Standard | 6 | 180 | 90 |
Um eine Kontingenterhöhung anzufordern, übermitteln Sie das Anforderungsformular für die Kontingenterhöhung. Anforderungen werden in der Reihenfolge verarbeitet, in der sie empfangen werden, und Priorität geht an Kunden, die ihre vorhandene Kontingentzuweisung aktiv verwenden.
Fehlerbehebung
Verwenden Sie die folgende Tabelle, um häufige Fehler beim Arbeiten mit MAI-Bildgenerierungsmodellen zu beheben:
| Fehler | Ursache | Behebung |
|---|---|---|
401 Unauthorized |
Ungültiger API-Schlüssel oder abgelaufenes Token | Generieren Sie den Schlüssel im Azure Portal neu. Stellen Sie für Entra ID Authentifizierung sicher, dass der Tokenbereich https://cognitiveservices.azure.com/.default ist. |
404 Not Found |
Falsche Bereitstellungsname oder Endpunkt-URL | Überprüfen Sie den Bereitstellungsnamen und den Endpunkt im Foundry-Portal unter "Bereitstellungen". |
400 Bad Request |
width oder height unter dem Minimum, oder die Gesamtpixelanzahl überschreitet das Maximum |
Stellen Sie sicher, dass width und height jeweils mindestens 768 sind und dass width × height weniger als oder gleich 1.048.576 ist. |
429 Too Many Requests |
Ratelimit überschritten | Warten Und wiederholen Sie den Vorgang, oder fordern Sie eine Kontingenterhöhung an. |
Verantwortungsvolle KI-Überlegungen
Berücksichtigen Sie bei der Verwendung von MAI-Bildgenerierungsmodellen in Foundry die folgenden verantwortungsvollen KI-Praktiken:
- Beachten Sie bekannte Einschränkungen: Trotz technischer Maßnahmen zur Entschärfung, wie Datenfilterung und Inhaltsklassifizierung, die auf Systemebene implementiert werden, können Bildgenerierungsmodelle schädliche oder unerwartete Inhalte basierend auf Benutzeranforderungen erzeugen. Häufige Risikobereiche sind gewaltsame oder blutrünstige Inhalte, sexuelle Inhalte oder Nacktheit, Darstellungen öffentlicher Personen und Replikation von Markenmaterialien oder anderen geschützten Materialien.
- Konfigurieren Sie die Sicherheit von Inhalten: Wenden Sie zusätzliche Gegenmaßnahmen an, die für Ihren Anwendungsfall geeignet sind, da kein generatives Modell gegen adversariale Eingabeaufforderungen immun ist.
- Einhaltung der geltenden Bedingungen: Stellen Sie sicher, dass Ihre Verwendung der generierten Bilder mit den Dienstleistungsbedingungen von Microsoft sowie den geltenden Urheberrechts- und geistigen Eigentumsgesetzen übereinstimmt.
- Seien Sie transparent: Geben Sie an, dass der Inhalt bei der Freigabe oder Veröffentlichung von Bildern KI-generiert ist.
- Vermeiden Sie schädliche Inhalte: Generieren Sie keine Inhalte, die schädlich, irreführend oder verletzung der Privatsphäre sein könnten.