Bereitstellen und Verwenden von MAI-Modellen in Microsoft Foundry (Vorschau)

MAI-Image-2 und MAI-Image-2e sind Text-zu-Bild-Generierungsmodelle, die qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache erstellen.

In diesem Artikel erfahren Sie, wie Sie:

Bereitstellen von MAI-Imagegenerierungsmodellen in Microsoft Foundry
Authentifizieren mithilfe von Microsoft Entra ID oder API-Schlüsseln
Generieren von Bildern mithilfe der MAI-Bildgenerierungs-API

Voraussetzungen

Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Wenn Sie kein Azure-Abonnement haben, erstellen Sie ein paid Azure Konto.
Zugriff auf Microsoft Foundry mit entsprechenden Berechtigungen zum Erstellen und Verwalten von Ressourcen.
Ein Microsoft Foundry-Projekt. MAI-Image-2 und MAI-Image-2e sind für die globale Standardbereitstellung verfügbar (West Central US, Ost-USA, West-USA, Westeuropa, Schweden Zentral und Südindien).
Die Rolle Cognitive Services Contributor auf der Azure AI Foundry Ressource, um Modelle bereitzustellen. Weitere Informationen finden Sie unter Azure RBAC-Rollen.

Bereitstellen von MAI-Imagegenerierungsmodellen

MAI-Image-2 und MAI-Image-2e sind für die globale Standardbereitstellung in West Central USA, Ost-USA, West-USA, Westeuropa, Schweden Mitte und Südindien verfügbar. Um ein Modell bereitzustellen, befolgen Sie die Anweisungen in Deploy Microsoft Foundry Models im Foundry-Portal.

Alternativ können Sie ein Modell mithilfe der Azure CLI bereitstellen. Der folgende Code zeigt die Bereitstellung von MAI-Image-2e. Wenn Sie stattdessen MAI-Image-2 bereitstellen möchten, ersetzen Sie es --model-name MAI-Image-2e durch --model-name MAI-Image-2 und --model-version 2026-04-09 durch .--model-version 2026-02-20

az cognitiveservices account deployment create \
  --name <ACCOUNT_NAME> \
  --resource-group <RESOURCE_GROUP> \
  --deployment-name <DEPLOYMENT_NAME> \
  --model-name MAI-Image-2e \
  --model-format Microsoft \
  --model-version 2026-04-09 \
  --sku-name GlobalStandard \
  --sku-capacity 1

Referenz:az cognitiveservices account deployment delete

Verwenden Sie nach der Bereitstellung den Foundry-Playground , um das Modell interaktiv mit Textaufforderungen zu testen.

Verfügbare MAI-Bildgenerierungsmodelle

Foundry unterstützt die Verwendung von MAI-Image-2 (Vorschau) und MAI-Image-2e (Vorschau). Jedes dieser Modelle verfügt über wichtige Funktionen, die Folgendes umfassen:

Text-zu-Bild-Generierung: Generieren Sie qualitativ hochwertige Bilder aus Aufforderungen in natürlicher Sprache, sodass Benutzer Textbeschreibungen in visuell kohärente Ausgaben übersetzen können, die für eine breite Palette von Kreativen und Design-Anwendungsfällen geeignet sind.
Photorealistische Bildsynthese: In der Lage, realistische Bilder mit konsistenter visueller Struktur zu generieren, sodass sie für Konzeptvisualisierungs- und Inhaltserstellungsszenarien geeignet ist.
Produkt-, Branding- und kommerzielles Design: Gut geeignet für Produktbilder, Marketingvisuale, Markenobjekte und kommerzielle kreative Workflows.

Weitere Informationen zu den Modellfunktionen finden Sie unter Funktionen von Microsoft-Modellen in Foundry-Modelle, die direkt von Azure verkauft werden.

MAI-Image-2 (Vorschau)

MAI-Image-2 (Vorschau) ist ein Text-zu-Bild-Generierungsmodell, das entwickelt wurde, um qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache zu erstellen. Es verwendet einen diffusionsbasierten generativen Ansatz, um Bilder schrittweise zu verfeinern und eine starke Ausrichtung zwischen dem Eingabetext und der generierten Ausgabe zu ermöglichen. Das Modell ist optimiert, um vielfältige und kohärente Bilder in einer breiten Palette von kreativen und Designszenarien zu erzeugen, sodass es gut für Aufgaben wie Konzeptvisualisierung, kreative Inhaltsgenerierung und Bildentwurfsworkflows geeignet ist.

MAI-Image-2e (Vorschau)

MAI-Image-2e (Vorschau) bietet eine qualitativ hochwertige Bildgenerierung – genau wie MAI-Image-2 – aber bis zu 22% schneller und viermal effizienter als MAI-Image-2, wodurch es die intelligenteste Wahl für Entwickler ist, die im Maßstab erstellen. MAI-Image-2e eignet sich am besten für großvolumige, schnelle Bearbeitungsszenarien – z. B. Produktbilder im Maßstab, Marketingvariationen, Brandingobjekte oder workflows, bei denen Effizienz und Kosten pro Bild entscheidend sind.

Übersicht über die Bildgenerierung mit MAI-Bildgenerierungsmodellen

Nachdem Sie ein MAI-Imagegenerierungsmodell bereitgestellt haben, verwenden Sie die MAI-Imagegenerierungs-API , um Bilder zu generieren. Dies ist ein Microsoft verwalteter Endpunkt, der eine Textaufforderung akzeptiert und ein PNG-Bild zurückgibt.

API-Endpunkt

Der API-Endpunkt hat das folgende Formular:

https://<resource-name>.services.ai.azure.com/mai/v1/images/generations

Zum Authentifizieren benötigen Sie Ihren ressourcenendpunkt und entweder ein Microsoft Entra ID-Token oder einen API-Schlüssel. Sie finden diese Werte im Abschnitt Keys und Endpoint Ihrer Ressource im Azure-Portal oder auf der Seite mit den Bereitstellungsdetails im Foundry-Portal.

Modellfunktionen

Beide Modelle akzeptieren Texteingaben (32.000 Token) und geben ein PNG-Bild aus. Sowohl width als auch height müssen jeweils mindestens 768 Pixel betragen. Die Gesamtpixelanzahl (width × height) darf 1.048.576 nicht überschreiten (entspricht 1024×1024). Da die Einschränkung auf Gesamtpixel und nicht auf jeder Dimension einzeln liegt, kann eine Dimension 1024 überschreiten, solange die Gesamtmenge innerhalb des Grenzwerts bleibt. Ein Bild von 768×1365 hat beispielsweise 1.048.320 Gesamtpixel, die sich innerhalb der zulässigen maximalen Gesamtpixel befinden.

In der folgenden Tabelle sind die Anforderungsparameter aufgeführt:

Parameter	Typ	Beschreibung
`model`	Schnur	Der Bereitstellungsname, den Sie beim Bereitstellen des Modells zugewiesen haben.
`prompt`	Schnur	Die Textaufforderung, die das zu generierende Bild beschreibt. Maximale Kontextlänge: 32.000 Token.
`width`	Ganzzahl	Breite des Ausgabebilds in Pixeln. Mindestwert: 768. Das Produkt von `width` × `height` darf 1.048.576 nicht überschreiten.
`height`	Ganzzahl	Höhe des Ausgabebilds in Pixeln. Mindestwert: 768. Das Produkt von `width` × `height` darf 1.048.576 nicht überschreiten.

Hinweis

Das Ausgabeformat ist immer PNG. Die maximale Gesamtpixelanzahl beträgt 1.048.576 (entspricht 1024×1024). Sowohl width als auch height müssen jeweils mindestens 768 Pixel groß sein. Beide Dimensionen können 1024 überschreiten, solange die Gesamtpixelanzahl innerhalb des Grenzwerts bleibt.

Generieren von Bildern

Die folgenden Beispiele zeigen, wie Sie ein Bild aus einer Textaufforderung mithilfe von MAI-Bildgenerierungsmodellen mit der MAI-Bildgenerierungs-API generieren.

Python
REST-API

Verwenden der API-Schlüsselauthentifizierung

Installieren Sie die requests Bibliothek:
```
pip install requests
```

Festlegen von Umgebungsvariablen:

export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com"
export AZURE_API_KEY="<your-api-key>"
export DEPLOYMENT_NAME="<your-deployment-name>"

Führen Sie den folgenden Code aus:

import os
import base64
import requests

endpoint = os.environ["AZURE_ENDPOINT"]
api_key = os.environ["AZURE_API_KEY"]
deployment_name = os.environ["DEPLOYMENT_NAME"]

width = 1024
height = 1024

url = f"{endpoint}/mai/v1/images/generations"

payload = {
    "model": deployment_name,
    "prompt": "A photorealistic image of a mountain lake at sunrise",
    "width": width,
    "height": height
}

response = requests.post(
    url,
    headers={
        "Content-Type": "application/json",
        "api-key": api_key,
    },
    json=payload,
)
response.raise_for_status()

result = response.json()
print(result)

image_data = [
    output
    for output in result.get("data", [])
    if "b64_json" in output
]

if image_data:
    image_base64 = image_data[0]["b64_json"]
    output_path = "output.png"
    with open(output_path, "wb") as f:
        f.write(base64.b64decode(image_base64))
    print(f"Image saved to {output_path}")
else:
    print("Unexpected response format:", result)

Erwartete Ausgabe: Eine JSON-Antwort, die die generierten Bilddaten im Base64-Format enthält. Das Bild wird decodiert und als output.png im aktuellen Verzeichnis gespeichert.

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Um Microsoft Entra ID anstelle eines API-Schlüssels zu verwenden, ersetzen Sie den header api-key durch ein Bearertoken, das mit dem DefaultAzureCredential abgerufen wird:

Installieren Sie die Azure Identity library:
```
pip install azure-identity
```

Aktualisieren Sie die Anforderungsheader im vorherigen Code:

from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
token = token_provider()

headers = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {token}",
}

Reference:DefaultAzureCredential

Verwenden der API-Schlüsselauthentifizierung

Exportieren Sie Ihren Endpunkt- und API-Schlüssel, und führen Sie dann den folgenden cURL-Befehl aus:

export AZURE_API_KEY="<your-api-key>"
export DEPLOYMENT_NAME="<your-deployment-name>"

curl -X POST "https://<resource-name>.services.ai.azure.com/mai/v1/images/generations" \
  -H "Content-Type: application/json" \
  -H "api-key: $AZURE_API_KEY" \
  -d '{
      "model": "'"$DEPLOYMENT_NAME"'",
      "prompt": "A photorealistic image of a mountain lake at sunrise",
      "width": 1024,
      "height": 1024
    }' \
  | jq -r '.data[0].b64_json' \
  | base64 --decode > output.png

Erwartete Ausgabe: Eine JSON-Antwort, die die generierten Bilddaten im Base64-Format enthält. Das Bild wird decodiert und als output.png im aktuellen Verzeichnis gespeichert.

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Ersetzen Sie die api-key Kopfzeile durch eine Authorization Kopfzeile:

-H "Authorization: Bearer $AZURE_AUTH_TOKEN"

AZURE_AUTH_TOKEN ist ein gültiges Microsoft Entra ID-Token, das auf https://cognitiveservices.azure.com/.default ausgerichtet ist.

API-Kontingente und -Grenzwerte

MAI-Bildgenerierungsmodelle weisen die folgenden Geschwindigkeitsgrenzwerte auf, die in Anforderungen pro Minute (RPM) gemessen werden. Die für Sie verfügbare Stufe hängt von Ihrer Abonnement- und Bereitstellungskonfiguration ab.

Bereitstellungstyp	Rang	MAI-Image-2e RPM	MAI-Image-2 U/min
Globaler Standard	1	18	9
Globaler Standard	2	30	15
Globaler Standard	3	60	30
Globaler Standard	4	90	45
Globaler Standard	5	120	60
Globaler Standard	6	180	90

Um eine Kontingenterhöhung anzufordern, übermitteln Sie das Anforderungsformular für die Kontingenterhöhung. Anforderungen werden in der Reihenfolge verarbeitet, in der sie empfangen werden, und Priorität geht an Kunden, die ihre vorhandene Kontingentzuweisung aktiv verwenden.

Fehlerbehebung

Verwenden Sie die folgende Tabelle, um häufige Fehler beim Arbeiten mit MAI-Bildgenerierungsmodellen zu beheben:

Fehler	Ursache	Behebung
`401 Unauthorized`	Ungültiger API-Schlüssel oder abgelaufenes Token	Generieren Sie den Schlüssel im Azure Portal neu. Stellen Sie für Entra ID Authentifizierung sicher, dass der Tokenbereich `https://cognitiveservices.azure.com/.default` ist.
`404 Not Found`	Falsche Bereitstellungsname oder Endpunkt-URL	Überprüfen Sie den Bereitstellungsnamen und den Endpunkt im Foundry-Portal unter "Bereitstellungen".
`400 Bad Request`	`width` oder `height` unter dem Minimum, oder die Gesamtpixelanzahl überschreitet das Maximum	Stellen Sie sicher, dass `width` und `height` jeweils mindestens 768 sind und dass `width` × `height` weniger als oder gleich 1.048.576 ist.
`429 Too Many Requests`	Ratelimit überschritten	Warten Und wiederholen Sie den Vorgang, oder fordern Sie eine Kontingenterhöhung an.

Verantwortungsvolle KI-Überlegungen

Berücksichtigen Sie bei der Verwendung von MAI-Bildgenerierungsmodellen in Foundry die folgenden verantwortungsvollen KI-Praktiken:

Beachten Sie bekannte Einschränkungen: Trotz technischer Maßnahmen zur Entschärfung, wie Datenfilterung und Inhaltsklassifizierung, die auf Systemebene implementiert werden, können Bildgenerierungsmodelle schädliche oder unerwartete Inhalte basierend auf Benutzeranforderungen erzeugen. Häufige Risikobereiche sind gewaltsame oder blutrünstige Inhalte, sexuelle Inhalte oder Nacktheit, Darstellungen öffentlicher Personen und Replikation von Markenmaterialien oder anderen geschützten Materialien.
Konfigurieren Sie die Sicherheit von Inhalten: Wenden Sie zusätzliche Gegenmaßnahmen an, die für Ihren Anwendungsfall geeignet sind, da kein generatives Modell gegen adversariale Eingabeaufforderungen immun ist.
Einhaltung der geltenden Bedingungen: Stellen Sie sicher, dass Ihre Verwendung der generierten Bilder mit den Dienstleistungsbedingungen von Microsoft sowie den geltenden Urheberrechts- und geistigen Eigentumsgesetzen übereinstimmt.
Seien Sie transparent: Geben Sie an, dass der Inhalt bei der Freigabe oder Veröffentlichung von Bildern KI-generiert ist.
Vermeiden Sie schädliche Inhalte: Generieren Sie keine Inhalte, die schädlich, irreführend oder verletzung der Privatsphäre sein könnten.

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-29

Bereitstellen und Verwenden von MAI-Modellen in Microsoft Foundry (Vorschau)

Voraussetzungen

Bereitstellen von MAI-Imagegenerierungsmodellen

Verfügbare MAI-Bildgenerierungsmodelle

MAI-Image-2 (Vorschau)

MAI-Image-2e (Vorschau)

Übersicht über die Bildgenerierung mit MAI-Bildgenerierungsmodellen

API-Endpunkt

Modellfunktionen

Generieren von Bildern

Verwenden der API-Schlüsselauthentifizierung

Verwenden Sie die Microsoft Entra ID-Authentifizierung

API-Kontingente und -Grenzwerte

Fehlerbehebung

Verantwortungsvolle KI-Überlegungen

Verwandte Inhalte

Feedback

Zusätzliche Ressourcen