Bereitstellen eines Flusses für echtzeitbasierte Ableitung (klassisch)

Gilt nur für:klassisches Foundry Portal. Dieser Artikel ist für das neue Foundry-Portal nicht verfügbar. Erfahren Sie mehr über das neue Portal.

Hinweis

Links in diesem Artikel können Inhalte in der neuen Microsoft Foundry-Dokumentation anstelle der jetzt angezeigten Foundry-Dokumentation (klassisch) öffnen.

Warnung

Die Entwicklung der Prompt Flow-Funktion endete am 20. April 2026. Das Feature wird am 20. April 2027 vollständig eingestellt. Am Ruhestandsdatum wechselt Prompt Flow in den schreibgeschützten Modus. Ihre vorhandenen Workflows werden bis zu diesem Datum weiterhin ausgeführt.

Recommended action: Migrieren Sie Ihre Prompt Flow-Arbeitslasten bis spätestens zum 20. April 2027 zu Microsoft Agent Framework.

Nachdem Sie einen Eingabeaufforderungsfluss erstellt und getestet haben, können Sie ihn als Onlineendpunkt bereitstellen. Bereitstellungen werden in einem Endpunkt gehostet. Sie können Daten von Clients empfangen und Antworten in Echtzeit senden.

Sie können den Endpunkt für die Echtzeit-Ableitung für Chat, einen Copilot oder eine andere generative KI-Anwendung aufrufen. Prompt-Flows unterstützen die Endpunktbereitstellung aus einem Flow oder einem Massen-Testlauf.

In diesem Artikel erfahren Sie, wie Sie einen Fluss als verwalteten Onlineendpunkt für die Echtzeit-Ableitung bereitstellen.

  • Testen Sie Ihren Ablauf, und bereiten Sie ihn für die Bereitstellung bereit.
  • Erstellen Sie eine Online-Bereitstellung.
  • Erteilen von Berechtigungen für den Endpunkt.
  • Testen Sie den Endpunkt.
  • Nutzen Sie den Endpunkt.

Voraussetzungen

Wichtig

Dieser Artikel bietet Unterstützung älterer Systeme für hub-basierte Projekte. Es funktioniert nicht für Foundry-Projekte. Sehen Sie , wie Sie wissen, welche Art von Projekt Sie haben?

SDK-Kompatibilitätshinweis: Codebeispiele erfordern eine bestimmte Microsoft Foundry SDK-Version. Wenn Kompatibilitätsprobleme auftreten, sollten Sie die Migration von einem hubbasierten zu einem Foundry-Projekt in Betracht ziehen.

Um einen Eingabeaufforderungsfluss als Onlineendpunkt bereitzustellen, benötigen Sie Folgendes:

  • Ein Azure-Abonnement. Wenn Sie nicht über ein Azure-Abonnement verfügen, erstellen Sie ein free-Konto.
  • Ein Microsoft Foundry-Projekt.
  • Ein in Ihrem Abonnement registrierter Microsoft.PolicyInsights-Ressourcenanbieter. Weitere Informationen finden Sie unter Registrieren eines Ressourcenanbieters.

Online-Bereitstellung erstellen

Nachdem Sie einen Fluss erstellt und getestet haben, erstellen Sie Ihren Onlineendpunkt für die Echtzeit-Ableitung.

So stellen Sie einen Prompt-Flow als Online-Endpunkt im Foundry-Portal bereit:

  1. Bereiten Sie einen Ablauf für die Bereitstellung vor. Wenn Sie keinen haben, lesen Sie " Entwickeln eines Eingabeaufforderungsflusses".

  2. Optional: Wählen Sie "Chat" aus, um zu testen, ob der Fluss ordnungsgemäß funktioniert. Es wird empfohlen, den Ablauf vor der Bereitstellung zu testen.

  3. Wählen Sie "Bereitstellen" im Fluss-Editor aus.

    Screenshot der Schaltfläche

  4. Geben Sie auf der Seite "Standardeinstellungen " die erforderlichen Informationen an.

    Screenshot der Seite

  5. Wählen Sie "Überprüfen" und "Erstellen" aus. Oder wählen Sie "Weiter" aus, um zu den Seiten mit erweiterten Einstellungen zu gelangen, die für diesen Artikel nicht erforderlich sind.

  6. Wählen Sie "Erstellen" aus, um den Eingabeaufforderungsfluss bereitzustellen.

  7. Um den Status Ihrer Bereitstellung anzuzeigen, wählen Sie "Modelle + Endpunkte " im linken Bereich aus. Nachdem die Bereitstellung erfolgreich erstellt wurde, wählen Sie die Bereitstellung aus, um weitere Informationen anzuzeigen.

    Screenshot, der den status der Bereitstellung in Bearbeitung zeigt.

  8. Wählen Sie die Registerkarte " Nutzen " aus, um Codebeispiele anzuzeigen, mit denen Sie das bereitgestellte Modell in Ihrer Anwendung nutzen können.

    Auf dieser Seite können Sie auch die Endpunkt-URL sehen, die Sie verwenden können, um den Endpunkt zu nutzen.

    Screenshot der Bereitstellungsdetailseite.

  9. Sie können den REST-Endpunkt direkt verwenden oder mit einem der hier gezeigten Beispiele beginnen.

    Screenshot, der den Bereitstellungsendpunkt und Codebeispiele zeigt.

Informationen zum Bereitstellen eines Basismodells finden Sie unter Bereitstellen von Modellen mit Foundry.

Einstellungen und Konfigurationen

Anforderungstextdatei

Optionalerweise können Sie zusätzliche Pakete angeben, die Sie in requirements.txt benötigen. Sie finden requirements.txt im Stammverzeichnis Ihres Flow-Ordners. Wenn Sie in der Benutzeroberfläche einen Prompt-Flow auf einem verwalteten Online-Endpunkt bereitstellen, verwendet die Bereitstellung standardmäßig die Umgebung, die basierend auf dem im flow.dag.yaml angegebenen Basis-Image und den im requirements.txt angegebenen Abhängigkeiten erstellt wurde.

Das in flow.dag.yaml angegebene Basisbild wird basierend auf dem Prompt-Flow-Basisbild mcr.microsoft.com/azureml/promptflow/promptflow-runtime-stable:<newest_version> erstellt. Die neueste Version finden Sie in dieser Liste. Wenn Sie das Basisimage flow.dag.yamlnicht angeben, verwendet die Bereitstellung das Standardbasisimage mcr.microsoft.com/azureml/promptflow/promptflow-runtime-stable:latest.

Screenshot, der das Basisbild in der unformatierten Yaml-Datei des Flusses angibt.

Grundlegende Einstellungen

In diesem Schritt konfigurieren Sie die grundlegenden Einstellungen, wenn Sie "Bereitstellen" im Flow-Editor auswählen.

Eigenschaft Beschreibung
Endpunkt Wählen Sie aus, ob Sie einen neuen Endpunkt bereitstellen oder einen vorhandenen Endpunkt aktualisieren möchten.
Wenn Sie "Neu" auswählen, müssen Sie den Endpunktnamen angeben.
Bereitstellungsname – Im selben Endpunkt muss der Bereitstellungsname eindeutig sein.
– Wenn Sie einen vorhandenen Endpunkt auswählen und einen vorhandenen Bereitstellungsnamen eingeben, wird diese Bereitstellung mit den neuen Konfigurationen überschrieben.
Virtueller Computer Die Größe des virtuellen Computers, die für die Bereitstellung verwendet werden soll.
Instanzanzahl Die Anzahl der Instanzen, die für die Bereitstellung verwendet werden sollen. Geben Sie den Wert für die erwartete Arbeitsauslastung an. Für hohe Verfügbarkeit wird empfohlen, den Wert auf mindestens 3festzulegen. Wir reservieren zusätzliche 20% für die Durchführung von Upgrades.
Ableitungsdatensammlung Wenn Sie diese Einstellung aktivieren, werden die Flusseingaben und -ausgaben in einer Azure Machine Learning Datenressource automatisch erfasst. Sie können sie für eine spätere Überwachung verwenden.

Nachdem Sie die grundlegenden Einstellungen abgeschlossen haben, wählen Sie "Überprüfen" und "Erstellen" aus, um die Erstellung abzuschließen. Sie können auch "Weiter" auswählen, um erweiterte Einstellungen zu konfigurieren.

Erweiterte Einstellungen: Endpunkt

Sie können die folgenden Einstellungen für den Endpunkt angeben.

Screenshot der erweiterten Endpunkteinstellungen.

Im Workflow für erweiterte Einstellungen können Sie auch Bereitstellungstags angeben und eine benutzerdefinierte Umgebung auswählen.

Screenshot der erweiterten Bereitstellungseinstellungen.

Authentifizierungstyp

Diese Einstellung identifiziert die Authentifizierungsmethode für den Endpunkt. Die schlüsselbasierte Authentifizierung stellt einen primären und sekundären Schlüssel bereit, der nicht abläuft. Azure Machine Learning tokenbasierte Authentifizierung stellt ein Token bereit, das regelmäßig aktualisiert wird.

Identitätstyp

Der Endpunkt muss auf Azure Ressourcen für die Ableitung zugreifen, z. B. Azure Container Registry oder Ihre Foundry Hub-Verbindungen. Sie können dem Endpunkt die Berechtigung erteilen, auf Azure-Ressourcen zuzugreifen, indem Sie seiner verwalteten Identität die Erlaubnis geben.

Die vom System zugewiesene Identität wird erstellt, nachdem Ihr Endpunkt erstellt wurde. Der Benutzer erstellt die vom Benutzer zugewiesene Identität. Weitere Informationen finden Sie unter Managed identities for Azure resources.

System zugewiesen

Die Option "Zugriff auf geheime Verbindungsschlüssel erzwingen" (Vorschau) ist standardmäßig aktiviert. Wenn Ihr Fluss Verbindungen verwendet, muss der Endpunkt auf Verbindungen zugreifen, um eine Ableitung durchzuführen.

Wenn Sie über die Berechtigung "Connection Secrets Reader" verfügen, wird dem Endpunkt Zugriff auf die Rolle "Azure Machine Learning Workspace Connection Secrets Reader" gewährt, um auf Verbindungen zugreifen zu können. Wenn Sie diese Option deaktivieren, müssen Sie dieser Rolle die vom System zugewiesene Identität manuell erteilen oder Ihren Administrator um Hilfe bitten. Weitere Informationen finden Sie unter Erteilen der Berechtigung für die Endpunktidentität.

Zugewiesener Benutzer

Wenn Sie die Bereitstellung erstellen, versucht Azure, das Benutzercontainer-Image aus der Container-Registry des Foundry-Hubs zu ziehen und das Benutzermodell sowie die Code-Artefakte aus dem Speicherkonto des Hubs in den Benutzercontainer einzuhängen.

Wenn Sie den zugehörigen Endpunkt mit der Option " Benutzer zugewiesene Identität " erstellen, erteilen Sie der vom Benutzer zugewiesenen Identität die folgenden Rollen, bevor Sie die Bereitstellung erstellen. Andernfalls schlägt die Bereitstellungserstellung fehl.

Umfang Rolle Warum es erforderlich ist
Gießereiprojekt Azure Machine Learning Workspace Connection Secrets Reader Rolle oder eine angepasste Rolle mit Microsoft.MachineLearningServices/workspaces/connections/listsecrets/action Ruft Projektverbindungen ab.
Gießereiprojektcontainerregistrierung ACR Pull Ruft Container-Images ab.
Standardspeicher des Foundry-Projekts Speicher-Blob-Datenleser Lädt ein Modell aus dem Speicher.
Gießereiprojekt Azure Machine Learning Metrics Writer (Vorschau) Wenn Sie nach der Bereitstellung des Endpunkts die endpunktbezogenen Metriken wie CPU/GPU/Disk/Memory-Auslastung überwachen möchten, erteilen Sie diese Berechtigung der Identität.

Fakultativ.

Weitere Informationen zum Erteilen von Berechtigungen für die Endpunktidentität finden Sie unter Erteilen von Berechtigungen für den Endpunkt.

Wichtig

Wenn Ihr Flow Authentifizierungsverbindungen basierend auf Microsoft Entra ID verwendet, müssen Sie der verwalteten Identität immer die entsprechenden Rollen für die entsprechenden Ressourcen erteilen, damit sie API-Aufrufe an diese Ressource durchführen kann. Diese Konfiguration ist erforderlich, unabhängig davon, ob Sie die vom System zugewiesene Identität oder die vom Benutzer zugewiesene Identität verwenden.

Wenn Ihre Azure OpenAI-Verbindung beispielsweise Microsoft Entra ID-basierte Authentifizierung verwendet, müssen Sie Ihrer endpunktverwalteten Identität die OpenAI User- oder Cognitive Services OpenAI-Mitwirkenderolle der entsprechenden Azure OpenAI-Ressourcen gewähren.

Erweiterte Einstellungen: Ausgaben und Verbindungen

In diesem Schritt können Sie alle Ablaufausgaben anzeigen und angeben, welche Ausgaben in die Antwort des von Ihnen bereitgestellten Endpunkts eingeschlossen werden sollen. Standardmäßig sind alle Flussausgaben ausgewählt.

Sie können auch die Verbindungen angeben, die der Endpunkt verwendet, wenn er eine Inferenz durchführt. Standardmäßig erbt der Endpunkt die Verbindungen vom Fluss.

Nachdem Sie alle vorherigen Schritte konfiguriert und überprüft haben, wählen Sie "Überprüfen" und "Erstellen" aus, um die Erstellung abzuschließen.

Erwarten Sie, dass die Endpunkterstellung mehr als 15 Minuten dauert. Die Phasen umfassen das Erstellen eines Endpunkts, das Registrieren eines Modells und das Erstellen einer Bereitstellung.

Der Fortschritt bei der Erstellung der Bereitstellung sendet eine Benachrichtigung, die mit Bereitstellung des Prompt Flows beginnt.

Aktivieren der Ablaufverfolgung durch Aktivieren der Application Insights-Diagnose (Vorschau)

Wenn Sie diese Funktion aktivieren, werden Ablaufverfolgungsdaten und Systemmetriken während der Ableitungszeit in arbeitsbereichsverknüpften Application Insights erfasst. Zu diesen Metriken gehören die Tokenanzahl, die Ablauflatenz und die Ablaufanforderung. Weitere Informationen finden Sie unter Aktivieren der Ablaufverfolgung und Sammeln von Feedback für eine Ablaufbereitstellung.

Erteilen von Berechtigungen für den Endpunkt

Wichtig

Nur der Besitzer der Azure-Ressourcen kann Berechtigungen erteilen, indem eine Rollenzuweisung hinzugefügt wird. Möglicherweise müssen Sie sich an den Besitzer Ihres Azure Abonnements wenden. Diese Person ist möglicherweise Ihr IT-Administrator.

Es wird empfohlen, der vom Benutzer zugewiesenen Identität Rollen zu gewähren, sobald die Endpunkterstellung abgeschlossen ist. Es kann mehr als 15 Minuten dauern, bis die erteilte Berechtigung wirksam wird.

Führen Sie die folgenden Schritte aus, um die erforderlichen Berechtigungen im Azure-Portal zu erteilen:

  1. Wechseln Sie zur Übersichtsseite des Foundry-Projekts im portal Azure.

  2. Wählen Sie access control (IAM) und dann "Rollenzuweisung hinzufügen" aus.

    Screenshot der Zugriffssteuerung mit hervorgehobener Option

  3. Wählen Sie Azure Machine Learning Workspace Connection Secrets Reader aus, und wählen Sie Next aus.

    Die Rolle Azure Machine Learning Workspace Connection Secrets Reader ist eine integrierte Rolle, die über die Berechtigung zum Abrufen von Hubverbindungen verfügt.

    Wenn Sie eine angepasste Rolle verwenden möchten, stellen Sie sicher, dass die angepasste Rolle über die Berechtigung Microsoft.MachineLearningServices/workspaces/connections/listsecrets/action verfügt. Erfahren Sie mehr darüber, wie Sie benutzerdefinierte Rollen erstellen.

  4. Wählen Sie verwaltete Identität und dann Mitglieder aus:

    • Vom System zugewiesene Identität: Wählen Sie unter vom System zugewiesener verwalteter Identität den Onlineendpunktfür maschinelles Lernen aus, und suchen Sie nach Endpunktname.
    • Vom Benutzer zugewiesene Identität: Wählen Sie vom Benutzer zugewiesene verwaltete Identität aus, und suchen Sie nach Identitätsnamen.
  5. Erteilen Sie für vom Benutzer zugewiesene Identität Berechtigungen für die Hubcontainerregistrierung und das Speicherkonto. Sie finden das Containerregistrierungs- und Speicherkonto auf der Hubübersichtsseite im Azure-Portal.

    Wechseln Sie zur Übersichtsseite des Hub-Containers und wählen Sie Zugriffskontrolle>Rollenzuweisung hinzufügen aus. Weisen Sie ACR Pull der Endpunktidentität zu.

    Wechseln Sie zur Standardspeicherübersichtsseite des Hubs, wählen Sie Access control>Rollenzuweisung hinzufügen aus. Weisen Sie Speicher-Blob-Datenleser der Endpunktidentität zu.

  6. Optional: Für benutzerzugewiesene Identitäten, wenn Sie Metriken, die mit dem Endpunkt zusammenhängen, wie CPU/GPU/Festplatte/Arbeitsspeicherauslastung überwachen möchten, müssen Sie der Identität die Rolle Workspace metrics writer des Hubs zuweisen.

Überprüfen des Status des Endpunkts

Nach Abschluss der Bereitstellung erhalten Sie Benachrichtigungen. Nachdem der Endpunkt und die Bereitstellung erfolgreich erstellt wurden, wählen Sie " Details anzeigen " in der Benachrichtigung für die Bereitstellungsdetailseite aus.

Sie können auch direkt zur Seite "Modell+ Endpunkte " im linken Bereich wechseln und die Bereitstellung auswählen, um den Status zu überprüfen.

Testen des Endpunkts

Wählen Sie auf der Seite "Bereitstellungsdetails" die Registerkarte " Test " aus.

Für Endpunkte, die aus dem Standardfluss bereitgestellt werden, können Sie Werte im Formular-Editor oder JSON-Editor eingeben, um den Endpunkt zu testen.

Testen des Endpunkts, der aus einem Chat-Flow bereitgestellt wird

Für Endpunkte, die aus einem Chatfluss bereitgestellt werden, können Sie sie in einem immersiven Chatfenster testen.

Die chat_input Nachricht wurde während der Entwicklung des Chatflusses festgelegt. Sie können die chat_input Nachricht in das Eingabefeld einfügen. Wenn Ihr Flow über mehrere Eingaben verfügt, geben Sie die Werte für andere Eingaben neben der chat_input Nachricht im Eingabe-Bereich auf der rechten Seite an.

Verwenden Sie den Endpunkt

Wählen Sie auf der Seite "Bereitstellungsdetails" die Registerkarte " Nutzen " aus. Sie finden den REST-Endpunkt und schlüssel/token, um Ihren Endpunkt zu nutzen. Beispielcode steht ihnen auch zur Verfügung, um den Endpunkt in verschiedenen Sprachen zu nutzen.

Screenshot, der den Beispielcode der Nutzung von Endpunkten zeigt.

Sie müssen Werte für RequestBody oder data und api_key eingeben. Wenn Ihr Ablauf beispielsweise zwei Eingaben hat, location und url, geben Sie Daten wie im folgenden Beispiel an:

 {
"location": "LA",
"url": "<the_url_to_be_classified>"
}

Bereinigen von Ressourcen

Wenn Sie den Endpunkt nach Abschluss dieses Lernprogramms nicht verwenden werden, löschen Sie den Endpunkt. Der vollständige Löschvorgang kann 20 Minuten dauern.