Einrichten der Datenabfrage für die Chatlösung in Agentic Retrieval in Foundry Local

Konfigurieren Sie Datenabfragen und Modelleinstellungen für Ihre Agentic Retrieval-Chatlösung, um Ihre Chatergebnisse zu optimieren. Passen Sie Suchtypen an, optimieren Sie Modellparameter, und verfeinern Sie Ihre Chaterfahrung im Agentic Retrieval-Entwicklerportal.

Important

Agentic Retrieval in Foundry Local ist derzeit in der Vorschau. Die zusätzlichen Nutzungsbestimmungen für Microsoft Azure-Vorschauen enthalten rechtliche Bedingungen. Sie gelten für diejenigen Azure-Features, die sich in der Beta- oder Vorschauversion befinden oder aber anderweitig noch nicht zur allgemeinen Verfügbarkeit freigegeben sind.

Voraussetzungen

Bevor Sie beginnen:

  • Stellen Sie sicher, dass Sie sich im wissensbasierten Chatmodus befinden.
  • Überprüfen Sie Suchtypen , um die verfügbaren Suchtypen und deren Verwendung zu verstehen.
  • Überprüfen Sie die Wissensschichtkonfiguration , um die Datenaufnahme zu planen, und wählen Sie die richtigen Eingabeaufforderungs- und Modellparameter aus.
  • Hinzufügen der Datenquelle für die Chatlösung
  • Um auf das Entwicklerportal zuzugreifen, müssen Sie sowohl über die Rollen "EdgeRAGDeveloper" als auch "EdgeRAGEndUser" in Microsoft Entra verfügen.

Konfigurieren von Inferencemodelleinstellungen

Konfigurieren Sie zunächst die Ableitungsmodelleinstellungen für Ihre Chatlösung.

  1. Wechseln Sie zum lokalen Portal, indem Sie den domänennamen verwenden, der bei der Bereitstellung und app-Registrierung angegeben ist. Beispiel: https://arcrag.contoso.com

  2. Melden Sie sich mit Entwickleranmeldedaten an, denen sowohl die Rollen "EdgeRAGDeveloper" als auch "EdgeRAGEndUser" zugewiesen sind. Wenn Sie den richtigen Zugriff konfiguriert haben, werden Sie automatisch an das Entwicklerportal weitergeleitet.

  3. Wählen Sie die Registerkarte "Chat " aus, um zum Chat-Playground zu gelangen.

  4. Passen Sie im Bereich Dateninferenz unter Modellparameter die Modellparameter für Temperatur und Top P nach Bedarf an.

    Screenshot des Abschnitts

  5. Wählen Sie den Abschnitt "Suchparameter " aus.

  6. Wählen Sie den Suchtyp aus, den Sie verwenden möchten.

    Suchtyp Description
    Hybridtextsuche Kombiniert Schlüsselwortsuche (Text) und Vektorsuche (kontextuell).
    Textsuche Sucht nach genauen Wörtern oder Ausdrücken in Dokumenten.
    Vektorsuche Sucht nach kontextbezogener Ähnlichkeit und nicht nach exakten Stichwortabgleichen.
    Hybride multimodale Suche (Vorschau, NUR BYOM) Kombiniert mehrere Modalitäten der Text- und Bildsuche gleichzeitig.
  7. Passen Sie unter "Parameter" die Modellparameter für Top-N Dokumente und die Text strictness nach Bedarf an.

    Screenshot der Felder für Suchtypen, Top-N-Dokumente und Textstrenge unter den Suchparametern.

  8. Wählen Sie den Abschnitt " Systemaufforderung" aus . Überprüfen und aktualisieren Sie die Eingabeaufforderung nach Bedarf für Ihre Lösung.

  9. Alle änderungen, die Sie vornehmen, werden angewendet, wenn Sie eine neue Frage im Chat übermitteln.

Testen von Chatergebnissen

Testen Sie als Nächstes den Chatendpunkt.

  1. Geben Sie im Chatfenster eine Frage ein, die ein einfaches Frage- und Antwortformat verwendet. Abfragen, die eine Zusammenfassung über mehrere Dokumente erfordern, geben möglicherweise keine genauen Antworten zurück.

    Beachten Sie, dass jede Frage mit der Agentic-Abruferweiterung Version 0.1.5 und höher nur basierend auf abgerufenen Inhalten beantwortet wird. Die Antwort enthält nicht den Kontext des Chatverlaufs. Der Chatverlauf wird nicht zwischen Fragen gespeichert. Behandeln Sie jede Frage als neuen Chat.

  2. (Optional) Um zu sehen, wie das Sprachmodell reagiert, ohne Ihre aufgenommenen Daten zu verwenden, wechseln Sie in den Chatmodus auf "Nur Modell" , und geben Sie Ihre Frage ein. Wechseln Sie zurück zum Knowledge-Base-Chat , um Ihre Lösung mit Ihren aufgenommenen Daten weiter zu verfeinern.

  3. (Optional) Testen Sie die Endbenutzerumgebung mithilfe der Chatlösungs-App für den Agentic-Abruf.

Details anzeigen, um Einstellungen zu verfeinern

Verwenden Sie die Details der Chatantworten, um Ihr Modell und Ihre Suchparameter zu analysieren und feinabzustimmen, damit Sie Ihre Chatantworten optimieren können.

  1. Wählen Sie unter der Chatantwort die Option "Details anzeigen" aus.

  2. Verwenden Sie die Chatdetails, um die Auswirkungen der Ableitungsparameter auf die Antwort des Sprachmodells auf Ihre Frage zu verstehen.

    Feld Description
    LLM-Antwort Antwort des großen Sprachmodells (LLM) für die entsprechende Frage.
    Benutzerfrage Frage, die vom Benutzer gestellt wird.
    Suchtyp Die Methode, die verwendet wird, um relevante Informationen für Ihre Frage zu finden, z. B. Hybrid-, Text-, Vektor- oder Hybrid-multimodale Suche.
    Parameter Parameter, die zum Durchsuchen von Inhalten und zum Generieren der LLM-Antwort verwendet werden.
    Systemaufforderung Die vom Entwickler festgelegten benutzerdefinierten Anweisungen zur Steuerung der Antworten des Sprachmodells.
    Neu angeordnete Blöcke Zeigt Such-IDs anhand der Neuanordnungsbewertung an.
    LLM-Eingabeblöcke Relevante Blöcke, die als abgerufener Inhalt an LLM übergeben werden; die Blöcke werden basierend auf der Textstrenge und der Bildstrenge ausgewählt.
    Details der Suche Zeigt Suchdetails an.
    Ergebnisse aus der Textsuche Ergebnisse der Textsuche für eine Abfrage: Jedes Ergebnis zeigt den Reranking-Score, die Suchdistanz, den Text, den Dateipfad, die Chunk-ID und das Datum der letzten Änderung.
    Ergebnisse aus der Vektorsuche Ergebnisse der semantischen Suche für eine Abfrage; Jedes Ergebnis zeigt den Reranking-Score, die Suchdistanz, den Text, den Dateipfad, die Chunk-ID und das Datum der letzten Änderung.
    Ergebnisse aus der Bildsuche Ergebnisse aus der Bildsuche für eine Abfrage, jedes Ergebnis zeigt das Reranking score, den Dateipfad, das Datum der letzten Änderung.
  3. Um die Details zu analysieren, wählen Sie "Kopieren" aus, um eine JSON-Version des Texts in einen Text-Editor einzufügen.

  4. Optimieren Sie die Ableitungsparameter, um den Typ der Antworten abzurufen, die Sie für Ihre aufgenommenen Daten benötigen.

API-Endpunkt abrufen

Wenn Sie mit der Lösung zufrieden sind, wählen Sie auf "Endpunkt anzeigen " aus, um den API-Endpunkt abzurufen, der in Ihren downstream-Anwendungen verwendet werden soll.

Nächster Schritt