Klassifizieren und Weiterleiten von Daten mithilfe von Inhaltsverständnis

Mithilfe von Inhaltsverständnis können Sie benutzerdefinierte Klassifizierungsworkflows erstellen, die Ihre Inhalte kategorisieren und an die richtige Analyse weiterleiten. Mit Routing können Sie mehrere Datenströme über dieselbe Pipeline senden und sicherstellen, dass Ihre Daten vom besten Analysegerät für den Typ verarbeitet werden.

Dieser Leitfaden führt Sie durch zwei Schritte:

  1. Erstellen Sie einen einfachen Klassifizierer , der Dokumente in benutzerdefinierte Kategorien kategorisiert.
  2. Klassifizieren und weiterleiten mit benutzerdefinierten Analysatoren, die die Klassifizierung mit der Feldextraktion für jede Kategorie kombinieren.

Voraussetzungen

Stellen Sie zunächst sicher, dass Sie über die folgenden Ressourcen und Berechtigungen verfügen:

  • Ein Azure-Abonnement. Wenn Sie nicht über ein Azure-Abonnement verfügen, Create a free account.
  • Eine Microsoft Foundry-Ressource im Azure-Portal, erstellt in einer unterstützten Region.
    • Diese Ressource wird im Portal unter Foundry>Foundry aufgelistet.
  • Richten Sie Standardmodell-Implementierungen für Ihre Ressource für Inhaltsverständnis ein. Standardmäßig erstellen Sie eine Verbindung mit den Microsoft Foundry-Modellen, die Sie für Inhaltsverständnisanforderungen verwenden. Wählen Sie eine der folgenden Methoden aus:
    1. Wechseln Sie zur Seite "Inhaltsverständniseinstellungen".

    2. Wählen Sie oben links die Schaltfläche "+Ressource hinzufügen " aus.

    3. Wählen Sie die Foundry-Ressource aus, die Sie verwenden möchten, und wählen Sie "Nächstes Speichern">aus.

      Stellen Sie sicher, dass das Kontrollkästchen "Automatische Bereitstellung für erforderliche Modelle aktivieren" aktiviert ist, wenn keine Standardeinstellungen verfügbar sind . Diese Auswahl stellt sicher, dass Ihre Ressource vollständig mit den erforderlichen GPT-4.1, GPT-4.1-miniund text-embedding-3-large Modellen eingerichtet ist. Für unterschiedliche vorkonfigurierte Analysegeräte sind unterschiedliche Modelle erforderlich.

    Indem Sie diese Schritte ausführen, richten Sie eine Verbindung zwischen Inhaltsverständnis- und Foundry-Modellen in Ihrer Foundry-Ressource ein.
  • cURL für Ihre Entwicklungsumgebung (für die Registerkarte REST-API) installiert.

Schritt 1: Erstellen eines einfachen Klassifizierers

Ein einfacher Klassifizierer kategorisiert Dokumente in benutzerdefinierte Inhaltskategorien. Sie definieren die Kategorien mit Namen und Beschreibungen, und der Dienst verwendet diese Definitionen, um Ihre Eingabedateien zu klassifizieren. Der enableSegment Parameter steuert, ob der Klassifizierer Mehrdokumentdateien in Segmente aufteilt oder die gesamte Datei als einzelnes Dokument behandelt.

Anmelden bei Content Understanding Studio

Wechseln Sie zum Portal "Content Understanding Studio ", und melden Sie sich mit Ihren Anmeldeinformationen an. Wenn Sie mit der klassischen Azure Dokumentintelligenz in Foundry Tools Studio vertraut sind, erweitert Inhaltsverständnis die gleiche Inhalts- und Feldextraktion über alle Modalitäten hinweg – Dokument, Bild, Video und Audio. Wählen Sie die Option aus, um die neue Content Understanding-Erfahrung auszuprobieren, um auf multimodale Funktionen zuzugreifen.

Erstellen eines Klassifiziererprojekts

  1. Beginnen Sie mit einem neuen Projekt: Wählen Sie auf der Startseite " Projekt erstellen" aus.

  2. Wählen Sie Ihren Projekttyp aus: Wählen Sie die gewünschte Option Classify and route with custom categories.

  3. Laden Sie Ihre Daten hoch: Laden Sie ein Stück Beispieldaten hoch, um mit der Klassifizierung zu beginnen.

  4. Routingregeln erstellen: Wählen Sie auf der Registerkarte " Routingregeln " die Option Add categoryaus. Geben Sie der Kategorie einen Namen und eine Beschreibung. Für einen einfachen Klassifizierer können Sie die Zuweisung eines bestimmten Analyzers zu jeder Kategorie überspringen.

  5. Testen Sie Ihren Klassifizierungsworkflow: Wenn Ihre benutzerdefinierten Routingregeln testbereit sind, wählen Sie "Analyse ausführen" aus, um die Ausgabe der Regeln für Ihre Daten anzuzeigen.

    Screenshot von Content Understanding Studio mit hervorgehobener Schaltfläche

  6. Erstellen Sie Ihre Klassifizierungsanalyse: Wenn Sie mit der Ausgabe zufrieden sind, wählen Sie oben auf der Seite die Schaltfläche " Analyse erstellen " aus. Geben Sie der Analyse einen Namen, und wählen Sie "Speichern" aus.

Schritt 2: Klassifizieren und Weiterleiten mit benutzerdefinierten Analysegeräten

Um über die grundlegende Klassifizierung hinauszugehen, können Sie jede Kategorie an einen bestimmten Analyseanalysator für die Feldextraktion weiterleiten. Dieser Ansatz kombiniert die Klassifizierung mit der Datenextraktion in einer einzigen Pipeline: Der Klassifizierer identifiziert den Dokumenttyp und leitet ihn dann an den richtigen Analyzer weiter, wodurch Felder extrahiert werden, die auf diese Kategorie zugeschnitten sind.

Um Ihre Daten erfolgreich weiterzuleiten, erstellen Sie benutzerdefinierte Analysegeräte für jede Kategorie. Weitere Informationen zum Erstellen von benutzerdefinierten Analyzern finden Sie unter Erstellen und Verbessern der benutzerdefinierten Analyse in Content Understanding Studio.

  1. Erstellen Sie zuerst benutzerdefinierte Analyzer: Erstellen Sie benutzerdefinierte Analyzer für jeden Dokumenttyp, den Sie weiterleiten möchten. Erstellen Sie z. B. einen benutzerdefinierten Analyzer für Kreditanwendungen mit einem Feldextraktionsschema, das für diesen Dokumenttyp spezifisch ist.

  2. Erstellen oder Aktualisieren von Routingregeln: Wählen Sie auf der Registerkarte " Routingregeln " die Option Add categoryaus. Geben Sie der Kategorie einen Namen und eine Beschreibung, und wählen Sie einen Analyzer aus, der dieser Route entspricht. Mit dem Tool können Sie eine Vorschau des Schemas für jede Analyse anzeigen, um sicherzustellen, dass Sie über das richtige Schema verfügen.

    Screenshot der Benutzererfahrung (UX) der Routen für die Klassifizierung.

  3. Testen Sie Ihren Klassifizierungsworkflow: Wählen Sie "Analyse ausführen" aus, um die Ausgabe der Regeln für Ihre Daten anzuzeigen. Sie können zusätzliche Beispieldaten für Tests hochladen, um zu sehen, wie sie mit mehreren verschiedenen Regeln funktioniert.

    Screenshot von Content Understanding Studio mit hervorgehobener Schaltfläche

  4. Erstellen Sie Ihre Klassifizierungsanalyse: Wenn Sie mit der Ausgabe zufrieden sind, wählen Sie oben auf der Seite die Schaltfläche " Analyse erstellen " aus. Geben Sie der Analyse einen Namen, und wählen Sie "Speichern" aus.

  5. Verwenden Sie Ihren Klassifizierungsanalysesanalysator: Jetzt verfügen Sie über einen Analyseendpunkt, den Sie in Ihrer eigenen Anwendung über die REST-API verwenden können.

Tipp

Ein vollständiges End-to-End-Python-Notizbuch finden Sie im Klassifiziererbeispiel auf GitHub.

Nächste Schritte