Grundlegendes zur Textanalyse in Foundry

Abgeschlossen

Hinweis

Weitere Details finden Sie auf der Registerkarte "Text und Bilder ".

Microsoft Foundry ist die Plattform zum Erstellen von KI-Apps und Agents auf Azure. Das Foundry-Portal bietet zwei Ansätze für die Textanalyse: allgemeine KI-Modelle, die eine breite Palette von Aufgaben durch Eingaben in natürlicher Sprache verarbeiten, sowie zweckorientierte Sprachtools, die strukturierte, deterministische Ergebnisse für bestimmte Aufgaben zurückgeben.

Hinweis

Foundry verfügt über ein webbasiertes Portal, in dem Sie KI-Anwendungen erstellen, testen und bereitstellen können. Das Portal verfügt über zwei Benutzeroberflächen (UIs) – eine klassische Benutzeroberfläche und eine neue Benutzeroberfläche – das neue Foundry-Portal. Dieser Inhalt beschreibt Funktionen im neuen Foundry-Portal.

Um mit der Textanalyse im neuen Foundry-Portal zu beginnen, müssen Sie eine Foundry-Ressource und ein Foundry-Projekt erstellen.

Eine Foundry-Ressource ist eine Azure-Ressource, die Zugriff auf KI-Dienste und bereitgestellte Modelle bietet. Ein Foundry-Projekt ist ein Arbeitsbereich innerhalb dieser Ressource, in dem Sie Ihre Arbeit organisieren, Modelle bereitstellen und auf Tools wie den Chat-Playground und KI-Dienste zugreifen.

Verwenden von allgemeinen KI-Modellen für die Textanalyse

Über Ihr Projekt im Foundry-Portal können Sie ein allgemeines KI-Modell bereitstellen. Ein allgemeines KI-Modell ist ein Sprachmodell , das auf großen Mengen von Textdaten trainiert wird und ihm ein umfassendes Verständnis der Sprache und die Fähigkeit gibt, viele verschiedene Aufgaben zu verarbeiten. Ein allgemeines Modell kann Anweisungen in natürlicher Sprache befolgen, um Stimmungen zu analysieren, Entitäten zu extrahieren, Text zusammenzufassen, Inhalte zu übersetzen, Fragen zu beantworten und vieles mehr – alles ohne Konfiguration oder Schulung auf Ihrer Seite.

Sie können ein allgemein einsetzbares KI-Modell verwenden, um Textanalyseaufgaben wie:

  • Schlüsselausdrucksextraktion listet die Hauptkonzepte von unstrukturiertem Text auf.
  • Entitätsverknüpfung identifiziert bekannte Entitäten zusammen mit einem Link zu Wikipedia.
  • Stimmungsanalyse und Meinungs-Mining identifizieren, ob Text positiv oder negativ ist.
  • Zusammenfassung fasst Text zusammen, indem die wichtigsten Informationen identifiziert werden.

Sie können die Textanalysefunktionen von KI-Modellen im Chat-Playground des Foundry-Portals erkunden. Nach der Bereitstellung eines Modells erhalten Sie auf dem Playground eine Chatschnittstelle, in der Sie eine Eingabeaufforderung eingeben und das Modell antwortet. Da das Modell den Kontext versteht, können Sie auch weitere Fragen beantworten oder die Analyse in derselben Unterhaltung verfeinern. Dies macht den Spielplatz zu einem nützlichen Weg, um zu erkunden, was möglich ist, bevor Sie eine vollständige Anwendung erstellen.

Screenshot des neuen Foundry Portal Playground mit der Extraktion von Schlüsselbegriffen.

Werfen wir einen genaueren Blick auf einige der Antworten, die ein allgemeines KI-Modell geben kann, wenn eine Textanalyseaufgabe gegeben wird.

Schlüsselphrasenextraktion

Sie können ein Sprachmodell verwenden, um die in einem Text verwendeten Schlüsselwörter und Ausdrücke zu extrahieren, die bei Prozessen wie Indizierung und Suche nach relevanten Dokumenten hilfreich sein können. Die Schlüsselauszugsextraktion identifiziert die Hauptpunkte aus Text.

Sie können beispielsweise eine Rezension erhalten, z. B.:

"Ich hatte am Samstag ein fantastisches Essen im Diner in Seattle. Das Pilz risotto war perfekt zubereitet und wirklich lecker. Unser Kellner, Pete, war freundlich und effizient; und gab uns eine tolle Empfehlung für ein Dessert (Erdbeerkäsekake). Ich würde diesen Ort definitiv für ein lässiges Abendessen empfehlen.""

Die Schlüsselauszugsextraktion kann einen Kontext zu dieser Überprüfung bereitstellen, indem die folgenden Ausdrücke extrahiert werden:

  • Ungezwungenes Abendessen
  • Dessert
  • fantastische Mahlzeit
  • diner
  • gute Empfehlung
  • Pilz risotto
  • Pete
  • Ort
  • Saturday
  • Seattle
  • Erdbeerkäsekake
  • Kellner

Entitätserkennung

Sie können auch die benannte Entitätserkennung verwenden, um Personen, Orte, Datumsangaben und andere bestimmte Entitäten zu finden, die im Text erwähnt werden.

Sie können ein Sprachmodell mit unstrukturiertem Text bereitstellen und eine Liste von Entitäten im Text abrufen, den er erkennt. Eine Entität ist ein Element eines bestimmten Typs oder einer Kategorie; und in einigen Fällen untertyp.

Betrachten Sie diesen kurzen Text:

" Am 2. Mai 2017 besuchte John Smith New York, um an einer Konferenz teilzunehmen, die von Microsoft gehostet wird. Das Ereignis begann um 8:00 Uhr und dauerte 3 Stunden. Über 25% der 40 Teilnehmer reisten mehr als 10 Meilen zur Teilnahme."

Zu den erkannten Entitäten gehören:

Art der Entität Untertyp /Kategorie Wert
Person Johan Lorenz
Standort New York
Organisation Microsoft
DateTime Datum 2. Mai 2017
DateTime Uhrzeit 8:00 Uhr
DateTime Dauer 3 Stunden
Menge Prozentsatz 25 %
Menge Number 40
Menge Abmessung 10 Meilen

Stimmungsanalyse und Meinungs-Mining

Sie können auch eine Stimmungsanalyse verwenden, um ein Dokument als positiv, negativ oder neutral zu klassifizieren. Dies ist nützlich, um Stimmungen in sozialen Medien, Kundenrezensionen, Diskussionsforen und mehr zu erkennen.

Betrachten Sie die folgende Restaurantbewertung:

"Ich hatte am Freitagabend ein wunderbares Abendessen in einem gemütlichen Bistro in Portland. Der gegrillte Lachs wurde perfekt und voller Geschmack gekocht, und das saisonale Gemüse war eine großartige Ergänzung. Unser Server, Maria, war aufmerksam und persönlich, und sie schlug die Zitrone zum Dessert vor – das war ausgezeichnet. Ich würde diesen Ort absolut empfehlen für eine entspannte und angenehme Nacht.""

Hinweis

Da ein allgemeines KI-Modell auf Aufforderungen in natürlicher Sprache reagiert, hängt die Ausgabe davon ab, wie Sie Ihre Anforderung ausdrücken. Sie können z. B. eine allgemeine Stimmungsbewertung anfordern oder nach einer Satz-nach-Satz-Aufschlüsselung fragen. Je spezifischer Ihre Aufforderung, desto strukturierter und detaillierter ist die Antwort.

Die Analyse der Restaurantbewertung kann folgendes zurückgeben:

  • Satz-nach-Satz-Stimmungsanalyse:

    "Ich hatte am Freitagabend ein wunderbares Abendessen in einem gemütlichen Bistro in Portland." Stimmung: Positive Erklärung: Die Worte "wunderbares Abendessen" und "gemütliches Bistro" vermitteln eine sehr positive Erfahrung.

    "Der gegrillte Lachs wurde perfekt und voll von Geschmack gekocht, und das saisonale Gemüse war eine großartige Ergänzung." Stimmung: Positive Erklärung: "Perfekt gekocht", "voller Geschmack" und "große Ergänzung" geben alle eine starke Zufriedenheit mit dem Essen an.

    "Unser Server, Maria, war aufmerksam und persönlich, und sie schlug die Zitrone tarte zum Dessert vor – das war ausgezeichnet." Stimmung: Positive Erklärung: Positive Beschreibungen der Qualitäten des Servers und das Dessert ("aufmerksam," "persönlich", "hervorragend") spiegeln einen sehr glücklichen Kunden wider.

    "Ich würde diesen Ort absolut empfehlen für eine entspannte und angenehme Nacht." Stimmung: Positive Erklärung: Eine klare Empfehlung mit den Worten "absolut", "entspannt" und "erfreulich" zeigen eine starke positive Stimmung.

  • Allgemeine Dokumentstimmung: stark positiv. Die Bewertung ist voller lobender Worte über das Essen, die Atmosphäre, den Service und das Gesamterlebnis. Es gibt keine neutralen oder negativen Aussagen.

Wann ein allgemein einsetzbares KI-Modell für die Textanalyse verwendet werden sollte.

Neben der Schlüsselausdrucksextraktion, der Entitätserkennung und der Stimmungsanalyse können allgemeine KI-Modelle auch lange Dokumente in präzise Absätze zusammenfassen , Text zwischen Sprachen übersetzen , Inhalte in Kategorien klassifizieren , die Sie definieren, Fragen zu einer Passage beantworten und vieles mehr. Da diese Funktionen alle von Aufforderungen in natürlicher Sprache gesteuert werden, können Sie sie frei kombinieren , z. B. das Modell auffordern, eine lange Überprüfung zu übersetzen und dann in einer einzigen Unterhaltung zusammenzufassen.

Verwenden Azure Sprache in Foundry-Tools

Während ein großes Sprachmodell, das für allgemeine generative KI-Workloads trainiert wurde, häufig eine großartige Aufgabe bei der Textanalyse machen kann, erhält manchmal ein spezielleres Tool vorhersehbarere Ergebnisse.

Azure Language in Foundry Tools ist ein Natürlicher Sprachverarbeitungsdienst mit speziellen Analysegeräten für bestimmte Textanalyseaufgaben. Diese Analyzer verwenden statistische Techniken, um strukturierte, deterministische Ergebnisse zurückzugeben – dadurch eignen sie sich besonders gut für automatisierte Pipelines, bei denen konsistente Ergebnisse wichtig sind.

Im neuen Foundry-Portal können Sie einige der Funktionen der Azure-Sprache im Chat-Playground erkunden. Um die Funktionen von KI-Diensten zu testen, navigieren Sie zur Seite " Erstellen " und dann zu " Modelle" und dann zur Registerkarte "KI-Dienste ". Auf der Registerkarte finden Sie eine Auswahl an KI-Diensten, die zum Testen zur Verfügung stehen.

Screenshot der Registerkarte „KI-Dienste“ im Foundry-Portal.

Berücksichtigen Sie die folgenden Azure Sprachfunktionen:

  • Die Spracherkennung wertet Text aus und erkennt die Sprache und den Dialekt.
  • Die Erkennung personenbezogener Informationen (PII) identifiziert personenbezogene vertrauliche Informationen, einschließlich personenbezogener Gesundheitsdaten (PHI).

Spracherkennung

In einem mehrsprachigen Workflow besteht der erste Schritt häufig darin, die Sprache zu identifizieren, in der ein Dokument geschrieben ist, sodass der Text an das am besten geeignete Modell oder Prozess weitergeleitet werden kann. Die Spracherkennung wertet Text aus und identifiziert die primäre Sprache zusammen mit einer Konfidenzbewertung. Azure Sprache unterstützt eine Vielzahl von Sprachen und regionalen Dialekten.

Angenommen Sie haben den folgenden Text:

"¡Hola! Me llamo Josefina y vivo en Madrid, España."

Die Spracherkennung gibt das folgende Ergebnis zurück:

Sprache ISO 6391-Code Zuverlässigkeitsbewertung
Spanish ES 1.00

Im Foundry-Portal können Sie die Azure-Sprachenerkennungsfunktion im Chat-Playground testen.

Screenshot der Spracherkennungsfunktion des Chat-Playgrounds.

Erkennung personenbezogener Informationen

Organisationen müssen häufig vertrauliche persönliche Details aus Text identifizieren und redigieren, bevor sie gespeichert oder freigegeben werden, um die Datenschutzbestimmungen einzuhalten. Die Erkennung personenbezogener Informationen (PERSONALly Identifiable Information, PII) identifiziert personenbezogene Details in Text , z. B. Namen, Telefonnummern, E-Mail-Adressen und Straßenadressen, und kann sie optional redigieren.

Angenommen Sie haben den folgenden Text:

"Maria García rief von 020 7946 0958 und bat, Dokumente an 42 Market Road, London, UK, SW1A 1AA zu senden.""

Die PII-Erkennung identifiziert die folgenden Entitäten:

Text Kategorie
Maria García Person
020 7946 0958 Rufnummer
42 Market Road, London, UK, SW1A 1AA Adresse

Im Foundry-Portal können Sie die PII-Erkennungsfunktion von Azure Language im Language Playground testen.

Screenshot der PII-Erkennungsfunktion des Sprachspielplatzes.

Erfahren Sie als Nächstes, wie Sie eine Clientanwendung mit Textanalysefunktionen mithilfe der OpenAI-Antwort-API und des Azure Language SDK erstellen.