Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Wichtig
Nicht englische Übersetzungen werden nur zur Bequemlichkeit bereitgestellt. Bitte konsultieren Sie die EN-US Version dieses Dokuments für die endgültige Version.
Was ist eine Transparenznotiz?
Ein KI-System umfasst nicht nur die Technologie, sondern auch die Personen, die es nutzen werden, die Menschen, die davon betroffen sind, und die Umgebung, in der sie bereitgestellt wird. Die Erstellung eines Systems, das für den vorgesehenen Zweck geeignet ist, erfordert ein Verständnis der Funktionsweise der Technologie, ihrer Fähigkeiten und Einschränkungen und derEn Erreichung der besten Leistung. Microsofts Transparenzhinweise sollen Ihnen helfen, zu verstehen, wie unsere KI-Technologie funktioniert, welche Entscheidungen Systembesitzer treffen können, die die Systemleistung und das Verhalten beeinflussen, und wie wichtig es ist, über das gesamte System nachzudenken, einschließlich der Technologie, der Menschen und der Umgebung. Sie können Transparenzhinweise verwenden, wenn Sie Ihr eigenes System entwickeln oder bereitstellen, oder sie mit den Personen teilen, die ihr System verwenden oder davon betroffen sind.
Microsoft Transparenzhinweise sind Teil eines umfassenderen Aufwands für Microsoft, unsere KI-Prinzipien in die Praxis umzusetzen. Weitere Informationen finden Sie unter Microsoft AI Principles.
Einführung in die benutzerdefinierte Textklassifizierung
Benutzerdefinierte Textklassifizierung ist ein cloudbasierter API-Dienst, der maschinelle Lernintelligenz anwendet, damit Sie benutzerdefinierte Modelle für Textklassifizierungsaufgaben erstellen können.
Benutzerdefinierte Textklassifizierung unterstützt zwei Arten von Projekten:
- Klassifizierung einzelner Bezeichnungen: Sie weisen nur eine Bezeichnung für jede Datei in Ihrem Dataset zu. Wenn eine Datei beispielsweise ein Filmskript ist, kann sie nur als "Action", "Thriller" oder "Romanze" klassifiziert werden.
- Mehrere Bezeichnungsklassifizierungen: Sie weisen für jede Datei im Dataset mehrere Bezeichnungen zu. Wenn es sich bei einer Datei beispielsweise um ein Filmskript handelt, könnte sie als "Action" oder "Action" und "Thriller" klassifiziert werden.
Die Grundlagen der benutzerdefinierten Textklassifizierung
Die benutzerdefinierte Textklassifizierung wird als Teil der "Azure Language"-Funktionen bei Foundry Tools angeboten. Dieses Feature ermöglicht es seinen Benutzern, benutzerdefinierte KI-Modelle zu erstellen, um Text in benutzerdefinierte Kategorien zu klassifizieren, die vom Benutzer vordefinierte sind. Durch das Erstellen eines benutzerdefinierten Textklassifizierungsprojekts können Entwickler Daten iterativ kategorisieren und trainieren, bewerten und die Modellleistung verbessern, bevor sie sie für den Verbrauch verfügbar machen. Die Qualität der markierten Daten wirkt sich stark auf die Modellleistung aus.
Um das Erstellen und Anpassen Ihres Modells zu vereinfachen, bietet der Dienst ein benutzerdefiniertes Webportal, auf das über Das Language Studio zugegriffen werden kann. Sie können ganz einfach mit dem Dienst beginnen, indem Sie die Schritte in dieser Schnellstartanleitung ausführen.
Terminologie für benutzerdefinierte Textklassifizierung
Die folgenden Begriffe werden häufig in der benutzerdefinierten Textklassifizierung verwendet:
| Begriff | Definition |
|---|---|
| Projekt | Ein Projekt ist ein Arbeitsbereich zum Erstellen ihrer benutzerdefinierten KI-Modelle basierend auf Ihren Daten. Auf Ihr Projekt kann nur von Ihnen und anderen Personen zugegriffen werden, die Zugriff auf die verwendete Azure Ressource haben. Innerhalb eines Projekts können Sie Daten markieren, Modelle erstellen, diese bei Bedarf auswerten und verbessern und schließlich ein Modell bereitstellen, um für den Verbrauch bereit zu sein. Sie können mehrere Modelle in Ihrem Projekt auf demselben Dataset erstellen. |
| Modell | Ein Modell ist ein Objekt, das trainiert wird, um eine bestimmte Aufgabe zu erledigen. Für dieses System klassifizieren die Modelle Text. Modelle werden trainiert, indem sie aus markierten Daten lernen. |
| Klasse | Eine Klasse ist eine benutzerdefinierte Kategorie, die die allgemeine Klassifizierung des Texts angibt. Entwickler markieren ihre Daten mit ihren zugewiesenen Klassen, bevor sie sie an das Modell zur Schulung übergeben. |
Beispielanwendungsfälle für die benutzerdefinierte Textklassifizierung
Benutzerdefinierte Textklassifizierung kann in mehreren Szenarien in einer Vielzahl von Branchen verwendet werden. Einige Beispiele sind:
Automatische E-Mails oder Tickettriaging: Support-Center aller Art erhalten ein hohes Volumen an E-Mails oder Tickets, die unstrukturierten, freien Text und Anhänge enthalten. Eine rechtzeitige Überprüfung, Anerkennung und Weiterleitung an Experten innerhalb interner Teams ist entscheidend. Die E-Mail-Triage in diesem Maßstab erfordert, dass Personen die richtigen Abteilungen überprüfen und weiterleiten, was Zeit und Ressourcen benötigt. Benutzerdefinierte Textklassifizierung kann verwendet werden, um eingehenden Text zu analysieren und den Inhalt zu kategorisieren, der automatisch an die relevanten Abteilungen weitergeleitet wird, um weitere Maßnahmen zu ergreifen.
Knowledge Mining zur Verbesserung und Erweiterung der semantischen Suche: Die Suche ist für jede App, die Textinhalte für Benutzer anzeigt, von grundlegender Bedeutung. Häufige Szenarien sind Katalog- oder Dokumentsuchen, Produktsuchen im Einzelhandel oder Knowledge Mining für Data Science. Viele Unternehmen in verschiedenen Branchen suchen eine umfangreiche Sucherfahrung über private, heterogene Inhalte, die sowohl strukturierte als auch unstrukturierte Dokumente umfassen. Als Teil ihrer Pipeline können Entwickler benutzerdefinierte Textklassifizierung verwenden, um ihren Text in Klassen zu kategorisieren, die für ihre Branche relevant sind. Die vorhergesagten Klassen können verwendet werden, um die Indizierung der Datei für eine angepasstere Sucherfahrung zu erweitern.
Überlegungen beim Auswählen eines Anwendungsfalles
Vermeiden Sie die Verwendung der benutzerdefinierten Textklassifizierung für Entscheidungen, die schwerwiegende nachteilige Auswirkungen haben könnten. Schließen Sie die menschliche Überprüfung von Entscheidungen ein, die das Potenzial für schwerwiegende Auswirkungen auf Einzelpersonen haben. Beispielsweise, ob ein Versicherungsanspruch auf der Grundlage der Beschreibung eines Vorfalls akzeptiert oder abgelehnt werden soll.
Vermeiden Sie das Erstellen von Klassen, die mehrdeutig und nicht repräsentativ sind. Vermeiden Sie beim Entwerfen ihres Schemas Klassen, die einander so ähnlich sind, dass es schwierigkeiten gibt, sie voneinander zu unterscheiden. Wenn Sie beispielsweise Filmskripts klassifizieren, vermeiden Sie die Erstellung einer Klasse für Romantik, Komödie und Rom-com. Erwägen Sie stattdessen die Verwendung eines Mehrlabel-Klassifizierungsmodells mit Romantik- und Komödienklassen. Weisen Sie dann für rom-com-Filme beide Klassen zu.
-
Rechtliche und behördliche Überlegungen: Organisationen müssen potenzielle spezifische rechtliche und behördliche Verpflichtungen bewerten, wenn Sie Foundry Tools und Lösungen verwenden, die möglicherweise nicht für die Verwendung in jeder Branche oder in jedem Szenario geeignet sind. Darüber hinaus sind Foundry Tools oder Lösungen nicht für sie ausgelegt und dürfen nicht auf eine Weise verwendet werden, die in anwendbaren Nutzungsbedingungen und relevanten Verhaltensregeln verboten ist.