Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Wichtig
Nicht englische Übersetzungen werden nur zur Bequemlichkeit bereitgestellt. Bitte konsultieren Sie die EN-US Version dieses Dokuments für die endgültige Version.
Was ist eine Transparenznotiz?
Ein KI-System umfasst nicht nur die Technologie, sondern auch die Personen, die es nutzen werden, die Menschen, die davon betroffen sind, und die Umgebung, in der sie bereitgestellt wird. Die Erstellung eines Systems, das für den vorgesehenen Zweck geeignet ist, erfordert ein Verständnis der Funktionsweise der Technologie, ihrer Fähigkeiten und Einschränkungen und derEn Erreichung der besten Leistung.
Microsoft bietet Transparency Notes, die Ihnen helfen, zu verstehen, wie unsere KI-Technologie funktioniert. Dazu gehören die Auswahlmöglichkeiten von Systembesitzern, die die Systemleistung und das Verhalten beeinflussen, und die Bedeutung des Denkens über das gesamte System, einschließlich der Technologie, der Menschen und der Umgebung. Sie können Transparenzhinweise verwenden, wenn Sie Ihr eigenes System entwickeln oder bereitstellen, oder sie mit den Personen teilen, die ihr System verwenden oder davon betroffen sind.
Transparenzhinweise sind Teil eines umfassenderen Aufwands bei Microsoft, unsere KI-Prinzipien in die Praxis umzusetzen. Weitere Informationen finden Sie unter Microsoft KI-Prinzipien.
Einführung in die benutzerdefinierte benannte Entitätserkennung
Benutzerdefinierte benannte Entitätserkennung (custom NER) ist ein cloudbasierter API-Dienst für die Informationsextraktion. Der Dienst wendet maschinelle Lernintelligenz an, damit Sie benutzerdefinierte Modelle für Informationsextraktionsaufgaben erstellen können.
Benutzerdefinierter NER kann verwendet werden, um Informationen aus .txt Dateien zu extrahieren. Beispielsweise könnte ein Finanzinstitut ein automatisiertes Benachrichtigungssystem erstellen, um Kunden an ihre fälligen Zahlungen zu erinnern. Die Organisation verwendet benutzerdefinierte NER, um relevante Informationen aus Kreditvereinbarungen zu extrahieren, z. B. den Kundennamen, den Kreditbetrag, den Zinssatz und das Zahlungsdatum. Das System kann die extrahierten Entitäten weiter verarbeiten, um eine Erinnerung mit dem nächsten Zahlungsdatum und dem fälligen Betrag an den Kunden zu senden.
Die Grundlagen der Erkennung benutzerdefinierter benannter Entitäten
Benutzerdefinierte benannte Entitätserkennung ermöglicht es seinen Benutzern, benutzerdefinierte Machine Learning-Modelle zu erstellen, um domänenspezifische Entitäten aus unstrukturiertem Text zu extrahieren, z. B. Verträge oder Finanzdokumente.
Durch die Erstellung eines benutzerdefinierten NER-Projekts können Entwickler iterativ Entitäten in den Daten kennzeichnen, Modelle trainieren, auswerten und die Leistung verbessern, bevor sie zur Nutzung bereitgestellt werden. Die Qualität der markierten Daten wirkt sich stark auf die Modellleistung aus. Um das Erstellen und Anpassen Ihres Modells zu vereinfachen, bietet der Dienst ein benutzerdefiniertes Webportal, auf das über Language Studio zugegriffen werden kann.
Benutzerdefinierte NER-Terminologie
Die folgenden Begriffe werden häufig mit diesem Feature verwendet:
| Begriff | Definition |
|---|---|
| Projekt | Ein Projekt ist ein Arbeitsbereich zum Erstellen ihrer benutzerdefinierten ML-Modelle basierend auf Ihren Daten. Auf Ihr Projekt kann nur von Ihnen und anderen Personen zugegriffen werden, die Zugriff auf die verwendete Azure Ressource haben. Innerhalb eines Projekts können Sie Entitäten innerhalb der Daten kategorisieren, Modelle erstellen, modelle auswerten und bei Bedarf verbessern und schließlich ein Modell bereitstellen. Sie können mehrere Modelle innerhalb Ihres Projekts haben, die alle auf demselben Dataset basieren. |
| Modell | Ein Modell ist ein Objekt, das trainiert wird, um eine bestimmte Aufgabe zu erledigen, in diesem Fall benutzerdefinierte Entitätserkennung. Modelle werden trainiert, indem markierte Daten bereitgestellt werden, aus denen sie lernen können, damit sie später für Erkennungsaufgaben verwendet werden können. |
| Entität | Eine Entität ist eine Textspanne, die einen bestimmten Informationstyp angibt. Der Textbereich kann aus einem oder mehreren Wörtern bestehen. Im Bereich benutzerdefinierter NER stellen Entitäten die Informationen dar, die der Benutzer aus dem Text extrahieren möchte. Entwickler kategorisieren Entitäten innerhalb ihrer Daten mit den erforderlichen Entitäten, bevor sie an das Modell zur Schulung übergeben werden. Beispiel: "Rechnungsnummer", "Startdatum", "Versandnummer", "Geburtsort", "Ursprungsort", "Lieferantenname" oder "Kundenadresse". |
Beispielanwendungsfälle
Hier sind einige Beispiele für die Verwendung von benutzerdefiniertem NER:
Knowledge Mining zur Verbesserung der semantischen Suche: Die Suche ist für jede App, die Textinhalte für Benutzer anzeigt, grundlegend. Häufige Szenarien sind Katalog- oder Dokumentsuche, Einzelhandelsproduktsuche oder Knowledge Mining für Data Science. Viele Unternehmen in verschiedenen Branchen möchten eine umfangreiche Sucherfahrung über private, heterogene Inhalte erstellen, die sowohl strukturierte als auch unstrukturierte Dokumente umfassen. Als Teil ihrer Pipeline können Entwickler benutzerdefinierte NER verwenden, um Entitäten aus dem Text zu extrahieren, der für ihre Branche relevant ist. Diese Entitäten können verwendet werden, um die Indizierung der Datei für eine benutzerdefiniertere Suchumgebung zu erweitern.
Informationsextraktion aus unstrukturiertem Text: Viele Finanz- und Rechtsorganisationen extrahieren und normalisieren Daten aus Tausenden komplexer, unstrukturierter Textquellen täglich. Solche Quellen umfassen Bankauszüge, rechtliche Vereinbarungen oder Bankformulare. Beispielsweise kann die Datenextraktion von Hypothekenanwendungen, die manuell von menschlichen Prüfern durchgeführt werden, mehrere Tage dauern, bis sie extrahiert werden. Die Automatisierung dieser Schritte vereinfacht den Prozess und spart Kosten, Zeit und Aufwand.
Überwachung und Compliance: Anstatt deutlich lange Textdateien manuell zu überprüfen und Richtlinien anzuwenden, können IT-Abteilungen in Finanz- oder Juristischen Unternehmen benutzerdefinierte NER verwenden, um automatisierte Lösungen zu erstellen. Diese Lösungen können hilfreich sein, um Compliancerichtlinien zu erzwingen und erforderliche Geschäftsregeln basierend auf Knowledge Mining-Pipelines einzurichten, die strukturierte und unstrukturierte Inhalte verarbeiten.
Überlegungen bei der Auswahl eines Anwendungsfalls
Beachten Sie beim Verwenden von benutzerdefiniertem NER die folgenden Anleitungen:
Vermeiden Sie die Verwendung von benutzerdefiniertem NER für Entscheidungen, die schwerwiegende nachteilige Auswirkungen haben könnten. Vermeiden Sie z. B. Szenarien, die medizinische oder gesundheitsbezogene Diagnose basierend auf extrahierten Informationen aus dem Formular der Medizinischen Geschichte einer Person enthalten, oder das Bankkonto eines Benutzers basierend auf extrahierten Werten aufladen. Darüber hinaus ist es ratsam, die menschliche Überprüfung von Entscheidungen einzubeziehen, die das Potenzial für schwerwiegende Auswirkungen auf Einzelpersonen haben.
Vermeiden Sie das Erstellen von benutzerdefinierten Entitäten, die unnötige oder vertrauliche Informationen extrahieren. Vermeiden Sie das Extrahieren vertraulicher Benutzerinformationen, wenn sie für Ihren Anwendungsfall nicht erforderlich ist. Wenn Ihr Szenario z. B. das Extrahieren der Stadt und Region Ihres Benutzers erfordert, erstellen Sie Entitäten, die nur die Stadt und das Land/die Region aus der Adresse eines Benutzers extrahieren, anstatt die gesamte Adresse zu extrahieren.
-
Rechtliche und behördliche Überlegungen: Organisationen müssen potenzielle spezifische rechtliche und behördliche Verpflichtungen bewerten, wenn Sie Foundry Tools und Lösungen verwenden, die möglicherweise nicht für die Verwendung in jeder Branche oder in jedem Szenario geeignet sind. Darüber hinaus sind Foundry Tools oder Lösungen nicht für sie ausgelegt und dürfen nicht auf eine Weise verwendet werden, die in anwendbaren Nutzungsbedingungen und relevanten Verhaltensregeln verboten ist.