Transparenzhinweise und Anwendungsfälle für Dokumentintelligenz

Wichtig

Nicht englische Übersetzungen werden nur zur Bequemlichkeit bereitgestellt. Bitte konsultieren Sie die EN-US Version dieses Dokuments für die endgültige Version.

Was ist eine Transparenznotiz?

Ein KI-System umfasst nicht nur die Technologie, sondern auch die Personen, die es nutzen werden, die Menschen, die davon betroffen sind, und die Umgebung, in der sie bereitgestellt wird. Die Erstellung eines Systems, das für den vorgesehenen Zweck geeignet ist, erfordert ein Verständnis der Funktionsweise der Technologie, ihrer Fähigkeiten und Einschränkungen und derEn Erreichung der besten Leistung.

Microsoft bietet transparency Notes, die Ihnen helfen, zu verstehen, wie unsere KI-Technologie funktioniert. Dazu gehören die Auswahlmöglichkeiten von Systembesitzern, die die Systemleistung und das Verhalten beeinflussen, und die Bedeutung des Denkens über das gesamte System, einschließlich der Technologie, der Menschen und der Umgebung. Sie können Transparenzhinweise verwenden, wenn Sie Ihr eigenes System entwickeln oder bereitstellen, oder sie mit den Personen teilen, die ihr System verwenden oder davon betroffen sind.

Transparenzhinweise sind Teil eines umfassenderen Aufwands bei Microsoft, unsere KI-Prinzipien in die Praxis umzusetzen. Weitere Informationen finden Sie unter Microsoft KI-Prinzipien.

Grundlagen der Dokumentintelligenz

Einführung

Auf die Dokumentintelligenz kann über eine Reihe von APIs zugegriffen werden und Entwickler können Text, Struktur und Felder problemlos aus ihren Dokumenten extrahieren. Es besteht aus Features wie:

  • Lesen für die Textextraktion.
  • Layout und allgemeine Dokumente für strukturelle Erkenntnisse und allgemeine Ke-Werte und Entitäten wie Namen, Orte und Dinge.
  • Vorgefertigte Modelle für bestimmte Dokumenttypen wie Rechnungen, Belege, Visitenkarten, W2s und IDs.
  • Benutzerdefinierte Modelle zum Erstellen von Modelltypen, die für Ihre Dokumenttypen spezifisch sind.

Document Intelligence unterstützt eine oder mehrere Sprachen und Gebietsschemas für die einzelnen Features, wie im Artikel " Unterstützte Sprachen " aufgeführt.

Schlüsselbegriffe

Begriff Definition
Lesen Mit diesem Feature werden Textzeilen, Wörter und deren Speicherorte aus Bildern und Dokumenten sowie anderen Informationen wie erkannten Sprachen extrahiert.
Layout Dieses Feature extrahiert Text, Auswahlzeichen und Tabellenstruktur (die Zeilen- und Spaltennummern, die dem Text zugeordnet sind). Siehe Dokument-Intelligenz Layout.
Allgemeine Dokumente Analysieren von Dokumenten und Zuordnen von Werten zu Schlüsseln und Einträgen zu Tabellen, die es entdeckt. Weitere Informationen finden Sie unter Document Intelligence General Documents.
Vorgefertigte Modelle Vordefinierte Modelle sind dokumentspezifische Modelle für eindeutige Formulartypen. Für diese Modelle ist vor der Verwendung keine benutzerdefinierte Schulung erforderlich. Beispielsweise extrahiert das vorgefertigte Rechnungsmodell Schlüsselfelder aus Rechnungen. Weitere Informationen finden Sie unter Dokumentintelligenz-Vorrechnungsmodell.
Benutzerdefinierte Modelle Mit Document Intelligence können Sie ein benutzerdefiniertes Modell trainieren, das auf Ihre Formulare und Dokumente zugeschnitten ist. Dieses Modell extrahiert Text-, Schlüssel-Wert-Paare, Auswahlzeichen und Tabellendaten. Benutzerdefinierte Modelle können mit menschlichem Feedback verbessert werden, indem sie menschliche Überprüfungen anwenden, die Bezeichnungen aktualisieren und das Modell mithilfe der API umgestalten.
Konfidenzwert Alle Operationen zum Abrufen von Analyseergebnissen geben Konfidenzwerte im Bereich zwischen 0 und 1 für alle extrahierten Wörter und Schlüsselwertzuordnungen zurück. Dieser Wert stellt die Schätzung des Diensts dar, wie oft es das Wort korrekt aus 100 extrahiert oder die Schlüsselwertpaare richtig zuordnet. Beispielsweise ergibt ein Wort, von dem geschätzt wird, dass es in 82 % der Fälle korrekt extrahiert wird, einen Konfidenzwert von 0,82.
Zusatzfunktionen Document Intelligence bietet eine Reihe von Add-On-Features, um die Ergebnisse zu erweitern, um weitere Elemente aus Ihren Dokumenten einzuschließen. Einige Add-On-Features verursachen zusätzliche Kosten und können je nach Szenario der Dokumentextraktion aktiviert und deaktiviert werden. Wir bieten derzeit hohe Auflösung, Formel, StyleFont, Barcodes, Sprachen, keyValuePairs und queryFields-Extraktionsfunktionen. Weitere Informationen finden Sie unter Dokumentintelligenz-Add-On-Funktionen.

Funktionen

Systemverhalten

Azure Document Intelligence in Foundry Tools ist ein cloudbasiertes Foundry-Tool, das mit optischer Zeichenerkennung (OCR), Textanalyse und benutzerdefiniertem Text aus Foundry Tools erstellt wird. Derzeit verwenden benutzerdefinierte Modelle das GPT-3.5-Modell des Azure OpenAI-Dienstes. OCR wird verwendet, um Schriftarten und handschriftliche Textdokumente zu extrahieren. Document Intelligence verwendet OCR zum Erkennen und Extrahieren von Informationen aus Formularen und Dokumenten, die von KI unterstützt werden, um mehr Struktur und Informationen für die Textextraktion bereitzustellen.

Anwendungsfälle

Beabsichtigte Verwendungen

Document Intelligence enthält Features, mit denen Kunden aus verschiedenen Branchen Daten aus ihren Dokumenten extrahieren können. Die folgenden Szenarien sind Beispiele für geeignete Anwendungsfälle:

  • Kreditorenbuchhaltung: Ein Unternehmen kann die Effizienz seiner Mitarbeiter der Kreditorenbuchhaltung steigern, indem es das vorgefertigte Rechnungsmodell und benutzerdefinierte Formulare verwendet, um die Eingabe von Rechnungsdaten mit einem menschlichen Ablauf zu beschleunigen. Das vorgefertigte Rechnungsmodell kann Schlüsselfelder wie Rechnungssumme und Versandadresse extrahieren.

  • Versicherungsformularverarbeitung: Ein Kunde kann ein Modell trainieren, indem benutzerdefinierte Formulare verwendet werden, um ein Schlüsselwertpaar in Versicherungsformularen zu extrahieren und dann die Daten in den Geschäftsablauf zu verfüttern, um die Genauigkeit und Effizienz ihres Prozesses zu verbessern. Für ihre eindeutigen Formulare können Kunden ein eigenes Modell erstellen, das Schlüsselwerte mithilfe von benutzerdefinierten Formularen extrahiert. Diese extrahierten Werte werden dann zu umsetzbaren Daten für verschiedene Workflows innerhalb ihres Unternehmens.

  • Bankformularverarbeitung: Eine Bank kann das vordefinierte ID-Modell und benutzerdefinierte Formulare verwenden, um die Dateneingabe für die Dokumentation "Kennen Ihres Kunden" zu beschleunigen oder die Dateneingabe für ein Hypothekenpaket zu beschleunigen. Wenn eine Bank erfordert, dass ihre Kunden im Rahmen eines Prozesses eine persönliche Identifikation übermitteln, kann das vordefinierte ID-Modell schlüsselwerte wie Name und Dokumentnummer extrahieren und die Gesamtzeit für die Dateneingabe beschleunigen.

  • Roboterprozessautomatisierung (RPA): Mithilfe des benutzerdefinierten Extraktionsmodells können Kunden bestimmte Daten extrahieren, die aus verschiedenen Arten von Dokumenten benötigt werden. Das extrahierte Schlüssel-Wert-Paar kann dann in verschiedene Systeme wie Datenbanken oder CRM-Systeme über RPA eingegeben werden, um die manuelle Dateneingabe zu ersetzen. Kunden können auch ein benutzerdefiniertes Klassifizierungsmodell verwenden, um Dokumente basierend auf ihren Inhalten zu kategorisieren und an einem richtigen Speicherort zu speichern. Daher kann ein organisierter Satz von Daten, die aus dem benutzerdefinierten Modell extrahiert wurden, ein wesentlicher erster Schritt sein, um RPA-Szenarien für Unternehmen zu dokumentieren, die große Mengen von Dokumenten regelmäßig verarbeiten.

Überlegungen bei der Auswahl anderer Anwendungsfälle

Berücksichtigen Sie die folgenden Faktoren, wenn Sie einen Anwendungsfall auswählen:

  • Berücksichtigen Sie sorgfältig die Anwendung der menschlichen Überprüfung, wenn vertrauliche Daten oder Szenarien beteiligt sind: Es ist wichtig, einen Menschen in die Schleife für eine manuelle Überprüfung einzuschließen, wenn Sie mit Szenarien mit hohem Einsatz (z. B. Auswirkungen auf die Folgerechte einer Person) oder vertraulichen Daten umgehen. Machine Learning-Modelle sind nicht perfekt. Berücksichtigen Sie sorgfältig, wann Sie einen manuellen Überprüfungsschritt für bestimmte Workflows einschließen. Beispielsweise sollte die Identitätsüberprüfung an einem Einreisehafen wie Flughäfen eine menschliche Aufsicht umfassen.

  • Überlegen Sie sorgfältig, wann Sie für die Gewährung oder Ablehnung von Leistungen nutzen: Doc Intelligence wurde nicht für die Gewährung oder Ablehnung von Leistungen entworfen oder bewertet, und die Verwendung in diesen Szenarien kann unbeabsichtigte Folgen haben. Zu diesen Szenarien gehören:

    • Krankenversicherung: Dazu gehören die Verwendung von Krankenakten und ärztlichen Verschreibungen als Grundlage für Entscheidungen über eine Versicherungsprämie oder Ablehnung.
    • Darlehensgenehmigungen: Dazu gehören Anträge auf neue Darlehen oder Refinanzierung bestehender Darlehen.
  • Berücksichtigen Sie sorgfältig die unterstützten Dokumenttypen und Gebietsschemas: Vordefinierte Modelle verfügen über eine vordefinierte Liste der unterstützten Felder und werden für bestimmte Gebietsschemas erstellt. Achten Sie darauf, die offiziell unterstützten Gebietsschemas und Dokumenttypen sorgfältig zu überprüfen, um die besten Ergebnisse sicherzustellen. Beispielweise siehe vorgefertigte Belegorte der Dokumentintelligenz.

  • Rechtliche und behördliche Überlegungen: Organisationen müssen potenzielle spezifische rechtliche und behördliche Verpflichtungen bewerten, wenn Sie Foundry Tools und Lösungen verwenden, die möglicherweise nicht für die Verwendung in jeder Branche oder in jedem Szenario geeignet sind. Darüber hinaus sind Foundry Tools oder Lösungen nicht für sie ausgelegt und dürfen nicht auf eine Weise verwendet werden, die in anwendbaren Nutzungsbedingungen und relevanten Verhaltensregeln verboten ist.

Einschränkungen

Technische Einschränkungen, Betriebliche Faktoren und Reichweiten

Vorkonfigurierte Modellbeschränkungen

Dokumentintelligenzmodelle werden für die Verarbeitung bestimmter Dokumenttypen verwendet und sind auf Tausenden von Formularen vortrainiert. Mit dieser Funktion können Entwickler innerhalb weniger Minuten erste Schritte durchführen und Ergebnisse erhalten, ohne dass Schulungsdaten oder Bezeichnungen erforderlich sind. Bei vordefinierten Modellen ist es wichtig, die Liste der Eingabeanforderungen, unterstützten Dokumenttypen und Gebietsschemas für jedes vordefinierte Modell zu beachten, um optimale Ergebnisse zu erzielen. Verweisen Sie z. B. auf die vordefinierten Rechnungseingabeanforderungen.

Einschränkungen des benutzerdefinierten Modells

Benutzerdefinierte Dokumentintelligenzmodelle werden mit Ihren eigenen Schulungsdaten trainiert, damit das Modell auf Ihre spezifischen Formulare und Dokumente abgestimmt wird. Diese Funktion hängt stark von der Art und Weise ab, wie Sie die Daten bezeichnen, sowie von der Art der von Ihnen bereitgestellten Schulungsdatensätze. Bei benutzerdefinierten Modellen ist es wichtig, die Grenzwerte für die Größe von Schulungsdatensätze, Dokumentseitenbeschränkungen und die Mindestanzahl der Für jeden Dokumenttyp erforderlichen Beispiele zu beachten. Benutzerdefinierte Modelle verwenden derzeit das GPT-3.5-Modell von Azure OpenAI Service. Weitere Informationen zu den Azure OpenAI-Modellen finden Sie im Azure OpenAI Transparency Note.

Die Seite "Dienstbeschränkungen " enthält weitere Informationen zu Dokumentintelligenz-Dienstkontingenten und Grenzwerten für alle Preisstufen. Sie enthält außerdem Modellbeschränkungen sowie bewährte Methoden zur Nutzung von Modellen und zur Vermeidung einer Anforderungsdrosselung.

Featureunterstützung

In der Tabelle "Analysefeatures" finden Sie eine Liste der verschiedenen Vorgänge, die von Document Intelligence-Modellen ausgeführt werden können.

Systemleistung

Genauigkeit

Text besteht aus Zeilen und Wörtern auf der Basisebene und Entitäten wie Namen, Preise, Beträgen, Firmennamen und Produkten auf Dokumentverständnisebene.

Wortgenauigkeit

Ein beliebtes Maß an Genauigkeit für OCR ist die Wortfehlerrate (WER), oder wie viele Wörter in den extrahierten Ergebnissen falsch ausgegeben wurden. Je niedriger der WER, desto höher die Genauigkeit.

WER ist definiert als:

Abbildung einer WER-Definition.

Wo:

Begriff Definition Beispiel
S Anzahl falscher Wörter ("ersetzt") in der Ausgabe. "Samt" wird als "Veivet" extrahiert, weil "l" als "i" erkannt wird.
D Anzahl fehlender ("gelöschter") Wörter in der Ausgabe. Für den Text "Firmenname: Microsoft" wird Microsoft nicht extrahiert, da er handschriftlich oder schwer zu lesen ist.
Ich Anzahl nicht vorhandener ("eingefügter") Wörter in der Ausgabe. "Abteilung" wird fälschlicherweise in drei Wörter als "Dep artm ent" segmentiert. In diesem Fall ist das Ergebnis ein gelöschtes Wort und drei eingefügte Wörter.
C Anzahl der korrekt extrahierten Wörter in der Ausgabe. Alle korrekt extrahierten Wörter.
N Anzahl der Gesamtzahl der Wörter in der Referenz (N=S+D+C) ohne I, da diese Wörter aus dem ursprünglichen Bezug fehlen und falsch als vorhanden vorhergesagt wurden. Betrachten Sie ein Bild mit dem Satz "Microsoft, mit Sitz in Redmond, WA hat ein neues Produkt namens Samt für Finanzabteilungen angekündigt." Angenommen, die OCR-Ausgabe ist " , mit Hauptsitz in Redmond, WA kündigte ein neues Produkt namens Veivet for finance dep artm ents." In diesem Fall S (Samt) = 1, D (Microsoft) = 1, I (dep artm ents) = 3, C (11) und N = S + D + C = 13. Daher gilt WER = (S + D + I) / N = 5 / 13 = 0,38 oder 38% (von 100).

Verwenden eines Konfidenzwerts

Wie in einem früheren Abschnitt beschrieben, bietet der Dienst einen Konfidenzwert für jedes vorhergesagte Wort in der OCR-Ausgabe. Kunden verwenden diesen Wert, um benutzerdefinierte Schwellenwerte für ihre Inhalte und Szenarien zu kalibrieren, um den Inhalt zur direkten Verarbeitung oder an den menschlichen In-the-Loop-Prozess weiterzuleiten. Die resultierenden Messungen bestimmen die szenariospezifische Genauigkeit.

OCR-Systemleistungsauswirkungen können je nach Szenarien variieren, in denen die OCR-Technologie angewendet wird. Wir werden einige Beispiele überprüfen, um dieses Konzept zu veranschaulichen.

  • Compliance von Medizinprodukten: In diesem ersten Beispiel muss ein multinationales Pharmaunternehmen mit einem vielfältigen Produktportfolio an Patenten, Geräten, Medikamenten und Behandlungen FDA-konformen Produktbezeichnungsinformationen und Analyseergebnissen analysieren. Das Unternehmen zieht möglicherweise eine niedrige Schwelle des Konfidenzwerts für die Anwendung von menschlicher Einbindung vor, da die Kosten für falsch extrahierte Daten erhebliche Auswirkungen auf Verbraucher haben und zu Geldbußen von Aufsichtsbehörden führen können.
  • Bild- und Dokumentverarbeitung: In diesem zweiten Beispiel führt ein Unternehmen eine Versicherungs- und Kreditantragsverarbeitung durch. Der Kunde, der OCR verwendet, bevorzugt möglicherweise einen Schwellenwert für mittlere Konfidenzwerte, da die automatisierte Textextraktion mit anderen Informationseingaben und Human-in-the-Loop-Schritten für eine ganzheitliche Überprüfung von Anwendungen kombiniert wird.
  • Inhaltsmoderation: Für eine große Menge von E-Commerce-Katalogdaten, die aus Lieferanten im Großen und Ganzen importiert werden, bevorzugen die Kunden möglicherweise einen schwellenwert für hohen Konfidenzwert mit hoher Genauigkeit, da selbst ein kleiner Prozentsatz falsch gekennzeichneter Inhalte viel Mehraufwand für ihre Mitarbeiterprüfteams und -lieferanten verursachen kann.

Genauigkeit auf Dokument- und Entitätsebene

Auf Dokumentebene kann z. B. bei einer Rechnung oder einem Beleg ein Fehler von nur einem Zeichen im gesamten Dokument unbedeutend bewertet werden. Wenn sich dieser Fehler jedoch im Text befindet, der den bezahlten Betrag darstellt, wird die gesamte Rechnung oder der gesamte Beleg möglicherweise als falsch gekennzeichnet.

Eine weitere nützliche Metrik ist die Entitätsfehlerrate (EER). Es ist der Prozentsatz falsch extrahierter Entitäten, z. B. Namen, Preise, Beträge und Telefonnummern, aus der Gesamtanzahl der entsprechenden Entitäten in einem oder mehreren Dokumenten. Zum Beispiel ergeben 2 falsche Wörter von insgesamt 30 Wörtern, die 10 Namen darstellen, einen WER von 0,06 (6%). Wenn dies jedoch dazu führt, dass 2 von 10 Namen falsch sind, beträgt die Fehlerrate (Name EER) 0,20 (20 %), was im Vergleich zum WER viel höher ist.

Das Messen von WER und EER ist eine nützliche Übung, um eine vollständige Perspektive auf die Genauigkeit des Dokumentverständnisses zu erhalten.

Bewährte Methoden zur Verbesserung der Systemleistung

Berücksichtigen Sie die folgenden Punkte zu Einschränkungen und Leistung:

Der Dienst unterstützt Bilder und Dokumente. Informationen zu den zulässigen Grenzwerten für die Anzahl von Seiten, Bildgrößen, Papierformaten und Dateigrößen finden Sie unter Was ist Dokumentintelligenz?.

  • Viele Variablen können sich auf die Genauigkeit der OCR-Ergebnisse auswirken, von denen die Dokumentintelligenz abhängt. Zu diesen Variablen gehören Dokumentscanqualität, Auflösung, Kontrast, Lichtbedingungen, Drehung und Textattribute wie Größe, Farbe und Dichte. Es wird beispielsweise empfohlen, dass das Bild mindestens 50 x 50 Pixel beträgt. Lesen Sie die Produktspezifikationen, und testen Sie den Dienst auf Ihren Dokumenten, um die Eignung für Ihre Situation zu überprüfen.
  • Beachten Sie die Einschränkungen der einzelnen Dienste in Bezug auf derzeit unterstützte Eingaben, Sprachen und Gebietsschemas sowie Dokumenttypen. Verweisen Sie z. B. auf die unterstützten Layoutsprachen.

Bewährte Methoden zur Verbesserung der benutzerdefinierten Modellqualität

Wenn Sie das benutzerdefinierte Dokumentintelligenzmodell verwenden, stellen Sie Ihre eigenen Schulungsdaten bereit, damit das Modell ihre spezifischen Formulare und Dokumente trainieren kann. In der folgenden Liste wird der benutzerdefinierte Formularmodelltyp verwendet, um Starttipps zur Verbesserung der Modellqualität zu teilen.

  • Verwenden Sie für ausgefüllte Formulare Beispiele, in denen alle Felder ausgefüllt sind.
  • Verwenden Sie Formulare mit realen Werten, die Sie für jedes Feld erwarten.
  • Wenn Ihre Formularbilder von geringerer Qualität sind, verwenden Sie einen größeren Datensatz (z. B. 10-15 Bilder).

Eine vollständige Anleitung und Eingabeanforderungen finden Sie unter Erstellen eines Schulungsdatensatzes für ein benutzerdefiniertes Modell.

Auswertung der Dokumentintelligenz

Die Leistung von Document Intelligence hängt von den realen Lösungen ab, für die sie implementiert ist. Um eine optimale Leistung in ihren Szenarien zu gewährleisten, sollten Kunden eigene Auswertungen durchführen. Der Dienst bietet einen Konfidenzwert im Bereich zwischen 0 und 1 für jedes extrahierte Wort und jede Schlüsselwertzuordnung. Kunden sollten ein Pilotprojekt oder einen Machbarkeitsnachweis ausführen, der ihren Anwendungsfall darstellt, um den Bereich der Konfidenzwerte und die Extraktionsqualität aus Document Intelligence zu verstehen. Sie können dann die Konfidenzwertschwellenwerte für die Ergebnisse schätzen, die entweder für die straight-through-Verarbeitung (STP) gesendet oder von einem Menschen überprüft werden sollen. Beispielsweise kann der Kunde Ergebnisse mit Konfidenzwerten übermitteln, die größer oder gleich 0,80 für die direkte Verarbeitung sind, und die menschliche Überprüfung auf Ergebnisse mit Konfidenzwerten unter 0,80 anwenden.

Auswerten und Integrieren von Dokumentintelligenz für Ihre Verwendung

Microsoft möchte Ihnen helfen, Lösungen mit Dokumentintelligenz verantwortungsbewusst zu entwickeln und bereitzustellen. Wir verfolgen einen prinzipiellen Ansatz zur Wahrung persönlicher Freiheit und Würde, indem wir die Fairness, Zuverlässigkeit und Sicherheit der KI-Systeme sowie deren Privatsphäre, Inklusion, Transparenz und menschliche Verantwortlichkeit in Betracht ziehen. Diese Überlegungen entsprechen unserem Engagement für die Entwicklung verantwortlicher KI.

Wenn Sie sich darauf vorbereiten, KI-basierte Produkte oder Features bereitzustellen, helfen Ihnen die folgenden Aktivitäten, um Sie zum Erfolg zu führen:

  • Verstehen, was es tun kann: Bewerten Sie das Potenzial der Dokument-Intelligenz, um ihre Funktionalitäten und Grenzen zu verstehen. Verstehen Sie, wie es sich in Ihrem jeweiligen Szenario und Kontext verhält. Wenn Sie z. B. das vordefinierte Rechnungsmodell verwenden, testen Sie mit realen Rechnungen aus Ihren Geschäftsprozessen, um die Ergebnisse anhand Ihrer vorhandenen Prozessmetriken zu analysieren und zu vergleichen.

  • Respektieren Sie das Recht einer Person auf Privatsphäre: Sammeln Sie nur Daten und Informationen von Einzelpersonen für rechtmäßige und berechtigte Zwecke. Verwenden Sie nur Daten und Informationen, für deren Nutzung Sie die Zustimmung zu diesem Zweck haben.

  • Rechtliche Überprüfung: Erhalten Sie eine entsprechende rechtliche Überprüfung, insbesondere, wenn Sie sie in sensiblen oder risikoreichen Anwendungen verwenden möchten. Verstehen Sie, in welchen Einschränkungen Sie möglicherweise arbeiten müssen, und Ihre Verantwortung, um probleme zu lösen, die in Zukunft auftreten könnten.

  • Mensch-in-der-Schleife: Behalten Sie einen Menschen im Entscheidungsprozess und schließen Sie menschliche Aufsicht als konsistenten Bereich zum Erkunden ein. Dies bedeutet, dass eine ständige menschliche Aufsicht über das KI-gestützte Produkt oder feature gewährleistet und die Rolle des Menschen bei der Entscheidungsfindung beibehalten wird. Stellen Sie sicher, dass Sie einen menschlichen Eingriff in Echtzeit in die Lösung durchführen können, um Schaden zu vermeiden. Ein menschlicher Eingriff ermöglicht es Ihnen, Situationen zu verwalten, in denen die Dokumenten-KI nicht wie erwartet funktioniert.

  • Sicherheit: Stellen Sie sicher, dass Ihre Lösung sicher ist und über ausreichende Steuerelemente verfügt, um die Integrität Ihrer Inhalte beizubehalten und unbefugten Zugriff zu verhindern.

Empfehlungen zum Schutz der Privatsphäre

Ein erfolgreicher Datenschutzansatz ermöglicht Einzelpersonen informationen und bietet Kontrollen und Schutz, um ihre Privatsphäre zu erhalten.

  • Wenn Document Intelligence Teil einer Lösung ist, die für die Einbeziehung personenbezogener Informationen (Personally Identifiable Information, PII) konzipiert ist, überlegen Sie sorgfältig, ob und wie diese Daten erfasst werden. Folgen Sie den geltenden nationalen und regionalen Vorschriften zu Datenschutz und vertraulichen Daten.
  • Datenschutzmanager sollten die Aufbewahrungsrichtlinien für den extrahierten Text und die werte sowie die zugrunde liegenden Dokumente oder Bilder dieser Dokumente berücksichtigen. Die Aufbewahrungsrichtlinien sind an die beabsichtigte Verwendung jeder Anwendung gebunden.

Erfahren Sie mehr über verantwortungsvolle KI

Weitere Informationen zur Dokumentintelligenz