Daten und Datenschutz für die benutzerdefinierte Textklassifizierung

Wichtig

Nicht englische Übersetzungen werden nur zur Bequemlichkeit bereitgestellt. Bitte konsultieren Sie die EN-US Version dieses Dokuments für die endgültige Version.

Dieser Artikel enthält allgemeine Details zur Verarbeitung von Daten durch die benutzerdefinierte Textklassifizierung. Denken Sie daran, dass Sie für Ihre Nutzung und die Implementierung dieser Technologie verantwortlich sind, einschließlich der Einhaltung aller Gesetze und Vorschriften, die für Sie gelten. Beispielsweise ist es Ihre Verantwortung:

Verstehen Sie, wo Ihre Daten vom benutzerdefinierten Textklassifizierungsdienst verarbeitet und gespeichert werden, um behördliche Verpflichtungen für Ihre Anwendung zu erfüllen.
Stellen Sie sicher, dass Sie über alle erforderlichen Lizenzen, proprietären Rechte oder andere Berechtigungen verfügen, die für den Inhalt in Ihrem Dataset erforderlich sind, der als Grundlage für die Erstellung Ihrer benutzerdefinierten Textklassifizierungsmodelle verwendet wird.

Es liegt in Ihrer Verantwortung, alle anwendbaren Gesetze und Vorschriften in Ihrer Gerichtsbarkeit einzuhalten.

Welche Daten verarbeitet die benutzerdefinierte Textklassifizierung?

Die benutzerdefinierte Textklassifizierung verarbeitet die folgenden Daten:

Benutzers Dataset- und Tagsdatei: Als Voraussetzung zum Erstellen eines benutzerdefinierten Textklassifizierungsprojekts müssen Benutzer ihr Dataset in ihren Azure-Blobspeichercontainer hochladen. Eine Tagsdatei ist eine JSON-formatierte Datei , die Verweise auf die markierten Daten und Klassen eines Benutzers enthält. Der Benutzer kann entweder eigene Tags mitbringen oder seine Daten über die Benutzeroberfläche im Language Studio kategorisieren. Auf beide Weise ist eine Tagsdatei, die markierte Daten und Klassen enthält, für die Schulung unerlässlich.

Das Dataset eines Benutzers wird in Trainings- und Testsätze aufgeteilt, wobei die Aufteilung entweder von Entwicklern in einer Tag-Datei vordefiniert oder während des Trainings zufällig ausgewählt werden kann. Der Train set und die Tags-Datei werden während der Schulung verarbeitet, um das benutzerdefinierte Textklassifizierungsmodell zu erstellen. Der Testsatz wird später vom trainierten Modell verarbeitet, um seine Leistung zu bewerten.
Benutzerdefinierte Textklassifizierungsmodelle: Basierend auf der Anforderung des Benutzers, das Modell zu trainieren, verarbeitet benutzerdefinierte Textklassifizierung die bereitgestellten markierten Daten, um ein trainiertes Modell auszugeben. Der Benutzer kann ein neues Modell trainieren oder ein vorhandenes Modell überschreiben. Das trainierte Modell wird dann auf der Seite des Diensts gespeichert und zur Verarbeitung der Modellauswertung verwendet. Nachdem der Entwickler mit der Leistung des Modells zufrieden ist, fordert er die Bereitstellung des Modells für den Einsatz an. Das bereitgestellte Modell wird auch auf der Seite des Diensts gespeichert, die verwendet wird, um die Anforderungen des Benutzers für die Vorhersage über die Analyse-API zu verarbeiten.
Zur Klassifizierung gesendete Daten: Diese Daten sind der Text des Benutzers, der von der Clientanwendung eines Kunden über die Analyse-API gesendet wird, um die Textklassifizierung durch das benutzerdefinierte Machine Learning-Modell zu verarbeiten. Die Ausgabe der verarbeiteten Daten enthält die vorhergesagten Klassen zusammen mit ihren Konfidenzergebnissen. Diese Ausgabe wird an die Anwendung des Clients zurückgegeben, um eine Aktion auszuführen, um die Anforderung des Benutzers zu erfüllen.

Die benutzerdefinierte Textklassifizierung sammelt oder speichert keine Kundendaten, um ihre maschinenlernten Modelle oder für Produktverbesserungszwecke zu verbessern. Wir verwenden aggregierte Telemetrie, z. B. welche APIs verwendet werden, und die Anzahl der Anrufe aus jedem Abonnement und jeder Ressource für Dienstüberwachungszwecke.

Wie verarbeitet die benutzerdefinierte Textklassifizierung Daten?

Das folgende Diagramm veranschaulicht, wie Ihre Daten verarbeitet werden.

Diagramm, das zeigt, wie Daten verarbeitet werden.

Wie werden Daten aufbewahrt, und welche Kundeneinstellungen sind verfügbar?

Die benutzerdefinierte Textklassifizierung ist ein Datenverarbeiter gemäß den Anforderungen der Datenschutz-Grundverordnung (DSGVO). In Übereinstimmung mit DSGVO-Richtlinien haben Benutzer der benutzerdefinierten Textklassifizierung vollzugriff, um Benutzerinhalte entweder über das Language Studio oder programmgesteuert mithilfe von Sprach-APIs anzuzeigen, zu exportieren oder zu löschen.

Ihre Daten werden nur in Ihrem Azure Storage Konto gespeichert. Die benutzerdefinierte Textklassifizierung hat nur während des Trainings Lesezugriff darauf.

Zu den Kundensteuerelementen gehören:

Vom Benutzer bereitgestellte Daten, die als Voraussetzung für das Trainieren des Modells dienen, werden im Azure-Speicherkonto des Kunden gespeichert, das bei der Erstellung mit dem Projekt verbunden ist. Kunden können Tags jederzeit in Language Studio bearbeiten oder entfernen.
Metadaten für benutzerdefinierte Textklassifizierungsprojekte werden auf der Seite des Diensts gespeichert, bis der Kunde das Projekt löscht. Die Metadaten des Projekts sind die Felder, die Sie beim Erstellen des Projekts ausfüllen, z. B. Projektname, Beschreibung, Sprache, Name des verbundenen BLOB-Containers und Dateispeicherort für Tags.
Trainierte benutzerdefinierte Textklassifizierungsmodelle werden in den Azure Storage Konten des Diensts gespeichert, bis der Kunde sie löscht. Das Modell wird jedes Mal überschrieben, wenn der Benutzer es neu trainiert.
Bereitgestellte benutzerdefinierte Textklassifizierungsmodelle bleiben in den Azure Storage Konten des Diensts erhalten, bis der Kunde die Bereitstellung löscht oder das Modell selbst löscht. Das Modell wird jedes Mal überschrieben, wenn der Benutzer denselben Bereitstellungsnamen bereitstellt.

Optional: Sicherheit für Kundendaten

Azure Dienste werden implementiert, während geeignete technische und organisatorische Maßnahmen zum Schutz von Kundendaten in der Cloud beibehalten werden.

Weitere Informationen zu den Datenschutz- und Sicherheitsverpflichtungen von Microsoft finden Sie im Microsoft Trust Center.

Nächste Schritte

Einführung in die benutzerdefinierte Textklassifizierung
Hinweis zur Transparenz bei benutzerdefinierter Textklassifizierung
Leitfaden für integrations- und verantwortungsvolle Nutzung
Microsoft KI-Prinzipien

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-29