Gegevens en privacy voor aangepaste tekstclassificatie

Belangrijk

Niet-Engelse vertalingen zijn alleen voor het gemak beschikbaar. Raadpleeg de EN-US versie van dit document voor de definitieve versie.

Dit artikel bevat gedetailleerde informatie over hoe gegevens worden verwerkt door aangepaste tekstclassificatie. Houd er rekening mee dat u verantwoordelijk bent voor uw gebruik en de implementatie van deze technologie, waaronder naleving van alle wetten en voorschriften die op u van toepassing zijn. Het is bijvoorbeeld uw verantwoordelijkheid om:

  • Inzicht in waar uw gegevens worden verwerkt en opgeslagen door de service voor aangepaste tekstclassificatie om te voldoen aan wettelijke verplichtingen voor uw toepassing.
  • Zorg ervoor dat u beschikt over alle benodigde licenties, eigendomsrechten of andere machtigingen die vereist zijn voor de inhoud in uw gegevensset die wordt gebruikt als basis voor het bouwen van uw aangepaste modellen voor tekstclassificatie.

Het is uw verantwoordelijkheid om te voldoen aan alle toepasselijke wetten en voorschriften in uw rechtsgebied.

Welke gegevens worden verwerkt door aangepaste tekstclassificatie?

Aangepaste tekstclassificatie verwerkt de volgende gegevens:

  • Bestand en tags van gebruiker: Als vereiste voor het maken van een aangepast tekstclassificatieproject moeten gebruikers hun gegevensset uploaden naar hun Azure Blob Storage-container. Een tagsbestand is een JSON-bestand dat verwijzingen bevat naar de gelabelde gegevens en klassen van een gebruiker. De gebruiker kan hun eigen tags meenemen of hun gegevens taggen via de gebruikersinterface-ervaring in Language Studio. In beide gevallen is een tagsbestand met getagde gegevens en klassen essentieel voor de training.

    De gegevensset van een gebruiker wordt gesplitst in trainings- en testsets, waarbij de splitsing kan worden vooraf gedefinieerd door ontwikkelaars in een tagsbestand of willekeurig tijdens de training kan worden gekozen. De treinset en het tagsbestand worden verwerkt tijdens de training om het aangepaste model voor tekstclassificatie te maken. De testset wordt later verwerkt door het getrainde model om de prestaties te evalueren.

  • Aangepaste modellen voor tekstclassificatie: op basis van de aanvraag van de gebruiker om het model te trainen, verwerkt aangepaste tekstclassificatie de opgegeven getagde gegevens om een getraind model uit te voeren. De gebruiker kan ervoor kiezen om een nieuw model te trainen of een bestaand model te overschrijven. Het getrainde model wordt vervolgens opgeslagen aan de kant van de service en gebruikt voor het verwerken van de modelevaluatie. Nadat de ontwikkelaar tevreden is met de prestaties van het model, vragen ze om het model te laten implementeren voor productiegebruik. Het geïmplementeerde model wordt ook opgeslagen aan de kant van de service, die wordt gebruikt om de aanvragen van de gebruiker voor voorspelling te verwerken via de Analyse-API.

  • Gegevens die worden verzonden voor classificatie: deze gegevens zijn de tekst van de gebruiker die wordt verzonden vanuit de clienttoepassing van een klant via de Analyze-API die moet worden verwerkt voor tekstclassificatie door het aangepaste machine learning-model. De uitvoer van de verwerkte gegevens bevat de voorspelde klassen, samen met hun betrouwbaarheidsscores. Deze uitvoer wordt geretourneerd naar de toepassing van de client om een actie uit te voeren om te voldoen aan de aanvraag van de gebruiker.

Aangepaste tekstclassificatie verzamelt of slaat geen klantgegevens op om de machine learning-modellen of voor productverbeteringsdoeleinden te verbeteren. We gebruiken geaggregeerde telemetrie, zoals welke API's worden gebruikt en het aantal aanroepen van elk abonnement en elke resource, voor servicebewakingsdoeleinden.

Hoe verwerkt aangepaste tekstclassificatie gegevens?

In het volgende diagram ziet u hoe uw gegevens worden verwerkt.

Diagram dat laat zien hoe gegevens worden verwerkt.

Hoe worden gegevens bewaard en welke besturingselementen van klanten zijn beschikbaar?

Aangepaste tekstclassificatie is een gegevensverwerker voor AVG-doeleinden. In overeenstemming met het AVG-beleid hebben aangepaste tekstclassificatiegebruikers volledige controle over het weergeven, exporteren of verwijderen van gebruikersinhoud via Language Studio of programmatisch met behulp van Language-API's.

Uw gegevens worden alleen opgeslagen in uw Azure Storage-account. aangepaste tekstclassificatie heeft alleen toegang om er tijdens de training van te lezen.

Klantcontroleopties omvatten:

  • Gelabelde gegevens die door de gebruiker worden geleverd als vereiste voor het trainen van het model, worden opgeslagen in het Azure Storage-account van de klant dat tijdens het maken is verbonden met het project. Klanten kunnen tags bewerken of verwijderen wanneer ze dat willen via Language Studio.
  • Metagegevens van aangepaste tekstclassificatieprojecten worden opgeslagen aan de kant van de service totdat de klant het project verwijdert. De metagegevens van het project zijn de velden die u invult wanneer u uw project maakt, zoals projectnaam, beschrijving, taal, naam van verbonden blobcontainer en locatie van tagsbestand.
  • Getrainde aangepaste modellen voor tekstclassificatie worden opgeslagen in de Azure Storage-accounts van de service totdat de klant ze verwijdert. Het model wordt telkens overschreven wanneer de gebruiker het opnieuw traint.
  • Geïmplementeerde aangepaste modellen voor tekstclassificatie blijven behouden in de Azure Storage-accounts van de service totdat de klant de implementatie verwijdert of het model zelf verwijdert. Het model wordt telkens overschreven wanneer de gebruiker het naar dezelfde implementatienaam implementeert.

Optioneel: Beveiliging voor de gegevens van klanten

Azure services worden geïmplementeerd met behoud van de juiste technische en organisatorische maatregelen om klantgegevens in de cloud te beschermen.

Zie het Microsoft Trust Center voor meer informatie over de privacy- en beveiligingsverplichtingen van Microsoft.

Volgende stappen