Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
Les traductions non anglaises sont fournies uniquement pour des raisons pratiques. Consultez la EN-US version de ce document pour obtenir la version définitive.
Cet article fournit des détails généraux sur la façon dont les données sont traitées par la classification de texte personnalisée. N’oubliez pas que vous êtes responsable de votre utilisation et de la mise en œuvre de cette technologie, qui inclut la conformité à toutes les lois et réglementations qui s’appliquent à vous. Par exemple, il vous incombe de :
- Comprendre où vos données sont traitées et stockées par le service de classification de texte personnalisé pour répondre aux obligations réglementaires de votre application.
- Vérifiez que vous disposez de toutes les licences, droits propriétaires ou autres autorisations nécessaires pour le contenu de votre jeu de données utilisé comme base pour la création de vos modèles de classification de texte personnalisés.
Il vous incombe de respecter toutes les lois et réglementations applicables dans votre juridiction.
Quelles données le processus de classification de texte personnalisé effectue-t-il ?
La classification de texte personnalisée traite les données suivantes :
Fichier de jeux de données et d'étiquettes de l'utilisateur : comme condition préalable à la création d'un projet de classification de texte personnalisé, les utilisateurs doivent charger leur jeu de données dans leur conteneur Stockage Blob Azure. Un fichier de balises est un fichier au format JSON qui contient des références aux données et classes étiquetées d’un utilisateur. L’utilisateur peut soit apporter ses propres balises, soit étiqueter ses données via l’expérience d’interface utilisateur dans Language Studio. Dans les deux cas, un fichier d’étiquettes qui contient des données et des classes étiquetées est essentiel pour l’entraînement.
Le jeu de données d’un utilisateur est divisé en jeux d’apprentissage et de test, où le fractionnement peut être prédéfini par les développeurs dans un fichier de balises ou choisi au hasard pendant l’entraînement. Le jeu d’apprentissage et le fichier d’étiquettes sont traités pendant l’entraînement pour créer le modèle de classification de texte personnalisé. Le jeu de tests est traité ultérieurement par le modèle entraîné pour évaluer ses performances.
Modèles de classification de texte personnalisés : en fonction de la demande de l’utilisateur d’entraîner le modèle, la classification de texte personnalisée traite les données étiquetées fournies pour générer un modèle entraîné. L’utilisateur peut choisir d’entraîner un nouveau modèle ou de remplacer un modèle existant. Le modèle entraîné est ensuite stocké côté service et utilisé pour le traitement de l’évaluation du modèle. Une fois que le développeur est satisfait des performances du modèle, il demande le déploiement du modèle pour une mise en production. Le modèle déployé est également stocké côté service, qui est utilisé pour traiter les demandes de prédiction de l’utilisateur via l’API Analyser.
Données envoyées pour la classification : ces données sont le texte de l’utilisateur envoyé à partir de l’application cliente d’un client via l’API Analyser pour être traitées pour la classification de texte par le modèle Machine Learning personnalisé. La sortie des données traitées contient les classes prédites ainsi que leurs scores de confiance. Cette sortie est retournée à l’application du client pour effectuer une action pour répondre à la demande de l’utilisateur.
La classification de texte personnalisée ne collecte ni ne stocke aucune donnée client pour améliorer ses modèles machine-learning ou à des fins d’amélioration du produit. Nous utilisons des données de télémétrie agrégées, telles que les API utilisées et le nombre d’appels de chaque abonnement et ressource, à des fins de supervision des services.
Comment la classification de texte personnalisée traite-t-elle les données ?
Le diagramme suivant illustre la façon dont vos données sont traitées.
Comment les données sont-elles conservées et quels contrôles clients sont disponibles ?
La classification de texte personnalisée est un outil de traitement de données à des fins du règlement général sur la protection des données (RGPD). En conformité avec les stratégies RGPD, les utilisateurs de classification de texte personnalisé ont un contrôle total pour afficher, exporter ou supprimer tout contenu utilisateur via Language Studio ou par programme à l’aide d’API de langue.
Vos données sont stockées uniquement dans votre compte stockage Azure. la classification de texte personnalisée a uniquement accès à la lecture à partir de celle-ci pendant l’entraînement.
Les contrôles des utilisateurs sont les suivants :
- Les données étiquetées fournies par l'utilisateur comme condition préalable à l'apprentissage du modèle sont enregistrées dans le compte stockage Azure du client connecté au projet lors de la création. Les clients peuvent modifier ou supprimer des balises chaque fois qu’ils le souhaitent via Language Studio.
- Les métadonnées de projets de classification de texte personnalisées sont stockées côté service jusqu’à ce que le client supprime le projet. Les métadonnées du projet sont les champs que vous renseignez lorsque vous créez votre projet, comme le nom du projet, la description, la langue, le nom du conteneur d’objets blob connectés et l’emplacement du fichier d’étiquettes.
- Les modèles de classification de texte personnalisés formés sont stockés dans les comptes stockage Azure du service jusqu'à ce que le client les supprime. Le modèle est réécrit chaque fois que l’utilisateur l’entraîne à nouveau.
- Les modèles de classification de texte personnalisés déployés persistent dans les comptes stockage Azure du service jusqu'à ce que le client supprime le déploiement ou supprime le modèle lui-même. Le modèle est remplacé chaque fois que l’utilisateur se déploie sur le même nom de déploiement.
Facultatif : Sécurité des données des clients
Azure services sont implémentés tout en conservant les mesures techniques et organisationnelles appropriées pour protéger les données client dans le cloud.
Pour en savoir plus sur les engagements de confidentialité et de sécurité de Microsoft, consultez le Centre de gestion de la confidentialité Microsoft.