Cas d’usage pour la classification de texte personnalisée

Important

Les traductions non anglaises sont fournies uniquement pour des raisons pratiques. Consultez la EN-US version de ce document pour obtenir la version définitive.

Qu’est-ce qu’une note de transparence ?

Un système d’IA inclut non seulement la technologie, mais aussi les personnes qui l’utiliseront, les personnes qui seront affectées par elle et l’environnement dans lequel il est déployé. La création d’un système adapté à son objectif prévu nécessite une compréhension du fonctionnement de la technologie, de ses capacités et de ses limitations et de la façon d’atteindre les meilleures performances. les notes de transparence de Microsoft sont destinées à vous aider à comprendre le fonctionnement de notre technologie IA, les choix que les propriétaires du système peuvent faire qui influencent les performances et le comportement du système, ainsi que l'importance de penser à l'ensemble du système, y compris la technologie, les personnes et l'environnement. Vous pouvez utiliser des notes de transparence lors du développement ou du déploiement de votre propre système, ou les partager avec les personnes qui utiliseront ou seront affectées par votre système.

Les notes de transparence de Microsoft font partie d'un effort plus large de Microsoft pour mettre en pratique nos principes d'IA. Pour en savoir plus, consultez Microsoft principes d’IA.

Présentation de la classification de texte personnalisée

La classification de texte personnalisée est un service d’API basé sur le cloud qui applique l’intelligence machine learning pour vous permettre de créer des modèles personnalisés pour les tâches de classification de texte.

La classification de texte personnalisée prend en charge deux types de projets :

  • Classification d’étiquette unique : vous n’attribuez qu’une seule étiquette pour chaque fichier de votre jeu de données. Par exemple, si un fichier est un script de film, il ne peut être classé que comme « Action », « Thriller » ou « Romance ».
  • Classification de plusieurs étiquettes : vous attribuez plusieurs étiquettes pour chaque fichier de votre jeu de données. Par exemple, si un fichier est un script de film, il peut être classé comme « Action » ou « Action » et « Thriller ».

Principes de base de la classification de texte personnalisée

La classification de texte personnalisée est proposée dans le cadre des fonctionnalités personnalisées dans Azure Language in Foundry Tools. Cette fonctionnalité permet à ses utilisateurs de créer des modèles IA personnalisés pour classifier du texte en catégories personnalisées prédéfinies par l’utilisateur. En créant un projet de classification de texte personnalisé, les développeurs peuvent étiqueter de manière itérative des données et entraîner, évaluer et améliorer les performances du modèle avant de les rendre disponibles pour la consommation. La qualité des données étiquetées affecte considérablement les performances du modèle.

Pour simplifier la création et la personnalisation de votre modèle, le service propose un portail web personnalisé accessible via Language Studio. Vous pouvez facilement commencer à utiliser le service en suivant les étapes décrites dans ce guide de démarrage rapide.

Terminologie de classification de texte personnalisée

Les termes suivants sont couramment utilisés dans la classification de texte personnalisée :

Terme Définition
Projet Un projet est un domaine de travail permettant de créer vos modèles IA personnalisés en fonction de vos données. Votre projet est accessible uniquement par vous et d'autres personnes qui ont accès en tant que contributeurs à la ressource Azure utilisée. Dans un projet, vous pouvez étiqueter des données, générer des modèles, les évaluer et les améliorer si nécessaire, puis déployer un modèle pour être prêt à être consommé. Vous pouvez créer plusieurs modèles au sein de votre projet sur le même jeu de données.
Modèle Un modèle est un objet formé pour effectuer une certaine tâche. Pour ce système, les modèles classifient le texte. Les modèles sont entraînés en apprenant à partir de données étiquetées.
Classe Une classe est une catégorie définie par l’utilisateur qui indique la classification globale du texte. Les développeurs étiquetent leurs données avec leurs classes affectées avant de les transmettre au modèle pour l’entraînement.

Exemples de cas d’usage pour la classification de texte personnalisée

La classification de texte personnalisée peut être utilisée dans plusieurs scénarios dans divers secteurs d’activité. Voici quelques exemples :

  • Triage automatique des e-mails ou des tickets : Les centres de support de tous les types reçoivent un volume élevé d’e-mails ou de tickets contenant du texte et des pièces jointes non structurés, de forme libre. L’examen, l’accusé de réception et le routage en temps opportun vers des experts en la matière au sein des équipes internes sont essentiels. Le tri des e-mails à cette échelle nécessite que les personnes examinent et routent vers les services appropriés, ce qui prend du temps et des ressources. La classification de texte personnalisée peut être utilisée pour analyser le texte entrant et trier et classer le contenu à acheminer automatiquement vers les services concernés pour une action supplémentaire.

  • Exploration des connaissances pour améliorer et enrichir la recherche sémantique : La recherche est fondamentale pour n’importe quelle application qui expose le contenu texte aux utilisateurs. Les scénarios courants incluent les recherches de catalogue ou de documents, les recherches de produits de vente au détail ou l’exploration de connaissances pour la science des données. De nombreuses entreprises de divers secteurs cherchent à créer une expérience de recherche riche sur du contenu privé et hétérogène, qui comprend à la fois des documents structurés et non structurés. Dans le cadre de leur pipeline, les développeurs peuvent utiliser la classification de texte personnalisée pour classer leur texte en classes pertinentes pour leur secteur d’activité. Les classes prédites peuvent être utilisées pour enrichir l’indexation du fichier pour une expérience de recherche plus personnalisée.

Considérations à prendre en compte lorsque vous choisissez un cas d’usage

  • Évitez d’utiliser la classification de texte personnalisée pour les décisions susceptibles d’avoir des répercussions négatives graves. Incluez l’examen humain des décisions susceptibles d’avoir des répercussions graves sur les individus. Par exemple, en identifiant s’il faut accepter ou rejeter une demande d’assurance en fonction de la description d’un incident par un utilisateur.

  • Évitez de créer des classes ambiguës et non représentatives. Lorsque vous concevez votre schéma, évitez les classes qui sont si similaires les unes aux autres qu’il peut y avoir des difficultés à les différencier les unes des autres. Par exemple, si vous classifiez des scripts vidéo, évitez de créer une classe pour la romance, la comédie et rom-com. Au lieu de cela, envisagez d’utiliser un modèle de classification à plusieurs étiquettes avec des classes romance et comédie. Ensuite, pour les films rom-com, attribuez les deux classes.

  • Considérations juridiques et réglementaires : les organisations doivent évaluer des obligations légales et réglementaires spécifiques potentielles lors de l’utilisation d’outils et de solutions Foundry, ce qui peut ne pas convenir à une utilisation dans chaque secteur ou scénario. En outre, les outils ou solutions Foundry ne sont pas conçus pour et ne peuvent pas être utilisés de manière interdite en termes de service applicables et les codes de conduite pertinents.

Étapes suivantes