Classification

Important

Cette fonctionnalité est disponible en préversion publique et est conforme HIPAA.

Vous pouvez utiliser la classification pour classifier vos documents en catégories prédéfinies avec l’IA.

Voici quelques exemples de classification :

  • Classification des transcriptions d’appels client par intention
  • Classification des documents par type de contenu
  • Classification des avis de produit par sentiment

La classification est basée sur la fonction IA. ai_classify La page Agents fournit une interface utilisateur pour classifier rapidement les documents et le texte non structuré et itérer sur les champs de classification pour obtenir de meilleurs résultats.

Exigences

Créer un agent de classification

Accédez à l’icône Agents.Agents dans le volet de navigation gauche de votre espace de travail. Cliquez sur Créer un agent, puis sélectionnez Classification de texte.

Étape 1. Sélectionner vos données sources

Utilisez la classification pour classifier vos documents.

  1. Sélectionnez vos données sources. Vous pouvez sélectionner un volume avec des documents ou un tableau avec des données texte.

  2. Cliquez sur Créer un agent.

Étape 2. Configurer des étiquettes de classification

Une fois que la classification traite vos données, configurez et affinez vos étiquettes de classification.

Pour ajouter manuellement des étiquettes de classification :

  1. Cliquez sur + Ajouter une étiquette pour ajouter une étiquette de classification.
  2. Entrez le nom de l’étiquette et la description facultative, puis cliquez sur Ajouter une étiquette.
  3. Répétez 1 à 2 pour chaque étiquette que vous souhaitez ajouter.
  4. (Facultatif) Activez plusieurs étiquettes si vous souhaitez que l’agent retourne plusieurs étiquettes.

Pour importer des étiquettes à partir d’une table :

  1. Cliquez sur Importer à partir de la table.
  2. Sélectionnez la table, puis cliquez sur Suivant.
  3. Sélectionnez la colonne d’étiquette, la colonne de description et l’entrepôt SQL.
  4. Cliquez sur Aperçu pour afficher les étiquettes importées.
  5. Si vous êtes satisfait des étiquettes, cliquez sur Importer et remplacer des étiquettes.

Vous devez avoir au moins deux étiquettes définies pour exécuter la classification. Une fois que vous avez terminé d’ajouter vos étiquettes, cliquez sur Enregistrer et exécuter la classification.

La classification classifie jusqu’à 5 documents et lignes et affiche les résultats. Vous pouvez également ajouter d’autres éléments.

Interface utilisateur de révision de classification montrant les étiquettes de classification et les résultats

Étape 3. Examiner et améliorer les réponses de classification

Passez en revue les réponses de classification et donnez des commentaires pour améliorer l’agent.

  1. Passez en revue la réponse concernant le document et la classification :

    • Si la réponse est correcte, donnez-lui un pouce vers le haut.
    • Si la réponse est incorrecte, donnez-lui un pouce vers le bas. Aidez Classification à corriger la réponse en choisissant la bonne étiquette. Cliquez sur Enregistrer.
  2. Pour améliorer les réponses de l’agent, ajustez les descriptions des étiquettes de classification.

  3. Comparez les versions pour optimiser les performances de l’agent. Cliquez sur Versions. En regard d’une version précédente, cliquez sur Comparer pour comparer les descriptions d’étiquettes de classification d’une version précédente à la version actuelle. Cliquez sur Restaurer pour restaurer une version précédente.

Étape 4. Utiliser l’agent de classification

Si vous êtes satisfait des réponses, commencez à utiliser l’agent pour la classification à grande échelle.

Cliquez sur Utiliser l’agent en haut à droite. Vous pouvez choisir l’une ou l’autre des options suivantes :

  • Exécutez sql pour utiliser l’agent pour classifier l’intégralité de votre volume ou table. Cela ouvre une requête SQL qui utilise ai_classify les étiquettes de classification que vous avez définies. Pour plus d’informations sur l’utilisation ai_classify dans les requêtes SQL, consultez ai_classify la fonction.
  • Créez un pipeline déclaratif Spark pour déployer un pipeline ETL qui s'exécute à des intervalles réguliers afin d'interroger votre agent sur de nouvelles données. Cela crée des pipelines déclaratifs Spark Lakeflow qui mettent à jour une table de streaming avec vos données classifiées. Vous pouvez configurer la planification du pipeline afin qu’il s’exécute quand de nouvelles données arrivent. Pour plus d’informations sur Lakeflow Spark Declarative Pipelines, consultez Lakeflow Spark Declarative Pipelines.

Limites

Voir limitations