Extraire des insights à l’aide du langage Azure et d’Azure Database pour PostgreSQL
Les entreprises stockent souvent du texte riche en détails, mais difficile à utiliser directement. Une description de propriété unique peut mentionner des meubles, des monuments de quartier et des commodités, tandis qu’une révision d’invité pourrait mélanger les louanges avec la critique. Enterrés dans ces mots sont des indices qui pourraient améliorer la recherche, mettre en évidence des caractéristiques uniques ou des tendances de surface. Le défi est de trouver un moyen de tirer ces détails sans lire chaque ligne de texte.
Considérons Margie’s Travel, une société de location de vacances qui gère des milliers de référencements. Leur base de données contient de longues descriptions et des avis clients. L’équipe d’application souhaite identifier rapidement les rubriques principales, capturer les mentions d’emplacements ou d’éléments spécifiques et s’assurer que les détails sensibles tels que les numéros de téléphone ne sont pas exposés. L’exécution de ces tâches manuellement n’est pas pratique à grande échelle. Elles utilisent donc les services Azure Language avec l’extension azure_ai dans Azure Database pour PostgreSQL.
Avec cette approche, ils peuvent appliquer trois fonctionnalités directement à l’intérieur de la base de données : extraction de phrases clés, reconnaissance d’entité nommée et détection d’informations d’identification personnelle (PII).
Extraction d’expressions clés
L’extraction d’expressions clés identifie les principales idées ou rubriques dans le texte. Il extrait les concepts qui représentent le mieux ce qu’est le passage.
Dans Azure Database pour PostgreSQL, cette extraction est effectuée avec la azure_cognitive.extract_key_phrases fonction. Elle nécessite le texte et la langue d’entrée, et retourne une liste des expressions les plus pertinentes. Par exemple, l’analyse d’une description de propriété peut générer des expressions telles que "queen bed,""light rail station" ou "garden produce".
Pour Margie’s Travel, ces informations facilitent l'étiquetage des listes avec des sujets cohérents ou le regroupement des avis basés sur des thèmes récurrents.
Reconnaissance d’entité nommée
La reconnaissance d’entité nommée (NER) identifie et catégorise des éléments spécifiques tels que des personnes, des emplacements, des produits ou des dates.
Dans Azure Database pour PostgreSQL, la azure_cognitive.recognize_entities fonction effectue cette analyse. Il étiquette les entités reconnues et fournit un score de confiance pour chacun d’eux. Par exemple, une description de liste peut exposer des entités telles que « Quartier Queen Anne » (emplacement), « sous-sol » (emplacement structurel) ou « canapé » (produit).
Pour Margie’s Travel, ces insights enrichissent leurs données en transformant le texte libre en informations structurées. Le personnel peut filtrer ou rechercher des listes par des entités reconnues, ce qui rend la plateforme plus utile pour les invités et les propriétaires de propriétés.
Détection d’informations d’identification personnelle
Le texte contient souvent des détails sensibles qui ne doivent pas être partagés, tels que les numéros de téléphone, les adresses ou les informations de paiement. La détection des informations d’identification personnelle (PII) identifie et réacte automatiquement ce type de contenu.
Dans Azure Database pour PostgreSQL, la azure_cognitive.recognize_pii_entities fonction détecte et masque les informations personnelles, en retournant à la fois le texte d’origine avec des détails sensibles et des métadonnées sur ce qui a été trouvé.
Pour Margie’s Travel, cette fonction garantit que les données client privées sont protégées lorsque les révisions sont analysées, affichées ou exportées. Elle réduit les risques et prend en charge les exigences de conformité.
Pourquoi ces insights ont une importance
L’extraction d’expressions clés, la reconnaissance d’entité nommée et la détection des informations personnelles permettent de transformer du texte non structuré en insights structurés et sécurisés. Ensemble, ils permettent aux organisations de :
- Améliorez la recherche et la catégorisation en exposant des expressions importantes.
- Mettez en surbrillance des entités telles que des emplacements et des produits pour enrichir les applications.
- Protégez la confidentialité en réactant automatiquement les informations sensibles.
Pour Margie’s Travel, ces fonctionnalités signifient qu’elles peuvent gérer de grands volumes de texte plus efficacement tout en améliorant la confiance des clients et l’expérience globale.
Points clés à prendre
Dans cette unité, vous allez apprendre à extraire des insights à partir de données textuelles avec les services Azure Language dans Azure Database pour PostgreSQL. L’extraction d’expressions clés identifie les rubriques importantes, la reconnaissance d’entité nommée catégorise les entités et la détection des informations personnelles protège les informations sensibles. Ces techniques transforment du texte de forme libre en données structurées plus faciles à analyser, rechercher et protéger.