Inzichten extraheren met behulp van Azure Language en Azure Database for PostgreSQL

Voltooid

Bedrijven slaan vaak tekst op die rijk is aan details, maar moeilijk om rechtstreeks mee te werken. Een enkele woningbeschrijving kan meubels, lokale bezienswaardigheden en voorzieningen vermelden, terwijl een gastbeoordeling zowel lof als kritiek kan bevatten. Begraven in deze woorden zijn aanwijzingen die de zoekfunctie kunnen verbeteren, unieke kenmerken kunnen markeren of trends op het oppervlak kunnen weergeven. De uitdaging is het vinden van een manier om die details eruit te halen zonder elke regel tekst te lezen.

Laten we eens kijken naar Margie's Travel, een vakantieverhuurbedrijf dat duizenden aanbiedingen beheert. Hun database bevat lange beschrijvingen en klantbeoordelingen. Het toepassingsteam wil snel de belangrijkste onderwerpen identificeren, vermeldingen van specifieke plaatsen of items vastleggen en ervoor zorgen dat gevoelige details, zoals telefoonnummers, niet zichtbaar zijn. Het uitvoeren van deze taken is niet praktisch op schaal, dus ze gebruiken Azure Language-services met de azure_ai extensie in Azure Database for PostgreSQL.

Met deze aanpak kunnen ze drie mogelijkheden rechtstreeks in de database toepassen: sleuteltermextractie, herkenning van benoemde entiteiten en piI-detectie (personally identifiable information).

Sleutelterm-extractie

Sleuteltermextractie identificeert de belangrijkste ideeën of onderwerpen in tekst. Het haalt de concepten op die het beste aangeeft waar de passage over gaat.

In Azure Database for PostgreSQL wordt deze extractie uitgevoerd met de azure_cognitive.extract_key_phrases functie. Hiervoor is de invoertekst en taal vereist en wordt een lijst met de meest relevante woordgroepen geretourneerd. Het analyseren van een beschrijving van een eigenschap kan bijvoorbeeld woordgroepen opleveren zoals 'queen bed', 'light rail station' of 'garden produce'.

Voor Margie's Travel maken deze inzichten het gemakkelijker om vermeldingen te taggen met consistente onderwerpen of clusterbeoordelingen op basis van terugkerende thema's.

Herkenning van genoemde entiteiten

NER (Named Entity Recognition) identificeert en categoriseert specifieke items, zoals personen, locaties, producten of datums.

In Azure Database for PostgreSQL voert de azure_cognitive.recognize_entities functie deze analyse uit. Het labelt herkende entiteiten en biedt een betrouwbaarheidsscore voor elke entiteit. Een vermeldingsbeschrijving kan bijvoorbeeld entiteiten zoals 'Queen Anne buurt' (locatie), 'kelder' (structurele locatie) of 'sofa' (product) weergeven.

Voor Margie's Travel verrijken deze inzichten hun gegevens door vrije tekst om te zetten in gestructureerde informatie. Medewerkers kunnen lijsten filteren en doorzoeken via erkende entiteiten, waardoor het platform nuttiger is voor zowel gasten als eigenaren van accommodaties.

Detectie van persoonsgegevens (PII)

Tekst bevat vaak gevoelige gegevens die niet mogen worden gedeeld, zoals telefoonnummers, adressen of betalingsgegevens. PiI-detectie (personally identifiable information) identificeert en redacteert dit type inhoud automatisch.

In Azure Database for PostgreSQL detecteert en maskert de azure_cognitive.recognize_pii_entities functie PII, waarbij zowel de oorspronkelijke tekst wordt geretourneerd met gevoelige details die worden bewerkt als metagegevens over wat is gevonden.

Voor Margie's Travel zorgt deze functie ervoor dat persoonlijke klantgegevens worden beveiligd wanneer beoordelingen worden geanalyseerd, weergegeven of geëxporteerd. Het vermindert risico's en ondersteunt nalevingsvereisten.

Waarom deze inzichten belangrijk zijn

Sleuteltermextractie, herkenning van benoemde entiteiten en PII-detectie helpen ongestructureerde tekst te transformeren in gestructureerde, veilige inzichten. Samen kunnen organisaties het volgende doen:

  • Verbeter de zoek- en categorisatie door belangrijke woordgroepen te herkennen.
  • Markeer entiteiten zoals locaties en producten om toepassingen te verrijken.
  • Beveilig privacy door gevoelige informatie automatisch te rediëren.

Voor Margie's Travel betekenen deze mogelijkheden dat ze grote hoeveelheden tekst efficiënter kunnen verwerken en tegelijkertijd het vertrouwen van klanten en de algehele ervaring kunnen verbeteren.

Belangrijke punten

In deze les leert u hoe u inzichten kunt extraheren uit tekstgegevens met Azure Language-services in Azure Database for PostgreSQL. Sleuteltermextractie identificeert belangrijke onderwerpen, benoemde entiteitsherkenning categoriseert entiteiten en PII-detectie beschermt gevoelige informatie. Met deze technieken kunt u vrije tekst omzetten in gestructureerde gegevens die gemakkelijker te analyseren, zoeken en beveiligen zijn.