Extrahera insikter med hjälp av Azure Language Service och Azure Database for PostgreSQL

Slutförd

Företag lagrar ofta text som är omfattande med information men som är svår att arbeta med direkt. En enda egenskapsbeskrivning kan nämna möbler, grannskapsmärken och bekvämligheter, medan en gästrecension kan blanda beröm med kritik. Begravt i dessa ord är ledtrådar som kan förbättra sökning, markera unika funktioner eller yttrender. Utmaningen är att hitta ett sätt att dra ut dessa detaljer utan att läsa igenom varje textrad.

Låt oss överväga Margie's Travel, ett semesteruthyrningsföretag som hanterar tusentals listor. Deras databas innehåller långa beskrivningar och kundrecensioner. Programteamet vill snabbt identifiera huvudämnena, ta upp omnämnanden av specifika platser eller objekt och se till att känslig information som telefonnummer inte exponeras. Att utföra dessa uppgifter för hand är inte praktiskt i stor skala, så de använder Azure Language-tjänster med azure_ai tillägget i Azure Database for PostgreSQL.

Med den här metoden kan de använda tre funktioner direkt i databasen: extrahering av nyckelfraser, namngiven entitetsigenkänning och identifiering av personligt identifierbar information (PII).

Extrahering av nyckelfraser

Extrahering av nyckelfraser identifierar huvudidéer eller ämnen i text. Den tar fram de begrepp som bäst representerar vad passagen handlar om.

I Azure Database for PostgreSQL görs den här extraheringen med funktionen azure_cognitive.extract_key_phrases. Den kräver indatatext och språk och returnerar en lista över de mest relevanta fraserna. Till exempel kan analys av en egenskapsbeskrivning ge fraser som "queen bed","light rail station" eller "trädgårdsprodukter".

För Margie's Travel gör dessa insikter det enklare att tagga listor med konsekventa ämnen eller klustergranskningar baserat på återkommande teman.

Igenkänning av namngiven entitet

Namngiven entitetsigenkänning (NER) identifierar och kategoriserar specifika objekt som personer, platser, produkter eller datum.

I Azure Database for PostgreSQL utför funktionen azure_cognitive.recognize_entities den här analysen. Den etiketterar identifierade entiteter och ger en konfidenspoäng för var och en. En listbeskrivning kan till exempel visa entiteter som "Queen Anne neighborhood" (plats), "källare" (strukturell plats) eller "soffa" (produkt).

För Margie's Travel berikar dessa insikter sina data genom att omvandla fri text till strukturerad information. Personalen kan filtrera eller söka i listor efter identifierade entiteter, vilket gör plattformen mer användbar för både gäster och fastighetsägare.

Identifiering av personligt identifierbar information (PII)

Text innehåller ofta känslig information som inte ska delas, till exempel telefonnummer, adresser eller betalningsinformation. Identifiering av personligt identifierbar information (PII) identifierar och redigerar automatiskt den här typen av innehåll.

I Azure Database for PostgreSQL azure_cognitive.recognize_pii_entities identifierar och maskerar funktionen PII och returnerar både den ursprungliga texten med känslig information redigerad och metadata om vad som hittades.

För Margie's Travel säkerställer den här funktionen att privata kunddata skyddas när granskningar analyseras, visas eller exporteras. Det minskar risken och stöder efterlevnadskrav.

Varför dessa insikter spelar roll

Extrahering av nyckelfraser, namngiven entitetsigenkänning och PII-identifiering hjälper till att omvandla ostrukturerad text till strukturerade, säkra insikter. Tillsammans gör de det möjligt för organisationer att:

  • Förbättra sökning och kategorisering genom att lyfta fram viktiga fraser.
  • Markera entiteter som platser och produkter för att berika program.
  • Skydda sekretessen genom att automatiskt redigera känslig information.

För Margie's Travel innebär dessa funktioner att de kan hantera stora mängder text mer effektivt samtidigt som kundernas förtroende och den övergripande upplevelsen förbättras.

Viktiga lärdomar

I den här lektionen får du lära dig hur du extraherar insikter från textdata med Azure Language-tjänster i Azure Database for PostgreSQL. Extrahering av nyckelfraser identifierar viktiga ämnen, namngiven entitetsigenkänning kategoriserar entiteter och PII-identifiering skyddar känslig information. De här teknikerna omvandlar text i fritt format till strukturerade data som är enklare att analysera, söka efter och skydda.