Competenza cognitiva Riconoscimento entità denominata (v2)

La competenza Riconoscimento entità denominata (v2) estrae entità denominate dal testo. Le entità disponibili includono i tipi person, location e organization.

Important

La competenza Riconoscimento entità denominata (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) è stata ritirata e sostituita da Microsoft.Skills.Text.V3.EntityRecognitionSkill. Seguire le raccomandazioni in Competenze di Azure AI Search deprecate per eseguire la migrazione a una competenza supportata.

Note

Quando si espande l'ambito aumentando la frequenza di elaborazione, aggiungendo più documenti o aggiungendo più algoritmi di IA, sarà necessario collegare una risorsa Microsoft Foundry fatturabile. Gli addebiti si accumulano quando si chiamano API in Foundry Tools e per l'estrazione di immagini come parte della fase di cracking dei documenti in Azure AI Search. Non sono previsti addebiti per l'estrazione di testo dai documenti. L'esecuzione di competenze predefinite viene addebitata al prezzo standard di Foundry Tools esistenti.

L'estrazione di immagini è un addebito aggiuntivo a consumo misurato da Azure AI Search, come descritto nella pagina dei prezzi. L'estrazione del testo è gratuita.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Data limits

Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli all'estrattore di frasi chiave, è possibile usare la competenza Divisione del testo. Se si usa una competenza di suddivisione del testo, impostare la lunghezza della pagina su 5.000 per ottenere prestazioni ottimali.

Skill parameters

I parametri fanno distinzione tra maiuscole e minuscole.

Parameter name Description
categories Matrice di categorie che devono essere estratte. Possibili tipi di categorie: "Person", "Location", "Organization". Se non vengono fornite categorie, vengono restituiti tutti i tipi.
defaultLanguageCode Codice lingua del testo di input. Sono supportate le lingue seguenti: de, en, es, fr, it
minimumPrecision Un numero compreso tra 0 e 1. Se la precisione è inferiore a questo valore, non viene restituita l'entità. Il valore predefinito è 0.

Skill inputs

Input name Description
languageCode Optional. Il valore predefinito è "en".
text Testo da analizzare.

Skill outputs

Output name Description
persons Una matrice di stringhe in cui ogni stringa rappresenta il nome di una persona.
locations Una matrice di stringhe in cui ogni stringa rappresenta il nome una posizione.
organizations Una matrice di stringhe in cui ogni stringa rappresenta un'organizzazione.
entities Una matrice di tipi complessi. Ogni tipo complesso include i campi seguenti:
  • category ("person", "organization" o "location")
  • value (nome entità effettivo)
  • offset (percorso in cui è stato trovato nel testo)
  • confidence (un valore compreso tra 0 e 1 che rappresenta l'attendibilità che il valore sia di un'entità effettiva)

Sample definition

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Sample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Sample output

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Warning cases

Se il codice lingua per il documento non è supportato, viene restituito un avviso e non vengono estratte entità.

See also