Der kognitive Skill „Erkennung benannter Entitäten“ (v2)

Der Skill Erkennung benannter Entitäten (v2) extrahiert benannte Entitäten aus Text. Zu den verfügbaren Entitäten gehören die Typen person, location und organization.

Important

Der Skill Erkennung benannter Entitäten (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) wurde jetzt eingestellt und ersetzt durch Microsoft.Skills.Text.V3.EntityRecognitionSkill. Führen Sie unter Berücksichtigung der Empfehlungen unter Veraltete Azure KI-Suche Skills eine Migration zu einem unterstützten Skill durch.

Note

Wenn Sie den Umfang erweitern, indem Sie die Verarbeitungsfrequenz erhöhen oder weitere Dokumente oder KI-Algorithmen hinzufügen, müssen Sie eine kostenpflichtige Microsoft Foundry-Ressource anfügen. Gebühren fallen beim Aufrufen von APIs in Foundry Tools sowie für die Bildextraktion im Rahmen der Dokumententschlüsselungsphase in Azure KI-Suche an. Für die Textextraktion aus Dokumenten fallen keine Gebühren an. Die Ausführung der integrierten Fähigkeiten wird zum bestehenden Foundry Tools Standard-Preis berechnet.

Die Bildextraktion ist eine zusätzliche Gebühr, die durch Azure KI-Suche berechnet wird, wie auf der Seite mit der Preisübersicht beschrieben. Die Textextraktion ist kostenlos.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Data limits

Die maximale Größe eines Datensatzes beträgt 50.000 Zeichen (gemessen durch String.Length). Wenn Sie Ihre Daten teilen müssen, bevor Sie sie an die Schlüsselbegriffserkennung senden, denken Sie daran, den Skill „Text teilen“ zu verwenden. Wenn Sie einen Textteilungsskill verwenden, legen Sie die Seitenlänge auf 5000 fest, um die beste Leistung zu erzielen.

Skill parameters

Bei Parametern wird zwischen Groß- und Kleinschreibung unterschieden.

Parameter name Description
categories Array von zu extrahierenden Kategorien. Mögliche Kategorietypen: "Person", "Location", "Organization". Wenn keine Kategorie angegeben ist, werden alle Typen zurückgegeben.
defaultLanguageCode Sprachcode des Eingabetexts. Die folgenden Sprachen werden unterstützt: de, en, es, fr, it
minimumPrecision Eine Zahl zwischen 0 und 1. Wenn die Genauigkeit unter diesem Wert liegt, wird die Entität nicht zurückgegeben. Der Standardwert ist 0.

Skill inputs

Input name Description
languageCode Optional. Der Standardwert ist "en".
text Der zu analysierende Text

Skill outputs

Output name Description
persons Ein Array von Zeichenfolgen, wobei jede Zeichenfolge den Namen einer Person darstellt.
locations Ein Array von Zeichenfolgen, wobei jede Zeichenfolge einen Ort darstellt.
organizations Ein Array von Zeichenfolgen, wobei jede Zeichenfolge eine Organisation darstellt.
entities Ein Array komplexer Typen. Jeder komplexe Typ umfasst die folgenden Felder:
  • category ("person", "organization" oder "location")
  • value (der tatsächliche Entitätsname)
  • offset (die Fundstelle im Text)
  • confidence (Ein Wert zwischen 0 und 1, der das Vertrauen darstellt, dass der Wert eine tatsächliche Entität ist.)

Sample definition

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Sample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Sample output

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Warning cases

Wird der Sprachcode für das Dokument nicht unterstützt, wird eine Warnung zurückgegeben, und es werden keine Entitäten extrahiert.

See also