名前付きエンティティの認識コグニティブ スキル (v2)

名前付きエンティティ認識 スキル (v2) は、テキストから名前付きエンティティを抽出します。 使用可能なエンティティ タイプには、personlocationorganization が含まれます。

Important

名前付きエンティティの認識スキル (V2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) は廃止となり、Microsoft.Skills.Text.V3.EntityRecognitionSkill に置き換えられました。 「非推奨の Azure AI 検索 スキル」に記載されているレコメンデーションに従い、サポートされるスキルを移行します。

Note

処理の頻度を増やす、ドキュメントを追加する、または AI アルゴリズムを追加することによってスコープを拡大する場合は、課金対象の Microsoft Foundry リソースをアタッチする必要があります。 Microsoft Foundry の API を呼び出すとき、および Azure AI 検索 のドキュメント解析段階の一部として画像抽出するときに、料金が発生します。 ドキュメントからのテキストの抽出には、料金はかかりません。 組み込みスキルの実行は、既存の Foundry Tools Standard 価格に基づいて請求されます。

画像抽出は、料金ページに説明されているように、Azure AI 検索 によって追加で従量課金されます。 テキスト抽出は無料です。

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Data limits

レコードの最大サイズは、String.Length によって測定されるため、50,000 文字にする必要があります。 データをキー フレーズ エクストラクターに送信する前に分割する必要がある場合は、テキスト分割スキルの使用を検討してください。 テキスト分割スキルを使用する場合は、最適なパフォーマンスを得るためにページ長を 5000 に設定します。

Skill parameters

パラメーターの大文字と小文字は区別されます。

Parameter name Description
categories 抽出する必要があるカテゴリの配列。 可能なカテゴリの型は、"Person""Location""Organization" です。 カテゴリが指定されていない場合、すべての型が返されます。
defaultLanguageCode 入力テキストの言語コード。 次の言語がサポートされます。de, en, es, fr, it
minimumPrecision 0 ~ 1 の数値。 精度がこの値よりも小さい場合は、エンティティは返されません。 既定値は 0 です。

Skill inputs

Input name Description
languageCode Optional. 既定値は "en" です。
SMS 送信 分析するテキスト。

Skill outputs

Output name Description
persons 各文字列が人物の名前を表す文字列の配列。
locations 各文字列が場所を表す文字列の配列。
organizations 各文字列が組織を表す文字列の配列。
entities 複合型の配列。 各複合型には、次のフィールドが含まれます:
  • category ("person""organization"、または "location")
  • value (実際のエンティティ名)
  • offset (テキスト内で見つかった場所)
  • confidence (値が実際のエンティティの信頼度を表す 0 から 1 の値)

Sample definition

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Sample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Sample output

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Warning cases

ドキュメントの言語コードがサポートされていない場合、警告が返され、エンティティは抽出されません。

See also