Habilidade cognitiva de Reconhecimento de Entidade Nomeada (v2)

A habilidade Reconhecimento de Entidade Nomeada (v2) extrai entidades nomeadas do texto. As entidades disponíveis incluem os tipos person, location e organization.

Important

A habilidade de reconhecimento de entidade nomeada (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) agora foi descontinuada, substituída por Microsoft.Skills.Text.V3.EntityRecognitionSkill. Siga as recomendações em Habilidades de Pesquisa de IA do Azure preteridas para migrar para uma habilidade suportada.

Note

À medida que expande o âmbito aumentando a frequência de processamento, adicionando mais documentos ou adicionando mais algoritmos de IA, terá de anexar um recurso faturável do Microsoft Foundry. As taxas acumulam-se ao chamar APIs no Foundry Tools, e para extração de imagens como parte da fase de decodificação de documentos no Pesquisa de IA do Azure. Não há taxas para extração de texto de documentos. A execução das competências integradas é cobrada ao preço padrão existente da Foundry Tools.

A extração de imagens é uma cobrança extra medida pelo Pesquisa de IA do Azure, conforme descrito na página de preços. A extração de texto é gratuita.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Data limits

O tamanho máximo de um registo deve ser de 50 000 carateres, medido por String.Length. Se você precisar dividir seus dados antes de enviá-los para o extrator de frase-chave, considere usar a habilidade Divisão de texto. Se você usar uma habilidade de divisão de texto, defina o comprimento da página como 5000 para obter o melhor desempenho.

Skill parameters

Os parâmetros diferenciam maiúsculas de minúsculas.

Parameter name Description
categories Matriz de categorias que devem ser extraídas. Tipos de categorias possíveis: "Person", "Location", "Organization". Se nenhuma categoria for fornecida, todos os tipos serão retornados.
defaultLanguageCode Código linguístico do texto de entrada. Os seguintes idiomas são suportados: de, en, es, fr, it
minimumPrecision Um número entre 0 e 1. Se a precisão for menor que esse valor, a entidade não será retornada. A predefinição é 0.

Skill inputs

Input name Description
languageCode Optional. A predefinição é "en".
enviar SMS O texto a analisar.

Skill outputs

Output name Description
persons Uma matriz de cadeias de caracteres onde cada cadeia representa o nome de uma pessoa.
locations Uma matriz de cadeias de caracteres onde cada cadeia de caracteres representa um local.
organizations Uma matriz de cadeias de caracteres onde cada cadeia de caracteres representa uma organização.
entities Uma matriz de tipos complexos. Cada tipo complexo inclui os seguintes campos:
  • categoria ("person", "organization", ou "location")
  • value (o nome real da entidade)
  • offset (O local onde foi encontrado no texto)
  • confiança (Um valor entre 0 e 1 que representa essa confiança de que o valor é uma entidade real)

Sample definition

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Sample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Sample output

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Warning cases

Se o código de idioma do documento não for suportado, um aviso será retornado e nenhuma entidade será extraída.

See also