Aptitud cognitiva de reconocimiento de entidades con nombre

La habilidad Reconocimiento de entidades con nombre (v2) extrae entidades con nombre del texto. Las entidades disponibles incluyen los tipos person, location y organization.

Important

La aptitud de reconocimiento de entidades nombradas (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) se ha dejado de usar y se ha sustituido por Microsoft.Skills.Text.V3.EntityRecognitionSkill. Siga las recomendaciones de Aptitudes de Búsqueda de Azure AI en desuso para migrar a una aptitud admitida.

Note

A medida que expanda el ámbito aumentando la frecuencia de procesamiento, agregando más documentos o agregando más algoritmos de IA, tendrá que asociar un recurso facturable de Microsoft Foundry. Los cargos se acumulan cuando se llama a las API de Herramientas de Foundry y por la extracción de imágenes como parte de la fase de descifrado de documentos de Búsqueda de Azure AI. No hay ningún cargo por la extracción de texto de documentos. La ejecución de aptitudes integradas se cobra por el precio estándar de las Herramientas de Foundry existentes.

La extracción de imágenes es un cargo adicional que mide Búsqueda de Azure AI, como se describe en la página de precios. La extracción de texto es gratuita.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Data limits

El tamaño máximo de un registro debe tener menos de 50 000 caracteres según la medición de String.Length. Si tiene que dividir los datos antes de enviarlos al extractor de frases clave, puede usar la aptitud de división de texto. Si usa una aptitud de división de texto, establezca la longitud de la página en 5000 para obtener el mejor rendimiento.

Skill parameters

Los parámetros distinguen entre mayúsculas y minúsculas.

Parameter name Description
categories Matriz de categorías que se deben extraer. Tipos de categorías posibles: "Person", "Location" y "Organization". Si no se proporciona ninguna categoría, se devuelven todos los tipos.
defaultLanguageCode Código de idioma del texto de entrada. Se admiten los siguientes idiomas: de, en, es, fr, it
minimumPrecision Número comprendido entre 0 y 1. Si la precisión es inferior a este valor, no se devuelve la entidad. El valor predeterminado es 0.

Skill inputs

Input name Description
languageCode Optional. El valor predeterminado es "en".
text Texto que se analizará.

Skill outputs

Output name Description
persons Una matriz de cadenas donde cada cadena representa el nombre de una persona.
locations Una matriz de cadenas donde cada cadena representa una ubicación.
organizations Una matriz de cadenas donde cada cadena representa una organización.
entities Una matriz de tipos complejos. Cada tipo complejo incluye los siguientes campos:
  • categoría ("person", "organization" o "location")
  • valor (el nombre de entidad real)
  • desplazamiento (la ubicación donde se encontró en el texto)
  • confianza (un valor entre 0 y 1 que representa esa confianza de que el valor es una entidad real)

Sample definition

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Sample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Sample output

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Warning cases

Si el código de idioma del documento no se admite, se devuelve una advertencia y no se extrae ninguna entidad.

See also